Vous êtes sur la page 1sur 328

--- lECTURE CRITIQUE

D'ARTIClE
EDITION 2018

-.. Jérémy LAURENT

99 bd de l'Hôpital
Editions Vernazobres-Grego 1so13 PARIS -Tél.: 01442413 s1
www.vg-editions.com
AVERTISSEMENT
Les Éditions VG sont en perpétuelle évolution afin de réaliser des
ouvrages innovants au plus proche de vos demandes. Malgré toute
l'attention et le soin apportés à la rédaction de ceux-ci, certaines
remarques constructives peuvent probablement être émises. N'hésitez
pas à nous transmettre vos commentaires à l'adresse patrice@vg-editions.com
(en nous précisant bien le titre de l'ouvrage et le numéro de la page concernée) ;
nous ne manquerons pas de les prendre en compte dans le cadre de la réalisation de
nos prochaines éditions.

MENTIONS LEGALES:
Cet ouvrage a été réalisé selon les dernières recommandations scientifiques en
vigueur lors de sa publication. Les données médicales étant en permanente évolution,
nous recommandons à nos lecteurs de consulter régulièrement les dernières données
de pharmacovigilance.
Le prescripteur étant strictement responsable de ses actes, l'éditeur et l'auteur ne
pourront en aucun cas être tenus responsables de la prise en charge d'un patient.

99 bd de l'Hôpital
Editions Vernazobres-Grego 1so13 PARIS -Tél.: 01442413 s1
www.vg-editions.com
Toute reproduction, même partielle, de cet ouvrage est interdite.
Une copie ou reproduction par quelque procédé que ce soit, photographie, microfilm,
bande magnétique, disque ou autre, constitue une contrefaçon passible des peines
prévues par la loi du 11 mars 1957 sur la protection des droits d'auteurs.

DECEMBRE 2017 - ISBN : 978-2-8183-1659-7


TABLE DES MATIERES
PREMIERE PARTIE :
MODALITES DE L'EPREUVE ...::::1 ...::::1 ...::::1
......
,8 ,8
N
,8
M
Chapitre Intitulé du chapitre Page

1 Présentation de l'épreuve de LCA 7

2 Déroulement de l'épreuve 9

3 Le fond de l'épreuve 11

DEUXIEME PARTIE :
LE COURS PAR OB.JECTIF ...::::1 ...::::1 ...::::1

Objectif
......
,8 ,8
N
,8
M
Intitulé de l'objectif Page
Pédagogique

L'objet d'un article médical scientifique, parmi les suivants


évaluation d'une procédure diagnostique, d'un traitement, d'un 15
4
programme de dépistage, estimation d'un pronostic, enquête
épidémiologique à l'exclusion des méta-analyses.

5 La« question » posée par les auteurs (hypothèse) 17

Identifier les caractéristiques (données démographiques) de la


population étudiée, à laquelle, les conclusions pourront être 27
appliquées.

Analyser les modalités de sélection des sujets, critères 31


7
d'inclusion et de non-inclusion et d'exclusion

Identifier la technique de randomisation et vérifier sa cohérence, 39


8 le cas échéant.
iKB LECTURE CRITIQUE D'ARTICLE

9 Discuter la comparabilité des groupes soumis à la comparaison. 45

Discuter l'évolution des effectifs étudiés et leur cohérence dans


10 la totalité de l'article ; savoir si le calcul du nombre de sujets 51
nécessaires a été effectué à priori

S'assurer que la méthode employée est cohérente avec le projet


11 du travail et qu'elle est effectivement susceptible d'apporter« 55
une » réponse à la question posée dans l'introduction.

Vérifier que les analyses statistiques (en fonction de notions


élémentaires) sont cohérentes avec le projet du travail ; 59
12 connaître les limites de l'analyse par sous groupe ; connaître la
notion de perdus de vue.

13 Vérifier le respect des règles d'éthique. 69

Analyser la présentation, la précision et la lisibilité des tableaux 75


14 et des figures, leur cohérence avec le texte et leur utilité

Vérifier la présence des indices de dispersion permettant


15 79
d'évaluer la variabilité des mesures et de leurs estimateurs.

Discuter la nature et la précision des critères de jugement des


16 résultats.
81

Relever les biais qui ont été discutés. Rechercher d'autres biais
d'information et de sélection éventuels non pris en compte dans
17 85
la discussion et relever leurs conséquences dans l'analyse des
résultats.

Vérifier la logique de la discussion et sa structure. Reconnaître


18 ce qui relève des données de la littérature et ce qui est opinion 91
personnelle de l'auteur.

0
(.9
LJ.J
a: 19 Discuter la signification statistique des résultats. 93
(.9

LJ.J
a:
CO

97
0

z
20 Discuter la pertinence clinique des résultats.
a:
LJ.J
>
en
z
0
fC=
0
LJ.J
@

2
Vérifier que les résultats offrent une réponse à la question
21 annoncée.
101

22 Vérifier que les conclusions sont justifiées par les résultats. 103

23 Indiquer le niveau de preuve de l'étude (grille de l'HAS). 109

24 Discuter la ou les applications potentielles proposées par l'étude 113

Identifier la structure IMRAD (Introduction, Matériel et méthode,


25 Résultats, Discussion) et s'assurer que les divers chapitres de la 117
structure répondent à leurs objectifs respectifs

26 Faire une analyse critique de la présentation des références. 123

27 Faire une analyse critique du titre. 125

TROISIEME PARTIE
LES DIFFERENTS TYPES D'ETUDE ...::::1 ...::::1 ...::::1
,s ,s ,s
..... N �
Chapitre Intitulé du chapitre Page

28 Les études thérapeutiques 129

29 Les études épidémiologiques 137

30 Les études diagnostiques 143

31 Les études pronostiques 151

3
iKB LECTURE CRITIQUE D'ARTICLE

QUATRIEME PARTIE
ANNEXES ...::::1 ...::::1 ...::::1

Chapitre
......
,8 ,8
N
,8

Intitulé du chapitre Page

32 Quelques notions d'anglais 157

33 Glossaire du CNCI 163

CINQUIEME PARTIE
...::::1 ...::::1 ...::::1
TRAINING - ANNALES LCA aux ECN
Chapitre
......
,8 ,8
N
,8

Intitulé du chapitre Page

34 Article 1 - LCA 2009 181

35 Article 2 - LCA 2010 193

36 Article 3 - LCA 2011 203

37 Article 4 - LCA 2012 215

38 Article 5 - LCA 2013 227

39 Article 6 - LCA 2014 241

40 Article 7 - LCA 2015 257

41 Article 8 - LCA_l 2016 271


0
(.9
LJ.J
a:
(.9
42 Article 9 - LCA_2 2016 283
LJ.J
a:
CO
0
43 Article 10 - LCA_l 2017 299
z
a:
LJ.J
>
en
z
0
44 Article 11 - LCA_2 2017 309
fC=
0
LJ.J
@

4
PARTIE 1

MODALITES DE L'EPREUVE
iKB LECTURE CRITIQUE D'ARTICLE

SOMMAIRE

Présentation de l'épreuve de LCA

Déroulement de l'épreuve

Le fond de l'épreuve

0
(.9
LJ.J
a:
(.9
J,
LJ.J
a:
CO
0


z
a:
LJ.J
>
en
z
0
fC=
0
LJ.J
@

6
Chapitre
1

PRESENTATION DE L'EPREUVE DE LCA

• OBJECTIFS GENERAUX DE LA LCA

• L'objectif de l'épreuve est d'amener l'étudiant à lire de façon critique et à analyser le contenu
d'un article en vue de son autoformation actuelle et future(« Evidence Based Medicine»).
• Le mot critique ne doit pas être entendu dans le sens où l'on demanderait aux étudiants de
chercher systématiquement tous les défauts d'un article.
• Cette épreuve part du principe que toute information médicale doit être analysée avec du recul,
en cherchant les défauts éventuels mais aussi les limites, les implications, l'utilité pour la
pratique.
• L'article choisi doit être considéré comme de bonne qualité (le but de l'enseignement de la
lecture critique est de donner à la fois le sens critique et le goût de la lecture).

n PLACE DE LA LCA DANS VOTRE NOTE FINALE

Dossiers Progressifs

70% de la note finale -":> 7 000 points

TOTAL

10 000
points
Questions isolées

20% de la note finale ....."), 2 000 points

LCA
1 000 points
10% de la note finale ;:::,

7
iKB LECTURE CRITIQUE D'ARTICLE

NE PAS METTRE DE COTE LA LCA :

10% de votre note finale peut sembler peu mais :

• Vous êtes sûr de tomber sur de la LCA aux ECNi (contrairement à d'autres matières qui peuvent
ne pas faire l'objet de questions ... ) :
o Il est donc « rentable » de bien la travailler pendant toute votre préparation aux ECNi

• La LCA est une épreuve discriminante :


o Elle peut vous permettre de gagner des points (et donc des places) par rapport à des
étudiants l'ayant peu travaillée
o Notamment avec les QCM qui permettent de poser des questions plus précises et
ciblées, parfois sur des éléments de cours

Il PRESENTATION DES ARTICLES LORS DES ECNi

L'épreuve portera sur 2 articles :

• Médicaux scientifiques originaux, c'est à dire


o Rapportant une étude d'observation ou expérimentale
o Traitant d'un sujet mentionné dans le programme de la deuxième partie du 2 ème cycle

• Issus d'une revue médicale avec comité de lecture

• En anglais à partir des ECNi 2017

• Utilisés en entier (ce qui est souhaitable) ou partiellement s'ils sont trop longs

• Un premier article traitera de l'orientation clinique et un second de l'orientation


physiopathologique

0
(.9
a:
LJ.J

(.9

a:
LJ.J

CO
0

z
a:
>
LJ.J

en
z
0
fC=
0
LJ.J
@

8
Chapitre
2

DEROULEMENT DE L'EPREUVE

.
DUREE . 3 heures, soit 1h30 par article
L'étudiant est libre d'organiser et de répartir son temps comme il
le souhaite entre lecture et réponse aux questions

. 13 à 17 QCM (15 QCM le plus souvent) par article, posées de


manière progressive
0 5 propositions de réponse (A à E) pour chaque QCM
0 Sur les objectifs pédagogiques officiels du conseil
QUESTIONS
scientifique du CNCI
0 1 à 5 bonnes réponses possibles

. Il n'y a plus de résumé d'article à faire pour les ECNi

9
iKB LECTURE CRITIQUE D'ARTICLE

0
(.9
LJ.J
a:
(.9
J,
LJ.J
a:
CO
0


z
a:
LJ.J
>
en
z
0
fC=
0
LJ.J
@

10
Chapitre
3

LE FOND DE L'EPREUVE

• OBJECTIFS PEDAGIGIQUES OFFICIELS

IDENTIFIER

1 ° ) L'objet d'un article médical scientifique, parmi les suivants : évaluation d'une procédure
diagnostique, d'un traitement, d'un programme de dépistage, estimation d'un pronostic, enquête
épidémiologique à l'exclusion des méta-analyses
2 ° ) La « question» posée par les auteurs (hypothèse)

ANALYSER LA METHODOLOGIE

Population étudiée
3 ° ) Identifier les caractéristiques (données démographiques) de la population étudiée, à laquelle, les
conclusions pourront être appliquées
4° ) Analyser les modalités de sélection des sujets, critères d'inclusion et de non inclusion et
d'exclusion
5 ° ) Identifier la technique de randomisation et vérifier sa cohérence, le cas échéant
6 ° ) Discuter la comparabilité des groupes soumis à la comparaison
7 ° ) Discuter l'évolution des effectifs étudiés et leur cohérence dans la totalité de l'article ; savoir si le
calcul du nombre de sujets nécessaires a été effectué a priori

Méthodes
8 ° ) S'assurer que la méthode employée est cohérente avec le projet du travail et qu'elle est
effectivement susceptible d'apporter« une» réponse à la question posée dans l'introduction
9 ° ) Vérifier que les analyses statistiques (en fonction de notions élémentaires) sont cohérentes avec
le projet du travail ; connaître les limites de l'analyse par sous groupe ; connaître la notion de
perdus de vue
10 ° ) Vérifier le respect des règles d'éthique

ANALYSER LA PRESENTATION DES RESULTATS

11 °) Analyser la présentation, la précision et la lisibilité des tableaux et des figures, leur cohérence
avec le texte et leur utilité
12 ° ) Vérifier la présence des indices de dispersion permettant d'évaluer la variabilité des mesures et
de leurs estimateurs

11
iKB LECTURE CRITIQUE D'ARTICLE

CRITIQUER L'ANALYSE DES RESULTATS ET DE LA DISCUSSION

13 ° ) Discuter la nature et la précision des critères de jugement des résultats


14° ) Relever les biais qui ont été discutés. Rechercher d'autres biais d'information et de sélection
éventuels non pris en compte dans la discussion et relever leurs conséquences dans l'analyse
des résultats
15 ° ) Vérifier la logique de la discussion et sa structure. Reconnaître ce qui relève des données de la
littérature et ce qui est opinion personnelle de l'auteur
16 ) Discuter la signification statistique des résultats
°

17 ° ) Discuter la pertinence clinique des résultats


18 ° ) Vérifier que les résultats offrent une réponse à la question annoncée
19 ° ) Vérifier que les conclusions sont justifiées par les résultats
20 ° ) Indiquer le niveau de preuve de l'étude (grille de l'HAS)

EVALUER LES APPLICATIONS CLINIQUES

21 °) Discuter la ou les applications potentielles proposées par l'étude

ANALYSER LA FORME DE L'ARTICLE

22 ° ) Identifier la structure IMRAD (Introduction, Matériel et méthode, Résultats, Discussion) et


s'assurer que les divers chapitres de la structure répondent à leurs objectifs respectifs
23 ° ) Faire une analyse critique de la présentation des références
24° ) Faire une analyse critique du titre

• PRECISION SUR LES QUESTIONS« TOMBABLES »

• Aucun calcul nouveau ne sera demandé

• Un commentaire de tableaux, figures ou calculs statistiques peut être demandé

• La forme de l'article peut être discutée

• Il ne pourra être posé de questions de mémorisation sur le sujet étudié ni de questions


s'écartant de l'article

• Les questions ne sont pas posées dans un langage de spécialistes. Elles doivent être
comprises simplement par tout étudiant de deuxième cycle

• Les questions sont indépendantes les unes des autres


0
(.9 • Il sera évité les sous questions
LJ.J
a:
(.9

LJ.J
a:
• Si une définition pose problème, c'est-à-dire si elle peut faire l'objet de discussions, la définition
CO
0 retenue pour cette épreuve doit être précisée dans l'intitulé
z
a:
LJ.J
>
en
z
0
fC=
0
LJ.J
@

12
PARTIE 2

LE COURS PAR OBJECTIF


iKB LECTURE CRITIQUE D'ARTICLE

SOMMAIRE
IDENTIFIER
1 °) L'objet d'un article médical scientifique, parmi les suivants : évaluation d'une procédure diagnostique, d'un
traitement, d'un programme de dépistage, estimation d'un pronostic, enquête épidémiologique à l'exclusion des
méta-analyses
2 °) La « question » posée par les auteurs (hypothèse)

ANALYSER LA METHODOLOGIE
Population étudiée
3 °) Identifier les caractéristiques (données démographiques) de la population étudiée, à laquelle, les
conclusions pourront être appliquées
4 °) Analyser les modalités de sélection des sujets, critères d'inclusion et de non inclusion et d'exclusion
5 °) Identifier la technique de randomisation et vérifier sa cohérence, le cas échéant
6 °) Discuter la comparabilité des groupes soumis à la comparaison
7 °) Discuter l'évolution des effectifs étudiés et leur cohérence dans la totalité de l'article ; savoir si le calcul du
nombre de sujets nécessaires a été effectué a priori
Méthodes
8 °) S'assurer que la méthode employée est cohérente avec le projet du travail et qu'elle est effectivement
susceptible d'apporter« une » réponse à la question posée dans l'introduction
9 °) Vérifier que les analyses statistiques (en fonction de notions élémentaires) sont cohérentes avec le projet du
travail ; connaître les limites de l'analyse par sous groupe ; connaître la notion de perdus de vue
10 °) Vérifier le respect des règles d'éthique

ANALYSER LA PRESENTATION DES RESULTATS


11 °) Analyser la présentation, la précision et la lisibilité des tableaux et des figures, leur cohérence avec le texte
et leur utilité
12 °) Vérifier la présence des indices de dispersion permettant d'évaluer la variabilité des mesures et de leurs
estimateurs

CRITIQUER L'ANALYSE DES RESULTATS ET DE LA DISCUSSION


13 °) Discuter la nature et la précision des critères de jugement des résultats
14 °) Relever les biais qui ont été discutés. Rechercher d'autres biais d'information et de sélection éventuels non
pris en compte dans la discussion et relever leurs conséquences dans l'analyse des résultats
15 °) Vérifier la logique de la discussion et sa structure. Reconnaître ce qui relève des données de la littérature et
ce qui est opinion personnelle de l'auteur
16 °) Discuter la signification statistique des résultats
17 °) Discuter la pertinence clinique des résultats
18 °) Vérifier que les résultats offrent une réponse à la question annoncée
19 °) Vérifier que les conclusions sont justifiées par les résultats
20 °) Indiquer le niveau de preuve de l'étude (grille de l'HAS)

EVALUER LES APPLICATIONS CLINIQUES


21 °) Discuter la ou les applications potentielles proposées par l'étude

ANALYSER LA FORME DE L'ARTICLE


22 °) Identifier la structure IMRAD (Introduction, Matériel et méthode, Résultats, Discussion) et s'assurer que les
divers chapitres de la structure répondent à leurs objectifs respectifs
23 °) Faire une analyse critique de la présentation des références
24 °) Faire une analyse critique du titre

0
(.9
LJ.J
a:
(.9
J,
LJ.J
a:
CO
0


z
a:
LJ.J
>
en
z
0
fC=
0
LJ.J
@

14
Chapitre
4

OBJECTIF PEDAGOGIQUE N ° 1

Les objectifs du CNCI pour l'iECN


IDENTIFIER
L'objet d'un article médical scientifique, parmi les suivants : évaluation d'une procédure
diagnostique, d'un traitement, d'un programme de dépistage, estimation d'un pronostic,
enquête épidémiologique à l'exclusion des meta-analyses

MOTS-CLES et REFLEXES GENERAUX

x Evaluation d'une procédure diagnostique


x Evaluation d'un traitement
x Evaluation d'un programme de dépistage
x Estimation d'un pronostic
x Enquête épidémiologique (sauf méta analyse)

Il COMMENT REPONDRE?

.
L'objet de l'étude concerne :

. Le domaine abordé
Le sujet abordé

.
QUE SIGNIFIE« OBJET Il ne concerne pas

.
DE L'ETUDE » ? La question étudiée (objectif 2)

.
La méthode employée (objectif 8)
Les conclusions et implications (objectif 21)

NB : ne pas confondre avec l'objectif de l'article !

.
L'information est indiquée le plus souvent dans :

OU TROUVER . Le titre
L'introduction
L'INFORMATION ?
.
et parfois dans :

. Les résultats
La conclusion

15
iKB LECTURE CRITIQUE D'ARTICLE

" L'OBJET D'UN ARTICLE

Objets d'étude Précisions

Evaluation d'une .
Caractéristiques du test étudié
Performances
PROCEDURE D�GNOSTIQUE
.
diagnostiques

.
Reproductibilité

.
Efficacité
ARTICLES MEDICAUX
ORIGINAUX
Evaluation d'un TRAITEMENT
.
Tolérance
Sécurité (rapport

.
bénéfices/risques)
Evaluation d'un PROGRAMME DE
.
Efficacité

.
DEPISTAGE Efficience

Estimation d'un PRONOSTIC .


Facteurs pronostiques

.
Devenir des patients
ENQUETE EPIDEMIOLOGIQUE
.
Analytique

.
(sauf méta-analyse) Descriptive
Revue générale ou systématique :

. 0 Réalise la synthèse d'informations déjà publiées


Mise au point :
0 Décrit des acquisitions récentes concernant un sujet

LES ARTICLES
. précis et limité
Cas clinique, case report :
0 Observation d'un effet observé chez un patient
EXCLUS A L'iECN
. 0 Peu de valeur scientifique
Article préliminaire :

. 0

Méta analyse :
Présente des résultats préliminaires d'une étude en cours

0 Synthèse exhaustive rigoureuse et reproductible


quantifiée

Tahlfan l. Type de protocole préreremiellemem proposé pom me qœstioo. donnée (à tit�e indicam)_
QUESTIONS PROTOCOLE
ÉPIDÉMIOLOOIE ]oodenee Suivi de population (suivi de cohorte cm registre)
ÉPIDÉMIOLOOIE Pn\valence Trans,;<ena.l (sm khantillon œprésentati:î)
THÊRAPElfllQUE Eflicacité Étude contrôlée rnndomisée
TIIÉRAPEUTIQUE Sécurité Étude oontrôlée ranrlo:misée ou mm� de cohorte
Dll\:GNOSTIC Reprodn.cb"\JilitéNwbili!é Tnwsver:sal cm:q1arntifa\<ec œpétition de wesme
DIAGNOSTIC Sensi"\Jilité/Spécificitê Tram:veri.al œn:paratifa,aec étalon-or
DIAGNOSTIC Efficacité/Utilité Étude contTôlée I:IIÈomÏsée
Dll\:GNOSTIC Slratégie Élude contrôlée randomisée ou arbre décisiomiel
CAUSALTIÉ l'béruirnàie contrôlable fréquent Étude contrôlée r:nm:misée
0
CAUSAIJ1É Pbawrnàie non oontrolable frequem Suivi de cobone (exposés/non. e.'lp()Sés)
(.9
LJ.J
a: CAUSALITÉ Phénoi:œœ rare Élwle cas-témoin
(.9
PRONOSTIC Maladie- fréquente Étude contrôlée ranrlo:misée ou mm� de ro.horte
LJ.J
a: PRONOSTIC Maladie rare Élude cas-témoiq
CO
0

z R.e:aw!lll• : l'lü.,taire ,.,i,11:eil• d'une mabllie· pomn être ,i!p� de la mm m:mière que les faaem; pron.ostiqnes, Le, dépi.-iage
a:
LJ.J
estapprécié GO!IllDI!' les. tests diagno5ÔI[ll.e!i.
>
en
z
0
fC=
D'après « Guide d'analyse de la littérature et gradation des recommandations», ANAES, 2000
0
LJ.J
@

16
Chapitre
5

OBJECTIF PEDAGOGIQUE N ° 2

Les objectifs du CNCI pour l'îECN


IDENTIFIER

• La « question » posée par les auteurs (hypothèse)

MOTS-CLES et REFLEXES GENERAUX

• Un objectif principal unique


• Dans une population précise
• Un seul critère de jugement principal

CRITERE DE QUALITE DE LA « QUESTION » DE L'ETUDE

.
L'information est indiquée dans :
OU TROUVER
. Le titre
L'INFORMATION ?
. L'introduction = à la fin
La conclusion

.
La« question » (ou hypothèse) de l'étude :

CRITERE DE QUALITE .
Doit être justifiée
DE LA QUESTION DE .
Doit être pertinente et doit présenter un intérêt

.
Doit être unique


L'ETUDE
.
Doit être plausible/vraisemblable
Doit avoir une formulation précise

17
iKB LECTURE CRITIQUE D'ARTICLE

L'hypothèse doit pouvoir être justifiée à partir des connaissances

.
JUSTIFICATION disponibles au moment de la planification de l'essai:
-
.
Contexte

.
PLAUSIBILITE Intérêt de l'étude
Ethique

L'objectif de l'essai doit correspondre à une question pertinente,


INTERET représentant un problème réel concernant un traitement, un pronostic,
PERTINENCE un programme de dépistage, ...
Impact de la question sur la pratique clinique

.
Il existe deux possibilités :

.
UNIQUE Objectif unique
Objectif principal et objectifs secondaires

.
La question doit être clairement formulée : « PICO»

. P => La population d'étude


1 => L'intervention / le facteur étudié : traitement, test

.
diagnostique, facteur de risque ...
FORMULATION
.
C => Le contrôle (placebo ou test/traitement de référence)
PRECISE
0 => Le critère de jugement principal(« outcome »)

.
Auxquels on peut ajouter:
Le schéma expérimental

0
(.9
LJ.J
a:
(.9

LJ.J
a:
CO
0

z
a:
LJ.J
>
en
z
0
fC=
0
LJ.J
@

18
LA« QUESTION » POSEE PAR LES AUTEURS (HYPOTHESE)

IDENTIFIER
La« question» posée par les auteurs (hypothèse)

E T N E P RN PA L
�-��-----o_s_J_ _c_ _1F _(u_ _ 1 _Q_u _ _o _ u_ _ 1 _ _c_1 _ _ _)
_____�
OBJET DE L'ETUDE OBJECTIF POSSIBLE

Evaluer la fiabilité d'une procédure diagnostique (précision)


Evaluer la validité d'une nouvelle procédure diagnostique par
EVALUATION D'UNE rapport au test de référence (gold standard)
PROCEDURE
DIAGNOSTIQUE Comparer plusieurs procédures diagnostiques

Comparer les performances d'une procédure diagnostique donnée


sur plusieurs populations

EVALUATION D'UN Evaluer l'efficacité d'un programme de dépistage


PROGRAMME DE
DEPISTAGE Evaluer le coût-efficacité d'un programme de dépistage
Etudier l'évolution d'une pathologie chez un groupe de malade
donné:
0 Récidive, poussées
ESTIMATION D'UN 0 Corn plications
PRONOSTIC
0 Survie

Identifier un facteur pronostique

ENQUETE Descriptive = Caractériser une population


EPIDEMIOLOGIQUE De causalité, étiologique = Déterminer un facteur causal
Efficacité =

.
Comparer le traitement par rapport à:

.
Un placebo
Un traitement de référence
EVALUATION D'UN Comparer deux stratégies thérapeutiques
TRAITEMENT
Sécurité=

.
Etudier les caractéristiques d'un traitement

.
Pharmacologiques
Toxicologiques

POP ULA TION D'ETUDE :


■ PATHO L OGI E, AGE, S EXE, ...

; . .QJ


FACT EUR, I NT E RVENTION OU EXPOSI TION :
TRAITEM ENT . TEST DIAG NO STIQUE. FACTEUR DERI SQUE...

; . ►@] ._____ coNTROLE(P LA C EBo,TRAITEM ENT_DEREF EREN C E) _ ___.


_ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _

>· ►��I _______



cRITEREDEJuGEM ENT ______�


_ _ _ _ _ _ _ _ _ _ _ _ _ _ _

19
iKB LECTURE CRITIQUE D'ARTICLE

■ CARACTERISER LE TYPE D'ETUDE

• Observationnelle : l'exposition au facteur étudié ne dépend pas


OBSERVATIONNELLE de l'investigateur
ou • Intervention ne lie : l'exposition au facteur étudié dépend de
INTERVENTIONNELLE l'investigateur (test diagnostic, soit avec un traitement, soit par une
prise en charge de la population d'étude)

• Epidémiologique : étude visant à évaluer la distribution des


maladies et des facteurs qui y contribuent sur les populations
humaines (exposition, etc.)
• Diagnostique : étude visant à évaluer la capacité d'un test à
discerner les malades des non malades
EPIDEMIOLOGIQUE • Thérapeutique : toute étude systématique d'un médicament chez
l'homme, qu'il s'agisse de volontaires malades ou sains, afin d'en
DIAGNOSTIQUE étudier l'efficacité, les effets secondaires ou la pharmacologie. Il
rentre dans le cadre de la recherche sur la personne humaine qui
THERAPETIQUE englobe tous les essais ou expérimentations organisés et
pratiqués sur l'être humain visant« à étendre la connaissance
PRONOSTIQUE scientifique de l'être humain et les moyens susceptibles
d'améliorer sa condition ». (attention le traitement étudié peut être
l'absence de traitement ou l'arrêt d'un traitement)
• Pronostique : étude visant à répondre à un objectif concernant
l'évolution d'un phénomène de santé (sujets porteurs d'une
affection précise, dont on souhaite déterminer le pronostic et/ou le
devenir)

• Prospectif: le recueil des données se fait avant la survenue de


la maladie = l'évènement survient après l'inclusion
• Rétrospectif: le recueil des données se fait après la survenue
de la maladie = l'évènement survient avant l'inclusion

PROSPECTIVE
Prospectif
ou

<::--�'
RETROSPECTIVE

-❖-------------14 + 1 ►

Début de l'étude

+
0
(.9
LJ.J
a:
(.9 Rétrospectif
LJ.J
a:
= Evènement
CO
0

z
a:
LJ.J
>
en
z
0
fC=
0
LJ.J
@

20
LA« QUESTION » POSEE PAR LES AUTEURS (HYPOTHESE)

• En ouvert : médecin et patient ont connaissance du


médicament administré ( = pas d'aveugle)
• Simple aveugle : le patient ne connaît pas le médicament
AVEUGLE
administré
• Double aveugle: ni le médecin, ni le patient ne connaissent
(= INSU)
le traitement administré
• Avec analyse en aveugle (triple aveugle): la personne qui
réalise les analyses ne connaît pas les traitements administrés

• Longitudinale : l'étude se déroule sur plusieurs semaines,


mois, consécutifs, pendant lesquels on observe la population
étudiée et on recueille les données
• Transversale : l'étude est menée à une date précise où l'on
recueille les différentes données simultanément (maladie,
facteurs de risque, etc.)
• Transversale répétée : on effectue des mesures répétées
d'un paramètre mais on ne suit pas la population au cours du
temps

Longitudinale

LONGITUDINALE ::::, ===============�:::::::=-


ou
TRANSVERSALE 1 ►

Transversale
...

Transversale répétée
....

COMPARATIVE • Comparaison de 2 groupes entre eux


(=CONTROLEE) • Groupe contrôle = placebo ou traitement de référence

MONOCENTRIQUE OU • Monocentrique : l'étude se déroule dans un seul centre


MULTICENTRIQUE • Multicentrique : l'étude se déroule dans plusieurs centres

21
iKB LECTURE CRITIQUE D'ARTICLE

• Sur échantillon : on définit dans une population cible de


l'étude, et on en prend un échantillon. Il faut que cet
SUR ECHANTILLON OU échantillon soit représentatif de la population cible pour
SUR POPULATION pouvoir conclure
EXHAUSTIVE • Sur population exhaustive : toute la population cible est
étudiée (par exemple registre de mortalité)

• Randomisation : attribution d'un patient à un groupe de


manière aléatoire, liée au hasard. Cela permet d'obtenir 2
groupes comparables sauf sur le facteur étudié
RANDOMISEE
• Non randomisée : les groupes ne sont pas formés par tirage
ou au sort, ils ne seront donc pas parfaitement identiques au
NON RANDOMISEE
début de l'étude. Il faudra donc apparier ou ajuster les
résultats pour les analyser

Groupes parallèles : chaque groupe reçoit un traitement


différent de l'autre groupe, et les groupes sont suivis en
même temps

EN GROUPES • En cross over : chaque groupe constitue son propre témoin


PARALLELES
après une période de « wash-out »
ou
EN CROSS OVER
A B


B A

[ « Wash-out » ]

• En intention de traiter : tous les patients randomisés sont


inclus dans l'analyse et sont analysés dans leur groupe de
randomisation, même s'ils n'ont pas reçu le bon traitement ou
mauvaise dose, ...

• Per protocole : les patients ne sont analysés que s'ils ont


reçu le bon traitement à la bonne dose dans le bon groupe
ANALYSE DES
0 (i.e. dans le respect du protocole de l'étude)
(.9
LJ.J
DONNEES
a:
(.9

LJ.J
• Analyse en traitement reçu : on analyse les patients s'ils ont
a:
CO
0
reçu le bon traitement à la bonne dose mais pas forcément
dans leur groupe de randomisation (c'est-à-dire que si un
z
a:
LJ.J
patient du groupe A a reçu le traitement B à la bonne dose il
> sera analysé comme patient du groupe B). Les perdus de vue
en
z
0 ne sont pas analysés.
fC=
0
LJ.J
@

22
LA« QUESTION » POSEE PAR LES AUTEURS (HYPOTHESE)

Moyen mnémotechnique
Quelle est le type d'étude ? (pour une étude thérapeutique)

L'ESCARPIN

• L : longitudinale (vs transversale)


• E : essai thérapeutique
• S : supériorité (vs non-infériorité)
• C : contrôlée ou non
• A: aveugle
• R : randomisée ou non
• P : prospective (vs rétrospective)
• 1 : intention de traiter (vs per protocole)
• N : numéro de phase (de I à IV)

li IDENTIFIER L'OBJECTIF DE L'ETUDE

OBJET ============ > EVALUATION D'UNE PROCEDURE DIAGNOSTIQUE

Objectif �ossible Critère Schéma ex�érimental

Evaluer la fiabilité d'une procédure Reproductibilité Transversal comparatif avec


diagnostique (précision) Variabilité répétition de mesure

Evaluer la validité d'une nouvelle Efficacité/Utilité Transversal comparatif


procédure diagnostique par rapport (ex: efficacité d'un nouveau test (comparaison avec test de
au test de référence (gold standard) diagnostique) référence)

Comparer plusieurs procédures


Sensibilité/Spécificité Etude contrôlée randomisée
diagnostiques

Comparer les performances d'une Stratégie


procédure diagnostique donnée sur (ex: évaluation de l'efficacité/utilité Etude contrôlée randomisée
plusieurs populations d'un dépistage)

OBJET ============ > EVALUATION D'UN PROGRAMME DE DEPISTAGE

Objectif �ossible Critère


Evaluer l'efficacité d'un programme Sensibilité
de dépistage (probabilité qu'un test soit positif si le patient est malade)

Evaluer le coût-efficacité d'un


Hors programme ECNi
programme de dépistage

23
iKB LECTURE CRITIQUE D'ARTICLE

( '
Comparaison entre programme de dépistage et procédure diagnostique

PROGRAMME DE PROCEDURE
DEPISTAGE DIAGNOSTIQUE

REALISATION Avant un test diagnostic Après un test de dépistage


CIBLE Une collectivité Un individu
SUJET Apparemment sain Malade
PRECISION Mauvaise (sensible) Bonne (spécifique)
COUT Faible Elevé
N'aide pas la décision Débouche sur une décision
CONSEQUENCE
thérapeutique thérapeutique

OBJET ============ > ESTIMATION D'UN PRONOSTIC

Objectif �ossible Schéma ex�érimental

. Etudier l'évolution d'une pathologie chez Maladie fréquente


Etude contrôlée randomisée ou suivi de cohorte
un groupe de malade donné
0 Récidive, poussées
0 Corn plications
0 Survie
Maladie rare
. Identifier un facteur pronostique
Etude cas-témoins

OBJET ============ > ENQUETE EPIDEMIOLOGIQUE (SAUF META ANALYSE)

� Objectif �ossible Critère Schéma ex�érimental


Suivi de population
Incidence
(suivi de cohorte ou registre)
Descriptive Caractériser une population
Transversal
Prévalence
0
(.9
(sur échantillon représentatif)
LJ.J
a: Phénomène contrôlable fréquent
(.9

LJ.J
a: Etude contrôlée randomisée
CO
0 Phénomène non contrôlable fréquent
De causalité
z Déterminer un facteur causal Facteur de risque Suivi de cohorte (exposés/non
a: Etiologique
LJ.J
> exposés)
en
z Phénomène rare
0
fC= Etude cas-témoins
0
LJ.J
@

24
LA« QUESTION » POSEE PAR LES AUTEURS (HYPOTHESE)

OBJET ============ > EVALUATION D'UN TRAITEMENT

� Objectif [10SSible Critère Schéma ex1::1érimental


Essais de su1::1ériorité
Comparer le traitement par Montrer qu'un traitement est
.
rapport à: supérieur à un autre

Efficacité
.
Un placebo
Un traitement de Pharmacologique
Etude contrôlée randomisée
Essais d'éguivalence
référence Clinique Montrer que la différence
d'efficacité entre 2 traitements est
négligeable
Comparer deux stratégies
Etude contrôlée randomisée
thérapeutiques
Etudier les caractéristiques
Sécurité .
d'un traitement Pharmacologique Etude contrôlée randomisée ou

.Pharmacologiques
Toxicologiques
Clinique suivi de cohorte

-----------------------------------------------------------------------------------------,
Phases d'un essai thérapeutique

Population
Phase Essai Objectifs
Type Effectif
■ Tolérance (dose maximale
Sains Petit Ouvert non tolérée)
1
Volontaires échantillon contrôlé ■ Toxicité
■ Pharmacocinétique
■ Effet thérapeutique (indications
possibles)
Malades Petit
Il Ouvert non ■ Pharmacodynamique
échantillon
contrôlé (posologie optimale)
■ Recherche d'effets secondaires

Randomisé ■ Essai clinique proprement dit


Contrôlé ■ Confirme les résultats de la
(placebo, phase 2 dans une grande
Malades Grand traitement population avec une plus
Ill
échantillon de grande valeur statistique
référence) ■ Efficacité comparative
Double ■ Toxicité
aveugle ■ Rapport bénéfice/risque

■ Pharmacovigilance
Après AMM
recensement des effets
Malades Population Après
IV secondaires
générale commerciali ■ Recherche de nouvelles
sation
indications
-----------------------------------------------------------------------------------------'

25
iKB LECTURE CRITIQUE D'ARTICLE

0
(.9
LJ.J
a:
(.9
J,
LJ.J
a:
CO
0


z
a:
LJ.J
>
en
z
0
fC=
0
LJ.J
@

26
Chapitre
6

OBJECTIF PEDAGOGIQUE N ° 3

Les objectifs du CNCI pour l'iECN


ANAL YSER LA METHODOLOGIE

Population étudiée
• Identifier les caractéristiques (données démographiques) de la population étudiée, à
laquelle les conclusions pourront être appliquées

MOTS-CLES et REFLEXES GENERAUX

• Population cible/source/ échantillon représentatif


• Critères d'inclusion
• Critères d'exclusion
• Extrapolabilité

27
iKB LECTURE CRITIQUE D'ARTICLE

n DEFINITIONS

Dans l'idéal, les populations devraient être représentées comme sur ce schéma :

Population-cible
(= En théorie)


--E_c_h_a_n_ _t il_ol _n_ d_ e_l'_é_tu_d_e_�

BIAIS

En pratique, les biais rendent impossibles ce schéma idéal mais les études tentent de s'en
rapprocher au maximum.
Parfois, les conclusions de l'étude ne sont pas généralisables à la population cible. Dans ce
cas, les résultats issus de l'échantillon de l'étude ne sont pas extrapolables à la population
cible théorique.

. Population à laquelle les résultats d'une étude pourront a


POPULATION CIBLE priori(= théoriquement) être étendus
q Population théorique

POPULATION
. Population d'où l'échantillon est issu
q Population théorique, décrite par les critères d'inclusion, de
SOURCE
0
non-inclusion et d'exclusion (cf. objectif 4)
(.9
LJ.J
a:

.
(.9

LJ.J
a:
CO ECHANTILLON DE Individus réellement inclus dans l'étude
L'ETUDE
0
q Population réelle ; description faite dans le tableau 1
z
a:
LJ.J
>
en
z
0
fC=
0
LJ.J
@

28
IDENTIFIER LES CARACTERISTIQUES (DONNEES DEMOGRA PHIQUES) DE LA POPULATION ETUDIEE

-,
Définition d'une « population »
Ensemble d'unités, le plus souvent des personnes, définies sur des critères précis.

Définition du terme « données démographiques »


Données relatant l'étude quantitative d'une population et de sa dynamique
• Age
• Sexe
• Activité
• Localisation
• Natalité et mortalité, nuptialité (conjugalité)
• Migration, etc.
-------------------------------------------------------------------------------------�

n COMMENT REPONDRE?

Comprendre l'objectif n° 3

CARACTERISft ES /'· définition


\ _
1 Jl..'.:..............................................................................1
:···························································: ························
« Identifier lesjcaractéristiques\ 1 (données démographiques) 1

df ia population étudié�: ; ;;���;;�: ;����nclusions pourront être • ppli��;;�;;���:


_ . _
__ __ . ..
.. .
.....

.
.. . ..... .....
. .
= POPULATION CIBLE
L'objectif n° 3 est d'identifier les caractéristiques de la population cible incluant des
critères démographiques

29
iKB LECTURE CRITIQUE D'ARTICLE

.
L'information est indiquée dans :
OU TROUVER
L'INFORMATION ? . Les méthodes
Les résultats => « Tableau 1 » +++

Tableau descriptif de la population étudiée

.
Deux intérêts :
Vérifier la comparabilité entre population étudiée et
population cible :
- Conséquences :
0 Populations comparables: extrapolation possible des
résultats
0 Populations non comparables: pas d'extrapolation
possible des résultats
INTERPRETATION - Lien avec la validité EXTERNE de l'étude
DU
« TABLEAU 1 » . Vérifier la comparabilité initiale des groupes :
- S'effectue« à vue d'œil », pas de réalisation de test
statistique (risque d'inflation du risque alpha dans l'étude) :
0 Si la randomisation a été bien menée et qu'il existe
une différence sur une des caractéristiques, alors
cette différence est due au hasard
0 Si la différence est majeure, elle peut entraîner un
biais de sélection
- Lien avec la validité INTERNE de l'étude

Il ETUDE MONO ou MULTl CENTRIQUE ?

Monocentrique Multicentrique
- Meilleure
représentativité de la
population générale
- Evite l'effet centre - Augmente la
Avantages - Plus facile à mettre en puissance
AVANTAGES -
œuvre Diminue le temps
ET
d'inclusion des
INCONVENIENTS patients
- Faible représentativité
- Faible nombre
Inconvénients d'inclusions - Risque d'effet centre
- Temps long de

.
0
(.9 recrutement
LJ.J
a:
(.9 Biais introduit dans une étude à cause des caractéristiques d'un
LJ.J
a:
CO
0
EFFET CENTRE
. centre investigateur
Il y a effet centre quand l'un des centres investigateurs diffère
z significativement des autres sur un des aspects de l'étude
a:
LJ.J
> (évaluation du CDJ principal, caractéristiques des patients pris en
en
z charge, etc.)
0
fC=
0
LJ.J
@

30
Chapitre
7

OBJECTIF PEDAGOGIQUE N °4

Les objectifs du CNCI pour l'iECN


ANAL YSER LA METHODOLOGIE

Population étudiée

• Analyser les modalités de sélection des sujets, critères d'inclusion et de non


inclusion et d'exclusion

MOTS-CLES et REFLEXES GENERAUX

• Critères d'inclusion, de non-inclusion, d'exclusion


• Biais de sélection
• Représentativité de la population cible

31
iKB LECTURE CRITIQUE D'ARTICLE

■ POPULATION CIBLE ET ECHANTILLON DE L'ETUDE

M
e
Population-cible
-u
,Q)
E
::::,
C (= En théorie)

Q)
E
0

--- c-�- ------------------------------:�p��:------------,�-���:���:::CTION


'­ source

1
,Q)

-n
E
:::,
C:
CRITERES D'INCLUSION
Q) ◄ CRITERES DE NON INCLUSION
E _ç_RITERES D'EXCLUSION

0
0
Echantillon de �
l'étude

� BIAIS DE SELECTION

REPARTITION DE L'ECHANTILLON
EN DIFFERENTS GROUPES
L!)
,◄ HOMOGENES

000
0

,Q)

-n
E
:::,
C:

Différents groupes
Q)
E de l'étude RANDOMISATION BIAIS DE SELECTION
0

·- - - - -

0
(.9
LJ.J
a:
(.9
J,
LJ.J
a:
CO
0


z
a:
LJ.J
>
en
z
0
fC=
0
LJ.J
@

32
ANALYSER LES MODALITES DE SELECTION DES SUJETS

n MODALITES DE SELECTION DES PATIENTS

METHODE DE SELECTION

Sélection Tous les nouveaux patients


consécutive sont soumis aux critères de sélection
Sélection Les patients tirés au sort
aléatoire sont soumis aux critères de sélection
Sélection Un patient sélectionné sur une séquence de X de patients est soumis aux
séquentielle critères de sélection
Tous les patients volontaires
Volontariat
sont soumis aux critères de sélection

LIEU DE SELECTION

.
.
Privé ou public

.
Centre universitaire, régionaux, ...
Type de Hospitalier
Mode d'hospitalisation : ambulatoire, court, moyen ou
structure
long séjour
Ville . Médecins généralistes ou spécialistes
Nombre de .
.
Monocentrique
centres de
recrutement Multicentrique (étude avec une meilleure puissance)

AUTRE

Durée de la
sélection
. Début et fin de la période de sélection

.
.
Qualification Personnel médical

.
de l'individu Personnel paramédical
réalisant la
.
Laboratoire
sélection
Autre

33
iKB LECTURE CRITIQUE D'ARTICLE

Il MODALITES D'INCLUSION, DE NON-INCLUSION ET D'EXCLUSION

DEFINITIONS
. Ensemble de critères qui définissent de façon précise les
caractéristiques des patients qui peuvent entrer dans une
Critères d'inclusion
. étude

.
Doivent tous être i::1résents pour que le patient puisse être inclus
Ensemble de critères ne permettant pas d'inclure certains
Critères de
non-inclusion
. patients
Ces critères ont fréquemment pour but de prévenir d'éventuels

. effets secondaires

.
Doivent tous être absents pour que le patient puisse être inclus

Critères . Ensemble d'éléments définis dans un protocole d'exclusion


Les patients ayant tel ou tel critère ne peuvent pas participer à
d'exclusion
. l'étude (après une inclusion initiale)
Le patient ne doit en présenter aucun

EXEMPLES DE CRITERES
.
.
Age, classe d'âge

CRITERES
. Sexe
Pathologie (Stade, forme clinique, symptomatologie, durée
D'INCLUSION, DE . d'évolution, traitement et son efficacité, etc.)
NON INCLUSION
. Comorbidités, facteurs de risque
ET D'EXCLSUION
. Traitements concomitants

. Prise en charge antérieure

. Hospitalisé ou non

.
Etc.

RISQUES EN CAS
. Difficultés de recrutement et d'inclusion des patients
Population étudiée non représentative de la population cible:
-
.
Baisse de la validité externe de l'étude
D'UN
Homogénéisation de la population étudiée :
NOMBRE TROP
- Renforcement de la validité interne de l'étude
ELEVE
DE CRITERES
D'EXCLUSION
. Objectif:
- Trouver un équilibre sur le nombre de critères d'exclusion, et
donc sur les validités interne et externe de l'étude

0
(.9
LJ.J
a:
(.9

LJ.J
a:
CO
0

z
a:
LJ.J
>
en
z
0
fC=
0
LJ.J
@

34
ANALYSER LES MODALITES DE SELECTION DES SUJETS

ANALYSE DES MODALITES DE SELECTION DES SUJETS, CRITERES


D'INCLUSION, DE NON INCLUSION, ET D'EXCLUSION

QUESTIONS POUR L'ANALYSE D'UN ARTICLE MEDICAL

.
(Conférence de consensus)
La population correspond-elle à la population
EVALUATION D'UN
TRAITEMENT
.
habituellement traitée?
Description précise des critères de sélection, d'inclusion

.
et de non inclusion?

.
Calcul du nombre de sujets nécessaires valide ? (objectif 7)

. La méthode de sélection des sujets est décrite?


Les échantillons sélectionnés sont-ils représentatifs d'une

. population auquel le test sera appliqué ? (objectif 7)

. La population source est-elle définie ?


EVALUATION D'UNE
PROCEDURE . Le lieu de l'étude est-il décrit?
La méthode de sélection de l'échantillon au sein de la
DIAGNOSTIQUE population source est-elle définie?
a. Critères d'inclusion et de non inclusion

. b. Randomisation ou non (objectif 5)


La prévalence de la maladie dans l'échantillon est-elle en
accord avec les données épidémiologiques connues?

QUESTIONS POUR L'ANALYSE D'UN ARTICLE MEDICAL

.
(Conférence de consensus)
Les critères d'inclusion et de non inclusion sont-ils
spécifiés et adéquats?
a. Caractéristiques démographiques
b. Critères diagnostiques, critères de sévérité
ESTIMATION D'UN
PRONOSTIC
. C. Moment de l'inclusion dans le cours de la maladie
Tous les patients sont-ils identifiés au même stade de la
maladie?
a. La définition des stades de la maladie est unanime
b. Les patients sont initialement tous au même stade
C. Le début du suivi doit être le même pour tous les

.
patients
Mode de sélection décrit (critères inclusion, non inclusion, lieu)
?
ARTICLE DE
a. Des cas et des témoins
CAUSALITE
. b. Des exposés/non exposés (cohorte)
Biais de sélection ?

35
iKB LECTURE CRITIQUE D'ARTICLE

BIAIS DE SELECTION
• Biais = erreur systématique non corrigée par la taille de
l'échantillon (opposée aux erreurs dues au hasard, réduites par une
augmentation de l'échantillonnage et inhérentes aux méthodes
statistiques employées) :
DEFINITION a. Biais de sélection
b. Biais de classement
c. Biais de confusion
• Biais de sélection = lié à la formation de l'échantillon de l'étude
et des différents groupes
Biais d'auto-sélection : les patients sélectionnés
Modalités de choisissent s'ils participent ou non à l'étude
sélection
Méthode de sélection par volontariat
Certains de ces critères ne créent-ils pas un biais rendant
Critères d'inclusion, non extrapolable les résultats de l'échantillon à ceux de la
de non inclusion et population cible?
CAUSES d'exclusion
q Baisse de la validité externe
Selon la méthode utilisée, si elle n'est pas validée
Répartition de
l'échantillon de
l'étude en différents NB : La randomisation favorise l'homogénéité des
groupes groupes, et minimise donc les biais de sélection
q Augmentation de la validité interne
• Toute évaluation d'un article médical nécessite une évaluation de
trois points
a. Validités interne et externe de l'étude
CONSEQUENCES b. Cohérence externe
c. Pertinence clinique et représentativité
• Les biais de sélection (comme tous les biais de l'étude) altèrent la
validité interne de l'étude

0
(.9
LJ.J
a:
(.9

LJ.J
a:
CO
0

z
a:
LJ.J
>
en
z
0
fC=
0
LJ.J
@

36
ANALYSER LES MODALITES DE SELECTION DES SUJETS

Définition du terme« Validité interne de l'étude »


Elle correspond à la cohérence interne de l'étude :
• Absence de biais ou prise en compte des biais par les auteurs
• Analyse statistique valide
• Plan méthodologique précis avec une démarche déductive à partir d'une
hypothèse claire

Définition du terme« Cohérence externe»


Elle correspond à la concordance entre les résultats de l'étude et les
connaissances en vigueur :
• Autre étude présentant les mêmes résultats
• Connaissances fondamentales
• Méta analyse
• Analyse statistique valide

Définition du terme« Pertinence clinique et représentativité»


Elle assure que l'étude concerne un critère cliniquement pertinent et que
l'échantillon est représentatif de la population cible.
Les caractéristiques à prendre en compte sont les suivantes :
• Balance bénéfices/risques
• Pertinence du critère de jugement
• Pertinence des interventions comparées
• Pertinence de l'objectif de l'étude
• Pertinence de la taille de l'effet
• Pertinence des patients inclus
• Contexte de soins similaire à celui de la pratique courante
• Rapport coût/efficacité

37
iKB LECTURE CRITIQUE D'ARTICLE

" EXEMPLES TYPES

RECRUTEMENT . Dans une étude si tous les cas inclus sont des cas hospitaliers, on
HOSPITALIER peut penser que ce sont des cas plus graves
. Si les cas recrutés sont des cas prévalents et non des cas
incidents(venant de survenir et dont on vient de faire le
diagnostic) les facteurs associés à la maladie retrouvés dans
l'étude peuvent être associés à une évolution plus longue de la
CAS PREVALENTS
.
maladie et non à sa survenue(« sélection sur la survie»)
Les éventuels facteurs de risques ainsi identifiés peuvent
donc avoir aussi bien une signification étiologique que
pronostique
. Si on choisit des témoins volontaires ou par exemple des
consultants en médecine préventive on peut penser que ce sont
TEMOINS des patients plus soucieux de leur santé qui ne sont pas alors

.
représentatifs de la population générale
Cela constitue un biais de sélection
. Détection(effet de l'exposition sur la détection ; par exemple

.
surveillance des patients sous œstrogènes avec cancer du sein)
Survie sélective(cas prévalents et incidents, les cas prévalents
BIAIS DE SELECTION
.
sont forcément moins graves car ils ont survécus)
EN EPIDEMIOLOGIE
.
D'admission(cas hospitalisés)

.
Travailleurs sains(mortalité inférieure à la population générale)
Perdus de vue

0
(.9
LJ.J
a:
(.9

LJ.J
a:
CO
0

z
a:
LJ.J
>
en
z
0
fC=
0
LJ.J
@

38
Chapitre
8

OBJECTIF PEDAGOGIQUE N ° 5

Les objectifs du CNCI pour l'îECN


ANAL YSER LA METHODOLOGIE

Population étudiée

• Identifier la technique de randomisation et vérifier sa cohérence, le cas échéant

MOTS-CLES et REFLEXES GENERAUX

• Tirage au sort / hasard


• Prise en compte des facteurs de confusion potentiels

'NTERVENTION

CONTROL

39
iKB LECTURE CRITIQUE D'ARTICLE

g GENERALITES SUR LA RANDOMISATION

. Tirage au sort des patients permettant une répartition au

DEFINITION . hasard, aléatoire, des patients dans 2 (ou plus) groupes


C'est donc une allocation aléatoire des sujets dans l'un des
groupes soumis à la comparaison lors de l'analyse

.
La randomisation permet plusieurs éléments :

. Assurer la comparabilité initiale des groupes


Minimiser les biais de sélection
- Sous réserve d'un essai bien mené, la différence observée

. pourra être attribuée au traitement


Prendre en compte l'intégralité des facteurs de confusion
potentiels, et assurer leur répartition uniforme et
équilibrée :
- Contrairement à un ajustement sur certains paramètres, la
OBJECTIFS randomisation répartit aléatoirement dans les groupes
l'ensemble des caractéristiques des sujets, même celles

. auxquelles on ne penserait pas spontanément


Garantir l'imprévisibilité de l'assignation :
- Dans un essai thérapeutique, cela permet à chaque patient
d'avoir la même probabilité de recevoir chaque traitement :
il y a donc égalité des chances, pour tous les patients

. participant à l'essai
Permettre une analyse en ITT des résultats et les analyses
en sous-groupes

. Toutes les études ne se prêtent pas à la randomisation. Pour


pouvoir randomiser il faut être dans le cas d'une étude :
0 Prospective
0 Avec comparaison de 2 ou plusieurs groupes
0 Expérimentale (interventionnelle)
0 Avec respect des règles d'éthique (on ne peut
pas concevoir une randomisation pour étudier
l'impact du délai avant prise en charge d'un

. AVC !!!!)
Il n'est pas pertinent de randomiser une étude :
QUAND 0 Ne comportant qu'un seul groupe (cohorte, étude
RANDOMISER ? transversale)
0 Observationnelle
0 Si l'allocation à un groupe est déterminée par une
0
(.9 caractéristique du patient (étude cas- témoins,
LJ.J
a: exposés-non exposés)
(.9

LJ.J
a:
- Les raisons du choix de randomiser ou non doivent être clairement
CO
0
décrites par les auteurs (non éthique, etc.). On doit trouver cette
z
justification dans la partie méthodologie
a:
LJ.J
>
en
z NB : la randomisation doit avoir lieu juste avant l'inclusion du sujet dans
0
fC= l'étude, et non trop en amont de celle-ci, pour limiter les perdus de vue
0
LJ.J
@

40
IDENTIFIER LA TECHNIQUE DE RANDOMISATION ET VERIFIER SA COHERENCE

n TECHNIQUES DE RANDOMISATION

. Le principe de la randomisation repose sur le tirage au sort des

. patients, qui permet leur allocation dans un groupe


Elle repose sur le principe de la répartition au hasard, permettant

.
la répartition équitable entre les différents groupes
METHODE
On distingue deux types de randomisation :
GENERALE
- Randomisation simple
- Randomisation restreinte (contrôle de certains facteurs) :
stratifiée, par blocs, en clusters, par minimisation

. Pour permettre la randomisation, il faut définir au préalable une

. méthode d'allocation
La meilleure méthode d'allocation d'un traitement est donc une
randomisation:
- Equilibrée (autant de patients dans chaque groupe)
- Centralisée
- En aveugle du protocole de l'étude, par une personne
indépendante qui ne faussera pas le tirage au sort
SEQUENCE DE - Par tables de nombres au hasard ou séquence aléatoire
RANDOMISATION
générée par ordinateur

. Vérifier que la randomisation a été bien réalisée:


- Utilisation du tableau 1
- Pas de différences entre les deux groupes pour chacun des
critères
- Nombre de sujets équivalent dans les deux groupes

. On définit des strates à partir de variables à contrôler,

. généralement des facteurs de confusion potentiels


Cette méthode permet une comparabilité« forcée » pour ces

. facteurs déterminés a priori


Il y a autant de listes de randomisation que de strates
RANDOMISATION
STRATIFIEE
. Objectifs:
- Répartition équilibrée des facteurs entre les groupes
- Dans les essais multicentriques, élimination de l'effet
centre (stratification faite sur le centre)
- Les analyses en sous-groupes prennent tout leur sens
(sous-groupes définis par les strates)

41
iKB LECTURE CRITIQUE D'ARTICLE

• Les sujets, par ordre d'entrée dans l'étude, sont regroupés par
bloc
• Le nombre de sujets dans chaque bloc doit être un multiple
du nombre de traitements
• Chaque bloc est alors soumis à un scénario d'assignation
• Les scénarios sont faits de manière à ce que les traitements
soient équitablement représentés (dans un bloc de 4 qui étudie 2
traitements chaque traitement apparaîtra 2 fois)

• Par exemple : on étudie 2 traitements A et B et on décide de faire

---- ----
une randomisation par bloc de 4. Tous les 4 patients 2 recevront
le traitement A et 2 le traitement B, avec des ordres variables à

---- ----
chaque groupe de 4 AABB ou ABAB ou ABBA .....

RANDOMISATION PAR
BLOC
• Intérêts:
- garantir un équilibre entre la taille des différents groupes
- garantir un équilibre au cours du temps (élimine l'effet-
temps)

• Cependant cette méthode expose au risque de prévisibilité par


l'investigateur de l'affectation d'un patient à la fin de chaque
bloc:
- Risque de biais de suivi
- Risque de biais de sélection
• Pour y remédier:
- Taille des blocs doit être inconnue de l'investigateur
- Utilisation de blocs de taille variable (le nombre de patients
change à chaque nouveau bloc)

• Des groupes entiers de sujets sont randomisés de façon


aléatoire dans un des bras de l'étude:
- Cette méthode est donc à opposer à la randomisation
individuelle où les sujets sont répartis un par un
• Les groupes ne sont souvent pas créés par les investigateurs de
l'étude mais préexistent (lieu de résidence, médecin qui a inclus
RANDOMISATION EN
le patient, centre, etc.)
CLUSTERS
• L'avantage principal est le contrôle de la contamination entre
(= EN GRAPPE)
les bras ou les sujets de l'étude
- Un sujet va recevoir le placebo à la place du traitement à
l'étude, ou inversement (contamination entre les bras)
- Le changement de comportement d'un sujet peut influencer
les autres (contamination entre les sujets)
0
(.9
LJ.J
a:
(.9

LJ.J
a:
CO
0

z
a:
LJ.J
>
en
z
0
fC=
0
LJ.J
@

42
IDENTIFIER LA TECHNIQUE DE RANDOMISATION ET VERIFIER SA COHERENCE

• C'est une randomisation par stratification particulière :


A chaque nouveau patient, l'investigateur choisit le groupe auquel
il sera alloué
• Surtout pour les études de faible effectif
RANDOMISATION • Intérêts :
PAR MINIMISATION Minimiser les biais
Permettre une égalisation dynamique entre les groupes
Assurer une comparabilité maximale entre les groupes
Assurer une stratification sur certains facteurs

• Impossibilité pour l'investigateur de prédire le groupe dans lequel


le patient sera inclus, au moment où il l'inclut
• Concept différent de l'aveugle :
L'assignation secrète est toujours possible, pas l'aveugle !
ASSIGNATION
SECRETE Comment assurer l'assignation secrète ?
• Investigateur n'a pas accès à la liste de randomisation
CLAUSE • Randomisation centralisée
D'INGORANCE
• Blocs de taille variable
• Enveloppes scellées et opaques
• Containers opaques pour les traitements (eux-mêmes identiques en
tous points de vue)

43
iKB LECTURE CRITIQUE D'ARTICLE

0
(.9
LJ.J
a:
(.9
J,
LJ.J
a:
CO
0


z
a:
LJ.J
>
en
z
0
fC=
0
LJ.J
@

44
Chapitre
9

OBJECTIF PEDAGOGIQUE N ° 6

Les objectifs du CNCI pour l'iECN


ANAL YSER LA METHODOLOGIE

Population étudiée
• Discuter la comparabilité des groupes soumis à la comparaison

MOTS-CLES et REFLEXES GENERAUX

• Comparabilité initiale, en cours d'étude et finale (analyse)


• Randomisation
• Double aveugle
• ITT
• Analyse du Tableau 1
• Biais

Il GENERALITES
• La question de la comparabilité des groupes est primordiale
• Il s'agit d'un critère de qualité d'une étude comparative
• La comparabilité des groupes à l'étude doit :
être présente à l'inclusion
être maintenue tout au long de l'étude
être maintenue lors de l'analyse finale

GENERALITES • La comparabilité des groupes permet de limiter les FACTEURS DE


CONFUSION (=> biais de confusion)

• La non-comparabilité initiale peut entraîner un biais de SELECTION


• Au cours du suivi, la perte de comparabilité peut entraîner un biais
d'EXECUTION ou un biais de CLASSEMENT
• Lors de l'analyse, la non-comparabilité peut entraîner un biais de
MESURE ou un biais d'ATTRITION

45
iKB LECTURE CRITIQUE D'ARTICLE

SCHEMA
D'UNE
ETUDE
Patients
éligibles
FLOW
CHART
... Patients
�, exclus
Patients
inclus

Groupe Groupe
A B
s
u
1
Perdus de Perdus de
vue V vue
1

Patients Patients
analysés analysés

• COMPARABILITE A L'INCLUSION

• Elle repose sur la randomisation (cf. objectif 5) :


Répartition aléatoire et équitable de divers facteurs (en
particulier de potentiels facteurs de confusion) entre les
différents groupes
• Cela permet de limiter le risque de biais de sélection
• Cependant il se peut parfois, que par l'effet du hasard, les
groupes ne soient pas comparables pour un ou plusieurs
facteurs:
RANDOMISATION Quel groupe est touché ?
Cette différence est-elle importante ?
0
(.9
LJ.J
• C'est pourquoi il faut TOUJOURS que les 2 groupes soient
a:
(.9 comparés dans un tableau sur leurs caractéristiques
LJ.J
a: importantes et qu'il n'y ait pas de différence significative entre
CO
0 les groupes:
z Comparaison « à vue d'œil »
a:
LJ.J
> Pas de tests statistiques (risque d'inflation du risque alpha)
en
z
0
fC=
0
LJ.J
@

46
DISCUTER LA COMPARABILITE DES GROUPES SOUMIS A LA COMPARAISON

• Analyse des caractéristiques initiales des patients


• Ce sont les données démographiques et cliniques à l'inclusion
• Cette information se trouve la plupart du temps dans le
TABLEAU 1 d'un article, qui décrit la population étudiée
• En pratique la comparabilité ne REPOSE PAS sur des tests
VERIFICATION DE LA statistiques mais sur le bon sens et la connaissance de la
COMPARABILITE pathologie étudiée = vérification « à vue d'œil »

• En cas de différence :
Quel groupe est concerné?
La différence est-elle importante (risque de biais de
sélection)?

• COMPARABILITE EN COURS D'ETUDE

• Le maintien de la comparabilité des groupes au cours de


l'essai est assuré par le double aveugle
Cela limite le biais de classement
En cas d'essai en ouvert (absence d'aveugle), le maintien
de la comparabilité entre les groupes est perdue
• La comparabilité des groupes au cours de l'étude peut se
vérifier sur le diagramme de flux (nombre de perdus de vue
notamment)

Technique du double placebo :


• Permet le maintien de l'aveugle quand impossible de faire
deux médicaments identiques
AVEUGLE • Quatre groupes de patients :
Traitement A + Traitement B
Traitement A + Placebo B
Placebo A + Traitement B
Placebo A + Placebo B

Rôles du groupe contrôle :


• Permet de minimiser le biais de confusion
• Reçoit un placebo ou le traitement de référence
• Conditions d'utilisation d'un placebo :
Pas de traitement de référence
Pas de perte de chance (sinon, pas éthique)

47
iKB LECTURE CRITIQUE D'ARTICLE

Il COMPARABILITE FINALE (analyse)

Biais d'exécution :
• Les groupes doivent rester comparables tout au long de
l'étude, jusqu'au recueil du critère de jugement principal sinon
on parle de biais d'exécution :
Ecart au protocole
Traitements concomitants différents dans les 2 groupes
Prise en charge différente
Etc.
AUTRES ELEMENTS
CLES Biais d'exclusion :
• Dans la plupart des études il existe des critères d'exclusion
des patients dus à des raisons éthiques, à des raisons de
faisabilité de l'analyse, etc.
• Si ces critères excluent de nombreux patients il est
nécessaire de vérifier que les caractéristiques des patients
analysés ne sont pas différentes des caractéristiques des
patients exclus
On parle de biais d'exclusion

• La comparabilité finale des groupes est assurée par l'analyse


en intention de traiter (ITT)
Tous les patients randomisés sont analysés
Tous les patients sont analysés dans le groupe dans
lequel ils avaient été randomisés, quel que soit le
traitement finalement reçu
Les perdus de vue sont inclus dans l'analyse
ANALYSE EN ITT • Permet la limitation du biais d'attrition (biais de sélection)

• En cas de données manquantes liées aux perdus de vue :


Hypothèse du biais maximum : on alloue le pire résultat
possible aux perdus de vue
LOCF (Last Observation Carried Forward) : prise en
compte du dernier résultat connu pour le critère de
jugement principal

0
(.9
LJ.J
a:
(.9

LJ.J
a:
CO
0

z
a:
LJ.J
>
en
z
0
fC=
0
LJ.J
@

48
DISCUTER LA COMPARABILITE DES GROUPES SOUMIS A LA COMPARAISON

" NON COMPARABILITE ENTRE LES GROUPES

. Si les groupes ne sont pas comparables, on ne pourra pas


conclure à la fin de l'étude :
- on ne pourra pas dire que la différence mesurée est due
au traitement du fait des différences entre les populations
CONSEQUENCES
des groupes

. Les facteurs pour lesquels les groupes ne sont pas


comparables sont des facteurs de confusion amenant des
BIAIS DE CONFUSION

. Appariement sur le ou les facteurs de confusion potentiels :


- pour chaque cas on associe un ou plusieurs témoins qui
lui sont similaires pour un ou plusieurs facteurs (âge, sexe,
tabagisme, etc.)
- il se fait en amont de l'analyse

. Ajustement (a posteriori) sur les facteurs de confusion :


- au moment de l'analyse, en utilisant des tests statistiques
spécifiques
- on retrouve alors les termes d'analyse « univariée » ou
« multivariée » selon que un ou plusieurs facteurs ont été
pris en compte (dans les résultats on donne toujours le
MOYEN DE LUTTE EN plus ajusté).
CAS DE NON-
COMPARABILITE . Stratification :
- de la randomisation (pour agir pendant la constitution des
groupes, en amont)
- de l'analyse : répartition d'un échantillon en différents
sous-groupes (= strates), en fonction d'une ou plusieurs
caractéristiques (au sein de chaque strate, les individus
sont homogènes pour la ou les caractéristiques prises en
compte)

. Restriction de l'analyse :
- au moment de l'analyse
- on ne réalise l'analyse que sur une sous population
homogène pour le facteur de confusion

49
Stratégie et méthodologie
pour réussir les QCM à l'ECN

Avec l'arrivée du nouveau concours de l'ECN, un chan­


gement profond des modalités d'examen a été effectué.
Les sujets tombés au premier concours de l'iECN ont été
Cardiologie/ Dermatologie/ Gériatrie / Hépato-gastro­ une grande surprise, tant dans les dossiers que dans les
entérologie/ Imagerie médicale/ Néphrologie/ Neurologie/ questions isolées.
ORL, Stomatologie, Chirurgie maxillo-faciale / Orthopédie / Afin de permettre un entraînement optimal, la collection
Pédiatrie / Psychiatrie / Santé publique, Médecine du « Training Book QCM » a été créée afin de couvrir les
travail / Urgences médico-chirurgicales questions tombables de la spécialité, mais surtout
dans le but de donner une STRATEGIE et une METHO­
DOLOGIE pour répondre aux QCM sans parfois même
avoir la connaissance.
TRAINING
BOOK�
En effet, comme en PAGES, la différence ne se fait pas
forcément en termes de connaissances, mais en termes
de stratégie de réponses. De nombreux étudiants ayant
moins de connaissances réussissent mieux les QCM
seulement parce qu'ils arrivent à éliminer certaines pro­
Stratégie et méthodologie pour réussir les QCM à l'ECN positions avec différentes astuces et que celles-ci leur
25 Dossiers QCM et 375 Questions isolées« tombables,. permettent d'accélérer leur temps de réponse.
C'est ainsi que la collection « Training Book QCM » a été

Hépato-Gastro créée pour vous apprendre à maîtriser ces astuces afin


de faire la différence le jour J. Pour faciliter la mémorisa­
Entérologie tion, celles-ci ont été présentées sous forme d'icônes
0 Déduction
Vincent DAUNY
é' Formulation
� Argument de fréquence
Stratégie, méthodologie al astuces QCM pour répondra
aux QCM sans parfois même avoir la connaissance.
X Eliminer les incorrectes
lc:8nes rapèn,s O ,i ,o X [il III
Un tour complot de la spéclallt6 en [] 1 "' idée
- Dossiers QCM tumbables
- Questions Isolées tumbables
W Connaissances
Ainsi, avec cette collection, vous pourrez faire le tour
complet du programme en dossiers QCM et en ques­
tions isolées, et vous assimilerez les astuces pratiques
VG QCM pour répondre aux QCM sans parfois même avoir
Editions
la connaissance.

__ __
_
:t===::.-=- -:= -· _... ------·
___,
.........__ -
_;. .,_,.., ,_.,,-....

_,_,_
__ ____. _.,__
.... ,__
- <IIC,•-"-"""·
c:
..·-·-·-� ..-·
'"'"".,._,.�a,.,,_
•J■,.,._""" ____,._ __..
•--
ŒIO


T"�:.:;:-�.;.�..-:-=.!..
&��-�
;_-- -·-
1
1

r�.....-�_______
1 -�...:.. -_..,__

_______ · :���:z�-=-1
atllt .,....,:::;----------

-· __-·------""'-
-
.,
_,_,__ ...

-·-----·--
""'' ,
•C_..,_ ..___ ,....,,_
..•
'1::::::-- __:.:.-:=
_ :=::.1
.
1 <':::::::=-- 1
•":'ë':::.�
' -............ ____

·--��
-----�·---
1
--.:-..;=:,___
1
_ ,_
.... ...
_ ,..___A ......___,.... __
Chapitre
10

OBJECTIF PEDAGOGIQUE N ° 7

Les objectifs du CNCI pour l'iECN


ANAL YSER LA METHODOLOGIE

Population étudiée

• Discuter l'évolution des effectifs étudiés et leur cohérence dans la totalité de


l'article ; savoir si le calcul du nombre de sujets nécessaires a été effectué a priori

MOTS-CLES et REFLEXES GENERAUX

• Calcul NSN en fonction de a ; 13 ; puissance


• Analyse du flow chart

• LE FLOW CHART - SUIVI DES EFFECTIFS

• On parle aussi de diagramme de flux


• Il s'agit d'un organigramme
• Il renseigne sur les effectifs aux quatre étapes principales de l'étude :
Recrutement des patients (représentativité de la population -
validité externe de l'étude)
Allocation des traitements (randomisation)
Suivi au cours de l'étude (perdus de vue)
FLOWCHART Analyse (détermination du type d'analyse effectuée : ITT, per­
protocole, en traitement reçu)
• Il permet de connaître rapidement le nombre de patients inclus,
l'équilibre des groupes, le nombre d'exclusions, d'arrêt d'étude ou de
retrait
• La réalisation de ce diagramme est régit par les Recommandations
CONSORT

51
iKB LECTURE CRITIQUE D'ARTICLE

r
Asses cd for ellglblllty (n =... }

Excluded ( n =...}
Not meeting Inclusion criterla (n = ...}
Decllned to pa rticipa te (n = ...)
Others reasons (n =... )

Randoml1ed (n =...)

FLOWCHART
i
Allocated to Intervention (n = ...} Allocated to Intervention (n =...)
Received ail ocated Intervention (n

00
R elved allocated Intervention
Recommandations (n =... } = ...)
CONSORT Old not recelve allocated Old not recelve allocated
Intervention (give 1 nterventlon (gl\'I!
reasons) ( n =... ) reasons) (n= ...)

!
[I]
Lo t to follow (glve reasons} ( n = ...) Lost to follow (give reasons} (n = ...)
O1.scontln ued Interventlon (glve O1.scontln ued Intervention (glve
-

œ
reasons} ( n =... ) reasons) (n= ...)

i
Analyzed (n =... ) Analyzed (n =... }
Excluded from analysl.s (gl\'I! Excluded from analysls (gl\'1!
reasons} ( n =... ) reasons} (n= ...)
-

" EVOLUTION DES EFFECTIFS

• Initialement :
Calcul du nombre de sujets nécessaires pour atteindre une
puissance donnée
A priori
EVOLUTION DES • Au cours de l'avancée de l'étude, évolution possible des
EFFECTIFS
effectifs due :
Aux perdus de vue++
Aux sortis d'étude
Au non respect de l'intention de traiter
0
(.9
LJ.J
a:
(.9

LJ.J
a:
CO
0

z
a:
LJ.J
>
en
z
0
fC=
0
LJ.J
@

52
DISCUTER L'EVOLUTION DES EFFECTIFS ETUDIES ET LEUR COHERENCE DANS LA TOTALITE DE L'ARTICLE

Définition :
• On considère comme perdus de vue les sujets dont le CDJ
principal n'a pas pu être recueilli
• Les sortis d'étude sont des patients pour lesquels le CDJ est
disponible mais qui n'ont pas été pris en compte dans
l'analyse

Place dans les études :


• On considère qu'un taux de perdus de vue est acceptable
jusqu'à 10% des effectifs initiaux :
PERDUS DE VUE Au-delà, il existe un trop grand risque de biais de
sélection
• Le nombre de perdus de vue doit être équilibré entre les
différents bras de l'étude :
Sinon, risque de biais de classement différentiel
• Les perdus de vue doivent si possible être pris en compte
dans l'analyse (analyse en ITT)
o Hypothèse du biais maximum
o LOCF
Sinon, risque de biais d'attrition (fait partie des biais de
sélection)

Il CALCUL DU NOMBRE DE SUJETS NECESSAIRES

• Abréviation = NSN
• Définition = nombre de sujets minimal qui garantit à
l'étude une puissance statistique donnée concernant le
critère de jugement principal
• Pour un essai clinique il doit obligatoirement figurer dans
l'article
• Il doit être calculé a priori, c'est-à-dire avant de débuter
DEFINITION
l'étude
• Les éléments du calcul doivent être référencés
• Le calcul du NSN permet également :
D'estimer le nombre attendu (maximal) de perdus de
vue (NSN = nombre de sujets à inclure - PDV)
De réduire le coût et la durée de l'étude (pas de
recrutement superflu de patients)

53
iKB LECTURE CRITIQUE D'ARTICLE

.
Les éléments nécessaires sont les suivants:
Le risque a:
- Risque de première espèce
- Probabilité de conclure à une différence entre les
traitements alors qu'il n'y en a pas

.
- Fixé à 5 % par convention
Le risque f3 (ou la puissance P = 1 - 13)
- Risque de deuxième espèce
- Probabilité de ne pas conclure à une différence alors que
cette différence existe

.
- Le plus souvent entre 5 et 20 %

. Taille � de la différence à mettre en évidence


La dernière variable dépend du type de critère de jugement
PARAMETRES DU principal:
CALCUL - CDJ principal quantitatif : variance
- CDJ principal qualitatif: risque de base

.
Les autres éléments à i::1rendre en comi::1te:

. Le caractère unilatéral ou bilatéral du test statistique

. Le type d'étude (supériorité, non-infériorité, équivalence)

. Le nombre de groupes comparés

. Le plan de l'étude

. La durée de l'étude
Le nombre de perdus de vue attendu

NB : plus la taille de l'effet à mettre en évidence est petite, plus le nombre


de sujets nécessaires est élevé ; de même si l'incidence du critère de
jugement principal est faible

CALCUL DU NSN . Le calcul n'est pas à connaître pour les ECNi

0
(.9
LJ.J
a:
(.9

LJ.J
a:
CO
0

z
a:
LJ.J
>
en
z
0
fC=
0
LJ.J
@

54
Chapitre
11

OBJECTIF PEDAGOGIQUE N ° 8

Les objectifs du CNCI pour l'iECN


ANAL YSER LA METHODOLOGIE

Méthodes
• S'assurer que la méthode employée est cohérente avec le projet du travail et qu'elle
est effectivement susceptible d'apporter « une » réponse à la question posée dans
l'introduction

MOTS-CLES et REFLEXES GENERAUX

• Observationnelle ou expérimentale
• Supériorité / non infériorité
• Cas-témoins / exposés-non exposés

Il DIFFERENTS TYPES D'ETUDE

• A chaque type de question posée, à chaque objectif


correspond une méthode de référence
• Pour apporter« une réponse» à la question posée dans
l'introduction il faut utiliser la meilleure méthode
• La mise en œuvre de la méthode ainsi que sa rigueur
scientifique sont également importantes
GENERALITES • Pour avoir un niveau de preuve élevé il est nécessaire de
conduire une étude
a. Expérimentale
b. Prospective
c. De forte puissance
d. Randomisée
e. Contrôlée

55
iKB LECTURE CRITIQUE D'ARTICLE

• La principale différence entre ces 2 types d'études est le


contrôle ou non de tous les paramètres

Etude observationnelle :
• On utilise une étude observationnelle quand tous les
paramètres ne peuvent pas être contrôlés par
l'investigateur de l'étude, pour des raisons de faisabilité ou des
raisons éthiques.
Par ex : on ne peut pas contrôler le tabagisme
OBSERVATIONNELLE • Dans le cas d'une étude observationnelle le lien de causalité
OU EXPERIMENTALE ? ne pourra donc pas être démontré, il reposera sur un
faisceau d'arguments

Etude expérimentale :
• Dans une étude expérimentale on contrôle l'intégralité des
paramètres, les patients sont randomisés selon l'intervention
réalisée et les autres paramètres sont répartis équitablement
dans les 2 groupes
• L'imputabilité causale peut donc être revendiquée

Tahfean Il. Type de protoooteprererentiellemeot proposé ponr mie question donnée (à titre indicatif).
QlESTIONi PROTOCOLE
ÉPIDÉMIOI..OOŒ fucidenœ Suiv.i de population (suivi de cohorte on registre),
ÉPIDÉMIOI..OOŒ Pre"� Tnmri.ra:sal (= écb@lilkm représe:ofafü)
THBR.I\PEUTIQUE Efficacité Étude comrôJée raœ.omiœe
'IHBRAPElJTIQUE Séourité Êtude confrôJée ran.domisée ou stmi:i de cohone
DIAGNOSTIC Reprodm.ctibilité.Nariabilifé Tra:im.'el!"sal rn�ati.favec répétition de merure

DIAGNOSTIC SensibilitélSpéc.ificité Tnms:versai c.on:parahl'a,;-ec étakm-or


I
1 D AGNOSTIC Efficacité/Utilité Etude c.o:ntrôJée raœ.omiœe
QUESTION
DIAGNOSTIC Stratégie Étude colllrolée randomisée 011 arbre dêcisiomel
=
1 CAUSAI11É Phéno.mène oont:rôl\ible fréqnem Êtude confrôJée raDl.omisée
METHODE CAUSAI11É Phénomène non oontmhble fi"équent Suivi de •comne (exposés/oon e.,ipos:és)
CAUSAI11É Phénorœœ rare Étude cas-,témoin
PRQ"l•l"OSTIC Maladie fréquenfe Êtmie contrôlée randomisée ou sim� de cohOife
PRONOSTIC Maladie mre Étude cas-it�

Ransr.que : Dtistoire llillliUrelle d'une mall!iœE!' pomra être appréœ de la même mmièœ qu.e lei factl!W:!I p:ronos:tiqne5. u dépkt:age'
est apprécié OO:lllllll!, �s te,,"13 diagn.oslliqu.es.
0
(.9 Source : « Guide d'analyse de la littérature et graduation des recommandations », ANAES,
LJ.J
a:
(.9 2000
LJ.J
a:
CO
0
z
a:
LJ.J
>
en
z
0
fC=
0
LJ.J
@

56
S'ASSURER QUE LA METHODE EMPLOYEE EST COHERENTE AVEC LE PROJET DU TRAVAIL

• Plusieurs paramètres doivent être pris en compte pour le choix


de la méthode au moment de mener une étude
Le niveau de preuve que l'on souhaite obtenir;
La faisabilité (coûts, organisation, centres participants,
PARAMETRES A
données manquantes) ;
PRENDRE EN COMPTE
L'éthique.
• Il faudra ensuite également respecter les points-clés
propres au protocole choisi pour mener l'étude.

n ARBRES DECISIONNELS

L'exposition au facteur est-elle contrôlée par


l'expérimentateur ?

Etude Etude
expérimentale observationnelle

/
Obj = évaluer
1
Obj = évaluer Obj =
1
Obj = déterminer un facteur
si un si un déterminer si de risque ou un facteur
traitement est traitement est test protecteur
meilleur au moins diagnostic
aussi efficace meilleur

Etude Etude Etude


thérapeutique thérapeutique diagnostique
de supériorité de non
infériorité
Etude
descriptive

57
iKB LECTURE CRITIQUE D'ARTICLE

L'étude suit-elle prospectivement des sujets dans


le temps?

Compare-t-elle rétrospectivement des


sujets chez qui on recherche une
Etude de exposition antérieure?
cohorte

S'agit-il d'une étude à une


Etude date donnée?
cas
témoins

Etude Etude
transversale longitudinale

0
(.9
LJ.J
a:
(.9
J,
LJ.J
a:
CO
0


z
a:
LJ.J
>
en
z
0
fC=
0
LJ.J
@

58
Chapitre
12

OBJECTIF PEDAGOGIQUE N ° 9

Les objectifs du CNCI pour l'iECN


ANAL YSER LA METHODOLOGIE

Méthodes
• Vérifier que les analyses statistiques (en fonction de notions élémentaires) sont
cohérentes avec le projet du travail ; connaitre les limites de l'analyse par sous
groupe ; connaitre la notion de perdus de vue

MOTS-CLES et REFLEXES GENERAUX

• Un critère = un test
• Type de variables
• Analyse en sous-groupes
• Analyse de survie

■ GENERALITES

• L'analyse statistique concerne tous les patients inclus


• Pour chaque critère étudié on ne réalise qu'un seul test
PRINCIPES
STATISTIQUES DE statistique
BASE En cas de multiplication des tests il existe une inflation du
risque alpha (qui pourra cependant être corrigée
secondairement)

59
iKB LECTURE CRITIQUE D'ARTICLE

Le choix d'un test statistique dépend de différents facteurs :


o La nature de la variable que l'on étudie (CDJ) :
qualitative ou quantitative ?
o La distribution de la variable :
Normale : tests paramétriques
CHOIX D'UN TEST Non normale : tests non paramétriques
STATISTIQUE o Le type de séries à comparer :
appariées (critère chez même patient avant et après
intervention), ou indépendantes (même critère dans 2
groupes différents)
o Les conditions d'application des tests (nombre de
patients minimum par exemple)

. Les tests les plus couramment utilisés sont les tests


paramétriques mais ils ne peuvent être utilisés que sous

. certaines conditions d'application


Les caractéristiques des données sont résumées à l'aide de
TEST PARAMETRIQUE
. paramètres estimés sur l'échantillon
L'hypothèse d'une distribution Normale sous jacente est

. admise
Ainsi pour exprimer l'absence de différence significative il
suffira de comparer les moyennes

. Dans une analyse univariée une seule variable explicative est


prise en compte

. Dans l'analyse multivariée on peut prendre en compte


plusieurs variables explicatives. On tient compte de l'effet des
ANALYSE UNIVARIEE
covariables (facteurs de confusion potentiels). Grâce à des
ET MULTIVARIEE
logiciels statistiques on obtient des résultats ajustés :
0 Modèle de régression logistique (si qualitative)
0 Modèle de régression linéaire (si quantitative)
0 Modèle de Cox (courbes de survie)

Q Si un test n'est pas significatif en analyse bilatérale, ne jamais


accepter une conclusion sur une analyse unilatérale
Q On peut éventuellement revendiquer la supériorité dans une étude
PIEGE de non-infériorité si toutes les valeurs de l'IC95% sont au-dessus de
la borne
Q En cas d'étude de supériorité négative ne jamais conclure à la non-
infériorité
0
(.9
a:
LJ.J

(.9

a:
LJ.J

CO
0

z
a:
>
LJ.J

en
z
0
fC=
0
LJ.J
@

60
VERIFIER QUE LES ANALYSES STATISTIQUES SONT COHERENTES AVEC LE PROJET DU TRAVAIL

.VARIABLES

. Différentes variables à distinguer dans une étude :


0 Variable expliquée (critère dont le critère principal)
0 Variable explicative (par exemple un médicament)
GENERALITES 0 Variable de confusion (variables à maîtriser au maximum
car pourrait avoir une influence sur la variable expliquée)
0 Autres variables

. Une variable aléatoire est une variable dont une partie ne peut

. pas être maîtrisée


Les sources de variabilité sont :
0 L'individu lui-même
0 lntra-groupe
VARIABLE ALEATOIRE
. 0 Inter groupe
Les variables aléatoires peuvent être :
0 Discrète (c'est-à-dire que les valeurs sont déterminées à
l'avance)
0 Continue (toutes les valeurs d'un intervalle sont possibles)
0 Catégorielle

• PRINCIPAUX TESTS UNIVARIES

Variable explicative

Quantitatif Qualitatif

Comparaison de 2 moyennes
Qualitatif Test du Chi 2
Test de Student
CDJ
Coefficient de corrélation de
Quantitatif Test de Student
Pearson

➔ Le test du Chi 2 peut par exemple être remplacé par un test de Fisher si l'effectif théorique est
inférieur à 5
➔ Le test de Student peut être remplacé par un test de Mann Whitney si la distribution n'est pas
Normale ou si l'effectif est inférieur à 30

En cas d'appariement :
Chi 2 - Mac Nemar
Student - Student apparié
Mann Witney - Wilcoxon apparié
ANOVA - ANOVA pour mesures répétées
Kruskal wallis - Friedman

61
iKB LECTURE CRITIQUE D'ARTICLE

n TESTS COURANTS POUR COMPARER 2 MESURES, SUR 2 GROUPES A ET B

Groupes indépendants Groupes appariés


(n paires de sujets)
Comparer 2 proportions
(variable qualitative) Grands effectifs (nombre de
Grands effectifs (supérieur à 5) paires discordantes supérieur à
Test du Chi 2 de Pearson 20)
Test du Chi 2 de Mac Nemar

Petits effectifs
Petits effectifs (inférieur à 5)
Test du Chi 2 de Mac Nemar
Test de Fisher exact
pour petits effectifs

Comparer 2 moyennes
Grands effectifs (>30)
Grands effectifs (>30)
Test t apparié (test
Test t de Student
paramétrique)

Petits effectifs ( <30) Petits effectifs ( <30)


Test t de Student (distribution Test t apparié (distribution
normale, variances égales) normale des différences)

Grands ou petits effectifs Grands ou petits effectifs


Test des rangs, test U, W, ou test Test des rangs signés de
de Mann Whitney ou de Wilcoxon) Wilcoxon

Comparer 2 survies
Test du log rank (risques
proportionnels) Test du Log Rang stratifié
Test de Wilcoxon

0
(.9
LJ.J
a:
(.9

LJ.J
a:
CO
0

z
a:
LJ.J
>
en
z
0
fC=
0
LJ.J
@

62
VERIFIER QUE LES ANALYSES STATISTIQUES SONT COHERENTES AVEC LE PROJET DU TRAVAIL

"ANALYSES DE SURVIE

• L'étude de courbes de survie correspond à l'étude de


données censurées :
Donnée censurée = contient 2 informations (survenue
de l'évènement et délai de survenue)
Délai de survenue d'un évènement binaire

• Les études concernées par ce genre d'analyse sont les études


pronostic et les essais thérapeutiques
GENERALITES
• Eléments clés dans ces études :
Date d'origine (début de l'étude de la survie)
Evènement (la plupart du temps le décès mais on peut
également prendre la récidive, l'hospitalisation, l'apparition
d'une complication, etc.) et délai par rapport à la date
d'origine
Date de point (fin de l'étude de la survie)

• Méthode actuarielle
• Méthode de Kaplan Meier+++ :

100

1:
00 50

DECRIRE UNE SURVIE

0
1 2 3
Years

• Comparer des survies (analyse univariée) : test du logrank


(ou modèle de Cox à 1 variable)
• Analyse multivariée : modèle de Cox

63
iKB LECTURE CRITIQUE D'ARTICLE

ANALYSES EN SOUS-GROUPES

• On analyse une partie de l'échantillon de patients


inclus (faibles effectifs)
Il y a donc diminution de la puissance
Risque de ne pas mettre en évidence une différence
existante
• Ces analyses donnent des résultats complémentaires de
ceux de l'analyse principale et permettent la formation de
nouvelles hypothèses pour des études ultérieures
• Elles entraînent un risque d'inflation du risque alpha :
GENERALITES
Du fait des comparaisons multiples avec la
multiplication des tests statistiques
Risque d'observer une différence du seul fait du hasard
A prendre en compte par des méthodes adaptées
(Bonferroni, O' Brien Fleming)
• Cependant elles ne doivent JAMAIS permettre de servir de
conclusion à l'article
• Elles doivent être prévues a priori
• Elles doivent êtres justifiées dans le protocole de l'étude

• La multiplication des tests statistiques (un par sous-groupe)


augmente la probabilité d'obtenir un test significatif
uniquement par hasard.
• Un résultat de sous-groupe significatif est toujours suspect car
il est impossible de savoir si ce test révèle l'effet réel ou s'il
s'agit simplement d'un artefact lié à la répétition des tests. Un
résultat significatif obtenu dans ces conditions fait courir un
risque d'erreur dans la conclusion bien supérieur aux 5%
INTERPRETATION habituellement consentis.
D'UN RESULTAT EN
SOUS GROUPE SI •
ESSAI NON De plus, rien ne permet d'être sûr que les patients recevant le
CONCLUANT
traitement ou le contrôle sont comparables à l'intérieur des
sous-groupes.

• En fait, dans cette situation, les analyses en sous-groupes ne


sont pas totalement dénuées d'intérêt. Elles génèrent de
nouvelles hypothèses, qui seront vérifiées dans de
nouveaux essais de confirmation. Cependant il est fréquent
que ces hypothèses ne se vérifient pas quand elles sont
0
(.9
testées de façon indépendante dans une étude ad-hoc
LJ.J
a:
(.9

LJ.J
a:
CO
0

z
a:
LJ.J
>
en
z
0
fC=
0
LJ.J
@

64
VERIFIER QUE LES ANALYSES STATISTIQUES SONT COHERENTES AVEC LE PROJET DU TRAVAIL

• Dans un essai concluant (où une différence statistiquement


significative a été obtenue) le but des analyses en sous­
groupes serait de rechercher ceux dans lesquels le
traitement serait le plus efficace et surtout ceux dans
lesquels il serait inefficace. L'objectif est de mieux définir la
population cible en restreignant éventuellement la diffusion
du traitement par rapport à la population qui a été incluse dans
l'essai

• Comme dans le cas d'un essai non significatif, les analyses


en sous-groupes se heurtent à des difficultés méthodologiques
INTERPRETATION
D'UN RESULTAT EN
qui les empêchent d'aboutir aux conclusions qu'elles
SOUS GROUPE SI recherchent.
ESSAI CONCLUANT
• Il est impossible de conclure qu'un traitement est sans
efficacité chez certains patients sous prétexte qu'aucune
différence significative n'existe dans ce sous-groupe.
L'absence de différence significative ne signifie pas qu'il y
a absence d'effet car la puissance de la comparaison au
niveau d'un sous-groupe n'est pas assurée. En effet, la
taille des sous-groupes est inférieure à la taille nécessaire
pour mettre en évidence un effet qui est la taille de l'essai tout
entier. La probabilité de ne pas conclure à une différence qui
existe pourtant est forte (risque d'erreur statistique de
deuxième espèce, erreur bêta).

Effet du
Sous-groupe traitement p
(risque relatif)
Essai en entier 0,92 NS

Age<75 0,92 NS
Age>75 0,95 NS

Hommes 0,92 NS
Femmes 0,99 NS

Antécédents 0,87 NS
EXEMPLE D'ESSAI d'infarctus
NON CONCUANT Pas d'antécédents 1,03 NS
d'infarctus

Diabétiques 0,78 p<0,05


Non diabétiques 1,09 NS

• Dans cet essai, on remarque que le résultat est non significatif


sur la population entière. Dans le sous-groupe diabétique, on
peut voir que le RR sous traitement est statistiquement
significatif d'une diminution de risque. On peut donc supposer
que le traitement serait efficace dans ce sous groupe, mais
cela nécessitera une nouvelle étude pour le confirmer.

65
iKB LECTURE CRITIQUE D'ARTICLE

Effet du traitement
Sous-groupe p
(risque relatif)

Essai en entier 0,78 p<0,05

Age<75 0,65 p<0,01


Age>75 0,90 NS

Hommes 0,76 p<0,04


Femmes 0,78 p<0,05

EXEMPLE D'ESSAI Antécédent d'infarctus 0,97 NS


CONCLUANT
Pas d'antécédent 0,70 p<0,02
d'infarctus

Diabétique 0,50 p<0,001


Non diabétique 0,91 p<0,05

• Dans cet essai, on voit que le traitement montre une


amélioration statistiquement significative sur l'ensemble de la
population.
• Le traitement paraît le plus efficace chez les diabétiques sans
antécédent d'infarctus, cela permet de définir une nouvelle
population cible.

DIVERS

Test bilatéral=
• Test statistique pour lequel on part du principe que la
différence entre les deux traitements A et B étudiés peut
être dans un sens ou dans un autre
• Le nouveau traitement meilleur ou moins bon que le précédent
(différent) :
HO: A= B
H1: A"' B

Test unilatéral=
TEST UNILATERAL OU • Test statistique pour lequel on part du principe que la
BILATERAL différence que l'on cherche à montrer a un sens connu
• Le nouveau traitement ne peut être que meilleur:
H1: A> B
0
(.9
LJ.J
a: •
(.9 Attention: le choix d'un test unilatéral doit être fait a priori et
LJ.J
a: justifié par des données de la littérature ou des données
CO
0 scientifiques:
z Différence attendue ne fait aucun doute
a:
LJ.J
> Essais de non-infériorité ++
en
z • Un test unilatéral augmente la puissance d'une étude et
0
fC= permet ainsi de diminuer le nombre de sujets à inclure
0
LJ.J
@

66
VERIFIER QUE LES ANALYSES STATISTIQUES SONT COHERENTES AVEC LE PROJET DU TRAVAIL

• Toujours se méfier des analyses trop nombreuses +++


• Multiplier les analyses augmente le risque d'observer un
résultat statistiquement significatif dû au hasard
• On peut retrouver ce problème dans plusieurs cas:
Multiplication des CDJ
INFLATION DU RISQUE Analyses en sous-groupes trop nombreuses
ALPHA Analyses intermédiaires
• Pour y remédier:
diminuer le seuil de significativité des tests (par
exemple 0.025 plutôt que 0.05)
méthodes de prise en compte: Bonferroni, O' Brien
Fleming

TENDANCE ET INTERACTION

• L'interprétation en classe de certains résultats a certaines


limites:
- on multiplie les tests ce qui augmente le risque alpha, les
résultats peuvent être contradictoires, ...
• Il est donc nécessaire de trouver un test plus global: le test
de tendance
TEST DE TENDANCE • Ce test répond à la question: « le risque diminue-t-il ou
augmente-t-il avec l'augmentation de l'exposition ? »
• On calcule donc un « p de tendance »:
- Si celui-ci est non significatif (>0.05) alors on n'interprète
pas les risques relatifs
• Condition: il faut une hypothèse linéaire pour la relation

• Dans le cas de variables non ordonnées


• On réalise un test d'hétérogénéité répondant à la question:
TEST « les différences observées entre les groupes sont-elles
D'HETEROGENEITE significatives ? »
• Si ce test est significatif, les résultats par classe peuvent être
examinés

67
iKB LECTURE CRITIQUE D'ARTICLE

• En cas de facteur de confusion, il existe la même


association entre les groupes
⇒ Nécessité d'un ajustement

DIFFERENCE ENTRE B
CONFUSION ET • En cas d'interaction, l'association est différente dans
INTERACTION chaque groupe
⇒ Nécessité d'une stratification de l'analyse

A�

• Pour savoir si une interaction est significative, on réalise un


test d'interaction
• Si celui si est significatif:
- les résultats sont divergents
INTERACTION - il est nécessaire de stratifier l'analyse
• Si ce test est non statistiquement significatif:
- on ne peut pas réaliser d'analyse en sous-groupe
- les différences d'un groupe à l'autre sont ininterprétables

• En cas d'interaction:
- analyse en sous-groupe obligatoire
- le résultat global n'a pas de sens

• En absence d'interaction:
- l'analyse stratifiée est inutile
- les différences entre les groupes sont ininterprétables
CONCLUSION - l'association est la même dans tous les groupes

• Toujours interpréter du plus large vers le plus précis:


- Interaction ?
- Test global
- RR dans chaque classe
- Forme de la relation
Commenter tous les résultats
0
(.9
LJ.J
a:
(.9

LJ.J
a:
CO
0

z
a:
LJ.J
>
en
z
0
fC=
0
LJ.J
@

68
Chapitre
13

OBJECTIF PEDAGOGIQUE N ° 10

Les objectifs du CNCI pour l'iECN


ANAL YSER LA METHODOLOGIE

Méthodes
• Vérifier le respect des règles d'éthique

MOTS-CLES et REFLEXES GENERAUX

• Comité d'éthique
• Consentement éclairé écrit et oral

Il TEXTES LEGISLATIFS

• Code de Nuremberg (1947)


• Déclaration d'Helsinki (1964)
• La loi Huriet-Sérusclat du 20 décembre 1988 : loi de
bioéthique
LISTE DES TEXTES
• La loi du 9 août 2004 : loi concernant la politique de santé
publique
• Loi du 5 mars 2012 dite« Loi Jardé » et décrets d'application
(2017)

69
iKB LECTURE CRITIQUE D'ARTICLE

• Entrée en application depuis un décret de novembre 2016


• On parle de recherches impliquant la personne humaine :
Recherches organisées et pratiquées sur l'être humain en
vue du développement des connaissances biologiques ou
médicales
Anciennement appelées recherches biomédicales
LOI JARDE
• On en distingue trois types :
Recherches interventionnelles
Recherches interventionnelles à risque et contraintes
minimes (fixés par arrêté)
Recherches non interventionnelles

• LEGISLATION

Recherches impliquant la personne humaine :

Recherche
Recherche interventionnelle à Recherche non
interventionnelle risques et contraintes interventionnelie
minimes
Avis CPP OUI OUI OUI
Information Information
ANSM Autorisation Transmission de l'avis Transmission de l'avis
favorable du CPP favorable du CPP
Assurance Obligatoire Obligatoire Pas d'assurance
Information Information Information
Consentement Consentement écrit, libre et Consentement exprès (écrit Déclaration de non-
éclairé ou oral), libre et éclairé opposition, libre et éclairée
Engagement de conformité Engagement de conformité Engagement de conformité
CNIL avec méthodologie MR001 ou avec méthodologie MR001 ou avec méthodologie MR003 ou
autorisation CNIL autorisation CNIL autorisation CNIL

Recherches sur les données :

.
= Recherche impliquant la personne humaine, non interventionnelle :
Recueil de données
prospectif . Avis CPP
CNIL : méthodologie de référence MR003 ou autorisation

.
0
(.9
CNIL
LJ.J
a: Avis du CEREES (comité d'expertise pour les recherches, les
(.9

LJ.J Données déjà études et les évaluations dans le domaine de la santé) qui
a:
collectées
. remplace le CCTIRS
CO
0

z Autorisation CNIL
a:
LJ.J
>
en
z
0
fC=
0
LJ.J
@

70
VERIFIER LE RESPECT DES REGLES D'ETHIQUE

• Il donne un avis à caractère décisionnel


Rôles scientifiques :
• Evalue la pertinence du projet
COMITE DE • Evalue l'adéquation entre les objectifs poursuivis et les
PROTECTION DES
moyens mis en œuvre
PERSONNES
• Evalue la qualification de l'investigateur
(CPP) Rôles éthiques :
• Evalue la qualité de la note d'information transmise aux
participants de l'étude
• Evalue les modalités de recueil du consentement

Il PRINCIPAUX ACTEURS DE L'ESSAI CLINIQUE

.
. Propose l'étude

. Gère et finance l'étude

. Recueille les autorisations nécessaires

.
PROMOTEUR Souscrit une assurance

. Assume la responsabilité juridique


Est le plus souvent un laboratoire ou un groupe

.
pharmaceutique

. Surveille et dirige la réalisation de la recherche

. Informe le patient

. Recueille le consentement du patient

INVESTIGATEUR . Assure le suivi des patients


Est le plus souvent un médecin (parfois chirurgien-dentiste ou
infirmier)

NB : dans le cas des études non interventionnel/es, l'investigateur peut


être toute personne reconnue comme qualifiée par le CPP

Il REGLES D'ETHIQUE

• Etude justifiée
• Etude utile
• Adaptée aux connaissances scientifiques actuelles (contre
traitement de référence, contre gold standard diagnostic, etc.)
• Méthode permettant de répondre à la question
• Protocole approuvé par un comité d'éthique indépendant
± 1 comité d'éthique par pays
• Participants volontaires, ayant reçu une information orale
10 COMMANDEMENTS et écrite, et ayant donné leur consentement éclairé par
écrit
• Respect de la confidentialité et du secret médical
• Conclusion conforme aux résultats
• Pas ou peu de conflits d'intérêts et si présents alors
déclaration obligatoire
• Les patients peuvent se retirer à tout moment, toutes leurs
données ne pourront alors pas être utilisées

71
iKB LECTURE CRITIQUE D'ARTICLE

Etude de non-infériorité :
• On peut admettre de faire une étude de non-infériorité s'il
existe un bénéfice évident en terme de coût, de facilité de
prise en charge, de risques, d'observance ...
• Il doit exister des arguments a priori en faveur de son
efficacité et de ses bénéfices par rapport au traitement de
référence

Placebo:
• Si aucun autre traitement n'est disponible (pas de traitement
de référence notamment)
PARTICULARITES • Pathologie bénigne/ Pas pour les actes invasifs (ex:
chirurgie)
• Pas de risques graves pour les participants

Liens / Conflits d'intérêt:


• Les éventuels liens et possibles conflits d'intérêt des auteurs
de l'étude doivent toujours être signalés et déclarés à la fin
de l'étude (possède des parts dans l'entreprise
pharmaceutique, rémunération pour effectuer l'étude, etc.)
• Ils ne remettent pas forcément en cause les résultats de
l'étude mais incite à plus de vigilance

" QUESTIONS TYPES

• Rationnel logique
• Etudes préexistantes:
Pas d'évaluation
Il existe des arguments a priori pour l'efficacité de ce
nouveau traitement
Il existe des arguments a priori pour un rapport bénéfice
risque favorable
• Analyses intermédiaires prévues avec des critères d'arrêt:
Arrêt pour toxicité
CETTE ETUDE EST­ Arrêt pour futilité
ELLE ETHIQUE ? Arrêt pour efficacité
Vérifier le taux d'écarts au protocole
Vérifier le taux d'inclusion
• Le traitement comparateur est le traitement de référence s'il
en existe un
0
(.9
LJ.J
• Etude en aveugle
a: •
(.9 Comité d'éthique
LJ.J
a: • Consentement éclairé
CO
0 • Pas de perte de chance
z
a:
LJ.J
>
en
z
0
fC=
0
LJ.J
@

72
VERIFIER LE RESPECT DES REGLES D'ETHIQUE

• Oral ET écrit
• Avant l'inclusion
CRITIQUEZ LES • Après information écrite et orale, claire, loyale et
MODALITES DE appropriée
CONSENTEMENT • Avec un délai de réflexion
• Recueilli par une tierce personne
• Révocable à tout moment

73
iKB LECTURE CRITIQUE D'ARTICLE

0
(.9
LJ.J
a:
(.9
J,
LJ.J
a:
CO
0


z
a:
LJ.J
>
en
z
0
fC=
0
LJ.J
@

74
Chapitre
14

OBJECTIF PEDAGOGIQUE N °11

Les objectifs du CNCI pour l'iECN


ANAL YSER LA PRESENTATION DES RESULTATS

• Analyser la présentation, la précision et la lisibilité des tableaux et des figures, leur


cohérence avec le texte et leur utilité

MOTS-CLES et REFLEXES GENERAUX

• Titre pour chaque tableau et figure


• Présentation « claire »
• Résultats essentiels
• Significativité statistique apparente
• Pas de redondance, indépendants du texte

Il REGLES GENERALES

• Chaque tableau ou figure doit comporter:


Un titre informatif (au-dessus d'un tableau et en dessous
d'une figure)
Un numéro correspondant à l'ordre d'apparition dans le
texte (référencement)
Un appel dans le texte ( « cf. tableau ... »)
GENERALITES • Les tableaux et figures doivent rester fidèles aux résultats
• Ils ne doivent pas faire une redondance avec le texte, sauf
pour les points principaux, réponse à la question posée, ...
• Ils doivent pouvoir être lus et être compréhensibles même
isolés du reste de l'article
Doivent pouvoir se lire indépendamment du texte

75
iKB LECTURE CRITIQUE D'ARTICLE

. Vérifier l'utilité : apport d'informations supplémentaires ou

. complémentaires, non redondantes avec le texte

. Cohérence avec la question étudiée


GRILLE DE LECTURE . Cohérence entre texte, tableau et figures
D'UN TABLEAU OU
D'UNE FIGURE . Précision : indices de précision et de dispersion
Lisibilité : compréhension indépendamment du texte,
abréviations expliquées en note, unités et légendes présentes

q Le rôle des tableaux et figures est de présenter le maximum


d'informations de façon plus claire et plus synthétique que le

.
texte ne le ferait
Tableau 1 :
- Caractéristiques démographiques de l'échantillon, ±

LES TABLEAUX ET . comparaison des 2 groupes après randomisation


Figure 1 :

.
FIGURES - Flow chart
INDISPENSABLES Tableau répondant à la question posée, portant sur le
critère de jugement principal :
- Résultats en valeur absolue, sur l'ensemble de
l'échantillon

.TABLEAUX

. Présentation des informations répétitives de façon claire et


ROLES . synthétique
Mise en évidence des résultats principaux

. Taille raisonnable :
- Pas de lignes verticales
- Lignes horizontales uniquement pour séparer les lignes du

. corps
REGLES DE . Un titre à chaque colonne
BASE . Abréviations et explications en note de bas de page
Symboles autorisés pour les notes : *, t, :j:, **, ...
.
. Unités de mesure (dans les titres de colonnes ou de ligne)
Données manquantes explicitement signalées (ND pour non
disponible, DM pour données manquantes)

.
. Les effectifs doivent être systématiquement présentés
La variabilité doit être systématiquement présentée (intervalle de
0
VARIABLES . confiance, écart type, p, ... )

.
(.9
LJ.J
a: Redondances
(.9

LJ.J
S'il en existe une, la classe de référence est bien visible (chiffre
a: 1 dans le tableau sans intervalle de confiance)
CO
0

z
a:
LJ.J
>
en
z
0
fC=
0
LJ.J
@

76
ANALYSER LA PRESENTATION, LA PRECISION ET LA LISIBILITE DES TABLEAUX ET DES FIGURES

Il FIGURES

.
. Présenter une distribution
ROLES
. Ne peut présenter la distribution que d'un seul groupe
Illustrer une variation/ une évolution

.
. Identification claire des lignes, courbes et symboles utilisés
Axes de la figure
- Légendés

.
- Echelles et unités indiquées
REGLES DE BASE
. Lisibilité et clarté

. Noter l'indice de dispersion, la variabilité


S'il existe plusieurs figures, autant que possible utilisation de
la même présentation

77
iKB LECTURE CRITIQUE D'ARTICLE

0
(.9
LJ.J
a:
(.9
J,
LJ.J
a:
CO
0


z
a:
LJ.J
>
en
z
0
fC=
0
LJ.J
@

78
Chapitre
15

OBJECTIF PEDAGOGIQUE N ° 12

Les objectifs du CNCI pour l'iECN


ANALYSER LA PRESENTATION DES RESULTATS

• Vérifier la présence des indices de dispersion permettant d'évaluer la


variabilité des mesures et de leurs estimateurs

MOTS-CLES et REFLEXES GENERAUX

• IC95%
• p-value (petit« p »)
• Distribution normale ou non

Il GENERALITES - DEFINITIONS

• Les indices de dispersion permettent de caractériser la


variation des observations autour de la valeur centrale
• Il s'agit le plus souvent de l'écart type et de l'intervalle de
GENERALITES
confiance
• On ne peut interpréter aucune valeur sans connaître son
indice de dispersion

79
iKB LECTURE CRITIQUE D'ARTICLE

Quelques définitions à connaître :

Moyenne . Somme des observations / nombre d'observations


. Un pourcentage des valeurs est inférieur au quantile
- Médiane = 50%
Quantile - Quartile = 25%
- Quantile = 10%
- Centile = 1%
. Intervalle contenant un pourcentage « central » des sujets :
- Ecart interquartile = 50% des sujets (entre 1er quartile et
3eme quartile)
Ecart inter-quantile - Ecart inter-décile = 80% des sujets (entre 1 er décile et
geme décile)
- Ecart inter-centile = 98% des sujets (entre 1er centile et
ggeme centile)
.
Ecart-type . Traduit la dispersion des valeurs autour de la moyenne

.
C'est la racine carrée de la variance
Différence entre les deux valeurs extrêmes (minimum ->
Etendue
maximum)

DISTRIBUTION Indices de position Indices de dispersion


- Variance
Normale - Moyenne - Ecart-type (déviation
standard)
- Quantiles
Non normale - Médiane - Ecart inter-quantile
- Etendue

• PRECISION DE L'ESTIMATEUR

• Les études ne sont pas réalisées sur l'intégralité de la


population cible, on n'étudie qu'un échantillon de cette
population
• On réalise donc une ESTIMATION sur un échantillon de la
valeur réelle
INDICE DE PRECISION • L'estimation peut être bonne ou mauvaise, on donne donc
DES ESTIMATIONS
avec ce résultat un indice de dispersion qui évalue dans
quelle proportion l'estimation est proche de la valeur réelle :
0
En cas de variable quantitative : écart type
(.9
LJ.J
a:
En cas de variable qualitative : intervalle de confiance
(.9

LJ.J
a:
CO
0

z
a:
LJ.J
>
en
z
0
fC=
0
LJ.J
@

80
Chapitre
16

OBJECTIF PEDAGOGIQUE N ° 13

Les objectifs du CNCI pour l'iECN


CRITIQUER L'ANALYSE DES RESULTATS ET DE LA DISCUSSION

• Discuter la nature et la précision des critères de jugement des résultats

MOTS-CLES et REFLEXES GENERAUX

• UN SEUL critère de jugement principal


• Critère objectif, unique, défini a priori, clinique, ...

• GENERALITES

. Le critère de jugement (CDJ) est une variable d'évaluation à


DEFINITION
. laquelle on s'intéresse pour répondre à l'objectif d'une étude
C'est la variable la plus importante

.
ROLES . Le CDJ principal permet de répondre à l'objectif principal
Il permet le calcul du nombre de sujets nécessaires (NSN)
à l'étude a priori

81
iKB LECTURE CRITIQUE D'ARTICLE

.
REGLES DE BASE . Les CDJ secondaires doivent être en nombre limité
On préfèrera des CDJ cliniques (baisse de mortalité), aux
critères dits « intermédiaires» (tension artérielle)

.
. Répondent aux objectifs secondaires

. Doivent être définis a priori


CDJ SECONDAIRES
. Sont en nombre raisonnable

. Ne permettent pas de conclure l'article


Permettent d'émettre des hypothèses (études
ultérieures) : ils sont complémentaires / exploratoires

. Quand il existe plusieurs critères de jugement, c'est celui pour


ASTUCE lequel on a fait le calcul du nombre de sujets nécessaires a
priori qui compte (= CDJ principal)

"CHOIX D'UN CRITERE DE JUGEMENT PRINCIPAL

.
. Unique
Clinique:

. Par opposition aux critères intermédiaires


Défini a priori:

. Dans le protocole de l'étude

. Pertinent cliniquement et par rapport à l'objectif de l'étude

. Précis

.
LE Validé (publications antérieures)
CDJ Objectif (autant que possible ++)
PRINCIPAL Renforce la validité interne de l'étude
IDEAL Pas de risque de biais d'évaluation si évaluation en

. ouvert du CDJ

. Consensuel

. Reproductible

. Fréquent dans la population de l'étude


Description des méthodes de mesure : référentiel choisi,
classification utilisés, instrument de mesure, double lecture de
la mesure?
0
(.9
LJ.J
a:
(.9

LJ.J
a:
CO
0

z
a:
LJ.J
>
en
z
0
fC=
0
LJ.J
@

82
DISCUTER LA NATURE ET LA PRECISION DES CRITERES DE JUGEMENT DES RESULTATS

Type étude CDJ


Incidence
Descriptive
Prévalence
Etiologique Maladie ou évènement étudié
Malade ou non ?
Diagnostique Traitement mis en œuvre après
EXEMPLES résultat du test diagnostic
Mortalité
Espérance de vie
Thérapeutique
Survenue évènement
cardiovasculaire grave
Complication
Pronostic
Décès
Dépistage Mortalité spécifique

.
. Définition claire et précise (unités, eut off, ... )

. Moment de l'évaluation du CDJ


Méthode de mesure homogénéisée / standardisée
COMMENT
AMELIORER UN CDJ ?
. (moment, lieu, personne, appareil, double lecture, ... )
Formation des personnes chargées de recueillir le CDJ

. (homogénéiser les mesures, éviter l'effet centre)


Echelles et scores valides (unités internationales, stade

. TNM, NYHA, ... )


Evaluation du CDJ en aveugle

Il LES DIFFERENTS CDJ

. Critère de jugement directement lié à l'objectif clinique :

.
- reflet direct de l'objectif du traitement étudié
CRITERE CLINIQUE
. Augmente la pertinence clinique de l'étude
Exemple: mortalité, survenue d'un évènement

.
cardiovasculaire...
Il n'est pas directement lié à l'objectif du traitement :
- reflet d'un mécanisme biologique physiopathologique
CRITERE . ou pharmacologique
INTERMEDIAIRE
. Moins pertinent
Exemple:
- tension artérielle (le critère pertinent serait la diminution de
la mortalité cardio-vasculaire)

83
iKB LECTURE CRITIQUE D'ARTICLE

. C'est un critère intermédiaire utilisé à la place d'un critère


clinique lorsque ce dernier n'est pas utilisable (délai de
survenue important, recueil complexe, caractère invasif, coût,

. ... )
Conditions d'utilisation:
CRITERE DE - Relation avec le CDJ clinique établie et indiscutable
SUBSTITUTION (on suppose fortement que ce critère est lié à l'effet du
traitement)
- Fiable, reproductible
- Sensible et spécifique

.
- Défini a priori

.
L'interprétation sur ce critère doit rester r::1rudente ++
C'est la combinaison de plusieurs critères en un seul
CDJ:
- Ne pas confondre avec un critère de jugement multiple

. (somme de plusieurs critères de jugement)


Il permet la vision globale d'un processus

. physiopathologique
Choix des critères à inclure dans le CDJ composite:
- Critères de même nature, d'importance similaire,
pertinents cliniquement, avec une fréquence de survenue

CRITERE COMPOSITE . similaire dans la population d'intérêt.


Un patient présente le critère composite à partir du moment où
il présente au moins un des évènements le composant:
- Mais il ne compte qu'une seule fois (par exemple OAP +

. mort=1)
L'interprétation et la comparaison avec d'autres études
peuvent parfois être délicates, la conclusion ne peut porter

. que sur le critère dans son ensemble


Avantages:
- Augmentation de la puissance
- « Situation clinique réelle »
- Aide pour les investigateurs

0
(.9
LJ.J
a:
(.9

LJ.J
a:
CO
0

z
a:
LJ.J
>
en
z
0
fC=
0
LJ.J
@

84
Chapitre
17

OBJECTIF PEDAGOGIQUE N ° 14

Les objectifs du CNCI pour l'iECN


CRITIQUER L'ANALYSE DES RESULTATS ET DE LA DISCUSSION

Relever les biais qui ont été discutés. Rechercher d'autres biais d'information et de
sélection éventuels non pris en compte dans la discussion et relever leurs conséquences
dans l'analyse des résultats.

MOTS-CLES et REFLEXES GENERAUX

• Validité interne
• Biais de sélection
• Biais de classement
• Biais de confusion

Il GENERALITES

• Erreur systématique qui fausse les résultats dans un sens


donné
• Ils sont donc à distinguer des erreurs aléatoires liées aux
fluctuations d'échantillonnage
• On distingue trois grandes familles de biais :
les biais de sélection (recrutement et suivi de la
DEFINITION
population) ;
les biais de classement (recueil des données, mesure du
CDJ principal) ;
les biais de confusion (interprétation des résultats).
• On peut les retrouver à toutes les étapes de l'étude

85
iKB LECTURE CRITIQUE D'ARTICLE

• Certains biais ne peuvent parfois être évités, ils entraînent


alors un problème de validité des résultats retrouvés :
Limitation de la VALIDITE INTERNE de l'étude
• Leur impact peut être limité à différentes étapes :
Lors de la planification de l'étude
Lors de l'analyse (seul le biais de confusion peut être pris
en compte lors de l'analyse)
IMPACT D'UN BIAIS • En présence d'un biais, préciser s'il est :
Différentiel : touche différemment les deux groupes
Non différentiel : touche les deux groupes de la même
manière
• En cas de biais ni évité ni pris en compte, leur impact doit
être abordé dans la discussion

NB : Chaque type d'étude possède certains biais principaux

■ BIAIS DANS LES ESSAIS THERAPEUTIQUES

.
Biais de recrutement- Biais lié à I' « effet centre » :

. Groupes initialement non comparables


On regarde le tableau 1
q Prévention :
- Randomisation
- Critères de sélection de la population (inclusion, non-
inclusion, exclusion)
- Stratification sur le centre si étude multicentrique

BIAIS DE SELECTION .
Biais de suivi :
Perte de comparabilité des groupes au cours du suivi
q Prévention :
- Insu/ aveugle (double voire triple)

.
Biais d'attrition :
Les patients sont analysés dans des groupes différents de la

. randomisation (exclusions, perdus de vue, etc.)


On regarde le flow-chart
q Prévention :
- Analyse des résultats en ITT

.
Biais d'évaluation :
Mesure du CDJ principal différente entre les groupes
0
(.9
LJ.J
a:
(.9
.
Biais de réalisation :
Intervention réalisée différemment entre les deux groupes
BIAIS DE
LJ.J
a:
CO CLASSEMENT
q Prévention de ces deux sous-types de biais :
0 - Insu / aveugle
z
a: - CDJ objectifs
LJ.J
> - Faire intervenir des investigateurs différents à chaque
en
z étape de l'étude
0
fC=
0
LJ.J
@

86
RELEVER LES BIAIS QUI ONT ETE DISCUTES

Biais provoqué par un facteur de confusion interagissant avec le


facteur de risque étudié dans l'étude du lien entre ce facteur et la
maladie
Un facteur de confusion est un facteur lié à la maladie et à l'exposition
et qui influence donc la relation entre ces deux entités
q Prévention :
Existence d'un groupe contrôle (placebo ou traitement de
référence)
BIAIS DE CONFUSION Randomisation stratifiée (a prion)
Analyse stratifiée (a posterion)
Analyse multivariée (ajustement - a posterion)

NB : grâce à l'existence du groupe contrôle, on s'affranchit


Du phénomène de régression vers la moyenne
De I' « effet prise en charge » ;
De l'évolution naturelle de la maladie .

• BIAIS DANS LES ETUDES EPIDEMIOLOGIQUES

• La population de l'étude diffère de la population cible


• Problématique de la constitution de l'échantillon d'étude
• Choix des témoins:
Témoins travailleurs(« healthy worker effect ») : les
personnes qui travaillent sont généralement en meilleure
santé que celles qui ne travaillent pas
Témoins hospitaliers (biais de Berkson) : possible lien
entre l'exposition et la pathologie pour laquelle le témoin
est hospitalisé
• Volontaires:
BIAIS DE SELECTION Non représentatifs de la population générale
• Cas:
Cas prévalents: risque de sélection sur la survie
possible lien entre la survie et le facteur de risque
(exposition) étudié
q Prévention :
Critères de sélection de la population (inclusion,
non-inclusion, exclusion)
Appariement des cas et des témoins

87
iKB LECTURE CRITIQUE D'ARTICLE

. Lié à la façon de mesurer le facteur étudié (exposition) ou la

. maladie
Le sujet est alors mal classé :
- Pour l'exposition dans les études cas-témoins
- Pour la maladie dans les études de cohortes/ exposés-

. non exposés

BIAIS DE
. Par ailleurs, ce biais peut être différentiel ou non différentiel
Sont concernés :
- Biais d'évaluation (enquêteur)
CLASSEMENT
- Biais de mémorisation
q Prévention :
- Recueil standardisé des données
- Formation des enquêteurs
- Enquêteurs en aveugle
- Patients en aveugle (réponse avant de savoir si
appartiennent au groupe des cas ou des témoins)

Biais provoqué par un facteur de confusion interagissant avec le


facteur de risque étudié dans l'étude du lien entre ce facteur et la
maladie
Un facteur de confusion est un facteur lié à la maladie et à l'exposition
et qui influence donc la relation entre ces deux entités
BIAIS DE CONFUSION q Prévention :
- Restriction de la population d'étude (critères d'inclusion,
non inclusion et exclusion)
- Appariement sur les facteurs de confusion
- Analyse stratifiée (a posterion)
- Analyse multivariée (RR, OR ajustés - a posterion)

0
(.9
LJ.J
a:
(.9

LJ.J
a:
CO
0

z
a:
LJ.J
>
en
z
0
fC=
0
LJ.J
@

88
RELEVER LES BIAIS QUI ONT ETE DISCUTES

n BIAIS DANS LES ETUDES DIAGNOSTIQUES

.
Est à évoquer quand :
Sélection sur le résultat du test à l'étude et non sur la

. pathologie
Sélection de sujets non homogènes (stades de la maladie,
patients plus graves, etc.)
BIAIS DE SELECTION
q Prévention :
- Critères de sélection de la population bien définis
(inclusion, non-inclusion, exclusion)

.
Est à évoquer devant :
Patients n'ayant pas subi tous les tests (Gold standard et test

. à l'étude) (biais de vérification)

BIAIS DE . Absence d'aveugle pour l'évaluation du test


Reproductibilité inter-évaluateur insuffisante
CLASSEMENT
q Prévention :
- Aveugle pour la réalisation des tests
- Evaluation du CDJ par des évaluateurs différents

. La réalisation du Gold standard est déterminée par le résultat


du test étudié
BIAIS DE CONFUSION
q Prévention :
- Aveugle pour la réalisation des tests

89
iKB LECTURE CRITIQUE D'ARTICLE

0
(.9
LJ.J
a:
(.9
J,
LJ.J
a:
CO
0


z
a:
LJ.J
>
en
z
0
fC=
0
LJ.J
@

90
Chapitre
18

OBJECTIF PEDAGOGIQUE N ° 15

Les objectifs du CNCI pour l'iECN


CRITIQUER L'ANALYSE DES RESULTATS ET DE LA DISCUSSION
• Vérifier la logique de la discussion et sa structure. Reconnaitre ce qui relève des
données de la littérature et ce qui est opinion personnelle de l'auteur

MOTS-CLES et REFLEXES GENERAUX

• Limites de l'étude
• Validité interne
• Validité externe
• Opinion des auteurs

• STRUCTURE DE LA DISCUSSION

• Synthèse des principaux résultats, et notamment rappel du résultat


principal
• Mécanismes pouvant expliquer ces résultats et les appuyant
• Discussion de la méthode et des conditions de réalisation de
l'étude. Qualité et validité des données, puissance de l'étude, schéma
de l'étude adapté à la question posée
• Forces de l'étude
• Limites de l'étude :
Biais éventuels : conséquences, prise en compte
COMPOSITION Discussion des imprécisions
CLASSIQUE
VALIDITE INTERNE
D'UNE •
DISCUSSION Réponse à la question posée
• Comparaison avec la littérature pré existante :
COHERENCE EXTERNE
Si résultats non concordant avec la littérature : pourquoi? Les
méthodes ou les populations étudiées sont-elles différentes?
• Extrapolation des résultats à la population cible :
VALIDITE EXTERNE
• Conclusion : implications dans la pratique clinique courante, pour
l'avenir
• Formulation de nouvelles hypothèses pour des recherches à venir

91
iKB LECTURE CRITIQUE D'ARTICLE

.
Ce que l'on ne doit pas retrouver dans la discussion:
Les données de l'introduction et de la partie matériel et

. méthode(pas de redondance dans l'article)


Les résultats détaillés, seuls les résultats principaux
permettant de répondre à la question doivent figurer dans la
REGLES DE
REDACTION . discussion
Pas de présentation de nouveaux résultats

.
Par ailleurs, elle doit:

. Etre argumentée
Etre courte(ne pas dépasser 50% de l'article)

.
. Les résultats confirment les connaissances
Les résultats révèlent de nouveaux faits:
- préciser si cela relève d'une progression logique des
3 SITUATIONS FACE connaissances

.
AUX RESULTATS - en cas d'étude observationnelle, discuter de la causalité
Les résultats contredisent les connaissances actuelles:
- vérifier la méthodologie de l'article: si bonne validité
interne de l'étude argumenter les points remis en question

.
. Généralisabilité des résultats

. Pré-requis: validité interne(« cohérence interne» de l'étude)


La validité externe dépend de plusieurs éléments :
VALIDITE EXTERNE - Les patients inclus dans l'étude
- Du cadre et du lieu de l'étude
- De l'intervention
- Du critère évalué

" SOURCES D'INFORMATION

SOURCES
. Il existe 3 sources d'information dans une discussion:
- Résultats tirés de l'étude
D'INFORMATION
- Littérature (essais antérieurs, mécanisme biologique, ... )
D'UNE DISCUSSION
- Opinion personnelle des auteurs (nouvelles hypothèses,
proposition d'explication à ces résultats, ... )

. Temps verbal: tandis que les résultats de l'étude sont au


présent, les données de la littérature et les opinions d'auteur
DISCERNER LES
0
(.9
LJ.J
a:
SOURCES . sont, elles, au passé
Les données de la littérature doivent être référencées à la
(.9
fin de l'article
LJ.J
a:
CO
0

z
a:
LJ.J
>
en
z
0
fC=
0
LJ.J
@

92
Chapitre
19

OBJECTIF PEDAGOGIQUE N ° 16

Les objectifs du CNCI pour l'iECN


CRITIQUER L'ANALYSE DES RESULTATS ET DE LA DISCUSSION

Discuter la signification statistique des résultats

MOTS-CLES et REFLEXES GENERAUX

IC95%
p
significativité statistique .- pertinence clinique

Il GENERALITES

• La signification statistique permet de quantifier la confiance


que l'on peut avoir dans les observations retrouvées
• Elle permet de répondre à la question : « la différence
observée entre les 2 groupes est-elle réelle ou uniquement
DEFINITION due au hasard (fluctuations d'échantillonnage) ? »
• L'objectif étant de conclure sur la population (valeurs
réelles) et non sur l'échantillon (valeurs estimées) :
C'est ce que l'on appelle l'inférence statistique

93
iKB LECTURE CRITIQUE D'ARTICLE

. Le risque alpha ou risque de première espèce est le risque de


conclure à une différence statistique alors qu'elle n'existe
pas

.
- Il est arbitrairement fixé à 5% dans la plupart des études
RISQUES a ET� Le risque bêta ou risque de seconde espèce est le risque de
ne pas conclure à une différence qui existe pourtant
- Il représente 1-puissance, on le fixe souvent à 20%

. Plusieurs tests sont réalisés pour répondre à la même

. question
Le risque d'erreur alpha réel augmente avec le nombre de
CAS PARTICULIER
DES TESTS . tests = inflation du risque alpha
Il est alors nécessaire de réaliser une correction lors de
MULTIPLES l'analyse:
- méthode de Bonferroni ++
- méthode de O' Brien et Fleming

. Si une association très forte existe entre un facteur étudié et le


IMPORTANCE DE
L'EFFET DE . CDJ choisi, il suffira d'un petit échantillon pour le démontrer
Si une étude est réalisée sur un nombre suffisant de sujets,
L'ECHANTILLON des petites différences peuvent être statistiquement
significatives, sans avoir forcément d'importance clinique

• INTERPRETATION DES DIFFERENTS RESULTATS

Degré de significativité « p »
• Probabilité que le hasard des fluctuations
d'échantillonnage explique à lui seul la différence
observée
• = probabilité de se tromper en affirmant à tort qu'il existe une
différence réelle entre les groupes

Interprétation :
• Comparaison du « p » au « risque alpha »
• p s alpha (5% le plus souvent) :
DEGRE DE résultat statistiquement significatif
SIGNIFICATIVITE le simple hasard ne suffit pas à expliquer la différence
retrouvée
• p > alpha (5% le plus souvent) :
résultat non significatif
la différence retrouvée est probablement due au hasard et
on ne peut donc pas conclure sur ce résultat
0
(.9
ce résultat non significatif peut être du à un manque de
LJ.J
a:
(.9
puissance de l'étude.
LJ.J
a:
CO
0
ATTENTION: La valeur du p ne reflète jamais la taille de la différence !
z
a:
LJ.J
>
en
z
0
fC=
0
LJ.J
@

94
DISCUTER L A SIGNIFICATION STATISTIQUE DES RESULTATS

.
Intervalle de confiance :
L'intervalle de confiance à 95% représente les bornes entre
lesquelles on a 95% de chance d'avoir la valeur réelle

INTERVALLE DE
.
lnterr::1rétation :
En cas d'étude de rapport (RR; OR; ... ) :

.
- résultat significatif si l'IC95% ne contient pas 1
CONFIANCE
En cas d'étude de différence entre 2 paramètres :
- résultat significatif si l'IC95% ne contient pas 0
. En cas d'étude de non-infériorité :
- résultat significatif si l'IC95% ne contient pas la borne
de non-infériorité définie a priori

.
. Prendre toujours les résultats les plus ajustés

. Description en valeur absolue d'abord

. Significativité ou non : valeur du p, IC95%


TABLEAU
. Sens de l'association

. Comparateur
Force de l'association

.
. La mesure est l'aire sous la courbe
On considère qu'un test est :
- Moyen si AUC entre 0.5 et 0.7
COURBE ROC - Bon si AUC entre 0.7 et 0.9
- Excellent si AUC supérieur à 0.9

Il CONCLUSION A TIRER DES RESULTATS

• La différence entre les groupes est bien réelle


• Vérifier que l'on a réalisé les bonnes comparaisons (CDJ
principal, tests cohérents, ... )
• Rechercher un éventuel problème lié aux comparaisons
multiples (inflation risque alpha)
• Un test statistiquement significatif ne corrige pas les biais
éventuellement présents dans une étude
• Bien différencier significativité statistique et pertinence
clinique++
RESULTAT
STATISTIQUEMENT Le résultat est-il robuste ?
• On peut douter de la robustesse d'un résultat si :
SIGNIFICATIF
l'IC95% ne contient pas O ou 1 selon les cas mais en est
très proche
l'étendue de l'IC95% est grande
la faiblesse d'un résultat peut parfois être due à un
nombre trop faible d'évènements
• A l'inverse un intervalle de confiance petit et très éloigné des
valeurs limites O ou 1 peut faire penser que le résultat
retrouvé est robuste, et donc que la signification statistique
des résultats est bonne

95
iKB LECTURE CRITIQUE D'ARTICLE

•Il n'existe pas de différence significative entre les résultats


•Explications possibles :
La différence n'existe pas réellement
Ou la différence existe mais n'a pas été mise en évidence
par manque de puissance (trop peu de patients, durée
de suivi trop faible, ... )
RESULTAT NON Ou la différence existe mais défaut de validité interne
STATISTIQUEMENT
(nombreux biais, etc.)
SIGNIFICATIF
ATTENTION:
• on ne peut pas conclure à une absence de différence !
le test ne parvient pas à rejeter l'hypothèse d'égalité sans
l'accepter pour autant
• « L'absence de preuve n'est pas la preuve de l'absence »

0
(.9
LJ.J
a:
(.9
J,
LJ.J
a:
CO
0


z
a:
LJ.J
>
en
z
0
fC=
0
LJ.J
@

96
Chapitre
20

OBJECTIF PEDAGOGIQUE N ° 17

Les objectifs du CNCI pour l'iECN


CRITIQUER L'ANALYSE DES RESULTATS ET DE LA DISCUSSION

Discuter la pertinence clinique des résultats

MOTS-CLES et REFLEXES GENERAUX

• Pertinence clinique .. significativité statistique

Il GENERALITES

La signification clinique résulte de la disponibilité des résultats


extrapolables à une pratique médicale courante, de l'importance
de l'effet démontré, de la force de l'association, et de la
pertinence de l'innovation en termes d'avantages pour le patient
ou la population

97
iKB LECTURE CRITIQUE D'ARTICLE

. Un résultat statistiquement significatif ne signifie pas


forcément qu'il est pertinent cliniquement
- En revanche, l'étude de la significativité statistique est un
NOTIONS DE BASE
. préalable à l'étude de la pertinence clinique

. La valeur de p ne reflète pas la taille de l'effet mis en évidence


Il est nécessaire d'évaluer la taille de l'effet et sa précision

. La signification clinique est capitale car c'est elle qui va


déterminer les changements de pratique et leurs impacts

IMPLICATION DE LA . sur la santé des patients et de la population


L'évaluation de la pertinence clinique permet de s'assurer que
PERTINENCE le bénéfice apporté par le traitement est suffisamment
CLINIQUE important et concerne un critère cliniquement pertinent, que la
balance bénéfices/risques est acceptable et que ce résultat
est informatif dans les situations de la pratique médicale
courante (extrapolabilité)

"IDENTIFIER LE CONTEXTE DE L'ARTICLE

. Pour pouvoir juger de la pertinence clinique d'un résultat il faut


d'abord pouvoir juger de la pertinence de la mise en œuvre de
GENERALITES
. l'étude
Il est donc nécessaire de déterminer la raison pour laquelle les
auteurs ont décidé de réaliser cette étude

. Problème de santé publique : maladie ou situation fréquente

. ayant un coût élevé pour la société


Pas de données sur ce sujet, ou données contradictoires,

. ou données superficielles
Avantages ou inconvénients par rapport aux prises en
LES MOTS CLES A charges ou traitements antérieurs
RECHERCHER - Avantage financier = prise en charge actuellement hors de
prix, nécessité de trouver une nouvelle thérapeutique
moins onéreuse
- Avantages en termes d'effets indésirables

.
- Avantage en termes de faisabilité, de mise en œuvre
Décrire les éventuels résultats des études précédentes
0

.
(.9
LJ.J
a:
(.9

LJ.J
Il faut JUSTIFIER le fait de faire une étude sur ce thème et
a: avec cet objectif pour pouvoir ensuite justifier les résultats à la
CO

.
0
CONCLUSION pratique
z
a:
LJ.J Les éléments pour répondre se trouvent souvent dans
>
en l'introduction
z
0
fC=
0
LJ.J
@

98
DISCU TER LA PER TINENCE CLINIQUE DES RESULTATS

• INDICES D'EFFET

. Ils sont définis en fonction :


INDICES D'EFFET - Du type de variable
- Du plan expérimental

. Etude interventionnelle:
- Variable qualitative : RR, RRR, NST
- Variable quantitative : comparaison de moyennes,
corrélation
- Variable censurée: analyse de survie
DIFFERENTS INDICES
D'EFFET . Etude étiologique:
- Cohorte: RR
- Cas témoins: OR

. Etude diagnostique :
- Performances du test: Se, Sp, VPP, VPN, RV+, RV-
- Impact (cf. études interventionnelles)

Il CRITERES DE LA PERTINENCE CLINIQUE

. C'est la validité interne de l'étude:


- La méthodologie doit être valide pour pouvoir utiliser les
QUALITE DE L'ETUDE
résultats
- Biais: quels biais ? comment ont-ils été pris en compte ?

COHERENCE
. Comparaison des résultats à d'autres études (antérieures le
plus souvent) ou à des références externes
EXTERNE

. Le CDJ choisi, pour être considéré comme pertinent, doit être


un critère objectif, clinique de préférence, non
PERTINENCE
CLINIQUE DU CDJ . intermédiaire
Le meilleur CDJ pour la pertinence clinique serait la MORBI-
MORTALITE

.
. Traduit le contraste entre les groupes
TAILLE DE L'EFFET . Ne pas confondre avec le « p »
Doit être cliniquement pertinente

99
iKB LECTURE CRITIQUE D'ARTICLE

.Il faut se poser la question: la population de l'étude est-elle la


même que la population que je côtoie dans mon activité
EXTRAPOLABILITE
- .clinique?
Quelle est la population de l'étude? Etude multicentrique?
VALIDITE EXTERNE Nombreux critères d'exclusion?
q POPULATION REPRESENTATIVE?
q VALIDITE EXTERNE de l'étude

. C'est la précision de l'estimation


- Comme vu dans le chapitre précédent cela représente
l'étendue de l'IC95% (bornes inférieure et supérieure)
- Plus l'intervalle est petit, plus la mesure est précise
IMPORTANCE DE
L'ASSOCIATION MISE
EN EVIDENCE .
CONCLUSION:
Une estimation ponctuelle seule est insuffisante, on

.
n'interprète JAMAIS un résultat sans p ou IC95%

.
La précision augmente avec la taille de l'échantillon
La borne inférieure de l'IC représente le plus petit effet
envisageable

. Les conséquences sur l'organisme d'un traitement,


médicamenteux ou d'autre nature, ne sont jamais
exclusivement bénéfiques, mais s'accompagnent d'effets
indésirables, plus ou moins sévères, plus ou moins intenses

.
RAPPORT BENEFICE- ou fréquents
RISQUE
La prise de décision doit donc mettre en balance les effets

. bénéfiques et les effets négatifs


Notion de tolérance

. Il faut raisonner sur:


- Le risque et la réduction de risque
- Le nombre de sujets à traiter pour éviter un évènement
supplémentaire

.
QUANTIFICATION DE - Les effets indésirables et le rapport bénéfice/risque
L'EFFET CLINIQUE Raisonner à l'échelle individuelle mais aussi à l'échelle
populationnelle
- Un faible bénéfice individuel peut être intéressant à
l'échelle populationnelle

. Il faut étudier l'applicabilité des résultats en pratique


quotidienne selon:
- Intérêt et pertinence des résultats obtenus
- Prise en compte de tous les facteurs cliniques
APPLICABILITE
0
importants dans la réflexion
(.9
LJ.J
- Le bénéfice du changement de pratique
a:
(.9 - Pour mes patients et pour ma pratique
LJ.J
a:
CO
0

z
a:
LJ.J
>
en
z
0
fC=
0
LJ.J
@

100
Chapitre
21

OBJECTIF PEDAGOGIQUE N ° 18

Les objectifs du CNCI pour l'iECN


CRITIQUER L'ANALYSE DES RESULTATS ET DE LA DISCUSSION

Vérifier que les résultats offrent une réponse à la question annoncée

MOTS-CLES et REFLEXES GENERAUX

• Objectif principal
• Population cible

Il STRUCTURE DE LA PARTIE RESULTATS

• La section résultats commence en général par une


description de la population étudiée
• La partie suivante fournit au lecteur les résultats permettant de
GENERALITES
répondre à la question posée
• Cette partie comportera également une estimation du critère
de jugement principal

101
iKB LECTURE CRITIQUE D'ARTICLE

. Vérifier que les résultats présentés correspondent aux

. objectifs annoncés et à la méthode de recherche décrite


L'ordre d'annonce des résultats doit être précis et suivre

. un sens logique
Tous les résultats des critères de jugement doivent

CARACTERISTIQUES
. apparaître (pas seulement les résultats significatifs)
La section résultats ne doit contenir que les résultats, sans

. commentaires ni références
S'ils sont nombreux, les résultats pourront être répertoriés

. dans un tableau ou être représentés par une figure


Un résultat n'est présenté qu'une seule fois, soit sous

. forme rédactionnelle, soit dans un tableau ou une figure


L'annonce des résultats fait l'objet d'une progression logique

. Résultats descriptifs de l'ensemble de la population

. étudiée : âge, sexe, caractéristiques cliniques

. Nombre de patients inclus et analysés


Données permettant de répondre à la question initiale
estimation du paramètre principal avec une indication de la
ORDRE DE . précision de cette estimation
PRESENTATION DES . Résultats sur les CDJ secondaires
RESULTATS
. Des données les moins ajustées vers les plus ajustées

. Comparaison (univariée) des populations étudiées


Si besoin, comparaison (multivariée) des populations
étudiées

NB : le résultat principal de l'étude doit être la première phrase de la


conclusion, qui doit répondre à la question posée.

"INTERPRETATION DES RESULTATS

• Analyse et présentation des résultats conformes :


A la question posée ;
Au type d'étude réalisé.
• Résultats obtenus sur l'échantillon entier (en ITT si essai
de supériorité)
• Mesure de l'effet de l'intervention ou de l'exposition
• Comparaison envisagée effectivement réalisée
• Analyse principale faite sur le CDJ principal :
CRITERES QUALITE Résultat statistiquement significatif
• Tout résultat sur un critère de jugement doit comporter:
La mesure du critère (dans chaque groupe si plusieurs
0
(.9
LJ.J
groupes)
a:
(.9 La taille estimée de l'effet ;
LJ.J
a: La précision du résultat(« p », IC95%).
CO
0 • Résultats provenant d'une comparaison entre les groupes, qui
z
a:
a due être prévue a priori
LJ.J
>
en
z
0
fC=
0
LJ.J
@

102
Chapitre
22

OBJECTIF PEDAGOGIQUE N ° 19

Les objectifs du CNCI pour l'iECN


CRITIQUER L'ANALYSE DES RESULTATS ET DE LA DISCUSSION

Vérifier que les conclusions sont justifiées par les résultats

MOTS-CLES et REFLEXES GENERAUX

• Causalité : critères de Bradford Hill


• Echantillon représentatif de la population cible
• Résultats statistiquement significatif ou non

• GENERALITES

• La conclusion c'est la réponse à la question posée pour le


CDJ principal et l'ensemble de l'échantillon étudié
• Elle est justifiée par les résultats
DEFINITION • Elle précise l'apport de l'étude pour la pratique

NB : on la trouve dans la première phrase de la discussion et à la fin de


celle-ci (individualisée ou intégrée à la discussion)

103
iKB LECTURE CRITIQUE D'ARTICLE

. Une conclusion :
- Reprend les principaux résultats
- Indique les implications majeures
- Est fondée sur les résultats de l'étude et surtout pas
sur l'opinion personnelle de l'auteur

.
- Indique la nécessité d'études ultérieures
QUALITE D'UNE
Dans une conclusion on ne doit pas :
CONCLUSION
- Extrapoler au-delà de la population cible
- Faire d'interprétation abusive
- Comporter de données chiffrées détaillées
- Comporter une opinion personnelle de l'auteur ou une
interprétation

. Sur le résultat de l'analyse du CDJ principal, qu'elle soit

. positive ou négative
INTERPRETATION DE
LA CONCLUSION . Pas d'interprétation ou opinion personnelle de l'auteur
Pas d'extrapolation en dehors de la population cible (validité
externe)

. Juste avant la conclusion, la discussion peut s'achever par la

RECOMMANDATONS
. formulation de recommandations
Elles sont une traduction des implications pratiques des

. résultats et des mesures qui peuvent être mise en place


Des recommandations ne sont pas systématiquement
formulées

"CAUSALITE

Essai contrôlé randomisé en double aveugle :


• Arguments directs pour la causalité :
Comparaison de l'intervention à un témoin (groupe
contrôle)
Comparabilité des groupes (randomisation, aveugle,
ETUDE analyse en ITT)
INTERVENTIONNELLE Contrôle des biais
• Niveau de preuve élevé

0
(.9
LJ.J
Autres essais thérapeutiques (ouvert, absence de randomisation, etc.) :
a: • Pas d'arguments directs de causalité :
(.9

LJ.J
a: Nombreux biais possibles
CO
0

z
a:
LJ.J
>
en
z
0
fC=
0
LJ.J
@

104
VERIFIER QUE LES CONCL USIONS SONT JUSTIFIEES PAR LES RESULTATS

. On ne peut jamais conclure à la causalité sur une étude

. épidémiologique
On ne peut parler que de présomption de causalité selon
ETUDE
EPIDEMIOLOGIQUE
. les critères de Bradford Hill++
On utilise un faisceau d'arguments en faveur de la
causalité :
- Arguments indirects
- Une seule étude ne suffit pas !

.
Critères INTERNES à l'étude :

. Existence d'une association


Temporalité : antériorité de l'exposition sur l'évènement

. étudié
La force de l'association : plus le RR ou l'OR est grand

. plus la relation est forte et plus la plausibilité est élevée


La relation dose effet, le risque de la maladie doit

. augmenter avec le niveau d'exposition ou la dose absorbée


Spécificité de la relation, si une exposition spécifique est
CRITERES DE reliée à la survenue d'un évènement de santé particulier, cela
BRADFORD HILL renforce le lien de causalité

.
Critères EXTERNES à l'étude :

. Cohérence de la relation et reproductibilité des résultats

. Existence d'un gradient géographique


La suppression du facteur d'exposition doit s'accompagner

. d'une diminution du risque dans le temps

. Plausibilité scientifique/physiopathologique du lien


Existence de preuves expérimentales (études chez
l'animal)

105
iKB LECTURE CRITIQUE D'ARTICLE

n ARBRE DECISIONNEL D'UNE ETUDE THERAPEUTIQUE

Essai thérapeutique de
supériorité


Essai statistiquement Essai non statistiquement
significatif significatif

/ \
C'est peut être vrai C'est peut être faux Manque de Traitement
puissance? équivalent?
inférieur?

Cliniquement Cliniquement Risque Lié à


intéressant non d'erreur un biais
intéressant alpha

Essai thérapeutique de non


infériorité

Essai statistiquement Essai non statistiquement


significatif significatif

C'est peut être vrai C'est peut être faux Manque de Traitement
puissance? équivalent ?
inférieur?

0
(.9
Cliniquement
j Cliniquement Risque Lié à
intéressant non d'erreur
LJ.J
a: un biais
(.9

LJ.J
a:
intéressant alpha
CO
0

z
a:
>
LJ.J

�------�----------
On peut revendiquer la supériorité ?
0
fC=
LJ.J
@ '-------------------'

106
VERIFIER QUE LES CONCL USIONS SONT JUSTIFIEES PAR LES RESULTATS

n COMMENT REPONDRE?

. On trouve les informations dans les parties


- Introduction
- Méthode
OU TROUVER LA - Résultats
REPONSE? - Conclusion

. Il faut étudier la cohérence des différentes parties entre


elles, leur suite logique

Q Si un test n'est pas significatif en analyse bilatérale, ne jamais


accepter une conclusion sur une analyse unilatérale

Q On peut éventuellement revendiquer la supériorité dans une


PIEGES étude de non-infériorité si toutes les valeurs de l'IC95% sont au-
dessus de la borne de non-infériorité

Q En cas d'étude de supériorité négative, ne jamais conclure à la


non-infériorité

107
DANS LA MÊME COLLECTION
DES OUVRAGES DIFFÉRENTS POUR RÉUSSIR
1
www.vg-ecni.fr

Livre + Appli
.--
VIDEOS
PIIIAGOGI_.ES li ➔ Sur chaque livre un code différent est imprimé, il se découvre en grattant.
Ce code donne accès à l'ensemble du livre (voir au dos de la couverture).
ONLINE 8 ➔ Le code donne un accès illimité à la consultation du contenu de ce livre sur une
seule tablette.

@J
.ivre+Appli
LA REFERENCE tO

SANTE PUBLIQUE
LECFURE CRITIQUE D'ARTI CLE-MEDECINEDUTRAVAIL -MEDECINELEGALE
lDITIDN2017

JérémylALIRENT

lu+ :=:•«oo�-:;H:�!:!��:
,i-.,,N,7'1,. M •rn�T-H
i•M

'"'•�-��� - M �œ� '�•

-� .. �
·�HO MT .J.,n��•� ..�-��

'""

LA REFERENCE POUR l' iECN


Chapitre
23

OBJECTIF PEDAGOGIQUE N ° 20

Les objectifs du CNCI pour l'iECN


CRITIQUER L'ANALYSE DES RESULTATS ET DE LA DISCUSSION

• Indiquer le niveau de preuve de l'étude (grille de l'HAS)

MOTS-CLES et REFLEXES GENERAUX

• Différence niveau de preuve et grade de recommandation


• Différents éléments constitutifs du niveau de preuve d'une étude

Il GENERALITES

• Le niveau de preuve d'une étude caractérise la capacité


d'une étude à répondre à la question posée
• Les critères :
Adéquation du protocole à la question posée ;
Existence ou non de biais importants dans la
réalisation ;
Puissance de l'étude, en particulier la taille de
l'échantillon ;
Adaptation de l'analyse statistique aux objectifs de
l'étude.
GENERALITES • En théorie on ne peut parler de niveau de preuve que dans
une étude thérapeutique, cependant attention cela pourrait
être demandé même dans le cas d'un article diagnostic ou
épidémiologique
• Ne pas confondre niveau de preuve qui ne caractérise que
l'article lui-même, sa validité interne et grade de
recommandation HAS qui représente l'apport de l'article
dans la pratique médicale
NB : le niveau de preuve d'une étude ne dépend pas :
Du type d'étude entre supériorité et non-infériorité ;
Du résultat (positif ou négatif) de l'étude.

109
iKB LECTURE CRITIQUE D'ARTICLE

• GRILLE HAS - NIVEAUX DE PREUVE/ GRADES DE RECOMMANDATIONS

Niveau de preuve scientifique fourni par la littérature (études Grade des


thérapeutiques) recommandations

Niveau 1 (NP1)
• Essais comparatifs randomisés de forte puissance sans Preuve scientifique
biais majeur établie
• Méta-analyse d'essais comparatifs randomisés A
• Analyse de décision basée sur des études bien menées

Niveau 2 (NP2)
Présomption
• Essais comparatifs randomisés de faible puissance
scientifique
• Études comparatives non randomisées bien menées
B
• Études de cohorte

Niveau 3 (NP3)
• Études cas-témoins
Faible niveau de
Niveau 4 (NP4) preuve
• Études comparatives comportant des biais importants C
• Études rétrospectives
• Séries de cas

Chaque article sélectionné a été analysé selon les principes de lecture critique de la
littérature. Sur la base de cette analyse de la littérature, le groupe de travail a proposé,
chaque fois que possible, des recommandations. Selon le niveau de preuve des
études sur lesquelles elles sont fondées, les recommandations ont un grade
variable, coté de A à C selon l'échelle proposée par l'ANAES.

En l'absence d'études, les recommandations sont fondées sur un ACCORD


PROFESSIONNEL.
0
(.9
LJ.J
a:
(.9

LJ.J
a:
CO
0

z
a:
LJ.J
>
en
z
0
fC=
0
LJ.J

110
INDIQUER LE NIVEAU DE PREUVE DE L'ETUDE (GRILLE DE L'HAS)

Il DIAGRAMME DECISIONNEL

1 Etude prospective
1
OUI

Comp arat ive C as témo ins

an m isee o_ o_ _ rt_e
�---R_ _ _do_ - _ '_ ---�11....____c_ h _____.

OUI NON
Fo rte puissance
sans biaism ajeur
OUI

111
iKB LECTURE CRITIQUE D'ARTICLE

0
(.9
LJ.J
a:
(.9
J,
LJ.J
a:
CO
0


z
a:
LJ.J
>
en
z
0
fC=
0
LJ.J
@

112
Chapitre
24

OBJECTIF PEDAGOGIQUE N ° 21

Les objectifs du CNCI pour l'iECN


EVALUER LES APPLICATIONS CLINIQUES

• Discuter la ou les applications potentiel/es proposées par l'étude

MOTS-CLES et REFLEXES GENERAUX

• Rapport bénéfices/risques
• Pertinence clinique
• Extrapolation

Il GENERALITES

• Il n'existe pas vraiment de technique universelle pour répondre


à cette question
• Pour évaluer les décisions médicales auxquelles peuvent
conduire les résultats et la conclusion de l'article il faut prendre
en compte : la méthodologie de l'article ET la pertinence
clinique ou thérapeutique qui en découlerait

113
iKB SANTE PUBLIQUE

• DIMENSIONS DE LA LCA

.
. Correspond à la « fiabilité » de l'étude
Préalable à la validité externe de l'étude et à son

. applicabilité potentielle
Evaluation de la validité interne d'une étude :
- Absence de biais majeur(s) = comparabilité entre les
VALIDITE INTERNE groupes
- Résultat statistiquement significatif (sur le CDJ
principal)
- Méthodologie correcte et adaptée à la question posée
q Le résultat de l'étude est-il fiable ?

. Elle correspond à l'applicabilité ou la généralisabilité des

. résultats de cette étude


Evaluation de la validité externe d'une étude :
- Population cible de l'étude (critères d'inclusion, de non-
inclusion et d'exclusion)
- Modalités de recrutement des patients
- Conditions de mise en œuvre de la stratégie étudiée
- Nature de l'intervention
- Critère de jugement

.
q A quels patients le résultat peut-il être généralisé ?
Etude thérapeutique: Mon patient est-il différent de ceux

. inclus dans l'étude?


Etude épidémiologique: Les résultats sont-ils adaptables à ma

VALIDITE EXTERNE . pratique?


Etude diagnostique: patient différent? Reproductibilité du test
correcte?

Sources de non extrapolabilité des résultats :


q Pourquoi l'effet observé dans ma population est-il différent de celui

.
de l'essai?
Facteurs épidémiologiques
- Comorbidités

.
- Traitements associés
Facteurs démographiques

.
- Age, ethnie, lieux de résidence différents

. Exposition à des facteurs confondant


Facteurs physiopathologiques
- Différence biologique entre les populations
0
(.9
LJ.J
a:
(.9

LJ.J
a:
CO
0

z
a:
LJ.J
>
en
z
0
fC=
0
LJ.J
@

114
DISCUTER LA OU LES APPLICATIONS POTENTIELLES PROPOSEES PAR L'ETUDE

. Un résultat peut être statistiquement significatif mais


n'apporter qu'une différence minime pour peu que le nombre

. de sujets inclus soit conséquent (forte puissance de l'étude)


La question à se poser est alors celle de savoir si la différence

. observée est pertinente cliniquement


Eléments à r::1rendre en considération :
- Taille de l'effet
- Balance bénéfices/risques favorable
PERTINENCE - Critère de jugement (clinique, pertinent, etc.)
CLINIQUE
q
.
Le résultat est-il intéressant I important en pratique ?
Diagnostic : quel est l'impact du résultat du test sur la décision

. de prise en charge ?
Thérapeutique : quel est l'effet réel quantitativement de ce
traitement ? (diminution de 5mmHg ou de 20mmHg de la
pression artérielle)

. Cohérence des données de cette étude avec ce qui était déjà


COHERENCE
EXTERNE . connu dans la littérature
En sus des trois dimensions évoquées précédemment

Il COMMENT REPONDRE?

. On trouve la réponse à cette question en analysant les


paragraphes :
OU TROUVER LA - Résultats
REPONSE? - Discussion

. OUI/ NON
- Niveau de preuve
- Validité interne/ fiabilité de l'étude
- Validité externe / applicabilité de l'étude
- Cohérence externe/ littérature
FAUT-IL SUIVRE CE - Pertinence clinique/ CDJ
QUE DIT L'ETUDE?
- Pertinence économique
- Alternative possible ?
- Différence significative applicable ? / Extrapolable ?
- Extrapolation possible du protocole ? / De la population ?

115
iKB LECTURE CRITIQUE D'ARTICLE

0
(.9
LJ.J
a:
(.9
J,
LJ.J
a:
CO
0


z
a:
LJ.J
>
en
z
0
fC=
0
LJ.J
@

116
Chapitre
25

OBJECTIF PEDAGOGIQUE N °22

Les objectifs du CNCI pour l'iECN


ANAL YSER LA FORME DE L'ARTICLE

• Identifier la structure IMRAD (Introduction, Matériel et méthode, Résultats,


Discussion) et s'assurer que les divers chapitres de la structure répondent à leurs
objectifs respectifs

MOTS-CLES et REFLEXES GENERAUX

• Introduction
• Méthodes
• Résultats
• Discussion

■ LA STRUCTURE IMRAD

• La structure d'un article original doit respecter un certain


nombre de règles énoncées dans les recommandations aux
auteurs
• Toutefois, certaines règles sont communes à la quasi-totalité
des articles, notamment dans la présentation générale de
GENERALITES ceux-ci
• La structure IMRAD (introduction, methods, results and
discussion), est la structure type que doivent respecter
l'ensemble des auteurs d'articles médicaux.
• Il existe donc 4 grandes parties dans un article médical qui
doivent chacune répondre à des questions précises

117
iKB SANTE PUBLIQUE

.
REDACTION . Concision : les phrases doivent être courtes
Clarté : phrases simples, tournures directes

. Le présent pour l'exposé des données actuellement


admises dans la communauté scientifique, les opinions, les
TEMPS VERBAUX . généralisations, ...
Le passé pour la méthode et les résultats (car au moment
de la rédaction la recherche est terminée), et pour rapporter
des faits passés (Smith et al. ont démontré que ... )

. Abréviations expliquées au moment de leur première


AUTRES
. utilisation
Unités internationales

" INTRODUCTION

. Elle est là pour permettre au lecteur de comprendre

. pourquoi ce travail a été réalisé


Elle définit la question de recherche et le plan d'étude

. adapté
Elle est le plus souvent constituée de 3 parties :
GENERALITES 0 La première partie est une rapide mise au point
rappelant le contexte de l'étude, la position du problème
pour un auteur non initié
0 La seconde permet de préciser les particularités de
l'étude
0 La dernière énonce l'objectif de l'étude

. Contexte de l'étude :
- Rapide point épidémiologique
PREMIERE PARTIE : - Synthèse des connaissances sur le sujet
CONTEXTE DE
- Nature et importance du problème étudié
L'ETUDE
- Questions restant en suspens qui justifient la réalisation
de cette étude

0
(.9
LJ.J
a:
. Ce qu'apporte l'étude par rapport aux études antérieures :
(.9 DEUXIEME PARTIE : - Lacunes et interrogations justifiant la mise en place de
LJ.J
a: PARTICULARITES DE cette étude
CO
0 L'ETUDE - Motivations des auteurs
z - Hypothèse(s) qu'ils veulent tester
a:
LJ.J
>
en
z
0
fC=
0
LJ.J
@

118
IDENTIFIER LA STRUCTURE IMRAD

Elle précise l'objectif principal (UNIQUE++) :


Sous forme de question
Contenant les éléments suivants : « PICO »
TROISIEME PARTIE : • Population de l'étude
OBJECTIF • Intervention réalisée
• Contrôle
• Outcome
• Un ou plusieurs objectifs secondaires possibles

• MATERIEL ET METHODE

. Cette partie permet d'évaluer la rigueur scientifique du travail


effectué :

.
- Oriente vers la validité externe de l'étude
Elle ne contient que des informations disponibles et
recueillies avant d'effectuer l'étude
- Elle ne peut donc contenir aucun résultat, ni
commentaire éventuel
GENERALITES - Dans l'absolu elle devrait permettre au lecteur de reproduire

. l'étude le plus fidèlement possible


Les choix des auteurs doivent être motivés par des

. références scientifiques bibliographiques


Cette partie permet de rechercher les principaux biais
éventuels de l'étude (sélection, classement, confusion)

.
. La population étudiée doit être décrite avec précision
On décrit la population source avec les critères d'inclusion et de
non-inclusion, puis la population étudiée après sortie des
DESCRIPTION DE LA
. patients présentant les critères d'exclusion
POPULATION
. Le lieu et la période d'inclusion sont également décrits

. Technique d'échantillonnage
Modalité de sélection, randomisation éventuelle

. Temporalité : transversale/ longitudinale, prospective/

. rétrospective
TYPE D'ETUDE
. Etude observationnelle ou interventionnelle
Cas-témoins ou exposés/non exposés

.
. Description de l'intervention
SCHEMA
EXPERIMENTAL . Méthode de recueil et d'analyse des résultats
Moyens mis en œuvre pour limiter les biais éventuels

119
iKB SANTE PUBLIQUE

.
. Définition des CDJ, et notamment du CDJ principal
Définition des variables la plus claire possible (classification

. utilisée, eut-off choisi... )


Modalités de recueil de la mesure: qui?, quand?, avec
CRITERE DE
JUGEMENT . quoi?, quelles unités de mesure?
Modalités de recueil des données non mesurables
comment? (questionnaire? appel téléphonique?... ), par qui?,
avec un contrôle de la qualité? (double recueil, contrôle sur
échantillon)

.
. Calcul du nombre de sujets nécessaire a priori

. Tests statistiques utilisés


ANALYSE
STATISTIQUE . Seuils de significativité, de non-infériorité...
Méthodologie de l'analyse univariée et de l'analyse multivariée
(critères inclus dans l'analyse multivariée)

g RESULTATS

.
. C'est le cœur de l'article
Cette partie doit donner TOUS les résultats et UNIQUEMENT

. ces derniers sans jugement ou commentaire éventuel


Ces résultats peuvent être présentés sous la forme de texte,

. de tableaux ou encore de figures


Ces différentes formes de communications doivent être

GENERALITES . complémentaires et non redondantes


Ils doivent être donnés dans un ordre logique, les résultats
concernant le CDJ principal avant ceux des CDJ
secondaires, l'analyse univariée avant l'analyse

. multivariée

. Ne pas omettre les résultats négatifs


Doit présenter des éléments pour apprécier la significativité
statistique mais aussi la pertinence clinique des résultats

.
. Nombre de sujets inclus et analysés

. Comparabilité des sujets (tableau 1 le plus souvent)


Effectifs et principales étapes de l'étude (diagramme de flux

. ou flow chart)

. Description en termes de CDJ


ENCHAINEMENT DES
. Analyse univariée

.
RESULTATS Recherche et analyse des facteurs de confusion
0
. Analyse multivariée

. Analyses secondaires
(.9
LJ.J
a:
(.9
Tableaux et figures en annexe ou intégrés dans le texte
LJ.J
a:
CO
définitif
0

z
a:
LJ.J
>
en
z
0
fC=
0
LJ.J
@

120
IDENTIFIER LA STRUCTURE IMRAD

g DISCUSSION

. Dire si le but énoncé à la fin de l'introduction a été atteint

. ou non (synthèse des principaux résultats de l'étude)


Jugement critique sur la qualité de l'étude, discussion de la

PLAN DE LA . validité interne de l'étude, ses biais et limites éventuelles


Comparaison aux autres données de la littérature =
DISCUSSION
. cohérence externe
Généralisation et extrapolabilité des résultats = validité

. externe
Implication clinique et pratique

. Cette partie n'est pas toujours individualisée et fait souvent

. partie du chapitre discussion

. Sur le seul critère de jugement principal


CONCLUSION
. Ouverture vers d'autres voies de recherche

. Compléments à apporter
Conséquences pratiques

121
iKB LECTURE CRITIQUE D'ARTICLE

0
(.9
LJ.J
a:
(.9
J,
LJ.J
a:
CO
0


z
a:
LJ.J
>
en
z
0
fC=
0
LJ.J
@

122
Chapitre
26

OBJECTIF PEDAGOGIQUE N ° 23

Les objectifs du CNCI pour l'iECN


ANAL YSER LA FORME DE L'ARTICLE
• Faire une analyse critique de la présentation des références

MOTS-CLES et REFLEXES GENERAUX

• Normes de Vancouver
• Références récentes et pertinentes

.CONTENU

• Le travail de recherche et l'écriture d'un texte scientifique


(rapport, article, thèse, ... ) suppose une recherche
d'information approfondie. Cette recherche, inscrite dans la
démarche scientifique, prend directement appui sur les
travaux antérieurs. L'information choisie et exploitée
permet de développer une réflexion personnelle
• Ainsi, chacun des documents, retenu et analysé, contribue à
la crédibilité scientifique du travail de recherche. Afin de
faciliter la réflexion des lecteurs, qui à leur tour vont vouloir
croiser leurs informations, il convient de référencer
correctement les travaux cités en rédigeant une partie intitulée
« Références Bibliographiques »
GENERALITES • Les références bibliographiques doivent permettre, sans
aucune ambiguïté, l'identification et ensuite la localisation
des documents
• Les références scientifiques et bibliographiques doivent
permettre de justifier tout fait énoncé : contexte, support
physiopathologique, épidémiologie sur le sujet, méthode,
comparaison des résultats aux données de la littérature.
• Le rédacteur doit choisir les plus pertinentes, sans
obligation d'exhaustivité
• Si un article princeps existe sur le sujet, il doit être mentionné
• Seules les références effectivement appelées dans l'article
sont citées
• Toujours privilégier les articles les plus récents

123
iKB LECTURE CRITIQUE D'ARTICLE

Il est possible de se faire une opinion sur la valeur scientifique


d'un article à partir du choix des références
• Des références trop anciennes suggèrent que les auteurs ne
sont pas au courant des publications récentes ;
CE QUE PEUVENT • Des auto-références peuvent traduire une autosatisfaction des
SUGGERER DES auteurs pas toujours justifiée.
REFERENCES
• Une mauvaise présentation des résultats peut faire douter de
la rigueur avec laquelle ils ont conduit leur travail :
o Une mauvaise abréviation du journal de parution
o L'absence du numéro de la dernière page d'un article

"PRESENTATION

. Dans le texte, un numéro entre crochet renvoie à la citation

. complète en fin d'article


Les références sont, soit numérotées dans leur ordre
d'appel dans le texte, soit numérotées dans l'ordre
GENERALITES . alphabétique du premier auteur
Elles sont appelées dans le texte soit par leur numéro soit par

. le nom du premier auteur


Il existe plusieurs systèmes mais l'un d'entre eux tend à se
généraliser : les normes de Vancouver

Les points abordés sont ceux de la National Library of Medicine

.
(NLM):
Zone auteur :
- Premier auteur (Nom et première lettre du prénom)
- Liste des auteurs : séparés par des virgules ; si> 6

.
auteurs : inscrire les 6 premiers puis mettre « et al. »
Zone du titre :

.
- titre reproduit fidèlement (ponctuation comprise)
Zone de l'édition :
NORMES DE - nom du journal dans lequel l'article a été publié (nom du
VANCOUVER journal abrégé conformément à la liste des abréviations de

. la NLM)
Zone de l'adresse :
- date de publication (si connue)

.
- année en chiffre puis mois en abrégé puis jour en chiffre
Zone de collation :
0 - on note ici la notion de volume puis le numéro puis la
(.9
a:
LJ.J

(.9
pagination (1 ere et dernière page de l'article)
a:
LJ.J

CO
0

z
a:
>
LJ.J

en
z
0
fC=
0
LJ.J
@

124
Chapitre
27

OBJECTIF PEDAGOGIQUE N ° 24

Les objectifs du CNCI pour l'iECN


ANAL YSER LA FORME DE L'ARTICLE

• Faire une analyse critique du titre

MOTS-CLES et REFLEXES GENERAUX

• Population étudiée
• Objectif principal
• Critère de jugement

• Le rôle du titre est d'informer rapidement le lecteur sur le


contenu de l'article
• Il est formé d'une succession de mots clés dont l'ensemble
n'est pas tenu de former une phrase
• Le titre doit être court et informatif par rapport au contenu de
GENERALITES l'article (= précision)
• Le plus souvent, le nombre de mots est limité par les
recommandations aux auteurs de la revue auquel l'article est
destiné ; généralement 1 O à 15 mots
• Il doit être neutre (n'annonce pas les résultats)
• Il ne doit pas contenir d'abréviations

125
iKB LECTURE CRITIQUE D'ARTICLE

. Idéalement, le titre doit comporter :


0 L'objet de l'étude, le lecteur doit pouvoir affirmer
rapidement le type d'étude
0 La question posée, le lecteur doit pouvoir juger de la
pertinence de l'étude pour la pratique

. 0 La population étudiée (lieu, période, individus, ... )


Le lecteur doit immédiatement comprendre de quoi
CONTENU
. l'article parle, il doit avoir envie de poursuivre sa lecture
On doit donc y trouver :
0 Le type d'article (épidémiologique, diagnostic,
thérapeutique)
0 La population de l'étude
0 L'intervention réalisée
0 Le critère de jugement principal
0 Le plan expérimental

. Epidémiologie : Etude de l'association entre tabac et risque de


survenue d'un cancer du poumon chez des hommes
européens

. Diagnostic : Impact du test de dépistage rapide du


streptocoque B sur la prise en charge antibiotique des angines
EXEMPLE
aux urgences pédiatriques

. Thérapeutique : Radio-chimiothérapie exclusive versus


chirurgie dans le traitement du cancer de la prostate chez des
hommes atteints d'un cancer de la prostate stade 2. Essai
comparé randomisé

.
. Doit être bref mais spécifique

. Doit refléter le contenu significatif de l'étude


UN BON TITRE
. Rappelle les éléments clés de l'objectif principal

. Doit éviter les abréviations


Doit être attractif

0
(.9
LJ.J
a:
(.9

LJ.J
a:
CO
0

z
a:
LJ.J
>
en
z
0
fC=
0
LJ.J
@

126
PARTIE 3

LES DIFFERENTS TYPES D'ETUDE


iKB LECTURE CRITIQUE D'ARTICLE

SOMMAIRE

Les études thérapeutiques

Les études épidémiologiques

Les études diagnostiques

Les études pronostiques

0
(.9
LJ.J
a:
(.9
J,
LJ.J
a:
CO
0


z
a:
LJ.J
>
en
z
0
fC=
0
LJ.J
@

128
Chapitre
28

LES ETUDES THERAPEUTIQUES

• Randomisation
• Groupe contrôle
• Double aveugle+analyse en aveugle
• Calcul NSN a priori
• Définition claire et pertinente de la population d'étude :
Echantillon représentatif de la population cible
• CDJ principal
10
COMMANDEMENTS Unique
Consensuel
Cliniquement pertinent
Objectif
• Intention de traiter (analyse)
• Analyse finale sur la population entière
• Différence statistiquement significative
• Différence cliniquement signifiante

• Les recommandations pour la rédaction d'articles concernant


RECOMMANDATIONS des études thérapeutiques sont les recommandations
CONSORT

129
iKB SANTE PUBLIQUE

■ PLAN EXPERIMENTAL

GROUPES PARALLELES :
• Le patient reçoit soit le traitement A soit le traitement B selon le
groupe dans lequel il a été randomisé:
Les deux groupes sont suivis « en parallèle »
Comparaison des deux groupes en fin d'essai
• Il existe moins de biais mais plus de patients sont nécessaires

CROSS-OVER :
• En cas de cross over le patient reçoit soit le A puis le B soit le B
puis le A:
chaque sujet est alors son propre témoin
• Une période de « wash-out » sans traitement est nécessaire
entre les 2 traitements:
Elimine l'effet rémanent du premier traitement
• Conditions de réalisation:
Maladie chronique et stable dans le temps
Pas d'effet rémanent des traitements (notamment
GROUPES traitement en première période)
PARALLELES VS Peu de perdus de vue en première période
CROSS OVER Il ne doit pas y avoir d'effet période (selon moment
d'administration du traitement dans l'étude)
• Avantages:
Gain de puissance
Moins de sujets à inclure
Diminution de la variabilité inter-groupes (meilleure
comparabilité des groupes) = meilleure validité interne
• Inconvénients:
Plus long, plus cher
Nécessité d'un « wash-out »
Pas réalisable si effet rémanent du premier traitement

Traitement A � , Traitement B

Traitement B Traitement A

• Evaluation de l'association de traitements :


Avec 2 traitements on peut faire jusque 4 groupes différents
(A; B; A+B; double placebo)
PLAN FACTORIEL • Ce type de plan d'étude permet:
De tester l'efficacité des traitements A et B par rapport au
0 placebo;
(.9
LJ.J
a: De tester l'interaction entre ces deux traitements (synergie,
(.9
antagonisme).
LJ.J
a:
CO
0

z
a:
LJ.J
>
en
z
0
fC=
0
LJ.J
@

130
LES ETUDES THERAPEUTIQUES

FI DESIGN DES ETUDES

. Objectif:

.
- Démontrer que l'un des traitements est supérieur à l'autre
Analyse: INTENTION DE TRAITER
- Tout patient randomisé sera analysé dans son groupe de
randomisation, et cela peu importe le traitement
ETUDE DE
effectivement reçu, sa dose...
SUPERIORITE
- C'est le gold standard des études de supériorité
- On diminue la probabilité de mettre en évidence une
différence, mais cela permet de renforcer la supériorité du
traitement si le résultat est significatif

. Objectif:
- Démontrer que la différence entre les deux traitements

. est négligeable
Intérêts :
- Traitement de référence difficilement dépassable en
termes d'efficacité
- La non-infériorité suffit à valider l'intérêt du nouveau
traitement car non invasif, plus pratique, coût diminué, ...
- Arguments de la littérature en faveur du nouveau traitement
et pas d'argument contre
- Différents avantages ; moins cher, plus rapide, moins

. contraignant...
Eléments à contrôler:
- Ce type d'étude doit être défini a priori dans le protocole
- Le seuil d'équivalence ou la borne de non-infériorité

ETUDE DE NON- . doivent également être fixées a priori


Analyses:
INFERIORITE I - INTENTION DE TRAITER
EQUIVALENCE - PER PROTOCOLE (Gold Standard des études de non-
infériorité)
- Analyses concordantes pour pouvoir conclure
0 Conclusion à la non-infériorité si IC95% présent
dans le domaine de non-infériorité (en particulier au
dessus de la borne de non-infériorité)
0 Conclusion à l'équivalence si tout l'IC95% est

. présent dans le domaine d'équivalence


Différences non-infériorité et éguivalence:
- Dans la non-infériorité, le traitement peut être plus efficace:
on peut mener une étude de supériorité complémentaire
si l'IC95 est au dessus de 0
- C'est l'intérêt de l'analyse en ITT qui doit également être
menée
- Le NSN pour les études de non-infériorité est supérieur au
NSN pour les études d'équivalence

131
iKB SANTE PUBLIQUE

li ANALYSE DES RESULTATS

. L'analyse porte sur tous les sujets randomisés au début


d'étude, quel que soit le traitement qu'ils ont

. effectivement reçu

INTENTION DE
. Reflet de ce qui se passe « dans la vraie vie»
Avantages:
- Evite le biais d'attrition (conservation de la comparabilité
TRAITER
initiale)
- Conditions de « vie réelle »
- Permet de renforcer le niveau de preuve d'une
différence par l'hypothèse du biais maximum

. Dans une analyse per protocole, seuls les patients ayant reçu
le bon traitement à la bonne dose avec le bon protocole sont

. analysés
Intérêt:

.
- Meilleure estimation de l'effet propre du traitement
Risques:
PER PROTOCOLE - Risque de déséquilibrer 2 groupes qui étaient
initialement homogènes et comparables
- Diminue la validité interne en diminuant la puissance
et en créant un biais d'attrition
- Risque de conclure à une différence qui n'existait pas ou
ne pas conclure à une différence qui existe

. Patients analysés = patients qui ont reçu le bon traitement à la


bonne dose mais pas forcément dans leur groupe de
ANALYSE EN
TRAITEMENT RECU
. randomisation
Perte du bénéfice de la randomisation

.
- Risque de biais de sélection
Permet d'augmenter les effectifs des patients analysés

0
(.9
LJ.J
a:
(.9

LJ.J
a:
CO
0

z
a:
LJ.J
>
en
z
0
fC=
0
LJ.J
@

132
LES ETUDES THERAPEUTIQUES

DIFFERENTES PRESENTATIONS D'UN MEME RESULTAT

RISQUE DE BASE
. C'est le risque de survenue d'un évènement dans le groupe
contrôle (placebo ou traitement de référence)
(X)
.
q Soit X=20/100=20%=0.20
RISQUE AVEC LE C'est le risque de survenue de ce même évènement en cas
TRAITEMENT d'utilisation du nouveau traitement

.
(Y) q Soit Y=15/100=15%=0.15
C'est le rapport X/Y
RISQUE RELATIF
.
q Soit ici 0.15/0.20=75%
REDUCTION ABSOLUE C'est la différence de risque entre les deux groupes
DU RISQUE q Soit ici X-Y= 0.20-0.15=0.05=5%

.
(RAR)
REDUCTION RELATIVE C'est la diminution d'un risque ou évènement défavorable (ou
DU RISQUE l'augmentation d'un évènement favorable)

.
(RRR) q Soit (X-Y)/ X
NOMBRE DE SUJETS C'est le nombre de sujets qu'il est nécessaire de traiter avec le
A TRAITER POUR nouveau médicament pour sauver une personne de plus que
EVITER UN dans le groupe contrôle
EVENEMENT q Soit ici 1/(X-Y)=1/RAR=1/(0.20-0.15)=20

.
(NST) q BENEFICE
C'est le produit du nombre de sujets à traiter pour éviter un
NOMBRE D'EFFET . évènement par l'incidence des effets secondaires graves
SECONDAIRE PAR
EVENEMENT EVITE
. Ce chiffre représente le RISQUE du traitement
Il caractérise le nombre d'évènements indésirables graves qui
vont survenir pour sauver 1 patient de plus
q Ici 20x0.1=2

133
iKB SANTE PUBLIQUE

ARRET D'UNE ETUDE - ANALYSES INTERMEDIAIRES

.
.
Analyse en cours d'étude sur des données partielles
Objectifs:
- Interrompre éventuellement l'étude
- Doivent être prévues a priori dans le protocole:
PRINCIPE 0 Car elles augmentent le nombre de sujets
nécessaires
0 Car il faudra les prendre en considération pour
anticiper une éventuelle inflation du risque alpha

Une analyse intermédiaire peut permettre de faire arrêter une étude en

.
cours pour différents motifs:
Arrêt pour efficacité :
- Détection plus précoce du bénéfice du traitement
- Ethique: éviter de traiter des patients avec un placebo ou
le traitement de référence alors qu'un traitement plus

.
efficace existe
Arrêt pour futilité :
- Arrêt de l'étude car elle ne pourra pas aboutir au vu des
BUT DES ANALYSES
.
résultats de cette première analyse
INTERMEDIAIRES
Arrêt pour toxicité :
- Détection précoce d'un éventuel effet délétère du
traitement à l'étude
- Eviter d'exposer plus longtemps des personnes à ce

.
risque
Vérification:
- Du taux d'écarts au protocole
- Du taux d'inclusion
- Des caractéristiques des patients inclus

0
(.9
LJ.J
a:
(.9

LJ.J
a:
CO
0

z
a:
LJ.J
>
en
z
0
fC=
0
LJ.J
@

134
LES ETUDES THERAPEUTIQUES

"GRILLE DE LECTURE D'UN ARTICLE THERAPAUTIQUE

GRILLE DE LECTURE D'UN ARTICLE THERAPEUTIQUE

Titre et autem de l'artickl:

Rev/kmée!Vo IJPages

Thèiœ de l'article

OUI NON ?

1. L es objectifs sont clairement définis □ □ □


2. Méthodolo @e de l' étude
• L'étude est comparative □ □ □
- l'étude est prospective □ □ □
- l'étude est randomisée □ □ □
• Le calcul du nombre de patie nts a été fuit a priori □ □ □
• La population de l'étude correspond à la □ □ □
population œbit uell ement traitée

• Toutes 1es variables cliniquement pe rtinentes □ □ □


sont prises en compte

• L'analyse statistique est adaptée □ □ □


• L'analyse est fuite e n intention de traiter □ □ □
3. Les résultats sont cohérents avec l'o� ecti f de l'étude □ □ □
et tiennent compte d'éventuels effets secondaires

4. A pplica bili té clinique

• L a signification dini que est don née □ □ □


• Les modalités de traitement sont applicables □ □ □
en routine

Connœntaires :

D'après « Guide d'analyse de la littérature et gradation des recommandations », ANAES, 2000

135
iKB LECTURE CRITIQUE D'ARTICLE

0
(.9
LJ.J
a:
(.9
J,
LJ.J
a:
CO
0


z
a:
LJ.J
>
en
z
0
fC=
0
LJ.J
@

136
Chapitre
29

LES ETUDES EPIDEMIOLOGIQUES

• Etude comparative
• Population et groupes bien définis
• Critères d'inclusion et d'exclusion justifiés
• Centres bien définis
10 • Appariement sur les facteurs de confusion potentiels
COMMANDEMENTS • Analyses ajustées si nécessaire
• Variables mesurées adaptées et fiables
• Mesure du CDJ identique dans les 2 groupes
• Suivi suffisamment long et complet (cohorte++)
• Méthodologie adaptée à la fréquence de l'évènement

• Les recommandations pour la rédaction d'articles concernant


RECOMMANDATIONS des études observationnelles en épidémiologie sont les
recommandations STROBE

Il GENERALITES

lnterventionnelle

Descriptive

Etude transversale Etude cas-témoins

Etude de corrélation Etude de cohorte


écologique
Etude transversale

Etude de corrélation
écologique

137
iKB SANTE PUBLIQUE

Etude interventionnelle :
• L'exposition est contrôlée par l'investigateur
Etude observationnelle :
• L'exposition (le facteur étudié) n'est pas contrôlée par
l'investigateur
DIFFERENTS TYPES Etude descriptive :
D'ETUDE • Description de certaines caractéristiques de la population
et leur variation (temporo-spatiale)
Etude analytique :
• Recherche d'une association statistique (et non d'un lien
de causalité) entre une (ou plusieurs) exposition(s) et une
(des) maladie(s)

n ETUDE DE COHORTE

.
. Sujets tous non-malades à l'inclusion
CRITERES
D'INCLUSION . Définition de l'exposition étudiée précise et objective
Appariement sur des facteurs de confusion potentiels

.
. Identique chez les exposés et les non-exposés

. Fiable

. Standardisé
RECUEIL STATUT DE
. Définition objective de la maladie

.
MALADE Evaluation en aveugle du statut exposés/non exposés
Risque:
- Biais de classement

. Biais de sélection lié aux perdus de vue :


- Fonction de la durée du suivi et du nombre d'évènements
PRINCIPAL RISQUE (risque élevé si peu d'évènements et beaucoup de perdus
de vue)

. Risque relatif (RR)

.
- Possibilité de calculer aussi un OR
Prise en compte des facteurs de confusion potentiels lors de
MESURE DE
l'analyse:
L'ASSOCIATION - Stratification
- Ajustement (analyse multivariée)

. Il existe des cohortes descriptives et des cohortes

0 . analytiques (exposés/non exposés)


Il existe des cohortes prospectives et des cohortes

.
(.9
LJ.J
a: rétrospectives (historiques)
(.9 AUTRES ELEMENTS
LJ.J
Il existe des cohortes fermées (nombre de sujets défini a
a: priori) et des cohortes ouvertes (des sujets peuvent entrer et
CO
0
sortir de la cohorte au cours du temps)
z
a:
LJ.J
>
en
z
0
fC=
0
LJ.J
@

138
LES ETUDES EPIDEMIOLOGIQUES

Il ETUDE CAS-TEMOINS
CRITERES . Sélection se fait sur la maladie

.
D'INCLUSION

. CAS: malades
Critères diagnostiques objectifs
- Cas incidents : tous les nouveaux cas sont inclus
CAS
- Cas prévalents : tous les malades présents à un moment
donné sont inclus

.
. TEMOINS: non malades
Sont issus de la même population d'origine des cas mais
sont indemnes de la maladie(« Si un témoin était malade, il

. serait considéré comme un cas dans notre étude »)


Permettent d'estimer la prévalence de l'exposition dans la
TEMOINS . population d'origine des cas
Risque de biais de sélection lié au choix des témoins:
- Témoins hospitaliers: simplicité d'accès, diminution du
biais de mémorisation différentiel
- Témoins en population générale: coûteux, risque de
biais de mémorisation différentiel

.
. Identique chez les cas et chez les témoins
Questionnaires:

.
- Objectifs, validés, etc.
Evaluateur:
RECUEIL STATUT DE
.
- Entraîné, en aveugle du statut cas/témoins
L'EXPOSITION
Risques:
- Biais de classement
- Biais de mémorisation

. Calcul d'un OR

.
- Pas de calcul possible de RR
Prise en compte des facteurs de confusion:
- Appariement (de 1 à 5 témoins par cas, permettant
MESURE DE
d'augmenter la puissance)
L'ASSOCIATION - Restriction de la population d'étude
- Stratification (analyse stratifiée)
- Ajustement (analyse multivariée)

139
iKB SANTE PUBLIQUE

Cas témoins Exposés-non exposés

Rapide, peu coûteux Niveau de preuve 2


Facile Adapté aux expositions rares
Avantages Adapté aux maladies rares ou à latence Etude de plusieurs maladies
longue Etude prévalence et incidence
Etude de plusieurs expositions Etude de la chronologie des
évènements

Niveau de preuve 3 Long et coûteux


Rétrospective Maladie doit être fréquente
Biais de mémorisation et de classement Incidence doit être élevée
Biais de sélection dans le choix des Latence de la maladie doit être
témoins courte
Inconvénients Peu adapté aux expositions rares Durée de l'étude longue
Ne permet pas d'étudier prévalence et Risque de biais d'attrition par perdus
incidence, calcul de l'OR uniquement de vue
Une seule maladie Une seule exposition

n ETUDE TRANSVERSALE

.
PRINCIPE
. Etude menée à un instant T donné
Recueil simultané des informations sur l'exposition et la
maladie

. Conclusions difficiles sur la relation entre exposition et


maladie:
- Pas d'information sur la chronologie entre exposition et
maladie
PRINCIPAL RISQUE - Le sujet a pu modifier son comportement (exposition)
entre le moment où il a appris sa maladie et le moment où
l'enquête est menée

.
MESURE DE
l'ASSOCIATION
. Calcul d'un OR
Calcul d'un RR

0
(.9
LJ.J
a:
(.9

LJ.J
a:
CO
0

z
a:
LJ.J
>
en
z
0
fC=
0
LJ.J
@

140
LES ETUDES EPIDEMIOLOGIQUES

"QUANTIFIER L'ASSOCIATION

L'objectif est de mesurer l'association entre un facteur d'exposition et un évènement (et la force de
cette association).
Construction d'un tableau de contingence :
Malades Non malades

Exposés a b IE+ =a/ (a+b)

Non exposés C d IE- =c/ (c+d)

Cote E+ =a/ c Cote E- =b/ d

• Rapport de l'incidence chez les exposés sur l'incidence chez


les non-exposés

RISQUE RELATIF RR = [a/(a+b)] / [c/(c+d)]

• Si ajustement: modèle de Cox (RR ajusté)

• Rapport de la cote chez les exposés sur la cote des non­


exposés
ODDS RATIO OR = ad/be

• Si ajustement: régression logistique (OR ajusté)


• RR et OR varient de O à l'infini
• Interprétation :
- Si = 1 alors aucune association démontrée
- Si > 1 alors association positive (facteur de risque) :
attention, pas de causalité pour autant !
- Si < 1 alors association négative (facteur protecteur)
• En cas de maladie rare (prévalence inférieure à 5 ou 10%
selon les auteurs) alors l'OR est un bon estimateur du RR
• En cas d'analyse multivariée, on s'intéresse au RR/OR ajusté
INTERPRETATION
(ajustement sur des covariables)
• Il faut toujours interpréter ces valeurs en fonction de
l'intervalle de confiance et/ou du degré de significativité
p:
- IC 95% contient la valeur 1 : résultat non significatif
(manque de puissance ou absence d'effet de l'exposition
sur la maladie)
- IC 95% ne contient pas 1 : résultat significatif
NB: l'interprétation graphique se fait par le diagramme de Forest
• Réduction relative du risque (RRR) = (1 - RR) x 100

• Réduction Absolue du Risque (RAR) = (IE+) - (IE-)


AUTRES INDICES
NB: il faut connaître les différentes présentations possibles d'un
même résultat dans un article: des questions peuvent être posées à
ce sujet aux ECNi !

141
iKB SANTE PUBLIQUE

"RESUME

Quelles données peut-on obtenir selon le type d'étude ?

Mesures liées à la maladie Association entre E et M


Incidence Prévalence Risque OR RR
Etude de cohorte X - X X X
Etude cas-témoins - - - X -
Etude transversale - X - X X

g GRILLE DE LECTURE - ETUDE EPIDEMIOLOGIQUE

GRILLE DE LECTURE D'UN ARTICLE EPIDEMIOLOGIQUE

Titre et auteur de l'artick!:

Rev/AnnéeN o1/Pa ge s

Thèiœ de l'article

OUI NON ?

1. Les obj ecti fs de l'étude sont clairement définis □ □ □


2. Méthodologie □ □ □
• Le s raract éri stiqm:s de la population sont décri tes □ □ □
• Les critères d'inclusion et d'exclusion sont
précisés et adéquats □ □ □
• Les qualités et 1 es modalités de recueil des données □ □ □
sont précisées

3. Aœlyse des résultats

• L'analyse statistique est adaptée □ □ □


• Les !àcteurs de confusion et les biais sont pris
0
(.9
LJ.J
en compte □ □ □
a:
• □ □ □
(.9

LJ.J Les résultats sont vérifiables à partir des données


a:
CO
0
brutes
z
a:
>
LJ.J

en
z
0
fC=
Connœntaires :
0
LJ.J
@
D'après « Guide d'analyse de la littérature et gradation des recommandations», ANAES, 2000

142
Chapitre
30

LES ETUDES DIAGNOSTIQUES

• Inclusion prospective (calcul NSN a priori)


• Sélection et représentativité de l'échantillon
• Gold Standard : test validé
• Définition de la maladie par le GOLD Standard
• Tous les patients ont eu les deux tests (Gold Standard et
10
test à l'étude)
COM MANDEMENTS • Réalisation et interprétation du test en aveugle
• Reproductibilité du test
• Tous les paramètres opérationnels sont fournis + leur
IC95%
• Courbe ROC fournie
• Validité externe

• Les recommandations pour la rédaction d'articles concernant


RECOMMANDATIONS
des études diagnostiques sont les recommandations STARD

143
iKB LECTURE CRITIQUE D'ARTICLE

Il GENERALITES

. Evaluer l'apport d'un signe clinique, d'un élément biologique


ou d'un examen morphologique pour le diagnostic d'une

. maladie
On peut alors réaliser plusieurs types d'études :
- Etude transversale +++
- Etude de cohorte prospective
OBJECTIF
.
- Etude cas-témoins
L'étude peut porter sur :
- Les performances diagnostiques du test
- L'impact pratique du test déjà mis en place (d'une
stratégie diagnostique)

.
. Sert à classer les malades et les non-malades

. Il doit être défini a priori


Il doit être justifié par des références adéquates (études

LE GOLD STANDARD
. antérieures, consensus)
Les conditions d'utilisation standard sont précises et

. semblables à celles de la littérature

. Doit être réalisé chez tous les patients de l'étude

. Doit être évalué en aveugle


Respect de l'éthique

. Echantillon REPRESENTATIF:
- Bonne représentation de la POPULATION CIBLE
- Fréquence de la maladie proche de la prévalence connue
UNE POPULATION
ADEQUATE
. en pratique
Représentation de tous les patients concernés (tous les
degrés de gravité par exemple)

. Description et définition du test et du test de référence

. (Gold Standard)

. Evaluation des paramètres opérationnels


Evaluation des qualités métrologiques (fiabilité,
METHODOLOGIE
. reproductibilité)
Apport décisionnel (avantages ou non du test, validité
externe du test) et impact pour le patient (place dans la
stratégie diagnostique)
0
(.9
LJ.J
a:
(.9

LJ.J
a:
CO
0

z
a:
LJ.J
>
en
z
0
fC=
0
LJ.J
@

144
LES ETUDES DIAGNOSTIQUES

EVALUATION D'UNE PROCEDURE DIAGNOSTIQUE - PARAMETRES


OPERATIONNELS

Construction du tableau de contingence

Test de référence (Gold standard)


Malades on malades Total
Test évalué
A (Vrais posi ifs) B (Fau posi ifs) A B VPP =A/(A B)
positif
Test évalué
C (Faux posi ifs) D (Vrais néga ifs) C D VP =C/(C D)
négatif
Total A C B D
Sensibilité = Spécificité =
A/(A+C) B/(B+D)

Qualités intrinsèques du test (ne dépendent pas de la prévalence de la


maladie):
• Sensibilité (Se):
- probabilité que le test soit positif si on est malade (la
sensibilité est l'aptitude à détecter la maladie)
- VP / (VP+FN)
• Spécificité (Sp):
- probabilité que le test soit négatif si on n'est pas malade (la
spécificité est l'aptitude à ne détecter que la maladie)
- VN / (VN+FP)
• Indice de Youden :
- Y= Se + Sp - 1
PERFORMANCES
D'UN TEST Qualités extrinsèques du test (dépendent de la prévalence de la
maladie):
• Valeur prédictive positive (VPP):
- probabilité d'être malade si le test est positif
- VP / (VP+FP)
• Valeur prédictive négative (VPN):
- probabilité de ne pas être malade si test négatif
- VN / (VN+FN)
q NB : si la prévalence de la maladie augmente, la VPP augmente et
la VPN diminue
• Efficacité diagnostique :
- (VP+VN) / (VP+VN+FP+FN)

145
iKB LECTURE CRITIQUE D'ARTICLE

• Les rapports de vraisemblance sont calculés à partir des paramètres de


performance:
Ils font partie des caractéristiques intrinsèques du test
• Ils varient de O à l'infini
• Le rapport de vraisemblance positif : RV+ = Se/ (1-Sp)
• Le rapport de vraisemblance négatif: RV- = (1-Se) / Sp
• Intérêt:
o Choisir entre 2 tests, le plus utile sera celui avec le RV+ le plus élevé
pour affirmer un diagnostic ou le RV- le plus faible pour en éliminer un
RAPPORT DE o Calcul de la probabilité post-test à l'aide du nomogramme de Fagan, en
VRAISSEMBLANCE partant de la probabilité pré-test d'être malade (= prévalence de la
maladie)
• Interprétation:
o un RV = 1 signifie qu'il n'y a aucune modification du risque de maladie avant
et après le test donc test inutile
o si le RV est très élevé, alors la probabilité post-test va augmenter
significativement
o si le RV est très proche de 0, alors la probabilité post-test va diminuer
o plus on s'éloigne de 1 et plus le test étudié est utile à la prise de
décision

• Graphique permettant de visualiser la probabilité post-test, connaissant la


probabilité pré-test (= prévalence de la maladie) et les rapports de
vraisemblance (positif et négatif):
• Utilisation du théorème de Bayès (d'où l'autre nom de ce diagramme =
nomogramme de Bayès)

Exemple de nomogramme de Fagan

omogramme de Fagan
' 1 : prévalence � 60 % Ex2 : prévalence 30 %
�------�99 .1 �------� 99
.2

95
90
80
NOMOGRAMME DE
70
FAGAN 60
50
40 Angjo-JRM;
.---�-R_,+ • 32 (-)

1-VPN --0.23(---)

5
.02
80 .01
2 .005 2
0
(.9
.002
a:
LJ.J

(.9
9S
.001 .5 95
.001
.s
a:
LJ.J

CO
0 .2 .2
z
a: 99 .1 99 .1
>
LJ.J
Pn:lc 1 Lik •lihood Post-t· 1 Prcl 1 Likelihood Po,,t-t�I
en
z probability ra1io probabili1y probabili1y ratio probabilily
0
fC=
0
LJ.J
@

146
LES ETUDES DIAGNOSTIQUES

Il LA COURBE ROC

• Pour certains examens, le résultat est quantitatif et non binaire


(oui/non)
• La distinction entre un test positif et un test négatif doit donc faire
intervenir un seuil :
- En-dessous du seuil : test négatif
- Au-dessus du seuil : test positif
GENERALITES
• La courbe ROC (Receiver Operating Characteristic) représente
l'ensemble des points (Se, 1-Sp) obtenus sur un même
échantillon en faisant varier le seuil diagnostic :
- Elle permet de déterminer le seuil opérationnel
- L'aire sous la courbe (AUC) représente alors la performance
globale du test

• Evaluation d'un test diagnostic à condition que celui-ci soit à


réponse continue (exemple : tension artérielle) :
- La valeur seuil à choisir est celle qui se situe le plus près
de l'angle supérieur gauche de la courbe ROC
BUTS • Comparer simplement 2 tests diagnostics ensemble en fonction
de leurs valeurs de spécificité et de sensibilité :
- Le test le plus performant est celui dont l'aire sous la
courbe (AUC) est la plus proche de 1
• Définir les meilleures normes d'un paramètre diagnostic

.. .
·. ··. -·
..
..·· .
:.0 ···
.. .
·
ënC ··
····
·· ..··
Q)

·
(f)

.
..· .
EXEMPLE �----.-··· 1- Spécificité
•••••••• SSC de 0,5

� SSC d'environ 0, 7
-SSC de 1
Interprétation :
• La courbe avec un AUC de 0.5 représente un test inutile
• La courbe avec une AUC de 1 représente un test parfait (aucune
erreur)
• La plupart des tests ont une courbe semblable à la courbe du
milieu, plus l'AUC est grande et meilleur est le test

147
iKB LECTURE CRITIQUE D'ARTICLE

Il QUALITES METROLOGIQUES

.
. Il s'agit de l'étude de la variabilité

. On s'intéresse à la mesure de la concordance


Test donnant un résultat binaire (r::1ositif / négatif):

.
- Coefficient de concordance kappa
GENERALITES
Test donnant un résultat guantitatif:
- Diagramme de corrélation
- Diagramme de Bland et Altman

.
. Pour évaluation des tests qualitatifs (positif ou négatif)

. Reproductibilité dans le temps et selon les expérimentateurs


Reproductibilité d'autant meilleure que le coefficient kappa tend
vers 1 :
Coefficient de - Reproductibilité excellente = > k = 1 - 0.81
concordance - Reproductibilité bonne = > k = 0.80 - 0.61
kappa
- Reproductibilité moyenne = > k = 0.60 - 0.41
- Reproductibilité faible = > k = 0.40 - 0.21
- Reproductibilité mauvaise= > k = 0.20 - 0

But:
. Pour chaque patient:
- mesure avec chacun des deux tests (test étudié et test de
référence)
- évaluation de la corrélation des résultats entre les deux
Coefficient de
corrélation . tests
Interprétation du coefficient de corrélation (r) :
- r > 0.6 = > bon
- r > 0.8 = > excellent
- r = 1 = > identique

. Représentation graphique de la différence entre les deux


mesures de chacun des tests pour chaque patient (ordonnée)
en fonction de la valeur moyenne de la variable mesurée par

Diagramme de . les deux méthodes de mesure (abscisse)


Intérêts:
Bland et Atman - Permet d'évaluer la dispersion des variables
- Permet de mettre en évidence le biais moyen
- Permet de repérer si le test est plus performant pour une
valeur particulière

0
(.9
LJ.J
a:
(.9

LJ.J
a:
CO
0

z
a:
LJ.J
>
en
z
0
fC=
0
LJ.J

148
LES ETUDES DIAGNOSTIQUES

"TEST DE DEPISTAGE

. Le dépistage est le fait de repérer une maladie sans ses


manifestations cliniques, de façon précoce, de manière à mieux la
DEFINITION
. traiter
Il s'agit d'une méthode de prévention secondaire

.
. Maladie fréquente

. Dont l'évolution est connue, histoire de la maladie connue


QUALITES DE LA
. Diagnosticable à un stade pré clinique précoce
MALADIE POUR UN
. Curable, il existe un traitement efficace

.
BON DEPISTAGE Pronostic amélioré par un traitement précoce

. Problème de santé publique


Maladie grave

.
. Fiable

QUALITES D'UN BON . Reproductible


TEST DE DEPISTAGE
. De bonne sensibilité, VPN

. Coût modéré
Acceptable, non invasif

.
. Population cible identifiée et sensibilisée
QUALITE DE LA
POPULATION DE . 90% de la population cible touchée
Population ayant accès aux moyens diagnostiques et
DEPISTAGE
. thérapeutiques
Suivi continu

RENDEMENT
DIAGNOSTIC
. Nombre de cas dépistés/ nombre de sujets dépistés

Test de confinnation
Test de dépistage
diagnostique
Detecter une maladie latente Diagnostic de certitude
Objectif
Patients asymptomatiques Patients symptomatiques
Problème de santé publique la suite d n test de
Contexte
Pr' ention secondaire dépistage positif

Sensibilité élevée (on veut Spécificité élevée (on ne veut


Paramètres trouver tous les malades) trouver que les malades)
opérationnels
N maximale P maximale

149
iKB LECTURE CRITIQUE D'ARTICLE

" GRILLE DE LECTURE D'UN ARTICLE DIAGNOSTIC

GRILLE DE LECTURE D'UN ARTICLE D IAGNOSTIQUE

Titre et auteur de l'artickl: ----------------

Rev/Pumée/Vol/Pages__________________

Thèiœ de l'article

OUI NON ?

1. Les objectifs sont clairement définis □ □ □


2. Méthodologie □ □ □
• Le test étudié est comparé à un test de □ □ □
référence fiable et va1i de, détenniné a priori

• La méthode de sélection des patients est décrite □ □ □


• La fréquence de la maladie dans l'écmntillon étudié □ □ □
correspond aux données épidémiologiques connues

• Le tenne << nonml }} est défini □ □ □


3. Am.lyse des résultats

• Les résultats sont analysés en aveugle quand □ □ □


c'est possible

• Les caractéristiques diagnostiques du test sont □ □ □


cal culées ou calculables ( sensibilité, sp éci fi.cité)

4. L'utilité clinique du test est recherchée □ □ □

0
(.9
LJ.J
a:
(.9
Corrnœntaires :
LJ.J
a:
CO
0

z
a:
LJ.J
> D'après « Guide d'analyse de la littérature et gradation des recommandations », ANAES, 2000
en
z
0
fC=
0
LJ.J
@

150
Chapitre
31

LES ETUDES PRONOSTIQUES

. Elle porte sur une population de sujets malades, dont on veut

. connaître le pronostic ou le devenir


Elle permet l'étude et la recherche de facteurs associés à
GENERALITES l'évolution de la maladie = FACTEURS PRONOSTIQUES

ATTENTION : Ne pas confondre avec des facteurs de risque associés

.
à la survenue de la maladie

. Adapter la décision thérapeutique, la surveillance et l'information

. Définir des groupes homogènes de pronostic


OBJECTIFS
. Améliorer la planification des futures études
Compréhension de l'histoire naturelle et de la physiopathologie
de la maladie

.
Deux possibilités d'études peuvent être menées:
Etude observationnelle :

.
PLAN D'ETUDE - Cohorte prospective
Etude interventionnelle :
- Essai contrôlé randomisé

• ELEMENTS CLES

• Echantillon représentatif de la population cible :


Critères d'inclusion, non-inclusion et exclusion
spécifiés et adéquats
Critères diagnostiques de la maladie (consensuels,
fiables)
Critères de recrutement (quels centres/hôpitaux?)
• Risques:
Biais de sélection (recrutement de patients dans certains
POPULATION D'ETUDE
centres hospitaliers / patients plus lourds?)
Biais lié à la sur- ou sous-estimation du risque
• Patients homogènes au regard du pronostic étudié :
Même stade d'évolution de la maladie => cas incidents
Définition précise et cohérente des cas
Pas de définition de la cohorte de manière
rétrospective à partir d'une autre cohorte

151
iKB LECTURE CRITIQUE D'ARTICLE

.
. Long

. Complet

SUIVI DES PATIENTS . Homogène pour l'ensemble des patients inclus


Risque:
- Perdus de vue => biais de sélection / biais lié aux perdus
de vue

.
. Valides

. Fiables / Pertinents

. Reproductibles
CRITERES DE
. Objectifs

.
JUGEMENT Définis a priori

. Evaluation en aveugle
Mesuré de la même manière pour chaque patient inclus et suivi

.
Si on ne s'intéresse qu'à la survenue de l'évènement:
Analyse univariée:
- Test du chi2 ou test de Student selon les variables

. considérées
Analyse multivariée:
- Prise en compte des facteurs de confusion potentiels
- Régression logistique

Si on s'intéresse à la survenue de l'évènement et au délai de survenue de

.
cet évènement:

.Données censurées = analyse de survie


Description:
- Méthode de Kaplan-Meier

.
ANALYSE DES - Méthode actuarielle
DONNEES Analyse univariée:
- Test du log-rank
- Modèle de Cox (mais avec une seule variable introduite

. dans le modèle)
Analyse multivariée:
- Modèle de Cox ++ (notion d'Hazard Ratio - HR)

.
ATTENTION = choix des facteurs pronostiques étudiés:

.
Ne choisir que les plus pertinents

.
Nombre de facteurs analysés = 1 pour 10 évènements (10%)

.
Facteurs pronostiques déjà connus dans la littérature

.
Facteurs facilement mesurables en routine
Acteurs significatifs en analyse univariée (p < 0.20)

0
(.9
LJ.J
a:
(.9

LJ.J
a:
CO
0

z
a:
LJ.J
>
en
z
0
fC=
0
LJ.J

152
LES ETUDES PRONOSTIQUES

n GRILLE DE LECTURE - ETUDES PRONOSTIQUES

GRILLE DE LECTURE D'UN ARTICLE DE PRONOSTIC


(ANALYSE DE COHORTE)

Titre et auteur de l'artickl:

Rev/Pumé e/Vo l/Pages

Thèiœ de l'article
OUI NON ?

1. Les o� ecti fs de l'étude sont clairement définis □ □ □


2. Méthodologie □ □ □
• Les mo daht és de consti tut.ion de la cohorte □ □ □
sont précisées

• Tous les patients de la cohorte ont été identifiés □ □ □


au même stade de la rraladi e

• Les critères d'inclusion et d'exclusion □ □ □


sont spécifiés et adéquats

• Les biais possibles sont exposés et les méthodes □ □ □


pour les prendre en compte sont décrites

• Le suivi est complet et correctement réalisé □ □ □


• Les critères de jugement sont pertinents, fiables □ □ □
et tous utilisés

3. Les résultats

• L'interprétation de ces critères est objective □ □ □


• Les résultats sont ajustés pour les autres iàcteurs □ □ □
pronostiques

Connœntaires :

D'après « Guide d'analyse de la littérature et gradation des recommandations », ANAES, 2000

153
iKB LECTURE CRITIQUE D'ARTICLE

0
(.9
LJ.J
a:
(.9
J,
LJ.J
a:
CO
0


z
a:
LJ.J
>
en
z
0
fC=
0
LJ.J
@

154
ANNEXES
iKB LECTURE CRITIQUE D'ARTICLE

SOMMAIRE

Quelques notions d'anglais

Glossaire du CNCI

0
(.9
LJ.J
a:
(.9
J,
LJ.J
a:
CO
0


z
a:
LJ.J
>
en
z
0
fC=
0
LJ.J
@

156
Chapitre
32

QUELQUES NOTIONS D'ANGLAIS

.
. Articles en anglais à partir de 2017
Nécessité de maîtriser les bases de la langue, et notamment de

. l'anglais médical

. Souvent articles « compréhensibles » dans leur globalité


Devant une incompréhension sur un terme anglais :
GENERALITES - Demandez-vous s'il ne ressemble pas à un autre terme
que vous connaissez (en lien avec les « vrais amis »)
- Essayez d'identifier la nature du mot selon sa place dans
la phrase.
- Il existe des faux-amis, mais ne vous focalisez pas

.
dessus
Idem que celle que l'on retrouve en français :

Sujet - Verbe+ complément/Objet


STRUCTURE DE LA
.
.
PHRASE Identifier le verbe dans la phrase est un bon point de départ
Le déterminant est situé avant le déterminé
- Exemple : an epidemiological study => une étude
épidémiologique

Il QUELQUES ELEMENTS CLES (NON EXHAUSTIF)

• Introduction par le terme « than »


• Constitue la base de l'interprétation des résultats

EGALITE
• « as »
SUPERIORITE
• Adjectif court : -er (longer than)
COMPARAISON • Adjectif long : more ... than ... (more expansive than)
Superlatif
• Adjectif court : -est (the strongest)
• Adjectif long : most (the most expansive)
INFERIORITE
• Comparatif: Less ... than ...
• Superlatif (infériorité) : The least ...

157
iKB LECTURE CRITIQUE D'ARTICLE

.
.
Much; Many; A lot of : beaucoup

.
Few ; Little : peu

.
QUANTIFICATION Both : les deux
Either: l'un ou l'autre

.
.
Howeverlsti/1: cependant

.
Neverthe/ess: néanmoins

.
Whereas : alors que
CONTRASTE
.
Unlike : au contraire de
Converse/y : inversement

.
.
Unless : à moins que
CONDITION Regardless of: indépendamment de

.
.
Since : puisque

.
Hence: d'où

.
CONSEQUENCE Thus: ainsi
Thereby: de cette façon

.
.
Although : bien que
CONCESSION Though : cependant

.
.
Because: parce que

.
Owing to I due to : a cause de/ suite à

.
CAUSE On account of: en raison de
As: comme

.
.
Above ail: avant tout

.
Especially: particulièrement
INSISTANCE
ln specie: en particulier

.
.
As regards : en ce qui concerne

.
As to : s'agissant de

.
ATTRIBUTION As for: pour ce qui est de
Thanks to : grâce à

.
.
Namely: à savoir

.
That is to say: c'est-à-dire

.
0
(.9
LJ.J
EXEMPLE For instance : par exemple
a:
(.9
Such as : tel que
LJ.J
a:

.
CO
0

.
z So far: jusqu'à présent
a:

.
LJ.J
> Up to now: jusqu'à maintenant
en
z
NOTIONS DE TEMPS
.
0 For the time being: pour l'instant
fC=
0
LJ.J
Forme/y : toutefois
@

158
QUELQUES NOTIONS D'ANGLAIS

.
.
Almost: presque, environ

.
Hard/y: presque pas
DEGRE
Barely: à peine

.
.
Can, could: capacité/aptitude

.
May, might: permission/probabilité

.
EXPRESS. MODALES Must: obligation
Should: conseil

n NOTIONS CLES DES DIFFERENTES PARTIES DE L'ARTICLE (NON EXHAUSTIF)

• Aim to: viser à


• Ask wether: se demander si
• Assess : évaluer
INTRODUCTION
• Carry out: réaliser
INTRODUCTION
• Review: examiner
• Further studies : des études complémentaires

SELECTION DES PATIENTS


• Completed: ont terminé
• Elligible patients : patients éligibles
• Dropped out: sont sortis d'étude
• Enrollment: recrutement
• Lost to follow-up : perdu de vue
MATERIEL et • Sample = échantillon
METHODES
MATER/AL and
METHODS INTERVENTION
• Adverse event: effet indésirable
• Contrai: contrôle/témoin
• Setting: lieu/milieu
• Follow-up: suivi
• Trigger off: déclencher

159
iKB LECTURE CRITIQUE D'ARTICLE

CRITERE DE JUGEMENT
• Primary endpoint I outcome : critère de jugement principal
• Secondary endpoint I outcome : critère de jugement secondaire
• Progression free survival: survie sans progression
• lnterim : intermédiaire (critère, analyse)

TYPE D'ETUDE
• Single center I multicenter: mono-multi centrique
• Open-label : en ouvert
• Blindness/blinding: aveugle
• Trial: essai
• Case-control study: étude cas-témoins
• Cohort study: étude de cohorte
• Cross-sectional study: étude transversale

RANDOMISATION
• Randomization: randomisation
• ... in blacks : en blocs
MATERIEL et • ... by laminating : par stratification (or stratification)
METHODES • Standardization : standardisation
MA TER/AL and • Software : logiciel
METHODS

.
ANALYSES STATISTIQUES

.
Adjust: ajuster

.
Average: moyenne

.
Confidence interval : intervalle de confiance

.
lnterquartile range: écart inter quartile

.
p-value : « p »

.
Standard deviation: écart-type

.
Statistical power: puissance statistique

.
Threshold: seuil

.
lntention-to-treat analysis : analyse en intention de traiter

.
per protocol analysis : analyse per-protocole

.
Analysis in received treatment: analyse en traitement reçu

.
Significance level: degré de signification

.
Matching : appariement

.
One-sided I two-sided: test unilatéral/ test bilatéral

.
Chi-square test: test du chi2
Lite expectancy: espérance de vie
0
(.9
LJ.J
a:
(.9

LJ.J
a:
0

z
a:
LJ.J

z
0

LJ.J

160
QUELQUES NOTIONS D'ANGLAIS

.
.
Rate: taux

.
Baseline: valeur de référence

.
Box-plot: boîte à moustaches
RESULTATS

.
RESULTS
Table : tableau

.
Survival curve: courbe de survie
Likelihood ratio : rapport de vraisemblance

.
.
Argue : estimer
Dise/ose: révéler

.
BIAIS

.
Bias: biais

.
Ascertainment: mesure
DISCUSSION

.
DISCUSSION
Confounding: confusion
Reca/1 biais : biais de mémorisation

. LOCF (Last Observation Carried Forward) : dernier état connu

.
du sujet
Maximum bias hypothesis: hypothèse du biais maximum

161
iKB LECTURE CRITIQUE D'ARTICLE

0
(.9
LJ.J
a:
(.9
J,
LJ.J
a:
CO
0


z
a:
LJ.J
>
en
z
0
fC=
0
LJ.J
@

162
Chapitre
33

GLOSSAIRE DES TERMES A CONNAITRE

D'après le document produit par le CNCI

A
Ajustement - Adjustment
Moyen, dans une enquête épidémiologique, de prendre en compte un biais de confusion au moment de
l'analyse.

Aléatoire - Random
Dont la survenue dépend du hasard.
La répartition aléatoire d'un traitement ou d'une action fait confiance au hasard.
On admet que les groupes de sujets tirés au sort sont comparables pour tous les facteurs connus ou
inconnus, qui pourraient influencer sur le critère que l'on mesure.
Souvent, cette hypothèse de comparabilité des groupes est vérifiée numériquement lors de l'analyse des
résultats.

Alpha : voir Risque alpha

Analyse - Analysis
Extraction et exploitation de résultats pertinents à partir d'une série de données.
Le type d'analyse doit être prévu a priori dans le protocole de l'étude. Elle prendra en compte la question
posée, les critères de jugement utilisés et d'autres variables, appelées covariables, qui peuvent interférer
avec les critères de jugement.
C'est en fonction du type de variables étudiées (qualitatives, nominales, ordinales ou quantitatives) que
pourra se faire le choix des tests utilisés pour cette analyse.

Analyse en intention de traiter - lntention-to-treat analysis


Méthode qui consiste à analyser les données de tout patient inclus (voir inclusion), et ce dans le « bras »
(groupe de tirage au sort) dans lequel il a été randomisé au début de l'étude.

Analyse intermédiaire - lnterim analysis


Analyse effectuée avant l'inclusion de tous les sujets prévus.
Elle est réalisée le plus souvent lorsque l'étude est longue.
Elle doit être prévue dans le protocole, et le nombre de sujets nécessaires prend en compte le nombre
d'analyses intermédiaires qui sont prévues.
Pour chaque analyse intermédiaire, un seuil de signification doit être choisi.

163
iKB LECTURE CRITIQUE D'ARTICLE

Analyse par sous-groupe - Sub-group analysis


Analyse qui, à partir des données initiales globales, permet de mettre en avant la différence de traitement
entre divers sous-groupes au cours d'un essai thérapeutique.
Attention! Si l'analyse par sous-groupe semble attrayante, elle peut être erronée si elle n'a pas été prévue
explicitement au départ dans le protocole et si l'étude ne conclut pas positivement sur le critère principal. En
effet, même s'il n'existe pas de différence entre deux traitements, on pourra très souvent trouver un sous­
groupe particulier où une différence est significative.

Appariement - Matching
Technique permettant de rendre comparables deux ou plusieurs groupes, en particulier par rapport à
certains facteurs de confusion déjà connus dont on veut neutraliser les effets, (voir apparier).

Apparier (former des paires) - To match


Rendre comparables deux groupes en termes de facteurs de confusion potentiels.
Pour chaque cas (exemple : un malade), on associe un ou plusieurs témoins qui lui sont similaires pour un
ou plusieurs facteurs (exemple: âge, sexe, niveau socio-économique).

B
Bêta: voir Risque bêta

Biais - Bias
Erreur systématique qui fausse les résultats dans un sens donné.
On distingue trois grandes familles de biais: les biais de sélection, de classement et de confusion.

Biais de classement - Ranking bias


Biais dans la mesure du facteur de risque ou dans la certitude de la maladie.
Cette erreur est quasi inévitable puisque aucun outil de mesure (interrogatoire, examen, test) n'est parfait.
Exemple : un comportement à risque minimisé par le malade, ou simplement non recherché dans le
questionnaire.

Biais de confusion - Coufoundig bias


Biais provoqué par un facteur de confusion interagissant avec le facteur de risque étudié dans l'étude du lien
entre ce facteur et la maladie.

Biais de sélection - Se/ection bias


Biais dans la constitution de l'échantillon, qui va se retrouver non représentatif de la population générale
pour des facteurs liés au problème étudié (d'où le biais).

Biais de mémorisation - Reca/1 bias


Type de biais de classement lorsque l'information sur l'exposition a été obtenue a posteriori après que le
diagnostic des cas a été établi (cas-témoin).

Bilatéral - Two-sided
Qui prend comme hypothèse alternative l'existence d'une différence. Un test statistique est bilatéral si on
0
suppose qu'il existe une différence, dans un sens ou dans l'autre.
(.9
LJ.J
a:
(.9

LJ.J
a:
CO
0 C
z
a:
LJ.J
> Causalité - Causality
en
z
0 Rapport établi entre une cause et un effet, un facteur de risque et une maladie.
fC=
0
LJ.J
Le facteur étudié est responsable (au moins en partie) de la maladie étudiée.
@

164
GLOSSAIRE DU CNCI

CCPPRB-CPP
Comité consultatif de Protection des personnes se prêtant à la recherche biomédicale.
Tous les protocoles de recherche clinique doivent être soumis au CCPPRB pour avis.
Ce comité informe de son avis l'investigateur qui lui a présenté la demande.
Les études épidémiologiques sans investigations invasives sortent de ce champ. Les nouveaux textes l'ont
renommé en CPP, Comité de protection des personnes.

Clause d'ambivalence -Principle of equipoise


Tout patient inclus dans un essai thérapeutique doit pouvoir recevoir n'importe lequel de traitements étudiés,
et donc n'avoir aucune contre-indication à aucun des traitements.

Clause d'ignorance -Ignorance of the treatment assignement


Fait de ne pas révéler à un patient le médicament qu'il va recevoir dans un essai thérapeutique, et pour un
médecin qui inclut un patient dans un essai, de ne pas savoir quel traitement ce patient va recevoir.
Sinon, l'inclusion des patients dans l'essai risque d'être influencée par la conviction intime du médecin de
l'efficacité de l'un ou l'autre traitement réellement efficace.
Le tirage au sort respecte la clause d'ignorance.

Cohorte de sujets -Cohort


Groupe de personnes suivies dans le temps de manière prospective, ayant en commun d'avoir subis un
événement semblable.

Comité d'éthique -Ethic committee


Groupe national d'experts composé de médecins, de juristes, de philosophes, etc. en France.
Il donne son avis sur des questions d'éthique d'ordre général.

Comparabilité des groupes-Groups comparability


C'est l'un des critères de qualité dans les essais cliniques.
C'est une condition nécessaire pour que seul le traitement influence le critère de jugement et que les
changements observés soient imputables à la nouvelle thérapeutique testée.
La randomisation permet, en théorie, de constituer des groupes comparables.

Consentement éclairé -lnformed consent


Document écrit spécifiant les risques encourus par un patient, signé par lui, et dans lequel il est
impérativement spécifié que le malade a le droit d'arrêter à tout moment de participer à l'étude, sans
conséquence pour la poursuite des soins, dans le cadre d'une étude de recherche clinique soumise à la loi
Huriet-Serusclat.
Le médecin doit donc expliquer clairement et simplement les avantages et inconvénients de la participation à
l'essai, et garde le consentement signé dans le dossier du patient (celui-ci en garde un double).

Courbe de survie: voir Survie (courbe de)

Courbe de survie de Kaplan-Meïer: voir Survie (courbe de)

Courbe de survie actuarielle : voir Survie (courbe de)

Critère de jugement -Outcome


Critère qui permet de mesurer l'effet du traitement dans un essai thérapeutique ou la survenue d'un
événement dans une étude épidémiologique.
L'idéal est d'avoir un seul critère de jugement, dit «critère de jugement principal».

Cross-Over -Cross-over
Essai thérapeutique où le sujet est pris comme son propre témoin.
Un groupe de patients reçoit le traitement A puis le traitement B, l'autre groupe de patients reçoit le
traitement B puis le traitement A.

165
iKB LECTURE CRITIQUE D'ARTICLE

D
Date d'origine de survie : voir Survie (date d'origine)

Date des dernières nouvelles de survie : voir Survie (date des dernières nouvelles)

Date de point de survie : voir Survie (date de point)

Degré de signification - Degree of significance


Risque (au sens de pari) de se tromper lorsque l'on conclut à une différence dans un test statistique, la
plupart des tests étant construits pour mettre en évidence une différence.
Lorsqu'on fait un test statistique, le logiciel donne le résultat du test mais surtout le « p » ou degré de
signification.
Le risque d'erreur considéré comme acceptable est le seuil de signification.
Classiquement, le risque d'erreur acceptable est inférieur à 5 %. Donc, si p < 0,05, on a moins de 5 % de
chances de se tromper en concluant à une différence, on dit que la différence est significative.
Pour p = 0,05, si on répétait cent fois l'expérience, on pourrait trouver une différence significative cinq fois
par hasard.

Délai ou temps de participation : voir Survie (délai ou temps de participation)

Densité d'incidence - Incidence density


Nombre de nouveaux cas d'une maladie, survenus au cours d'une période donnée, rapporté au nombre
d'unités personne-temps exposées au risque dans la population.

Dépistage - Screening
Identification de sujets malades à un stade asymptomatique ou peu évolué facilement curable, ou de sujets
chez qui on suspecte fortement la maladie et chez qui il est licite de procéder à des explorations plus ou
moins invasives et coûteuses qui confirmeront ou infirmeront le diagnostic.

Dose-effet (relation dose-effet) - Dose-response relationship


Il existe une relation dose-effet, en épidémiologie, lorsque le risque lié à un facteur varie en fonction de
l'intensité de l'exposition (c'est-à-dire : plus l'exposition est grande, plus l'incidence est élevée).
Pour ce qui concerne les médicaments, il existe une relation dose-effet lorsque l'effet du médicament varie
en fonction de la dose reçue.
Cette variation a, en général, une certaine forme : linéaire, exponentielle.

Double placebo - Double placebo


Dans un essai thérapeutique au cours duquel deux médicaments sont comparés, il est idéal qu'ils soient
identiques sur le plan galénique et sur celui du mode d'administration (posologie).
Quand ce n'est pas possible, il faut prévoir que les patients recevant A prennent aussi un placebo de B ; et
que les patients recevant B prennent aussi un placebo de A.

0
E
(.9
LJ.J

ffi Écart au protocole - Protocol deviation


J,
� Ensemble de situations où le protocole n'a pas été suivi scrupuleusement.
CO
0 Il faut le mentionner lors de la restitution des résultats et dire comment cela a été pris en compte dans

i!i§ l'analyse, en expliquant quelle influence peuvent avoir eu ces écarts sur les résultats observés.
>
LJ.J

� Échantillon - Sample
� Partie de la population totale sur laquelle on va travailler.
LJ.J
@

166
GLOSSAIRE DU CNCI

L'échantillon est représentatif pour un caractère, si ce caractère se distribue identiquement dans l'échantillon
et dans la population globale. Un échantillon aléatoire de taille conséquente (loi des grands nombres) est
supposé représentatif (on fait confiance au hasard).

Effet carry over - Carry-over effect


Poursuite de l'effet d'un médicament après son arrêt, et dépendant de la demi-vie du médicament : lorsqu'un
patient prend un médicament, et qu'il n'interrompt pas assez tôt la prise du médicament, l'effet de celui-ci
peut se poursuivre et interférer avec le médicament testé, d'où l'utilité d'une période préalable plus ou moins
longue sans traitement (wash out).

Effet nocebo- Nocebo effect


Effet négatif de la prise d'un médicament qui n'est pas lié aux propriétés physico-chimiques de la molécule,
mais au fait même que l'on prend un traitement (effet psychologique).

Effet placebo - Placebo effect


Effet positif de la prise d'un médicament qui n'est pas lié aux propriétés physico-chimiques de la molécule,
mais au fait même que l'on prend un traitement (effet psychologique).

Éligibilité : voir Sujets éligibles

Enquête (ou étude) Cas-Témoin - Case-Contrai study


Enquête rétrospective dans laquelle on interroge comparativement des malades (cas) et des non malades
(témoins) sur leurs expositions dans le passé à des facteurs de risque.
Les liens entre expositions et maladies (la mesure du risque de survenue de la maladie lié à l'exposition)
sont résumés par des odds ratios et leurs intervalles de confiance.

Enquête de cohorte - Cohort study


Enquête prospective dans laquelle on suit l'évolution de sujets dont on a relevé initialement l'exposition à
des facteurs pour lesquels on veut étudier l'effet sur la santé.

Enquête exposés, non exposés - Exposed/Not exposed survey


Enquête prospective dans laquelle on suit un groupe de sujets exposés à un facteur de risque et un groupe
de sujets non exposés.

Enquête longitudinale - Longitudinal study


Enquête au cours de laquelle des informations sont recueillies de façon longitudinale, c'est-à-dire tout au
long de l'étude.
La durée de l'étude est définie et peut être assez longue (plusieurs années).
Elle peut être prospective ou rétrospective.

Enquête transversale - Cross-sectional study


Enquête qui consiste à recueillir simultanément ou quasi simultanément les données relatives à la maladie
et aux facteurs de risques étudiés.

Epidémie - Epidemia
Augmentation de la fréquence d'une maladie dans une population donnée et à un moment donné, par
rapport à ce qui serait attendu en situation normale.

Epidémiologie - Epidemiology
Étude de la distribution des problèmes de santé et des facteurs qui les influencent.
On distingue classiquement épidémiologie descriptive, analytique et évaluative

Équilibre (tirage au sort) - Balanced


Tirage au sort défini dans le protocole par le fait que pour tous les « n » patients (par exemple, tous les six
patients), le nombre de patients recevant le médicament A (trois patients) et le médicament B (trois patients)
est le même.

167
iKB LECTURE CRITIQUE D'ARTICLE

Equivalence - Equivalence
Démonstration que deux traitements sont équivalents dans certains essais thérapeutiques spécifiques.
La méthodologie est différente des essais classiques dits « essais d'efficacité » (dans les essais classiques,
on cherche à mettre en évidence une différence).
Les essais d'équivalence nécessitent des hypothèses et des tests statistiques particuliers.

Essai clinique - Clinical trial


Étude expérimentale mise en place pour comparer un nouveau traitement au traitement de référence quand
il existe, ou à un placebo. Le traitement peut être curatif (le plus souvent) ou préventif.
Dans cette définition, le mot:« traitement» peut également s'entendre au sens de stratégie thérapeutique.

Essai contrôlé - Controlled trial


Essai dans lequel il y a un groupe considéré comme témoin et un groupe de sujets traités.

Essai d'efficacité - Efficiency trial


Mise en évidence d'une différence dans un essai thérapeutique où, le plus souvent, le but est de montrer
l'efficacité d'un traitement par rapport à un placebo ou au traitement de référence.

Essai de phase 1 - Phase I trial


Ces essais portent sur des volontaires sains.
L'étude sert à déterminer la dose maximale tolérée.
Elle sert aussi à étudier la cinétique du produit et à calculer les doses qui seront administrées au malade en
phase Il.

Essai de phase Il - Phase Il trial


Ces essais portent sur des malades volontaires.
Cette phase a pour but d'étudier l'efficacité pharmacologique du produit et de déterminer la dose optimale
pour la phase Ill.

Essai de phase Ill - Phase Ill trial


Cette phase correspond, aux essais thérapeutiques comparatifs.
Au cours de cette phase d'étude de l'efficacité d'un traitement, on recherche la dose pour laquelle le rapport
efficacité/ tolérance est le meilleur et on définit le schéma posologique.

Essai de phase IV - Phase IV trial


Tout essai thérapeutique réalisé après la commercialisation d'un médicament.
Il s'agit principalement d'essais de pharmacovigilance ou d'essais comparatifs pour glissement d'indication
(indications non encore autorisées par l'AMM).

Essai de prévention - Prevention trial


Étude expérimentale, ou quasi expérimentale, mise en place pour évaluer l'efficacité d'une action de
prévention.
Ces essais se font chez des personnes saines (prévention primaire) ou malades (prévention secondaire).

Essai en double aveugle - Double blinded trial


Essai au cours duquel, ni le patient, ni le médecin ne connaissent le traitement pris.
Cela permet d'éliminer l'effet placebo chez le patient et les biais de mesure liés à la subjectivité du médecin.
0 Dans l'essai en triple aveugle, le chercheur qui analyse les résultats ne sait pas quel groupe de patients a
(.9
LJ.J
a: reçu quel type de traitement.
(.9

LJ.J
a: Essai en simple aveugle - Single blinded trial
CO
0
Essai au cours duquel le patient ne connaît pas le traitement qu'il reçoit. Le médecin connaît le traitement
z
a:
LJ.J
que chaque patient reçoit.
> Cela permet normalement de neutraliser les effets placebo et nocebo.
en
z
0
fC=
Syn. : essai en simple insu.
0
LJ.J
@

168
GLOSSAIRE DU CNCI

Essai ouvert - Open label trial


Essai thérapeutique souvent mené sur un petit groupe de sujets, parfois comparatif, permettant d'étudier la
faisabilité d'un essai comparatif à plus grande échelle.

Essai séquentiel - Sequential trial


Essai thérapeutique dont l'analyse est effectuée régulièrement, au fur et à mesure de l'inclusion et de
l'évaluation du critère de jugement chez les sujets inclus (tous les« n » sujets).
Ce type d'analyse, par sa méthodologie particulière, permet de maîtriser les risques d'erreurs statistiques de
première et de seconde espèce.

Essai thérapeutique - Therapeutic trial


Essai permettant l'évaluation d'un candidat médicament chez l'Homme.

Estimation - Estimation
Méthode visant à obtenir une valeur approchée (estimée) pour un paramètre, quand la vraie valeur est
inaccessible (ce qui est le cas le plus fréquent).
Cette estimation doit être exacte (non biaisée) et précise (variance faible).

Étude épidémiologique prospective - Prospective epidemiological study


Étude épidémiologique au cours de laquelle le recueil d'informations concernant les participants porte sur
des événements postérieurs au début de l'enquête et sur l'inclusion des participants.

Événement - Event
Situation qui survient au cours de l'étude guérison, aggravation de la maladie (décompensation,
hémorragie, etc.), rechute, décès.

Exactitude - Accuracy
Qualité d'une mesure sans erreur systématique ou sans biais.

Exclusion (critère d'exclusion) - Exclusion criteria


Ensemble d'éléments définis dans un protocole d'exclusion.
Les patients ayant tel ou tel critère ne peuvent pas participer à l'étude.

F
Facteur d'exposition - Exposition factor
Fait d'être exposé à un facteur (par exemple, exposé à l'amiante, exposé aux colorants etc.).

Facteur de risque - Risk factor


Facteur augmentant ou diminuant le risque de maladie.
Si le risque diminue, on parle de facteur protecteur.

Facteur pronostique - Pronostic factor


Facteur qui influence l'évolution d'une maladie, et qui entraîne plus rapidement une complication ou un
décès.
Il peut être nécessaire, dans l'analyse d'un essai thérapeutique (en particulier), d'ajuster sur les facteurs
pronostiques connus si le critère de jugement est l'évolution de la maladie (par exemple, décès).

169
iKB LECTURE CRITIQUE D'ARTICLE

G
Gold Standard - Reference for .../Gold standard
Test diagnostique qu'on utilise comme référence (même si aucun test n'est parfait).
Dans une démarche diagnostique, c'est l'examen que l'on considère comme donnant la meilleure certitude
diagnostique.

Groupe contrôle (groupe témoin) - Contrai group


Groupe qui reçoit le médicament de référence ou le placebo, par opposition au groupe qui reçoit le nouveau
médicament dans un essai thérapeutique contrôlé.

Groupes parallèles - Parai/el groups


Deux groupes de patients suivis en parallèle au cours d'un essai thérapeutique contrôlé, dit : « essai en deux
groupes parallèles », où il existe toujours deux groupes au minimum : le groupe qui reçoit le nouveau
médicament et le groupe qui reçoit le médicament de référence ou le placebo.

Groupe témoin : voir Groupe contrôle

H
Hypothèse - Hypothesis
Concept qui n'est pas encore démontré.

Hypothèse du biais maximum - Maximum bias hypothesis


Hypothèse dans laquelle on choisit de se situer, au moment de l'analyse, dans la situation la plus
défavorable, pour arriver à conclure à une différence.

Hypothèses d'un test statistique - Test hypothesis


En pratique, pour les tests statistiques, on utilise une hypothèse nulle (pas de différence) et une hypothèse
alternative (présence d'une différence).
Le test statistique est construit dans le but de rejeter l'hypothèse nulle, avec une certaine probabilité d'erreur.

Incidence (taux d') - Incidence rate


Fréquence des cas nouveaux dans une période de temps donnée.

Inclusion (critères d') - Inclusion criteria


Ensemble de critères qui définissent de façon précise les caractéristiques des patients qui peuvent entrer
dans une étude.

Indépendance - lndependence
g Neutralité d'un événement A sur un événement B : deux événements sont indépendants si l'issue de l'un
� n'influe pas sur l'issue de l'autre.
LJ.J

ffi
0
Inférence - lnference

z
Des conclusions concernant la population étudiée sont obtenues à partir de données issues d'un échantillon
ffi aléatoire.
z
0

LJ.J
@

170
GLOSSAIRE DU CNCI

Insu - Blinded
Dans un essai thérapeutique, fait de ne pas savoir lequel des traitements est donné.
Syn. aveugle.

Intention de traiter : voir Analyse en intention de traiter

Interaction - Interaction
Mesure dans laquelle l'effet d'un facteur est modifié en fonction de l'action d'un ou de plusieurs facteurs.

Intervalle de confiance - Confidence interval


Fourchette de valeurs qui encadre une estimation.
Quand on parle d'un intervalle de confiance à 95 %, c'est que la probabilité que la vraie valeur du paramètre
estimé soit comprise dans cette fourchette est de 0,95.

L
Logrank (test du) : voir Survie (Comparaison de deux courbes de survie)

Loi Huriet-Serusclat
Loi relative à la protection des personnes qui se prêtent à des recherches biomédicales.
Cette loi définit les conditions qui permettent d'effectuer des recherches biomédicales, en particulier la
nécessité que la recherche soit menée par un médecin ayant suffisamment d'expérience, la nécessité du
consentement éclairé du patient, la désignation d'un promoteur, d'un investigateur coordonnateur, et les
autorisations du CPP et de l'autorité compétente.

M
Médiane de survie : voir Survie (Médiane de)

Modèle - Mode/
Représentation simplifiée d'un phénomène ou d'un processus dans un but explicatif ou prédictif.

Multicentrique (essai) - Multicentric trial


Qualifie un essai ou une étude se déroulant dans plusieurs centres à la fois, pour, le plus souvent,
augmenter le nombre de patients à inclure dans l'essai.
Les essais multicentriques sont intéressants à réaliser lorsque la fréquence de la maladie est faible.
Lors de l'analyse des résultats, il faut tenir compte de l'effet-centre (malgré un protocole commun, il est
possible que les patients pris en charge diffèrent légèrement d'un centre à l'autre).

N
Nombre de sujets nécessaires - Number needed to treat
Nombre de sujets qui permettra de mettre en évidence une différence minimale escomptée.
Ce nombre est calculé a priori, il est lié au risque alpha, au risque bêta et à la différence
A moyenne que l'on souhaite mettre en évidence.
Le nombre de patients inclus tient compte, non seulement du nombre de sujets nécessaires, mais, en plus,
des éventuels perdus de vue.
Il est donc généralement supérieur au nombre de sujets nécessaires.

Non-inclusion (critères de) - Non-inclusion criteria


Liste de critères faisant que les patients ne peuvent pas être inclus dans une étude ou un essai.

171
iKB LECTURE CRITIQUE D'ARTICLE

0
Observance - Observance
Capacité des patients à prendre leur traitement conformément à ce qui est décrit dans le protocole.
Il peut être nécessaire de s'en assurer en demandant au patient de ramener les boîtes vides, ou par des
mesures de marqueurs biologiques dans le sang ou les urines.

Observateur aveugle - Blinded evaluator


Dans un essai thérapeutique, investigateur tiers qui dans un but d'objectivité ne connaît pas le traitement
reçu par le patient et qui mesure le critère de jugement.

Odds cote - Odds


Cote (de probabilité), utilisé dans les jeux et les paris. C'est un ratio dans lequel le numérateur contient le
nombre de fois où un événement survient, et le dénominateur inclut le nombre de fois où l'événement ne
survient pas.

Odds ratio rapport de cotes - Odds ratio


Rapport de deux odds: celui estimé chez les exposés sur celui estimé chez les non exposés.

M+ M-
IE+ a b a+b
E- C d c+d
a+ C b+d N
Le rapport (a x d) I (b x c) odds ratio (OR).
Si la prévalence est faible, OR est un bon estimateur du risque relatif RR.
La valeur de l'OR doit s'interpréter avec son intervalle de confiance ou la valeur du test du Chi-2 calculée sur
le tableau.
E+ exposés, E- non exposés, M+ malades, M- non malades, N total

p
p : voir Degré de signification.
Syn. « petit p », p value

Perdu de vue - Lost to follow-up


Patient qui n'est pas suivi sur la totalité de la période prévue par le protocole d'un essai ou d'une étude
épidémiologique.
On ne sait pas si le patient a guéri, s'il a eu une complication ou des effets secondaires, et pourquoi il n'est
pas revenu.

0
(.9
Population - Population
LJ.J
a: Ensemble d'unités, le plus souvent des personnes définies sur des critères précis.
(.9

LJ.J
a:
CO
0
Population-cible - Target population
Population à laquelle les résultats d'une étude pourront a priori être étendus.
z
a:
LJ.J
>
en
z Population-Source - Source population
0
fC=
Population au sein de laquelle l'échantillon a été tiré.
0
LJ.J
@

172
GLOSSAIRE DU CNCI

Prévalence - Prevalence
Nombre de personnes égal à la proportion de malades M à un instant t.

Prévention - Prevention
« Ensemble des mesures visant à éviter ou à réduire le nombre ou la gravité des maladies ou accidents »
(OMS).

Prévention primaire - Primary prevention


Ensemble des mesures ayant pour but de lutter contre l'apparition de nouveaux cas.
On diminue l'incidence.

Prévention secondaire - Secondary prevention


Ensemble des mesures ayant pour but de diminuer le nombre de malades, donc, de diminuer la durée de
l'état morbide.
Elle vise à réduire la prévalence.

Prévention tertiaire - Tertiary prevention


Ensemble de mesures ayant pour but de diminuer le nombre d'incapacités et leurs conséquences sociales
suite à une maladie dans une population.

Probabilité - Probability
Vraisemblance de survenue d'un événement, généralement exprimée en tant que proportion entre ceux qui
subissent l'événement et ceux qui courent le risque de le subir.

Prospectif - Prospective
Qualifie une enquête dont le suivi se fait postérieurement à l'enregistrement de l'exposition au facteur de
risque.

Protocole - Protocol
Document planifié qui définit précisément les objectifs, les moyens et les méthodes mis en oeuvre pour y
parvenir.

Puissance - Power
Dans un test statistique, probabilité de conclure à l'existence d'une différence qui existe dans la réalité.
C'est le complément à un du risque bêta (1-bêta).
Elle augmente avec le nombre de sujets inclus dans l'étude.
Elle est fixée a priori.
Elle peut être recalculée à la fin de l'étude, en fonction du nombre de patients qui ont effectivement participé
à l'étude

R
Randomisation - Randomization
Tirage au sort des patients permettant une répartition au hasard, aléatoire, des patients dans deux ou
plusieurs groupes.

Ratio de mortalité standardisé - Standard Mortality Ratio


Rapport entre un nombre de décès observé dans une population et le nombre de décès attendu (en se
basant sur le taux de la population générale).

Régression linéaire - Linear regression


Établissement d'une relation linéaire dans laquelle une variable de la forme Y = aX + bZ + ... + constante
quantitative dépend linéairement d'une (X) ou plusieurs autres variables (X et Z) (dites explicatives).
On parlera respectivement de régressions linéaires simple (une variable explicative) ou multiple (plusieurs
variables).

173
iKB LECTURE CRITIQUE D'ARTICLE

Répartition aléatoire: voir Aléatoire

Représentatif - Representative
Qualifie un échantillon par rapport à un caractère, si ce caractère se distribue identiquement dans
l'échantillon et dans la population dont il est issu.
Un échantillon tiré au sort est représentatif, pourvu que son effectif soit suffisant (loi des grands nombres).

Rétrospectif - Retrospective
Qualifie un intérêt pour le passé des sujets participant l'enquête.
On part à la recherche du temps passé.

Risque - Risk
Probabilité de survenue d'un événement.

Risque absolu - Absolute risk


Risque de survenue d'un événement (en général fâcheux : décès, maladie, complication, etc.) chez une
personne donnée, pendant un intervalle de temps déterminé, en fonction de la connaissance des facteurs de
risque auxquels elle est exposée.

Risque alpha - Alpha risk


Probabilité de conclure à une différence alors qu'elle n'existe pas.

Risque bêta - Bêta risk


Probabilité de ne pas conclure à une différence alors que cette différence existe.

Risque de deuxième espèce: voir Risque bêta

Risque de première espèce: voir risque alpha

Risque relatif - Relative risk


C'est un indicateur qui mesure l'association entre un facteur d'exposition et un événement (survenu d'une
maladie, décès, etc.)
Sur un tableau de contingence, on peut définir:

M+ M-
E+ a b a+b
E- C d c+d

a+,c b+d N

Incidence chez les exposés: 1 E= a / (a + b)


Incidence chez les non exposés: 1 NE= c / (c + d)
La quantité (a/(a+b)) / (c/(c+d)) est nommée: « risque relatif RR ».
55
LJ.J
Les exposés ont RR fois plus de risques de développer la maladie que les non exposés.
ffi Un risque relatif supérieur à un signifie que l'exposition augmente le risque (facteur de risque), un risque
J,
� inférieur à un signifie que l'exposition diminue le risque (facteur protecteur).
CO
0

z
a:
LJ.J
>
en
z
0
fC=
0
LJ.J
@

174
GLOSSAIRE DU CNCI

s
Sensibilité - Sensibility
Probabilité que le test soit positif (T+) si on est malade.

M+ M-
Test+ VP FP Nb T+
Test- FN VN NbT-
NbM+ INbM- N

Sensibilité :Se= VP / (VP+FN)


Voir VP vrais positifs, VN vrais négatifs, FP faux positifs, FN faux négatifs.

Signification statistique - Statistical significance


Conviction selon laquelle le résultat observé n'est pas lié au seul hasard; elle est généralement basée sur
une valeur de p inférieure à 0,05.

Spécificité - Specificity
Probabilité que le test soit négatif (T-) si on n'est pas malade.

M+ M-
Test+ VP FP NbT+
Test- FN VN NlbT-
Nib M+ Nib M- N

Spécificité : Sp = VN / (VN+FP)
Voir VP vrais positifs, VN vrais négatifs, FP faux positifs, FN faux négatifs.

Stratification - Stratification
Répartition d'un échantillon en sous-groupes appelés strates, en fonction d'une ou plusieurs caractéristiques.
Ainsi, au sein de chaque strate, les individus sont homogènes pour cette ou ces caractéristiques.

Sujets éligibles - Eligible population/patients


Un sujet est dit éligible dans le cadre d'une étude de recherche clinique, à partir du moment où l'ensemble
de ses caractéristiques répond d'une part à l'ensemble des critères d'inclusion, et d'autre part à l'ensemble
des critères de non-inclusion définis dans le protocole de l'étude.

Survie [Comparaison de deux courbes de survie (Test du log rank)] - Survival


C'est le test le plus courant permettant la comparaison de deux courbes de survie.

Survie (Courbe de) - Survival curve


Représentation graphique d'un taux de survie en fonction du temps. On rencontre principalement :
- les courbes de survie de Kaplan-Meïer, avec un aspect en marches d'escalier de hauteurs inégales, où
chaque événement, ou plusieurs événements simultanés, représentent la verticale d'une marche (la
hauteur de la marche étant proportionnelle au nombre d'événements survenus) ;

175
iKB LECTURE CRITIQUE D'ARTICLE

- les courbes de survie actuarielle, avec un aspect de courbe formée de segments de droite reliant des
points situés à intervalles réguliers au cours du temps (semaines, mois, etc.).
L'utilisation de ces méthodes suppose que le risque de décès soit constant pendant toute la durée de
l'étude.
La notion de survie est extensible à tout événement qualitatif binaire non récurent autre que le décès : on
peut citer, en cancérologie, l'apparition d'une récidive ou l'apparition d'une métastase.

Survie (date d'origine) - Starting point


La date d'origine, dans une étude de survie, représente pour chaque patient sa date d'entrée dans l'étude,
par exemple la date de diagnostic anatomo-pathologique de son cancer.

Survie (date des dernières nouvelles) - Date of latest news


La date des dernières nouvelles, dans une étude de survie, représente pour chaque patient, soit la date de
survenue de l'événement (décès par exemple), soit la dernière date pour laquelle on dispose de
renseignements concernant un patient en vie (si l'événement étudié est le décès)

Survie (délai ou temps de participation) - Time of participation


Le délai de participation, dans une étude de survie, représente le délai entre la date des dernières nouvelles
et la date d'origine.

Survie (Médiane de) - Median survival


Délai de survie pour lequel on observe une mortalité de 50 % de la population de sujets inclus dans l'étude.

Survie (recul) - Startpoint to endpoint time of participation


Le recul d'un patient, dans une étude de survie, représente le délai écoulé entre la date d'origine et la date
de point.
Les reculs minimum et maximum d'une série de sujets participant à une étude définissent donc «
l'ancienneté» de la série.

Survie (sujet censuré) - Censored patient


Un sujet est dit censuré à droite, dans deux situations de mécanismes différents :
- lorsqu'il est considéré comme perdu de vue, si on ne connaît pas son état à la date de point, mais si on
sait qu'il était encore vivant à une date antérieure, définie comme date des dernières nouvelles,
- lorsqu'il est considéré comme exclu-vivant, c'est-à-dire lorsqu'on dispose de son état (vivant ou mort) à
une date des dernières nouvelles, postérieure à la date choisie comme date de point. Dans ce cas, sa
participation à l'étude ne sera étudiée qu'entre sa date d'origine et la date de point.

Survie (Taux de survie à cinq ans) - Survival rate


Indicateur largement utilisé en cancérologie, indiquant le taux de survie cinq ans après le diagnostic initial.

T
Taux- Rate
Rapport constitué d'un numérateur représenté par le nombre d'individus porteurs d'un attribut ou vivant un
événement dans une population susceptible de présenter l'attribut ou de vivre l'événement en question (en
général à un moment ou durant une période donnée).
0
(.9 Cette population constitue le dénominateur du taux.
LJ.J
a: Proportion dans laquelle le numérateur est une partie du dénominateur. Un taux est donc un nombre sans
(.9

LJ.J unité.
a:
CO
0

z Taux de survie à cinq ans : voir Survie (taux de survie à cinq ans)
a:
LJ.J
>
en
z Taux de survie à un temps donné : voir Survie (taux de survie à un temps donné)
0
fC=
0
LJ.J
@

176
GLOSSAIRE DU CNCI

Technique d'échantillonnage - Sampling techniques


Mode d'obtention de l'échantillon. Pour avoir un échantillon représentatif, la méthode la plus simple est le
tirage au sort.
La taille de l'échantillon est primordiale car elle conditionne la précision des estimations sur cet échantillon.

Temps de participation ou délai de survie : voir Survie (délai ou temps de participation)

Test bilatéral - Two-sided


Test statistique pour lequel on prend, comme hypothèse alternative, l'existence d'une différence, dans un
sens ou l'autre.

Test unilatéral - One-sided


Test statistique pour lequel on prend comme hypothèse alternative l'existence d'une différence dont le sens
est connu.

u
Unilatéral - Unilateral
Test statistique pour lequel on prend comme hypothèse alternative une différence, uniquement dans un
sens.

Univariée (analyse) - Univariate analysis


Analyse dans laquelle on étudie l'action d'un seul facteur à la fois sur un phénomène observé.

V
Valeur de p - p-value
Probabilité que la survenue d'un résultat donné ne soit due qu'au seul hasard.

Valeur prédictive négative - Negative predictive value


Probabilité de n'être pas malade (M-) si le test est négatif (T-).

M+ M-
Test + VP FP NbT+
Test- FN VN NbT-
NbM+ NbM- N

Valeur prédictive négative


VPN=VN/(VN+FN)
Voir VP vrais positifs, VN vrais négatifs, FP faux positifs, FN faux négatifs.

Valeur prédictive positive - Positive predictive value


Probabilité d'être malade (M+) si le test est positif (T+).

177
iKB LECTURE CRITIQUE D'ARTICLE

Ml+ M-
Test+ VP FP N!bT+
Test- FN VN NbT-
NbM+ NbM- N

Valeur prédictive positive


VPP=VP/(VP+FP)
Voir VP vrais positifs, VN vrais négatifs, FP faux positifs, FN faux négatifs.

0
(.9
LJ.J
a:
(.9
J,
LJ.J
a:
CO
0


z
a:
LJ.J
>
en
z
0
fC=
0
LJ.J
@

178
PARTIE 5

TRAINING - ANNALES LCA aux ECN


iKB LECTURE CRITIQUE D'ARTICLE

SOMMAIRE

Article 1 : LCA ECN 2009

Article 2 : LCA ECN 2010

Article 3 : LCA ECN 2011

Article 4 : LCA ECN 2012

Article 5 : LCA ECN 2013

Article 6: LCA ECN 2014

Article 7: LCA ECN 2015

Article 8 : LCA_1 ECNi 2016

Article 9 : LCA_2 ECNi 2016

Article 10 : LCA_1 ECNi 2017

Article 11 : LCA_2 ECNi 2017

0
(.9
LJ.J
a:
(.9
J,
LJ.J
a:
CO
0


z
a:
LJ.J
>
en
z
0
fC=
0
LJ.J
@

180
Chapitre
34

ARTICLE 1 - LCA 2009

A 10-Year Prospective Study of Sensorineural Hearing Loss 1n Children


with Congenital Cytomegalovims Infection
INA FOU LON, MD, ANNE NAESSENS, MD, PHD, WAL TER FOULON, MD, PHD, ANN CASTEELS, MD, AND FRANS GORDTS, MD, PHD

Objective To detennine the incidence, characteristics, and evolution of sensorineural hearing loss (SNHL) in infants with
a congenital cytomegalovirus infection (cCMV).
Study design In a prospective 10-year study, 14 021 unselected live-born infants were screened for cCMV by virus isolation
in urine. Congenitally infected newborns were evaluated for SNHL during the first 5 years of life.
Results A total of 74 of the 14 021 infants (0.53%) were congenitally infected; of these, 4 (5.4%) were symptomatic at birth.
Hearing testing could be perfonned in 60 of the infants. SNHL was found in 21% of the asymptomatic and in 33% of
symptomatic congenitally infected infants. Late-onset hearing loss was detected in 5%, progression in 11%, fluctuation in 16%,
and improved hearing threshold in 18% of the infants with cCMV. SNHL was observed in 15% of infected infants born after
a materna! primary infection, in 7% born after a materna! recurrent infection, and in 40% after a materna! infection of
indetenninate timing.
Conclusions In our study population, 0.53% of the infants had cCMV infection, 22% of whom developed SNHL. Long-tenn
follow up and repeated audiologie testing is needed, because progression, fluctuation, improvement, and late-onset hearing
loss are important features of cCMV infection. The search for a neonatal screening program to detect ail cCMV is worthwhile.
(J Pediatr 2008;153:84-8)

C
ongenital cytomegalovirus (cCMV) infection is the most common fetal viral infection, with an estimated overail birth
prevalence of approximately 0.64%.1 CMV is the leading nongenetic cause of sensorineural hearing loss (SNHL).2 The
vast majority of these infants (approximately 90%) exhibit no signs of congenital infection; however, infants with
asymptomatic CMV infection may later develop neurologie deficits, behavioral problems, and hearing loss.3•4 Approximately
10% of infected infants are born with clinical evidence of cCMV infection. Severe neurologie deficits are commonly seen in this
group of infants. SNHL is a frequent consequence in both asymptomatic and symptomatic cCMV infection. Few prospective
studies have documented the incidence of hearing loss in these 2 groups. Although the clinical diagnosis of symptomatic
infection will not be easily missed, without screening ail infants at birth (neonatal viral screening), the true incidence of SNHL
caused by asymptomatic infection will remain undetermined.
ln this study, we investigated the incidence and characteristics of hearing loss in 74 consecutive infants with cCMV
infection. We also evaluated the significance of primary and recurrent CMV infection during pregnancy in the development of
hearing loss.

METHODS
The study protocol was approved by the Committee of Medical Ethics of the
Universitair Ziekenhuis Brussel. From the Depar tments of Otolaryngology
and Head and Neck Surgery (IJ., F.G.),
Microbiology (AN), Obstetncs (WJ.), and
Subjects Neonatology (AC), University Hospital
Brussels, Free University Brussels, Belgium
Between June 1996 and November 2006, UZ Brussels ran a screening program for
Submitted for publication Jun 11, 2007; last
the detection of congenitally infected neonates. This screening program, designed as revision received Oct 5, 2007; accepted
described previously, 5 consisted of serologic screening in pregnant women in combination Dec 17, 2007
with urine culture for CMV in ail live-born infants. During this period, 14 021 unselected Reprint requests: lna Foulon, ENT Dept
Universitair Ziekenhuis Brussels, Laarbeek­
infants were screened for cCMV; this represented about 80% of ail infants born during laan 101, 1090 Brussels, Belgium E-mail
inafoulon@uzbrussel.be
0022-3476/$ - see front matter
ABR Auditory brainstem response DPOAE Distortion products otoacoustic emissions Copyright © 2008 Mosby Inc Ali nghts
cCMV Congential cytomegalovirus SNHL Sensorineural hearing loss
reserved
dBHL Decibel hearing level
10.10 l 6/J.Jpeds2007. l 2.049

84

181
iKB LECTURE CRITIQUE D'ARTICLE

this period. Ali congenitally infected infants were examined at with TDH39 headphones. Registrations were made at 20, 40,
birth by a neonatologist, who recorded any potential symp­ 60, 80, and, if necessary, 100 decibel hearing loss (dBHL).
toms of symptomatic infection (eg, hepatosplenomegaly, pe­ Distortion product otoacoustic emissions (DPOAEs),
techiae, jaundice, microcephaly). recorded with a MADSEN Capella cochlear emissions ana­
lyzer (GN Otometrics, Taastrup, Denmark) at intensities Ji =
65 dBHL andJi = 50 dBHL, 7 were obtained during the same
Virology
visit. DPOAEs were assessed for 5 different frequencies (500,
Urine specimens were collected from ail infants within
1000, 2000, 4000, and 8000 Hz) in bath ears.
7 days of birth. The diagnosis of cCMV infection was based
Behavioral pure tone audiometry measurements also
on the isolation of CMV in these samples.
were attempted starting at age 4 years. Before age 4 years,
thresholds were obtained with ABR. If for some reason ABR
Typ e of Maternai CMV Infection could not be performed during follow-up (due to, eg, parental
For each congenitally infected infant, the type of the refusa! for sedation, failure of the test due to inadequate
materna! CMV infection was determined by evaluating the sedation or for any other reason), then DPOAEs were eval­
results of materna! serologic screening. Materna! infection uated. If these values were normal, then no additional ABR
was considered primary when a materna! seroconversion in was performed; if DPOAE results were abnormal, then ABR
CMV IgG occurred during pregnancy or when the initial was performed. After 4 years, the results of pure tone audi­
CMV serology was highly suggestive of a primary CMV ometry were used. In these cases, the mean thresholds of the
infection (ie, presence of high IgM and low IgG antibodies in 4 frequencies 500, 1000, 2000, and 4000 Hz were used.
the first serum sample, with a subsequent increase in IgG Changes in hearing thresholds were taken into account
antibodies and decrease in IgM antibodies in the follow-up only when the results were obtained using the same method.
samples). Materna! infection was considered recurrent when a Consequently, ABR results were not compared with results
congenitally infected infant was barn to a mother showing obtained with pure tone audiometry or DPOAE.
immunity in a serum sample obtained before the current
pregnancy, or when the mother's serologic profile in the first
Classification of Hearing Loss
trimester of pregnancy showed high IgG avidity antibodies, or
The classification system of Bluestone8 was used to
when IgG without IgM antibodies was present in the first 6
categorize hearing loss. Normal hearing was defined as the
weeks of pregnancy without evolution of the serologic profile
ability to hear sounds between O and 20 dBHL; mild hearing
in follow-up samples. Materna! seroprevalence was 58.9% in
loss, as detection of sounds at 21 to 30 dBHL; moderate
our population.
hearing loss, as detection of sounds at 31 to 60 dBHL; severe
Materna! infection was classified as unknown in those
hearing loss, as detection of sounds at 61 to 90 dBHL; and
cases when neither primary nor recurrent infection could be
profound hearing loss, as detection of sounds only at 91
ruled out using the foregoing criteria. These women were
dBHL or greater. In those individuals with bilateral SNHL,
considered possibly infected with CMV during the current
we used the results of the better ear to classify hearing loss.4
pregnancy. This infection could be either primary or recur­
Progressive hearing loss was defined as a decrease in the
rent.
auditory threshold of 2::10 dBHL. A fluctuating hearing loss
was defined as a decrease followed by an improvement of at
Audiologie Assessment least 10 dBHL on each occasion. Hearing loss was defined as
Infants with cCMV infection underwent audiologie as­ late onset when there was initial normal hearing, followed by
sessment during the first month after birth, at age 6 months, at an abnormal test that confirmed hearing loss at a later stage.
age 1 year, and annually thereafter. Additional tests were carried Combinations of different types of hearing loss were seen.
out as necessary. The presence of additional risk factors for
SNHL, including prematurity (gestational age <37 weeks), low
Statistical Analyses
birth weight, mechanical ventilation for at least 10 days, the
use of intravenous antibiotics, bacterial meningitis, craniofa­ Differences in the prevalence of SNHL according to
cial malformations, and family history of hearing loss6 were the type of materna! infection were analyzed using Fisher
recorded. Otoscopic examination and tympanometry were exact test.
performed to exclude middle-ear disorders. During the first 4
years of life, audiologie fonction was evaluated with auditory RESULTS
0
(.9
LJ.J brainstem responses (ABRs). Infants who underwent this test Of the 14 021 infants barn in UZ Brussels Hospital
a:
(.9 were usually sedated with chloral hydrate or pentobarbital between June 1996 and November 2006, 74 (0.53%) were
LJ.J
a: (together with DHBP and fentanyl). ABRs were recorded diagnosed with a cCMV infection (33 boys and 41 girls).
CO
0 with a Madsen 2250 ERA (Madsen Electronics, DK-2630 Four of these infants (5.4%) had a symptomatic infection, and
z Taastrup, Denmark) or Interacoustics EP25 (Interacoustics, 70 (94.6%) had an asymptomatic infection. A total of 13
a:
LJ.J
> DK-5610 Assens, Denmark) instrument. Rarefaction clicks infants were lost to follow-up, and 1 infant with a symptom­
en
z were administered to each ear at a rate of 40 clicks per second atic cCMV infection died before a hearing test could be
0
fC=
0
LJ.J
@
A 10-Year Prospective Study of Sensorineural Hearing Loss in Children with Congenital Cytomegalovirus Infection 85

182
ARTICLE 1 - LCA 2009

Table 1. Incidence and severity of SNHL in children Table Il. Incidence of SNHL according to the type
with cCMV infection of maternai infection

Degree of Bilateral SNHL, Unilateral SNHL, Type of maternai infection


hearing loss n (%) n (%) Primary, Recurrent, lndeterminate,
Mild 2 (3.3%) 0 Hearing n (%) n (%) n (%)
Moderate 3 (5.0%) 1 (1.6%) Normal 22 (85%) 13 (93%) 12 (60%)
Severe 2 (3.3%) 3 (5.0%) Unilateral SNHL 2 (7.5%) 0 3 (15%)
Profound 1 (1.6%)* 1 (1.6%) Bilateral SNHL 2 (7.5%) 1 (7%) 5 (25%)
Total 8 (13.3%) 5 (8.3%) Total 26 (100%) 14 (100%) 20 (100%)
*Hearing loss observed in symptomatic cCMV.

Evolution of Hearing Loss


performed. Hearing tests were conducted in the remaining 60 Three infants (5%), 2 with a unilateral loss and 1 with
congenitally infected infants (3 symptomatic and 57 asymp­ a bilateral loss, were diagnosed with late-onset SNHL (at 8,
tomatic). The median age at follow-up was 33 months. None 15, and 79 months). One of the infants with unilateral SNHL
of these infants received antiviral therapy. had severe hearing loss (70 dBHL), and the other had mod­
erate hearing loss (60 dBHL); however, the latter infant
presented with bacterial meningitis at age 8 months. The
Type of Maternai CMV Infection
hearing loss in the infant with bilateral late-onset SNHL was
Of the 60 infants followed, 26 were barn after a ma­
70 dBHL in one ear and 120 dBHL in the other ear.
terna! primary infection (23 after seroconversion during preg­
Multiple hearing tests were available for 44 infants. Of
nancy and 3 exhibiting a serologic profile highly suggestive of
these infants, 7 (16%) had a fluctuating hearing threshold.
recent infection), and 14 were barn after materna! recurrent
Five infants (11%) had progressive hearing loss (2 bilateral
infection (6 with previous immunity; 7 with high-avidity
and 3 unilateral). Improved degree of hearing loss was noted
antibodies in the first trimester of pregnancy, and 1 with IgG
in 8 infants (1 bilateral and 7 unilateral; 18%); in 4 of these
but no IgM antibodies in the 6th week of pregnancy without
infants, the improvement exceeded 20 dBHL.
progression of the serologic profile in the follow-up samples).
In 20 infants, the type of materna! infection could not be
determined.
Relationship between Type of Maternai
Infection and SNHL
Table II shows the incidence of unilateral and bilateral
Hearing Loss
SNHL in each group. Of the 26 infants barn after a materna!
Among the 60 infants, 13 (22%) demonstrated SNHL primary infection, 4 (15%) developed SNHL (2 unilateral and
ranging in severity from mild to profound. Bath unilateral and 2 bilateral). The unilateral hearing lasses were severe (>60
bilateral SNHL was seen (Table I). Unilateral SNHL oc­ dB), and 1 of the infants with bilateral hearing loss required
curred in 5 infants (8.3%), 2 left-sided and 3 right-sided; intervention for disability.
hearing loss was moderate in 1 case, severe in 3 cases, and Of the 14 infants barn after a recurrent materna! infec­
profound in 1 case. Bilateral SNHL was seen in 8 infants tion, 1 infant (7%) demonstrated bilateral severe SNHL re­
(13.3%); in these infants, hearing loss was mild in 2, moderate quiring intervention (7%). The mother of this infant was
in 3, severe in 2, and profound in 1. found to be seropositive before the current pregnancy.
Among the 8 infants with bilateral SNHL, 6 required Of the 20 infants barn to mothers with unknown time
intervention for their hearing disability. In those infants with of infection, 8 (40%) had SNHL (3 unilateral and 5 bilateral).
asymptomatic infection, 12 (21%) had some degree of hearing Four of the 5 infants with bilateral SNHL required interven­
loss; in those with symptomatic infection, 1 (33%) had some tion.
degree of hearing loss. The differences in SNHL among the infants barn to
the 3 groups of mothers were not statistically significant (P =
Risk Factors for SNHL .072).
Among the infants with SNHL, 4 were diagnosed with
an additional risk factor for SNHL. Two of these 4 were barn DISCUSSION
prematurely (at 32 and 35 weeks' gestation), 1 received intra­ Among 14 000 unselected live-barn infants studied
venous aminoglycoside therapy for more than 5 days, and 1 prospectively over a 10-year period in a single hospital, the
had Streptococcus pneumoniae meningitis at age 8 months. In incidence of cCMV was 0.53%, with 5.4% of cases symptom­
those infants without SNHL, 5 demonstrated risk factors for atic. Hearing loss was found in 22% of the cCMV-infected
SNHL; 2 were barn prematurely (at 33 and 35 weeks' gesta­ infants (21% of the asymptomatic and 33% of the symptom­
tion), 2 had a family history of hearing impairment, and 1 atic infected infants). Previous studies have put the incidence
received intravenous aminoglycoside therapy. of SNHL at 6% to 25%9-11 in infants with asymptomatic

86 Foulon et al The Journal of Pediatrics • July 20 08

183
iKB LECTURE CRITIQUE D'ARTICLE

cCMV infection and 22% to 65% in infants with symptomatic audiologie tests also may have contributed to a higher fre­
cCMV infection.11 The incidence of SNHL in the asymp­ quency of fluctuations.
tomatic infants found in our present study (21%) is more An improved hearing threshold was found in 18% of
closely compatible with the higher prevalence figures for infants, half of whom had an improvement of >20 dB. Dahle
SNHL. et al9 also reported improved threshold levels at 1 or more
Although not statisticaily different in this sample, the frequencies in 48% of asymptomatic and 21% of symptomatic
trend toward increased SNHL after materna! primary infec­ infected infants.
tion (15%) compared with that after recurrent materna! in­ The reasons for these fluctuations are not clear, assum­
fection (7%) was substantial (P = .072). The high incidence ing that temporary and common middle-ear problems, such
of SNHL in infants barn after a materna! infection of inde­ as otitis media with effusions, have been properly ruled out.
terminate timing (40%) is surprising. However, this group The deteriorating hearing threshold possibly may be attrib­
comprises mainly infants barn to mothers who had bath uted to reactivation of the virus or the host's inflammatory
positive IgM and IgG in their first serum sample and in response.
whom recent primary infection was possible. In those cases, The high incidence of SNHL found in infants with
primary infections would have occurred very early during asymptomatic infection underscores the need for a good neo­
pregnancy, and early materna! infection is a known risk factor natal screening program. Along with selecting infants requir­
for SNHL. 12 ing audiometric follow-up, neonatal screening would provide
Bilateral hearing loss was detected in 8 of the infants the opportunity to consider antiviral treatment. Although not
with cCMV (13.3%), 6 of whom required intervention. Bi­ yet advocated for asymptomatic cases, therapy with intrave­
lateral hearing loss was found after bath primary and recurrent nous ganciclovir for 6 weeks was shown to reduce the inci­
materna! infections. dence of hearing loss in symptomatic cCMV.15 A serologic
In Belgium (data from the Flanders region, which rep­ strategy providing detection of 82% of cCMV cases has been
resents 60% of the Belgian population), a neonatal screening reported.5 Unfortunately, a number of infants barn after re­
program to detect SNHL has been in place since 1997. This current materna! infection will remain undiagnosed. Al­
program reaches >95% of infants barn in the region. The though generaily assumed to be less severe, cCMV originating
incidence of bilateral SNHL (>40 dBHL) detected at birth from recurrent materna! infections may be underestimated. In
was 0.1%.13 In our study, 5 congenitaily infected infants our study, 1 infant with bilateral hearing loss necessitating
presented with bilateral SNHL (>40 dBHL) at their first intervention was barn to a mother with previous immunity.
hearing test (excluding late-onset hearing loss). Based on Earlier studies have demonstrated that recurrent infection can
these data, we can estimate that cCMV infection is respon­ result in a severely affected infant and that preexisting anti­
sible for 36% of ail cases of bilateral SNHL in Belgium. bodies do not preclude SNHL. 16-19 An easy-to-perform neo­
Late-onset hearing loss, progression, fluctuation, and natal screening method is highly recommended.
improvement of SNHL are important to the final individual Currently, it is not possible to predict which infants will
outcome of infants. The values reported in the literature vary develop late-onset, fluctuating, improved, or progressive hear­
considerably. There have been reports of delayed-onset hear­ ing loss. Follow-up should be maintained for ail infants
diagnosed, and revalidation should be individualized. The
ing loss up to age 6 years and even later.11 In our population,
occurrence of fluctuating, progressive, or even improved hear­
3 infants (5%) experienced late-onset hearing loss. Although
ing thresholds makes it difficult to formulate guidelines re­
our prevalence of late-onset hearing loss (5%) is lower than
garding the duration of the follow-up period or the frequency
that reported by others (18% to 50%4•11), their occurrence is
of audiometric testing. Unnecessary parental anxiety should
important, because screening programs aimed at detecting
be avoided and weighed against the consequences of a delayed
neonatal hearing loss will miss these infants.14 The occurrence
diagnosis of SNHL. Our data suggest that infants with
of late-onset hearing loss underscores the need for careful
cCMV barn to mothers with possible infection during preg­
follow-up of ail infants with cCMV.
nancy (ie, those with initial IgM antibodies in the first serum
Fluctuating hearing loss was detected in 16% of the
sample obtained during pregnancy) are at significant risk for
infants; progressive hearing loss, in 11%. Bath of these oc­
SNHL, and follow-up in these infants should not be ne­
curred only in infants with asymptomatic infections. These
glected. More studies are needed to identify possible prog­
values are lower than those reported by Dahle et al, 9 who
nostic factors for the development of hearing disorders, such
found fluctuating hearing loss in 54% of asymptomatic infants
as the viral blood load of CMV.20•21
and in 29% of symptomatic infants, and progressive hearing
loss in 54% of infants with cCMV. The differences may be
0
(.9
LJ.J due to differences in inclusion criteria or in the duration of
REFERENCES
a: 1. Kenneson A, Cannon MJ. Review and meta-analysis of the epidemiology of
(.9 follow-up of infants. In our study, congenital infections were congenital cytomegalovirus (CMV) infection. Rev Med Virol 2007;17:253-76.
LJ.J
a: diagnosed in a neonatal screening program, and the inclusion 2. Nance \NE, Lim BG, Dodson Kl\.1. Importance of congenital cytomegalovirus
CO
0 of more infants with asymptomatic infection occurring after infections as a cause for pre-lingual hearing Joss. J Clin Virol 2006;35:221-5.
3. Williamson \ND, Demmler GJ, Percy AK, Catlin FI. Progressive hearing loss in
z recurrence may result in a lower incidence of fluctuating
a:
LJ.J
infants with asymptomatic congenital cytomegalovirus infection. Pediatrics 1992;90:
> hearing loss. A longer follow-up and the performance of more 862-6.
en
z
0
fC=
0
LJ.J A 10-Year Prospective Study of Sensorineural Hearing Loss in Children with Congenital Cytomegalovirus Infection 87
@

184
ARTICLE 1 - LCA 2009

4. Fowler KB, McCollister FP, Dahle AJ, Boppana S, Britt WJ, Pass RF. Progressive 14. Fowler KB, Dahle AJ, Boppana SB, Pass RF. Newbom hearing screening: will
and fluctuating sensorineural hearing loss in children with asymptomatic congenital children with hearing loss caused by congenital cytomegalovirus infection be missed?
cytomegalovirus infection. J Pediatr 1997;130:624-30. J Pediatr 1999;135:60-4.
5. Naessens A, Casteels A, Decatte L, Foulon W. A serologic strategy for detection 15. Kimberlin DW, Lin CY, Sanchez PJ, Demrrùer GJ, Dankner W, Shelton M,
neonates at risk for congenital cytomegalovirus infection. J Pediatr 2005;146:194-7. et al. Effect of ganciclovir therapy on hearing in symptomatic congenital cytomegalo­
6. Joint Committee on Infant Hearing. Year 2000 position statement: principles and virus disease involving the central nervous system: a randomized, controlled trial.
guidelines for early hearing detection and intervention programs. Pediatrics 2000;106: J Pediatr 2003;143:16-25.
798-817. 16. Ross SA, Fowler KB, Ashrith G, Stagno S, Britt WJ, Pass RF, et al. Hearing Joss
7. Gordts F, Naessens B, Mudde CA, Clement PAR. Reference data for DPOAE in in children with congenital cytomegalovirus infection bom to mothers with preexisting
healthy newboms. Scand Audiol 1999;28:l-5. immunity. J Pediatr 2006;148:332-6.
8. Grundfast KM, Siparsky NF. Hearing Joss. ln: Bluestone CD, Stool ES, Alper
17. Casteels A, Naessens A, Gordts F, De Catte L, Bougatef A, Foulon W.
CM, Arjmand EM, Casselbrant ML, Dohar JE (eds). Pediatric Otolaryngology. 4th
Neonatal screening for congenital cytomegalovirus infections. J Perinat Med
edition. Philadelphia: Saunders; 2003. p 306-50.
1999;27:116-21.
9. Dahle AJ, Fowler KB, Wright JD, Boppana SB, Britt WJ, Pass RF. Longitudinal
18. Ahlfors K, Ivarsson SA, Harris S. Report on a long-term study of maternal and
investigation of hearing disorders in children with congenital cytomegalovirus. J Am
congenital cytomegalovirus infection in Sweden: review of prospective studies available
Acad Audio! 2000;11:283-90.
in the literature. Scand J Infect Dis 1999;31:443-57.
10. Iwasaki S, Y amashita M, Maeda M, Misawa K, Mineta H. Audiological outcome
of infants with congenital cytomegalovirus infection in a prospective study. Audiol 19. Griffiths PD, Baboonian C, Rutter D, Peckham C. Congenital and maternal
Neurotol 2007;12:13-36. cytomegalovirus infections in a London population. Br J Obstet Gynaecol 1991;
11. Fowler KB, Boppana SB. Congenital cytomegalovirus infection and hearing def­ 98:135-40.
icit. J Clin Virol 2006;35:226-31. 20. Lanari M, Lazzarotto T, Venturi V, Papa I, Gabrielli L, Guerra B, et al. Neonatal
12. Pass RF, Fowler KB, Boppana SB, Britt WJ, Stagno S. Congenital cytomegalo­ cytomegalovirus blood load and risk of sequelae in symptomatic and asymptomatic
virus infection following first trimester maternal infection: symptoms at birth and congenitally infected newborns. Pediatrics 2006;117:76-83.
outcome. J Clin Virol 2006;35:216-20. 21. Bradford RD, Cloud G, Lakeman AD, Boppana S, Kimberlin DW, Jacobs R,
13. Kind en Gezin (www.kindengezin.be). Van Kerschaver E, Stappaetts L, Buysse B. et al. Detection of cytomegalovirus (CMV) DNA by polymerase chain reaction is
Kind en Gezin: Gehoorscreening in Vlaanderen 2004. Annual Report 2004. Available associated with hearing loss in newborns with symptomatic congenital CMV infection
at www.kindengezin.be/KG/Algemeen/ Over_Kind_En_ Gezin/Rapporten/ defaul t.jsp. involving the central nervous system. J Infect Dis 2005;19:227-33.

88 Foulon et al The Journal of Pediatrics • July 2008

185
iKB LECTURE CRITIQUE D'ARTICLE

Q M
� I Pourquoi cette étude a-t-elle été mise en place ?
A- L'infection congénitale à CMV (cCMV) est la plus commune des infections virales fœtales.
B- L'incidence de la PANS due à une cCMV n'est pas connue.
C- La c CMV est la principale cause non génétique de PANS.
D- Peu d'études ont été menées sur le sujet, notamment concernant l'incidence de la PANS dans ce
contexte.
E - La majorité des enfants avec une cCMV sont asymptomatiques.

QCM
2
1Quel(s) étai(en)t le(s) objectif(s) principal(aux) de cette étude ?
A - Evaluer l'incidence de la PANS chez les enfants avec une cCMV.
B - Evaluer la prévalence de la PANS chez les enfants avec une cCMV.
C - Evaluer l'incidence de la cCMV au cours de la grossesse.
D - Evaluer la signification d'une primo-infection à CMV durant la grossesse dans le développemen1
de la perte auditive.
E - Evaluer la signification d'une infection récidivante à CMV durant la grossesse dans le
développement de la perte auditive.

QCM
3
1
De quel type d'enquête s'agit-il ?
A - Une enquête épidémiologique.
B - Une enquête observationnelle.
C - Une enquête descriptive.
D - Une enquête analytique.
E - Une étude de cohorte prospective.

A-
Q M
� I Ce type d'étude vous semble-t-il adapté à la question posée par les auteurs ?
Oui, l'objectif est essentiellement descriptif.
B- Oui, l'objectif porte sur une stratégie de dépistage.
C- Oui, il est le seul parmi les études épidémiologiques à permettre un calcul d'incidence.
D- Non, une étude cas-témoin aurait été préférable.
E- Non, seul un essai randomisé permet d'établir une causalité.

0
(.9
LJ.J
a:
(.9

LJ.J
a:
CO
0

z
a:
LJ.J
>

@
en
z
0
fC=
0
LJ.J

186
ARTICLE 1 - LCA 2009

QCM Comment se nomme cette figure ?


5 1

14021 enfants nés évalués pour le


- CMV

1
74CMV :
13 perdus de vue
- 4 symptomatiques 1-+
- 70 asymptomatiques 1 décès

60 évalués pour test d'audition :


- 3 symptomatiques
- 57 asymptomatiques

!
20 infections maternelles 14 infections maternelles
!
20 indéterminés :
primitives : récidivantes : - 12 auditions normales
- 22 auditions normales - 13 auditions normales - 3 PANS unilatérale s
- 2 PANS unilatérales - 0 P NS unilatérale - 5 P NS bilatérales
- 2 PANS bilatérales - 1 PANS bilatérale

A- Diagramme de Forrest.
B- « Funnel-plot ».
C- Diagramme de flux.
D- Nomogramme de Bayès.
E- Flow-chart.

QCM 20% des enfants n'ont pas eu de recherche de CMV dans les urines. Quel(s)
6 1 est(sont) alors le(s) biais possible(s)?
A - Biais de sélection.
B - Biais de classement.
C - Biais de confusion.
D - Biais de suivi.
E - Biais d'attrition.

QCM Certains enfants présentant une infection à CMV n'ont pas eu de suivi audiologique.
7 1 Avec quelle(s) conséquence(s) possible(s)?
A - Sur-estimation de l'incidence de la PANS chez les enfants présentant une infection à CMV.
B - Sous-estimation de l'incidence de la PANS chez les enfants présentant une infection à CMV.
C - Possible biais de classement.
D - Possible biais de sélection.
E - Possible biais de confusion.

Q M
� I Quels étaient les facteurs de confusion potentiels dans cette étude ?
A- La prématurité.
B- L'âge de la mère.
C- Un petit poids de naissance.
D- L'existence d'une ventilation mécanique pendant au moins 10 jours.
E- Les antécédents familiaux de troubles auditifs.

187
iKB LECTURE CRITIQUE D'ARTICLE

Q M
� I Comment ont-ils été pris en compte dans cette étude?
A- Restriction de la population d'étude.
B- Appariement.
C- Analyse stratifiée.
D- Analyse multivariée.
E- Pas de prise en compte de ces facteurs de confusion par les auteurs.

QCM
10
1Dans cette étude, qui est (théoriquement) concerné par l'évaluation audiologique?
A - Tous les enfants nés et explorés à l'hôpital universitaire de Ziekenhuis.
B - Les seuls enfants présentant une infection à CMV.
C - Tous les enfants nés de mère ayant présentée une infection à CMV au cours de la grossesse.
D - Seuls les enfants ayant présenté une infection symptomatique à CMV.
E - Seuls les enfants ayant présentés une infection asymptomatique à CMV.

QCM
11 1 A propos des résultats présentés dans le tableau Il, que pouvez-vous dire?
A - L'incidence de la PANS unilatérale est plus élevée chez les mères avec une primo-infection que
chez les mères avec un statut infectieux« indéterminé».
B - L'incidence de la PANS unilatérale est significativement plus élevée chez les mères avec une
primo-infection que chez les mères avec un statut infectieux« indéterminé».
C - Une infection à CMV récidivante chez la mère est un facteur protecteur de survenue d'une PANS
chez l'enfant.
D - L'incidence des différents types de PANS ne varie pas significativement en fonction du statu1
infectieux de la mère.
E - Un test de Fisher a été utilisé pour comparer ces données.

QCM 118% des enfants ont présenté une amélioration de leur déficit auditif. Comment
12 pouvez-vous l'expliquer?
A - Cela peut être dû à la répétition des tests auditifs.
B - Cela peut être dû à une modification de la technique d'évaluation auditive en cours d'étude.
C - Cela peut être dû à des variations« physiologiques» de l'audition au cours du temps.
D - Il n'y a pas d'explications clairement données par les auteurs.

1
E - Cela peut s'expliquer par une modification de la population étudiée et analysée.

QCM A la lecture de cette étude, vous semble-t-il nécessaire de mettre en place un


13 dépistage systématique des infections congénitales à CMV chez les nouveau-nés?
A - Oui, car c'est un problème de santé publique majeur.
B - Oui, car l'incidence de ces infections est élevée.
C - Oui, car on connaît l'histoire naturelle de la maladie et un traitement est possible.
D - Non, car ce n'était pas l'objectif de cette étude.
E - Non, car l'incidence des PANS après infection à CMV n'est pas suffisamment élevée.

A la lecture de cette étude, vous semble-t-il nécessaire de faire pratiquer des


QCM
examens répétés de l'audition chez les enfants qui auraient une infection
0
(.9
14 congénitale à CMV?
LJ.J
a:
(.9
A- Oui, en raison de l'incidence élevée des PANS après une infection asymptomatique à CMV.
LJ.J
a:
CO
B- Oui, car les PANS suivant une infection à CMV peuvent être tardives.
0
C- Non, car il existe un seuil d'audition fluctuant chez certaines enfants.
z D- Non, car il existe une amélioration du déficit auditif chez certains enfants.
a:
LJ.J
> E- Non, car la fréquence optimale de réalisation des tests audiométriques n'a pas été étudiée.

@
en
z
0
fC=
0
LJ.J

188
ARTICLE 1 - LCA 2009

QCM
J Quel est le niveau de preuve de cette étude ?
15
A - Niveau de preuve 1.
B - Niveau de preuve 2.
C - Niveau de preuve 3.
D - Niveau de preuve 4.
E - Niveau de preuve 5.

189
iKB LECTURE CRITIQUE D'ARTICLE

Grille de correction QCM


(Questions à choix multiples)

A- V
B-
:!!: C-
V
F
.
Réponse: ABDE
On se place ici dans le contexte de planification de cette étude, qui doit toujours
(.)
0 D-
E-
V
V
.
répondre à une question de recherche bien définie.
Les éléments permettant de répondre à la question se trouvent dans l'introduction.

N
A-
B- F .
V Réponse: A
L'objectif principal de cette étude est d'évaluer l'incidence de la perte d'audition
:!!: C-
0 D-
(.)
F
F .
chez des enfants avec cCMV (et de décrire cette perte d'audition).
L'objectif secondaire était d'évaluer la signification d'une primo-infection à CMV et
d'une infection récidivante durant la grossesse dans le développement de la perte
E- F d'audition.
A- V
M B-
:!!: C-
(.)
V .
V Réponse: ABCE
C'est une enquête épidémiologique, observationnelle, descriptive (mesure
0 D- F d'une incidence) de type enquête de cohorte prospective.
E- V
A-
B- F .
V Réponse: AC
L'étude étant prospective, une mesure de l'incidence de la PANS pourra être
"'" C-
:!!: D-
V
F .
réalisée.
Ce type d'étude est bien adapté pour tout ce qui touche à la description de

.
(.)
0 données/population.
E- F La question d'étude ne porte pas ici sur la causalité, qui est déjà établie (cf.
introduction de l'article).
A- F
B- F .
Réponse: CE

.
Lt)
:!!: C- Il s'agit d'un flow-chart ou diagramme de flux.
V
(.) Il doit être présent dans toute étude de qualité, et permet le suivi des effectifs de
0 D- F
l'étude.
E- V
A-
B- F .
V Réponse: A
On touche ici à la constitution de la population d'étude, donc il s'agit d'un biais de
ID C-
:!!: D-
(.)
F
F .
sélection.
Les auteurs ne justifient pas ce chiffre.
0
E- F

A-
B- V .
V Réponse: ABD
14 enfants présentant une infection à CMV n'ont pas eu de suivi audiologique =>
C-
:!!: D-
F
V .
1 décès+ 13 PDV
Le principal problème des études de cohorte est le nombre de perdus de vue,

.
entraînant un possible biais de sélection.
(.)
0
0 Du fait de ces données manquantes, il y a donc dans cette étude sur- ou sous-
(.9
LJ.J
a:
E- F estimation de l'incidence de la PANS (le choix du sens de la variation dépendant
(.9
des résultats que l'on aurait retrouvé chez les enfants concernés).

.
LJ.J
a:
0
A- V Réponse: ACDE
z
B- F Il est important dans les études d'identifier les facteurs de confusion afin de les
a: prendre en compte dans sa conception mais aussi possiblement lors de l'analyse
LJ.J
:!!: C- V
en
z
0
fC=
0
0 D-
(.)

E-
V
V
.
des données.
Pour rappel, un facteur de confusion est lié à la fois à l'exposition et à la maladie. Il
LJ.J peut entraîner un biais de confusion.
@

190
ARTICLE 1 - LCA 2009

A-
B- F .
F Réponse: E
Les auteurs ont effectivement bien recherché la présence éventuelle de ces

.
a,
:!!: C- F facteurs de confusion, mais ils ne les ont pas pris en compte dans leurs études.
Pour rappel, le biais de confusion est le seul (parmi les trois grands types de biais)
0 D- F
(.)

à pouvoir être pris en compte a priori lors de la planification de l'étude, et a


E- V posteriori lors de l'analyse des données.

.
A- F Réponse: B
....
0 B- V L'évaluation audiologique porte sur tous les enfants présentant une infection à
:!!:
(.)
0 D-
C- F
F . CMV dépistée à la naissance sur les urines.
Dans cette étude, certains enfants n'ont pas pu être «évalués, car perdus de vue
E- F ou décédés.

........
A-
B-
V
F .
Réponse: ADE
Il existe des différences d'incidence de la PANS selon le type d'infection de la
C- F mère, mais ces différences ne sont pas statistiquement significatives (p=0,072
:!!:
(.)
0
D-
E-
V
V
. - valeur donnée dans le texte de l'article, sous le tableau).
Le test utilisé par les auteurs est mentionné dans la partie « analyses
statistiques ».

....
N
A-
B-
V
V .
Réponse: ABCD
Il n'y a pas d'explications clairement données pour expliquer ces modifications, de
C- V même que pour les 16% d'enfants avec un seuil auditif fluctuant.
:!!:
(.) D- V
0
E- F
A- F
....
M B-
.
F Réponse: D
:!!: C- F On touche ici à la validité externe des études : toujours bien remettre l'étude dans
(.)
0 D- V son contexte et ne pas extrapoler au-delà de l'objectif poursuivi !
E- F
A- V
"".... B- V .
Réponse: AB
:!!:
(.)
0 D-
C- F
F
. L'atteinte auditive est fréquente car elle touche 22% des enfants.
De plus, les atteints peuvent être tardives, justifiant la réalisation de plusieurs tests
dans le suivi des enfants atteints.
E- F
A- F

....
Lt)
B-
.
F Réponse: D
:!!:
0 C-
(.)
F . Il s'agit ici d'une étude épidémiologique descriptive.
Les niveaux de preuve de la HAS doivent être connus :

D- V

191
iKB LECTURE CRITIQUE D'ARTICLE

parla Grade des ,-commanda


Niveau1:
• Essais comparatifs randomisésde
i rte puissance A
• 'ta-analyse d'essais comparatifs
randomisés p
• Analysede décision basée sur des
études bien menées

Niveau2:
• Essais comparatifs randomisés de
faible puissance B
E- F • Etudes comparatives non Péso e
randomisées bien menées
• Etudes de cohorte

Niveau3:
• Etudes caslémoin

Niveau
C
• Etudes comparatives comportant
des biais importants Fa
• Etudes épidémiol iques
descriptives
• Etudes rétrospectives
• Sériede cas

0
(.9
LJ.J
a:
(.9

LJ.J
a:
CO
0

z
a:
LJ.J
>
en
z
0
fC=
0
LJ.J
@

192
Chapitre
35

ARTICLE 2 - LCA 2010

The Cardiac lnsufficiency Bisoprolol Study Il (CIBIS-11):


a randomised trial

CIBIS-ll lnvestigators and Committees*

Summary Introduction
Experimental and clinical trials have shown beneficial
Background ln patients with heart failure, �-blockade has
effects with �-blockade in heart failure. 1-3 There is
improved morbidity and left-ventricular function, but the reluctance to use �-blockade therapy, however, and
impact on survival is uncertain. We investigated the unequivocal evidence of benefit from randomised placebo
efficacy of bisoprolol, a �. selective adrenoceptor blocker controlled trials is needed to convince the medical
in decreasing ail-cause mortality in chronic heart failure. community ofits safety and efficacy.
Methods ln a multicentre double-blind randomised placebo­ Clinical trials in heart failure have tested compounds
controlled trial in Europe, we enrolled 2647 symptomatic with different pharmacological profiles. 2·' Meta-analyses of
patients in New York Heart Association class Ill or IV, with placebo-controlled trials of �-blockers have suggested an
left-ventricular ejection fraction of 35% or less receiving overall effect on mortality of 32% ....' The Cardiac
standard therapy with diuretics and inhibitors of Insufficiency Bisoprolol Study (CIBIS) studied bisoprolol,
angiotensin-converting enzyme. We randomly assigned a highly selective antagonist of � 1 adrenoceptors, which are
found mainly in the heart and especially in ventricular
patients bisoprolol 1-25 mg (n=1327) or placebo (n=1320)
tissue.7 That trial showed a non-significant trend towards
daily, the drug being progressively increased to a maximum
20% lower mortality in the bisoprolol group and 30%
of 10 mg per day. Patients were followed up for a mean of
fewer admissions to hospital for worsening heart failure. 8
1-3 years. Analysis was by intention to treat.
We designed the CIBIS-II trial to test this evidence
Findings CIBIS-11 was stopped early, after the second further, based on the CIBIS trial results.
interim analysis, because bisoprolol showed a significant
mortality benefit. Ali-cause mortality was significantly Methods
lower with bisoprolol than on placebo (156 [11-8%] vs 228 The study design and protocol of CIBIS has been published.'
[17-3%] deaths with a hazard ratio of 0-66 (95% Cl We did a double-blind placebo-controlled randomised trial,
0-54-0-81, p<0-0001). There were significantly fewer analysed by intention to treat.
sudden deaths among patients on bisoprolol than in those
on placebo (48 [3-6%] vs 83 [6-3%] deaths), with a hazard Patients
Eligible patients were ambulatory, aged 18-80 years, and had a
ratio of 0-56 (0-39--0-80, p=0-0011). Treatment effects
left-ventricular ejection fraction, measured within 6 weeks of
were independent of the severity or cause of heart failure. randomisation, of 35% or less. Symptoms had to include
lnterpretation �-blocker therapy had benefits for survival in dyspnoea on exertion, orthopnoea, or paroxysmal noctumal
dyspnoea, with or without oedema, and fatigue, corresponding
stable heart-failure patients. Results should not, however,
to class Ill or IV of the New York Heart Association (NYHA).
be extrapolated to patients with severe class IV symptoms We recruited patients from 274 hospitals in 18 countries in
and recent instability because safety and efficacy has not western and eastern Europe.
been established in these patients. Patients had to have a diagnosis of chronic heart failure, made
at least 3 months previously, with clinical stability during the
Lancet1999;353: 9-13 preceding 6 weeks for heart failure or 3 months for acute
See Commentary page myocardial infarction or unstable angina. Cardiovascular therapy
had to have been unchanged in the 2 weeks before
randomisation. Treatment had to include a diuretic and an
angiotensin-converting-enzyme (ACE) inhibitor, although we
allowed other vasodilators if patients were intolerant of ACE
inhibitors; the use of digoxin was optional. We measured left­
ventricular ejection fraction by echocardiography with the
Teicholz formula for M-mode recordings, or the modified
Simpson's rule for measurements of end-diastolic and end­
systolic volume on apical two-dimensional views. If adequate
views could not be obtained by echocardiography, we used
contrast or radionuclide ventriculography.
The main exclusion criteria were uncontrolled hypertension,
myocardial infarction or unstable angina pectoris in the previous
3 months, percutaneous transluminal coronary angioplasty or
*lnvestigators and committee members listed at end of paper coronary-artery bypass graft in the previous 6 months, previous
Correspondence to: Philippe Lechat, Pharmacology Department, or scheduled heart transplant, atrioventricular black greater than
AP-HP, Pitié Salpêtrière Hospital, 75013 Paris, France first degree without a chronically implanted pacemaker, resting
(e-mail: philippe. lechat@psl.ap-hop-paris.fr) heart rate of less than 60 beats per min, systolic blood pressure

193
iKB LECTURE CRITIQUE D'ARTICLE

ARTICLES

Characteristics Placebo Bisoprolol


12647 patients randomisedl
(na1320) (na1327)

Mean (range) age (years) 61 (22-80) 61 (26-80)


Sex (M/F) 1062 (80%)/ 1070 (81%)/
Demographic

1320 patients 11327 patients 1


258 (20%) 257 (19%) given placebo 1 given bisoprolol

Ill 1096 (83%) 1106 (83%)


IV 224 (17%) 221 (17%) 372 patients 305 patients
NYHA class

died or died or
Documented ischaemic heart 654 (50%) 662 (50%) permanent permanent
disease treatment treatment
Heart failure

Primary dilated cardiomyopathy 157 (12%) 160 (12%) withdrawal withdrawal


Others* 509 (40%) 505 (38%) 28 treatment 41 treatment
Duration of heart failure (median/mean) 2-31/3-60 2-25/3-49 withdrawn early withdrawn early
I+- f------J

Mean (SD) systolic blood pressure (mm Hg) 130-2 (19-5) 129-2 (19-2)
Mean (SD) diastolic blood pressure (mm Hg) 80-0 (10-9) 79-4 (11-2) 1 lost to 5 lost to
Mean (SD) heart rate (beats/min) 81 0 (15-5) 79-9 (14-5) follow-up follow-up
Mean (SD) left-ventricular ejection fraction (%) 27-6 15-5) 27-5 (6-0)
Mean (SD) left-ventricular end-diastolic 6-7 [0-9) 6-7(0-9)
diameter (cm)
Mean (SD) left-ventricular end-systolic 5-7 (0-9) 5-711-0) 920 patients 981 patients
diameter (cm) on treatment on treatment
Mean (SD) left-ventricular fractional shortening 15-5 (5-7) 15-5 (5-7) at end of study at end of study
Atrial fibrillation 264 (20%) 257 (20%)

Diuretic 1310 (99%) 1305 (98%) Figure 1: Trial profile


ACE inhibitor 1274 (96%) 1273 (96%)
Concomitant medications

Dihydropyridine-type calcium antagonists 23 (2%) 23 (2%) treatment withdrawals.


Nitrates 762 (58%) 773 (58%) Ali important clinical circumstances were analysed by the
670 (51%) 697 (53%)
206 (16%) 185 (14%) members of the critical events committee, who were masked to
Anticoagulants 413 (31%) 399 (30%) treatment status. They classified ail endpoints according to strict
Digoxin

Antiplatelet agents 558 (42%) 537 (40%) definitions of critical events, only the most important of which
Amiodarone

*Coronary angiography unavailable or no history of myocardial infarction. are defined here.


Table 1: Baseline characteristics of patients Sudden death was defined as death occurring within 1 h
without previous worsening of symptoms of heart failure. We
at rest of Jess than 100 mm Hg, renal failure (serum creatinine also took unexpected deaths occurring during sleep to be sudden
;;.300 µmol/L), reversible obstructive Jung disease, or pre­ when patients were found dead by family members sharing the
existing or planned therapy with 13-adrenoreceptor blockers. same room in the morning. We generally classified other
We did not allow treatment with 13-blockers (including eye unwitnessed deaths as unknown. We classified pump failure
drops), calcium antagonists, inotropic agents except digitalis, when death occurred as a consequence of progressive
and antiarrhythmic drugs other than amiodarone during the trial. deterioration of heart failure, acute pulmonary oedema, or
We identified three mutually exclusive aetiological groups: cardiogenic shock. We recorded non-cardiovascular death if
patients with definite ischaemic heart disease with at least one cardiovascular events were excluded as cause of death. Death
important coronary arterial stenosis of 70% or more of luminal was classified as being due to unknown cause when there was
diameter seen on angiography, or a confirmed myocardial insufficient evidence to confirm cardiovascular or non­
infarction; those with idiopathie dilatcd cardiomyopathy if cardiovascular cause.
normal coronary arteries were seen on angiography; and patients We recorded permanent treatment withdrawal when a medical
with valvular heart disease or hypertension, together with those need for a 13-blocker arose, when intolerance to study medication
with suspected but unproved ischaemic heart disease or occurred despite increases in baseline therapy, if study-drug dose
cardiomyopathy. \Ve used a non-parallcl structure to describe was decreased or temporarily withdrawn, if patients experienced
these groups. intolerance to first dose, and for ail other circumstances in which

Randomisation was done by random numbers generated on


Placebo Bisoprolol Hazard ratio p
Methods
----
computer at the independent statistical centre, sent to study
(na1320) (na1327) (95%CI)

Ali-cause mortality 228 (17%) 156 (12%) 0-66 (0-54-0-81) <0-0001


centres by telefax. The code was kept at the statistical centre and
Primary endpoint

was not broken until the trial was stopped.


Ali-cause hospital 513 (39%) 440 (33%) 0-80 (0-71-0-91) 0-0006
- - - -- - - -

The study treatments were identical in appearance. Patients


Secondary endpoints

were started on bisoprolol l ·25 mg (n= 1327) or placebo Ali cardiovascular deaths 161 (12%) 119 (9%) 0-71 (0-56-0-90) 0-0049
(n= 1320) daily, the drug being increased successively to Combined endpoint 463 (35) 388 (29%) 0-79 (0-69-0-90) 0-0004
admission

2-50 mg, 3-75 mg, 5-00 mg, 7-50 mg, and 10-00 mg, according Permanent treatment 192 (15%) 194 (15%) 1-00 (0-82-1-22) 0-98
to tolerance. Patients received the first three concentrations of withdrawals
each dose for 1 week, and the higher concentrations for 4 weeks.
---- ----
Investigators were asked to ensure that the highest tolerated dose Sudden death 83 (6%) 48 (4%) 0-56 (0-39-0-80) 0-0011
Pump failure 47 (4%) 36 (3%) 0-74 (0-48-1-14) 0-17
Exploratory analyses

was reached and maintained, if possible, for the duration of the


trial. In patients with worsening heart failure, we recommended Myocardial infarction 8 (1%) 7 (1%) 0-85 (0-31-2-34) 0-75
Other cardiovascular 23 (2%) 28 (2%) 1-17 (0-67-2-03) 0-58
a: that the baseline heart-failure treatments were increased before Non-cardiovascular deaths 18 (1%) 14 (1%) 0-75 (0-37-1-50) 0-41
0

the study drug was decreased. We followed up until the end of Unknown cause of death 49 (4%) 23 (2%) 0-45 (0-27-0-74) 0-0012
(.9
LJ.J

the study ail patients in whom study medication was withdrawn, Hospital admission for 232 (18%) 159 (12%) 0-64 (0-53--0-79) 0-0001
a: worsening heart failure
(.9

with follow-up visits every 3 months. Thcre was no run-in period.


The primary endpoint was ail-cause mortality. Secondary Numbers refer to patients who presented at least once with given event. For hospital
LJ.J

admissions, numbers refer to patients admitted at least once with any cause.
CO

z endpoints were ail-cause hospital admissions, cardiovascular


0

a:
mortality, cardiovascular mortality and cardiovascular hospital Table 2: Primary and secondary endpoints and exploratory
>
en admissions, a composite endpoint, and permanent premature
z
LJ.J

analyses


0
0

LJ.J
10 THE LANCET • Vol 353 • January 2, 1999
@

194
ARTICLE 2 - LCA 2010

ARTICLES

study drug was pcrmancntly stoppcd. Bisoprolol Placebo


(n/total) (n/total)

Statistical ana/ysis lschaemia � 75/662 121/654


Based on the CIBIS survival curves, we estimated the annual '
Primary DCM 13/160 15/157
mortality rate to be about 11 ·2% in the placebo group. To
obtain a minimum of 25% lower mortality in the bisoprolol Undefined ,- 68/505 92/509
'
group in a 1-year recruitmcnt pcriod and 2-ycar follow-up, we
calculated that for an Πrisk of 5% and a power of 95%, we NYHA Ill -+- 116/1106 173/1096
needed to recruit 2500 patients.

----
NYHA IV 40/221 55/224
\Ve planned two interim analyses at 2500 patient-years and '
'
5000 patient-years. The study could be stopped according Total
'
to Peto's rule'° if a significant difference in ail-cause mortality
was seen between the two groups at p<0·00 1 (two-tailed log­
Relative risk 0·4 0·6 0·8 1·0 1·2 1·4 1·6 1·8
rank test).
\Ve did analyses by intention to treat. We calculated Kaplan­ Figure 3: Relative risk of treatment effect on mortality by
J\,leier survival curves on total mortality, and assessed differences aetiology and functional class at baseline
between the treatment groups with the log-rank test (time to Horizontal bars represent 95% Cls.
event). Hazard ratios and 95% Cls were calculated with Cox's
proportional hazards regression mode!. We used the Breslow­ groups for any subgroup of aetiology of heart failure or
Day test to calculate homogeneity of odds ratios between class of disease severity.
treatrnent groups, according to NYHA class and cause of Circumstances and causes of deaths are shown in
heart failure. We compared baseline variables between the two table 2. There were 48 sudden deaths in the bisoprolol
groups with Student's t or Wilcoxon's rank-sum tests for groups compared with 83 in the placebo group, a
continuous variables, and Fisher's exact or x' tests for categorical difference of 42% (p=0·00I 1 ).
variables. The difference in admissions to hospital for worsening
heart failure between the two groups was 32% (p<0·0001,
Results table 2). There were, however, more admissions to
2647 patients were enrolled into the study and followed hospital for stroke in the bisoprolol group than in the
up for a mcan of l ·3 years. Basclinc characteristics wcrc placebo group (31 vs 16, p=0·04). Hospital admissions
similar in the two groups (table 1). were significantly fewer in the bisoprolol group than in
The trial was stopped early bccausc ail-cause mortality the placebo group for ventricular tachycardia and
was significantly less in the bisoprolol group than in the ventricular fibrillation (six vs 20, p=0·006) and for
placebo group (figure 1). ln the bisoprolol group, 156 hypotension (three vs 11, p=0·03), but were more
(11·8%) patients died, compared with 228 (17·3%) in the common for bradycardia (14 vs two, p<0·004). The rate
placebo group (p<0·000l). The estimated annual of heart transplantation was low and similar in the two
mortality rate was 8·8% in the bisoprolol group and groups. The number of hospital admissions did not differ
13·2% in the placebo group (hazard ratio 0·66 [95% CI significantly for angina, myocardial infarction,
0·54 0·81], figure 2). supraventricular arrhythmias, cardiogenic shock, or
There were significantly fewer cardiovascular deaths coronary revascularisation.
among patients on bisoprolol than among those on The most common dose of bisoprolol during the
placebo (p=0·0049). Significantly fewer patients on maintenance phase was 10·0 mg, which was reached in
bisoprolol were admitted to hospital for all causes than 564 patients; 152 reached 7·5 mg and 176 reached
patients on placebo (p=0·0006) as well as for the 5·0 mg.
combined endpoint of cardiovascular death and admssion Treatment effect did not differ between the
to hospital for cardiovascular events (p=0·0004). The participating countries.
number of permanent treatment withdrawals was similar
in the two groups (table 2). Discussion
We did subgroup analyses by cause of heart failure and �-blockade had bcncfits for ail-cause mortality in patients
severity of disease at baseline (figure 3). Mortality and with chronic heart failure. Benefits were also seen for
admissions to hospital did not differ significantly between morbidity, assessed by admissions to hospital for all
causes, especially for worsening heart failure.
1·0 The magnitude of the treatment effect (a 32% lower
risk of mortality and admission to hospital for heart
--.. _'•, .. failure) is in accordance with findings from meta-analyses
of previous randomised placebo-controlled trials.' Our
.. .........__ .. - -
'° o-8
results were obtained in patients already taking diuretics

·2: -., .. -- . ·- .. --.


Placebo
and ACE inhibitors and not patients selected for
tolerance of bisoprolol, since we had no run-in period.
::,
(fJ Benefit occurred irrespective of the cause of heart failure
or NYHA class of severity. The greatest effect was,
however, seen in patients with ischaemic heart disease
0·6 p<0-0001
who were in NYHA class III at baseline.
With the inclusion of our results, the cumulative
o�----�----�----��---� experience with �-blockade therapy in chronic heart
0 200 400 600 800 failure (more than 6000 patients in randomised trials)
Time after inclusion (days) approaches that of ACE inhibitors in heart-failure
Figure 2: Survival curves patients with syrnptorns. 11 Benefit frorn the addition of�-

TIIE LANCET • Vol 353 • January 2, 1999 11

195
iKB LECTURE CRITIQUE D'ARTICLE

ARTICLES

blockade to ACE inhibitors after acute myocardial with our trial impossible. In theory, blockade of P,­
infarction has also been suggested in post-hoc analyses," adrenoceptors and P, adrenoceptors should provide more
but this strategy has not been supported by randomised complete protection against the harmful effects of
controlled trials with sufficient power to address outcome catecholamines, but our results show that selective
in patients with left-ventricular dysfunction, with or inhibition of P, receptors is sufficient to lower the rate of
without heart failure. sudden death presumed ta be associated with arrythmia.
Neuroendocrine activation may underlie this Differences in effects according to the pharmacological
therapeutic benefit by inhibition of the potential harmful profiles of P-blockers is, however, important and
effects of compensatory mechanisms, the renin­ continuing trials of drugs such as bucindolol,2° carvedilol,
angiotensin-aldosterone system for ACE inhibitors, and and metoprolol with carvedilol will provide essential
sympathetic activity with P-blockers. Cardiac work and information.
energy consumption are decreased by unloading with The Jack of difference in treatment effects on mortality
ACE inhibitors, slowing of heart rate with P-blockers, and and secondary endpoints by cause or severity of disease
lowering of blood pressure with both. The contrasts with the findings of CIBIS, in which bisoprolol
neuroendocrine hypothesis in heart failure includes the had greatest benefits in patients with non-ischaemic
possibility that ACE inhibitors prevent direct toxic heart failure. Given the consistent and striking benefit of
cardiac effects of angiotensin II and aldosterone, and B-blockers in secondary prevention after myocardial
B-blockers prevent the toxic effects of catecholamines. infarction,1.21 there is no plausible scientific explanation
The greatest effect on mortality was a 42% lower rate for this apparent anomaly. This observation did, however,
of sudden deaths among patients on bisoprolol, as well as result from a post-hoc analysis and highlights the
non-significantly fewer deaths related to pump failure. limitations of such analyses.
This finding suggests that bisoprolol was acting We saw benefits of bisoprolol for patients in NYHA
principally as an antiarrhythmic agent rather than having class IV; however, we included only stable patients and
a specific effect on myocardial function. Given what is the use of P-blocker treatment in non-ambulatory
known already about the positive effects of B-blockade on patients with class IV symptoms, especially those with
cardiac structure and function, the way in which we recent instability, needs ta be defined.
classified the cause of death should be taken into account. The addition of a P-blocker to standard therapy with a
Sudden deaths or those associated with pump failure had diuretic and an ACE inhibitor can be recommended in
strict definitions. Many deaths had, therefore, to appropriate, stable, ambulatory patients who have heart
be classified for the purposes of the trial as being failure caused by impaired left-ventricular systolic
of unknown cause. Unwitnessed or insufficiently function. The limited use of P-blocker therapy after
documented deaths classified as unknown were probably myocardial infarction, despite the cumulative evidence of
sudden and some deaths associated with pump failure, double-blind, randomised, controlled trials, suggests that
which can also seem to be sudden. Moreover, bisoprolol anxiety about safety or lack of clarity about the target
led to a significantly lower death rate in the unknown population are common. The continued accumulation of
group, which strongly implies that most of the deaths in information about P-blockers in heart failure is, therefore,
this category were cardiac. These difficulties of important, since the population of patients with heart
classification reinforce the value of ail-cause mortality as failure is much Jess well-defined than that for patients
the major mortality endpoint in similar trials. with myocardial infarction. Without further information
The strikingly lower frequency of sudden deaths among from large randomised controlled trials, the uptake of
patients on bisoprolol in our trial suggests an important P-blockade in clinical practice outside specialist
antiarrhythmic effect. Although a similar difference was departments will be slow.
not seen in CIBIS, a significant trend was found in the For ail heart-failure patients, administration of P-blocker
USA carvedilol studies. 13 In CIBIS, the rate of ventricular therapy should be graduai and progressive, starting with
tachycardia episodes was lower in a substudy, in which low doses. The optimum rate of dose increase and the
vagally dependent variability in heart rate was higher in maximum dose need to be more accurately defined. Use
the bisoprolol group than in the placebo group, •, an1 15
of the maximum tolerated dose seems acceptable; at
effect that has been linked ta improved long-term present, recommendations on rates of dose increase can
prognosis after myocardial infarction and in heart be based only on those adopted in clinical trials.
failure. 6' This finding and the significantly lower rate of
1 17
Patients with severe class IV heart failure, those with
admission to hospital for ventricular tachycardia or heart failure after acute myocardial infarction, and those
fibrillation in the CIBIS-11 bisoprolol group supports the with symptomless left-ventricular dysfunction are being
drug's potential antiarrhythmic effect. studied in the continuing clinical trials COPERNICUS,
Improvement or preservation of left-ventricular CAPRICORN, and CARMEN with carvedilol.
function could also improve long-term prognosis. In our trial the mean age of patients was 61 years, at
Increased left-ventricular ejection fraction has been seen least a decade younger than that of patients seen in
with other B-blockers,• which may be dose-dependent. • 1
clinical practice. In most clinical trials in heart failure,
0
(.9
We did not measure left-ventricular function sequentially, there is, therefore, inadequate information about the
LJ.J
a: but in CIBIS prognostic improvement was significantly effects of treatment in aider patients and more data in the
(.9
linked to increased left-ventricular ejection fraction. 19 very old are urgently needed.
LJ.J
a: A meta-analysis of randomised trials showed a trend C/8/S Il investigators
CO
0 towards better survival with non-selective compounds.4 A us tria-Klein \î/ Brunhuber, R Hofmann, P Kühn, H-J Nesser, J Slany,
z This finding was mainly related ta the strikingly lower \Xr Weihs, C Wiedermann, H \Xtimmer. Belgium----W van �Ueghem,
a:
LJ.J mortality rate seen in the US trials of carvediloJ;• J Boland, J M Chaudron, L Jordaens, J P Melchior. Czech Republic-
> M Aschermann, J Brurhansl, M Hradec, F Kôlbel, B Semr3d. Denmark­
en differences in design, especially the presence of a run-in T Haghfelt, J Fischer-Hansen, C O Goetzsche, P Hildebrandt, E Kassis,
z
0 phase in the carvedilol trials, makes comparison of results V Rasmussen, J Rokkedal, A Thomassen. Finland-K. Groundstroem,
fC=
0
LJ.J
@
12 THE LANCET • Vol 353 • Januarv 2, 1999

196
ARTICLE 2 - LCA 2010

ARTICLES

P Uusimaa. France--J YLe Heuzey, M C Aumont, J F Aupetit, N Baille, Waagstein F, Hjalmarson A,Varnauskas E, Wallentin I. Effect of
P Baudouy, A Belin, A Bonneau, G Bonnetie, J P Bousser, B Citron, chronic beta-adrenergic recepror blockade in congestive
P Darv, E Decoulx, P De Groote, T Denolle, F Dievart, P Duriez, cardiomyopathy. Br HeartJ 1975; 37: 1022-36.
J C Ei�her, G Enjuto, 1\il Ferrièœ, E Fournier, M Garandeau, J Gauthier, 2 The Metoprolol in Dilated Cardiomyopathy (MDC) Trial Study
M Genest, A Gerbe, J P Godenir, B Guillot, J P Guillot, P Guillot, Group. 3-ycar follow-up of patients randomiscd in the Mctoprolol in
P Heno, C d'Ivernois, M Jean, S Kacet, R Kalle, J\,1 Komajda, A Lacroix, Dilated Cardiomyopathy Trial. Lancet 1998; 351: 1180-81.
R Lallemand, H Lardoux, .1\1. Marquet, M Martin, 0 Martin, D Mëry, 3 Australia and New Zealand Heart Failure Research Collaborative
R Mossaz, P Mothes, T Olive , M Ostorcro, F Paganclli, E Page, Group. Randomised, placebo-controlled trial of carvedilol in patients
C Pauly-Laubry, J Puel, J F Rousseau, J J Roux, A Schenowitz, with congestive heart failure due to ischaemic heart disease. Lancet
K Sourdais, F Tremel, AVerdun, S Witchiz, J E Wolf. Germany­ 1997; 349: 375-80.
\1 Hambach, I Assmann, T Beyer, K O Bischoff, H Darius, G Ertl., 4 Doughty RN, Rodgers A, Sharpe N, MacMahon S. Effects of
E Fleck, K Fërster, F Freytag, U Gleichmann, R Haasis, R Henflge, beta-blocker therapy on mortality in patients with heart failure: a
D Hey, P Hesse, T Héifs, M Keck, H Klein, E T Kromer, J Krüls-Münch, systcmatic ovcrvicw of randomiscd controllcd trials. Eur Heart .11997;
B Lüderitz, B Maisch,V Mitrovic, S Neubauer, K J Osterziel, H Simon, 8: 560-65.
S G Spitzer, R Stéihring, G Taubcrt, W Tcichmann, K Thciscn,
5 Heidenrich PA, Lee TT, Massie BM. Effect of beta-blockade on
W Wende, H Wieser, R Zotz. Hungary-1 Preda, M Csanady,
mortaliry in patients with heart failure: a meta-analysis ofrandomized
L Cserhalmi, l Edes,T Gesztesi, P Karp:iti, K Simon, J Tarj:in.
clinical trials. J Am Coll Cardiol 1997; 30: 27-34.
l taly-R Fogari, R Trarnarin, N Galie, P Giani, U Milanese, S Scalvini,
D Scrutinio, L A Sechi, F Tettamanti, F DeVito. lreland--P Crean, 6 Lechat P, Packer M, Chalon S, Cucherat 1V1, Arab T, Boissel JP.
H McCann, D Mulcahy, D Sugrue. Netherlands- Beta-blockers in heart failure: meta-analysis of randomized trials.
Circulation 1998, 98: 1184-91.
D C A van Hoogenhuyze, P H van der Burgh, R Ciampricotti,
J M van Dantzig, F R DenHartog, J A Henneman, H A M van Kesteren, 7 Haeusler G, Schliep HJ, Schelling P, et al. High [31 selectivity and
J A Kragten, K L Liem, A Limburg, M R van derLinde, G C MLinssen, favourable pharmacokinetics as the outstanding properties of
H Pasteuning, H J A M Penn, P Van Rossum, H J Schaafsma, bisoprolol. J Cardiovasc Pharmacol 1986; 8 (suppl Il): S2-15.
A Schelling, R Sloos, J C L Wesdorp. Po/and----J Korewicki, 8 ClBlS investigators and committees. A randomized trial of j3-blockade
P Achremczyk, E Czestockowska, ."11. Dowgird, A Dyduszynski, J Gérski, in heart failure: the Cardiac Insufficiency Bisoprolol Study (CIBIS).
K Ilmurzynska, K Janicki, Z Kornacewicz-Jach, T Kraska, Circulation 1994; 90: l 765-73.
M Krzeminska-Pakula, J Kuch, E Nartowicz, T Perelenz, W Piwowarska, 9 The CIBIS-11 Scientific Committee. Design of the Cardiac
I Rawczynska-Englert, W Ruzyllo, G Swiatecka, M Tendera, Insufficiency Bisoprolol Study II (CIBIS II). Fund Clin Pharmacol
M Wierzchowiecki, J Wodniecki, D Wojci�chowoski, K Wrabt!c, 1997; 11: 38-42.
H"\X7ysocki. PortugaJ-R Seabra Gomes, M F:itima Ceia, N Lousada, 10 Peto R, Pike MC, Armitage P, et al. Design and analysis of
J M Martins Campos, L A Providência, AL Zamith Cerveira de 1\1.oura. randomised clinicat trials requiring prolonged observation of
Russi�V J Marejev, D M Aronov, G P Arutjunov, B J Bart, each patient, I: introduction and design. Br J Cancer 1976; 34:
S S Bascchikin, J N Bclcnkov, J B Bcloussov, 0 A Bokcria, 585-612.
R A Charchog1jan,V Doschytsin, T A Fedorova, M G G\ezer, 11 Garg R, YusufS, for the Collaborative Group on ACE lnhibitor
A Gorbachenkov,VA Gorshkov, AL Gospodarenko,V T lvashkin, Trials. Overview of randomized trials of angiotensin-converting
A J lvleva, A A Kyrichenko, A ALavrov, L BLazebnik, A Marynov, enzyme inhibitors on mortality and morbidity in patients with heart
V P Mazaev, N R Polejev, A Shpektor, B A Sidorenko, K E Sobolev, failurc. JAMA 1995; 273: 1450-56.
A K Starodoubtsev, G I Storozhakhov, A L Syrkin,V S Zodionchenko, 12 Gottlieb SS, McCarter RJ,Vogel RA. Effect of beta-blockade on
TV Zvereva. 5/ovakia--J Murin, G Kaliskà, R Rybar. Spain-VValle, mortality among high risk and low risk patients after myocardial
M Artaza, P Conthc, J M Cruz, M Garcia-Moll, J L Lopcz-Scndon, infarction. N Engl J Med 1998; 339: 489-97.
A Martinez, F Monzon, M Ribas, E Ruig, I Ruldan Sweden-C Hüglund, 13 Packer M, Bristow MR, Cohn J, et al for the US Carvedilol Heart
S Ekdahl, L Hjelmaeus, K Lindberg, P Léifdahl, G Ulvenstam, Failure Study Group. T'he e.tlect of carvedilol on morbidity and
L Warselius. Switzerland-F Follath, W Anghern, P Dubach, P Erne, mortality in patients with chronic heart failure. 1V flngl J Med 1996;
A Gallino, T Moccetti. UK-A Bridges, J Adgey, G Ambepitiya, N Boon, 334: 1349-55.
R M Boyle, A J Cowley, T Cripps, M K Davies, F Dunn, J Findlay,
14 Pousset F, Copie X, Lechat P, et al. Effects of bisoprolol on heart rate
P Forsey, T Fyfe, B Gau.Id, T W Greenwood, P Hubner, S Khan,
variability in heart failure. Am J Cardiol 1996; 77: 612-17.
PLewis, A Mackay, M Maltz, J McArthur, A Mcl..eod, D Mcl..eod,
M Metcalfe, M Millar-Craig, P Mills, J K Nelson, D Nichulls, 15 Copie X, Pousset F, Lechat P, Jai1lon P, Guize L, Le Heuzey JY, and
G D Oakley, D L H Patterson, J E F Pohl, S Ray, B Silke, P R Wilkinson. the Cardiac lnsufficiency Bisoprolol Study lnvestigators. Efl"ects of
Ukraine--AV Jmouro. beta-blockade with bisoprolol on heart rate variability in advanced
heart failure: analysis of scatterplots of RR intervals at selected heart
C/815 11 committee members rates. Am Heart J 1996; 132: 369-75.
Writing Committee--H J Dargie, P Lechat 16 Leiger RE, Miller JP, Bigger JT, Moss AJ and the multicenter
S cientific committee--H J Dargie (Chairman, UK), E Erdmann post-infarction research group. Decreased heart rate variability and
(Germany), F Follath (Switzerland), C Héiglund (Sweden), P Lechat its association with increased mortality after myocardial infarction.
(France), J L Lopez Sendon (Spain),V Mareyev (Russia), W J Remme Am J Cardiol 198 7; 59: 256-62.
(Ncthcrlands), Z Sadowski (Poland), R J Scabra-Gomcs (Portugal), l7 Nolan J, Batin P, Andrews R, et al. Prospective study of heart rate
F Zannad (France), M Wehrlen-Grandjean (France). variability and mortality in chronic heart failure:results of the United
Critica/ event committee--C Funck-Brentano (Chairman, France), Kingdom Heart Failure Evaluation and Assessment Trial (UK-Heart).
S Hansen (Sweden), S Hohnloser (Germany), EVanoli (ltaly). Circulation 1998; 98: 1510-16.
Advisory and safety committee--P Jaillon (Chairman, France),
18 Bristow M, Gilbert EM, Abraham WT, et al for the MOCHA
G De Baker (Belgium), U Dahlstr'm (SWeden), C Hill (France). investigators. Carvedilol produces dose-related improvements in left
lndependent statistica/ centre--A Leizorovicz, F Bugnard, C Rolland
ventricular function and survival in subjects with chronic heart failure.
(Lyon, France). Circulation 1996; 4: 2807-16.
Merck KGaA-H Wiemann, PVerkenne.
19 Lechat P, Escolano S, Golmard JL, et al on behalf of CIBIS
Coordinating centre--T Arab, N Cussac,V Dussous, S Haise,
investigators. Prognostic value ofbisoprolol-induced hemodynamic
C Funck-Brentano (France).
effects in heart failure during the Cardiac Insufficiency Bisoprolol
Acknowledgment Study. Circulatùm 1997; 96: 2197-205.
This study was spunsured by E Merck, Darmstadt. 20 The BEST Steering Committee. Design of the Beta-blocker
Evaluation Survival Trial. Am J Cardiol 1995;75: 1220-23.
References 21 YusufS, Peto R, Lewis J, Collins R, Sleight P. Beta-blockade during

THE l.ANCET •Vol 353 • January 2, 1999 13

197
iKB LECTURE CRITIQUE D'ARTICLE

QCM
1
1Quel est le type d'étude?
A - Essai clinique contrôlé randomisé.
B - Etude monocentrique.
C - Etude multicentrique.
D - Etude prospective.

I
E - Etude en double aveuqle.

Q M
� Quel est le schéma expérimental choisi par les auteurs dans cette étude?
A- Plan factoriel.
B- Plan croisé.
C- Plan en groupes parallèles.
D- Plan en cross-over.

I
E- Cohorte de patients suivie longitudinalement.

QCM Pourquoi avoir décidé d'exclure les patients avec un bloc atrio-ventriculaire de
3 degré supérieur au premier degré sans stimulateur permanent?
A - Pour simplifier le recrutement des patients éligibles à l'étude.
B - Pour homogénéiser la population d'étude.
C - Car ces patients présentaient une contre-indication à un traitement par bêta-bloquant.
D - Pour respecter la clause d'ignorance.
E - Pour respecter la clause d'ambivalence.

QCM
4
1Quelle(s) est(sont) la(les) proposition(s) vraie(s) concernant la randomisation dans
cette étude?
A - C'est une randomisation centralisée.
B - La génération de la liste de randomisation se fait selon un processus validé et fiable.
C - On peut parler de randomisation simple.
D - Lors de la randomisation, il y a stratification sur le centre.
E - La randomisation est gérée de façon indépendante des centres.

Dans la partie Méthode, les auteurs mentionnent la non-réalisation d'une période


QCM
d'observation préalable, appelée « run-in ». Quelle(s) est(sont) la(les)
5
proposition(s) vraie(s) à son sujet?
A- Elle doit être obligatoirement réalisée dans les essais contrôlés randomisés, selon le CONSORT.
B- Cette période précède l'inclusion des patients dans l'étude.
C- Durant cette période, tous les patients prennent un placebo.
D- Cette période permet de repérer les patients « placebo-répondeurs ».
E- Cette période peut permettre de sélectionner les patients les mieux observants.

QCM
6
1Quel est le critère de jugement principal?
A - La mortalité toute cause.
B - La mortalité cardiovasculaire.
0
(.9
C - Les admissions à l'hôpital pour toutes causes.
LJ.J
a:
(.9
D - La mortalité cardiovasculaire associée aux hospitalisations pour raisons cardiovasculaires.
LJ.J E - L'arrêt prématuré et permanent du traitement.
a:
CO
0

z
a:
LJ.J
>

@
en
z
0
fC=
0
LJ.J

198
ARTICLE 2 - LCA 2010

QCM J Quelle(s) est(sont) la(les) caractéristique(s) de ce critère de jugement principal?


7
A - C'est un critère composite.
B - C'est un critère objectif.
C - C'est un critère dit« dur».
D - C'est un critère intermédiaire.
E - C'est un critère qui peut être considéré comme fréquent dans la population d'étude.

QCM
8
J Sur quelle(s) base(s) les auteurs peuvent-ils affirmer que les caractéristiques
initiales des patients des deux groupes à l'étude sont similaires?
A - Ils l'ont affirmé à tort car il n'y a pas de résultats de test statistique présentés dans le tableau 1.
B - Cette affirmation repose sur une constatation « à vue d'œil» que les deux populations d'étude
sont similaires.
C - Il y a eu appariement des patients des deux groupes sur chacune des caractéristiques
présentées dans le tableau 1.
D - La comparabilité initiale des groupes à l'étude a été assurée par la randomisation.
E - Les caractéristiques initiales des patients ne peuvent être identiques car il s'agit d'une étude
multicentrique.

QCM 1 Quelle(s) est(sont) la(les) proposition(s) vraie(s) concernant l'arrêt prématuré de


9 cette étude?
A - Il était licite car prévu a priori dans le protocole de l'étude.
B - Il s'agit ici d'un arrêt prématuré pour futilité.
C - Il n'aurait pas été éthique de poursuivre l'étude malgré les résultats de l'analyse intermédiaire.
D - A cause de cet arrêt prématuré, il n'y a pas de conclusion possible sur le critère de jugemen
principal.
E - L'étude a pu être arrêtée prématurément car le résultat de l'analyse intermédiaire sur le critère de
jugement principal était significatif.

QCM
10
JSur quel(s) critère(s) le bisoprolol a-t-il un effet significatif?
A - La mortalité toutes causes confondues.
B - Toutes causes d'hospitalisation
C - La mortalité cardio-vasculaire.
D - La mortalité cardio-vasculaire associée aux hospitalisations pour causes cardio-vasculaire.
E - L'arrêt prématuré du traitement.

QCM
11
J Quelle(s) est(sont) la(les) proposition(s) vraie(s) à propos de la figure 3 ?
A - Il s'agit d'un diagramme de Forrest.
B - L'intervalle de confiance du risque pour les patients avec cardiomyopathie dilatée es
particulièrement large, du fait d'un faible nombre de patients dans ce sous-groupe.
C - L'effet du bisoprolol sur la mortalité est retrouvé quelque soit la gravité de l'insuffisance
cardiaque.
D - Dans le groupe NYHA IV, l'effet du bisoprolol (risque relatif) n'est pas statistiquement significati
car son intervalle de confiance contient la valeur 1.
E - Il existe des sous-groupes pour lesquels la mortalité diffère significativement entre le groupe
placebo et le groupe bisoprolol.

199
iKB LECTURE CRITIQUE D'ARTICLE

QCM
12
1Concernant la sécurité d'emploi du bisoprolol, que pouvez-vous dire ?
A - Les patients traités par bisoprolol présentaient significativement plus de morts subites que ceu)<
traités par placebo.
B - Les défaillances cardiaques étaient plus fréquentes chez les patients traités par bisoprolol.
C - Les décès de cause inconnue étaient significativement plus fréquents chez les patients traités
par bisoprolol.
D - Les hospitalisations pour aggravation de l'insuffisance cardiaque étaient significativemen1
réduites chez les patients traités par bisoprolol.
E - Les hospitalisations pour bradycardie étaient significativement augmentées chez les patients
traités par bisoprolol.

QCM 1 Quelle(s) peu(ven)t être la(les) implication(s) clinique(s) de cette étude ?


13
A - Ces résultats pourront être généralisés à l'ensemble des patients insuffisants cardiaques.
B - Le bisoprolol diminue la mortalité des patients insuffisants cardiaques NYHA Ill ou IV quel que
soit leur âge.
C - Le bisoprolol réduit la mortalité des patients insuffisants cardiaques âgés de moins de 80 ans.
D - Cette étude ne permet pas de conclure sur l'effet du bisoprolol chez des patients insuffisants
cardiaques des suites d'une cardiomyopathie dilatée.
E - On touche ici à la validité interne de l'étude.

Dans la discussion, les auteurs évoquent une problématique relative au classement


QCM de certaines causes de mortalité, avec la nécessité de classer certains décès
14 comme ayant une « cause inconnue ». Quel(s) effet(s) potentiel(s) cela a-t-il eu sur le
critère de jugement principal ?
A- Surestimation du risque de mortalité dans le groupe bisoprolol.
B- Sous-estimation du risque de mortalité dans le groupe bisoprolol.
C- Dilution du risque de mortalité vers 1 concernant le critère de jugement principal.
D- Biais de classement.
E- Aucun effet sur le critère de juqement principal.

QCM
15
1
Quel est le niveau de preuve de cette étude ?
A - Niveau de preuve 1.
B - Niveau de preuve 2.
C - Niveau de preuve 3.
D - Niveau de preuve 4.
E - Niveau de preuve 5.

0
(.9
LJ.J
a:
(.9

LJ.J
a:
CO
0

z
a:
LJ.J
>

@
en
z
0
fC=
0
LJ.J

200
ARTICLE 2 - LCA 2010

Grille de correction QCM


(Questions à choix multiples)

A- V
....
::!!:
(.) C-
B-
V .
F Réponse: ACDE
Il s'agit d'un essai clinique contrôlé randomisé, en double aveugle, contre
....
0 D- V placebo, multicentrique (plusieurs centres en Europe).
E- V

.
A- F Réponse: C

.
N B- F Question simple !
::!!: C- V Il s'agit ici d'une étude avec un plan en groupes parallèles : deux groupes de
(.)
0 D- F patients sont constitués, chacun avec un traitement différent, et ils sont suivis au
E- F cours du temps, « en parallèle».
A-
B- F .
F Réponse: CE
La population source est définie par les critères d'inclusion, de non-inclusion et

M
::!!:
C-
D-
V
F .d'exclusion. La population étudiée sera un échantillon de cette population source.
La clause d'ambivalence correspond au fait que tout patient inclus dans une
(.)
étude doit pouvoir être randomisé dans l'un ou l'autre groupe : cela implique
0 qu'il ne doive donc pas présenter de contre-indications à l'un ou l'autre des
E- V
.traitements.
La clause d'ambivalence est un préalable à la randomisation, qui elle va
permettre l'allocation du traitement au patient.
A-
B- V .
V Réponse: ABCE
Il existe deux méthodes validées pour générer une liste de randomisation :
"'" C- V génération de nombres au hasard par ordinateur ou utilisation de tables de
nombres au hasard. Toutes les autres méthodes sont perfectibles et ne sont pas
::!!: D- F
(.)
0
E- V
.validées.
Ici, la randomisation est centralisée (critère de qualité supplémentaire) et gérée de
façon indépendante du centre ; il n'y a par ailleurs pas de stratification sur le
centre (attention, risque d' « effet centre»).
A-
B- V .
F Réponse: BCDE
Il s'agit d'une phase de pré-inclusion durant laquelle tous les patients prennent un
Lt) C-
::!!: D-
(.)
V
V .traitement placebo.
Deux objectifs :
0 Repérer les patients qui répondent au placebo (cela permettra de les
E- V exclure secondairement)
Repérer et sélectionner les meilleurs observants.

.
A- V Réponse: A

.
ID B- F Critère primaire (= critère principal) = mortalité toute cause.
::!!: C- F Critères secondaires = admissions à l'hôpital pour toutes causes, la mortalité
(.)
0 D- F cardiovasculaire, mortalité cardiovasculaire associée aux hospitalisations pour
E- F raisons cardiovasculaires, l'arrêt prématuré et permanent du traitement.
A-
..... B- V .
F Réponse: BCE
Le critère de jugement principal dans cette étude peut être considéré comme un
::!!: C- V critère fiable, objectif, « dur», validé, fréquent dans la population d'étude (décès
0 D-
(.)

E-
F
V
.fréquent chez les patients atteints d'IC), cliniquement pertinent.
Il a été défini a priori, et il y a intervention d'un comité en aveugle et indépendant
pour analyser les évènements.
A-
.
F Réponse: BD
CO
::!!: B- V Il s'agit de l'analyse du tableau 1 qui présente les caractéristiques initiales des
C- F
.patients à l'étude.
(.)
0
D- V La comparaison des populations des deux groupes doit se faire « à vue d'œil»,

201
iKB LECTURE CRITIQUE D'ARTICLE

sans test statistique (risque d'inflation du risque alpha si répétition des tests

E- F . statistiques).
La randomisation permet d'assurer cette comparabilité initiale des patients, et elle
a été ici réalisés dans des conditions optimales (centralisée, méthode de
génération de la séquence validée, etc.).
A-
B-
V
F .
Réponse: ACE
L'analyse intermédiaire était prévue a priori et a été mentionnée par les auteurs
C-
D-
V
F . dans le protocole de l'étude.
Elle a montré des résultats statistiquement significatifs pour le critère de
a, jugement principal en faveur du groupe traitement par bêtabloquant, justifiant donc
::!!: son arrêt (arrêt pour efficacité). Les patients sous placebo ont donc pu recevoir le
(.)
0 traitement par bêtabloquant (dans le cas contraire, cela n'aurait pas été éthique de
E- V
. poursuivre cette étude).
Il existe d'autres raisons qui peuvent conduire à l'arrêt d'une étude : arrêt pour
futilité, arrêt pour toxicité. L'analyse intermédiaire permet également de vérifier le
taux d'inclusion dans l'étude et le taux d'écarts au protocole.
A- V
....
0 B- V .
Réponse: ABCD
::!!: C-
(.)
0 D-
V
V
.
Il s'agit de l'interprétation du tableau 2 .
On parle de significativité lorsque l'IC95% du RR (HR) ne contient pas la valeur 1
et que p < 0,05.
E- F
A-
........ B- V .
V Réponse: ABDE
Ce diagramme présente les résultats des analyses pour certains sous-groupes de
::!!: C-
(.) D-
0
F
V . la population d'étude.
Il permet d'identifier des sous-groupes de patients pour lesquels le traitement
serait plus efficace que pour d'autres. Cela constituera des pistes exploratoires
E- V pour les futures études (il ne faudra pas conclure sur ces analyses).
A- F
....
N B- F .
Réponse: DE
::!!: C-
(.)
0 D-
F
V
.
La majorité des informations sont présentées dans la tableau 2 .
D'autres sont mentionnées par les auteurs dans le corps de l'article, sans pour
autant apparaître dans un tableau de résultats.
E- V

....
M
A-
B- F .
F Réponse: D
Il s'agit ici de la validité externe de l'étude et à l'extrapolation des résultats à
::!!: C-
(.)
0 D-
F
V .
notre population d'intérêt (en temps que clinicien).
Les résultats ne pourront être extrapolés qu'à une population similaire à celle de
E- F l'étude (et ayant donc les mêmes critères cliniques et de pathologies associées).
A-
B- F .
F Réponse: E
Ce problème soulevé par les auteurs doit être pris en compte en ce qui concerne
"'"....
C-
::!!: D-
F
F .
les sous-groupes de mortalité, avec possible biais de classement.
Cependant, cela n'a aucun effet sur le critère de jugement principal car celui-ci
(.) correspond aux mortalités « toute cause ». Ainsi, un patient ayant présenté un
0 décès suspect sera classé dans « mortalité de cause inconnue» alors qu'il aurait
E- V pu être classé dans un autre sous-groupe plus précis, mais il apparaîtra toujours
comme ayant présenté le critère de jugement principal.
A- V
0

.
(.9
LJ.J
a: B- F Réponse: A
....
.
(.9 Lt)
LJ.J
C'est un essai clinique, contrôlé, randomisé de forte puissance.
a: ::!!: C- F L'étude a été correctement menée, il y a peu de perdus de vue et la validité interne
CO
0 (.)
0 est bonne.
z D- F
a:
LJ.J
>
en
z E- F
0
fC=
0
LJ.J
@

202
Chapitre
36

ARTICLE 3 - LCA 2011

The New England


Journal of Medicine

•---
© C o p y r ig h t , 1 997, by the Massachuse tts M e d i c a l S o c i e t y

VOLUME 336 FEBRUARY 6, 1997 NUMBER 6

THE DURATION OF ORAL ANTICOAGULANT THERAPY AFTER A SECOND


EPISODE OF VENOUS THROMBOEMBOLISM

SAM SCHULMAN, M.D., STAFFAN GRANOVIST, M.D., MARGARETA HOLMSTRÔM, M.D., ANDERS CARLSSON, M.D.,

0
PER LINDMARKER, M.D., PETER NICOL, M.D., SVEN-GUNNAR EKLUND, M.D., SUNE NORDLANDER, M.D.,
GERD LARFARS, M.D., BARBRO LEIJD, M.D., ÜLLE LINDER, M.D., ENNO LOOGNA, M.D.,
AND THE DURATION OF ANTICOAGULATION TRIAL STUDY GROUP*

ABSTRACT RAL anticoagulant therapy is routinely


Background A consensus has not been reached given to most patients who have had ep­
about the optimal duration of oral anticoagulant isodes ofvenous thromboembolism. Two
therapy after a second episode of venous thrombo­ recent multicenter trials have demonstrat­
embolism. ed that ifthe duration oftreatment after a first epi­
Methods ln a multicenter trial, we compared six sode of thromboembolism is extended to three to
months of oral anticoagulant therapy with anticoag­ six months, instead offour to six weeks, the rate of
ulant therapy continued indefinitely in patients who recurrence can be reduced, especially among pa­
had had a second episode of venous thromboembo­
tients with permanent risk factors such as throm­
lism. Of 227 patients enrolled, 111 were randomly
boembolism that was idiopathie in nature and venous
assigned to six months of anticoagulation and 116
were assigned to receive anticoagulant therapy in­ insufficiency. 1, The optimal duration of secondary
2

definitely; for both groups, the target international prophylaxis after a second episode ofvenous throm­
normalized ratio was 2.0 to 2.85. The initial episodes boembolism is unknown. In one study, patients
of deep-vein thrombosis (n = 193) and pulmonary were stratified according to whether the episode of
embolism (n = 34), as well as recurrent episodes, were venous thromboembolism was their first or second,
ail objectively confirmed. but the number of patients with second episodes
Results After four years of follow-up, there were 26 was small and no conclusions could be drawn. 3 In
recurrences of venous thromboembolism that ful­ the absence of data, it has been assumed that the
filled the diagnostic criteria, 23 in the group assigned risk of recurrence is greater after a second episode
to six months of therapy (20.7 percent) and 3 in the
than after a first. Sixty percent of Swedish hospitals
group assigned to continuing therapy (2.6 percent).
The relative risk of recurrence in the group assigned
recommend that patients with second episodes of
to six months of therapy, as compared with the group venous thromboembolism receive oral anticoagulant
assigned to therapy of indefinite du ration, was 8.0 (95
percent confidence interval, 2.5 to 25.9). There were
13 major hemorrhages, 3 in the six-month group (2.7
percent) and 10 in the indefinite-treatment group (8.6
percent). The relative risk of major hemorrhage in the
six-month group, as compared with the indefinite­ From the Departments of Internai Medicine at Karolinska Hospital,
Stockholm (S.S., l'L.), Huddinge Hospital, Huddinge (M.H.), Danderyd
treatment group, was 0.3 (95 percent confidence in­ Hospital, Danderyd (A.C.), Küping Hospital, Küping (P.N.), Südertilje
terval, 0.1 to 1.1 ). There was no difference in mortality Hospital, Südertilje (S.-G.E.), Vasted.s Central Hospital, Vasted.s (S.N.),
between the two groups. Südersjukhuset, Stockholm (G.L.), St. Goran Hospital, Stockholm (B.L.),
Conclusions Prophylactic oral anticoagulation that Ôrebro Regional Hospital, Ôrebro (O.L.), and Nacka Hospital, Stockholm
(E.L.); and the Department of Radiology, Ersta Hospital, Stockholm
was continued for an indefinite period after a second (S.G.) - ail in Sweden. Address reprint requests to Dr. Schulman at the
episode of venous thromboembolism was associat­ Department oflnternal Medicine, Karolinska Hospital, S-171 76 Stockholm,
ed with a much lower rate of recurrence during four Sweden.
years of follow-up than treatment for six months. Other authors were Hans Walter, M.D., Sabbatsberg Hospital, Stock­
holm; Stanka Viering, M.D., Norrtalje Hospital, Norrtilje; Martin Hjorth,
However, there was a trend toward a higher risk of M.D., Lidküping Hospital, Lidküping; and Jonas Boberg, M.D., Uppsala
major hemorrhage when anticoagulation was contin­ Academic Hospital, Uppsala.
ued indefinitely. (N Engl J Med 1997;336:393-8.) *The investigators and institutions participating in the Duration of An­
©1997, Massachusetts Medical Society. ticoagulation (DURAC II) Trial Study Group are listed in the Appendix.

Volume 336 Number 6 393

203
iKB LECTURE CRITIQUE D'ARTICLE

The New England Journal of Medicine

therapy for three to six months or even longer; some samples from patients who were less than 50 years old and those
with a family history of venons thromboembolism for measure­
centers recommend continuing therapy for more ment of antithrombin, protein C, and protein S, as previously de­
than two years.4 It has also been suggested that oral scribed.2
anticoagulation be continued indefinitely after re­ The patients were instructed to abstain from taking analgesic
current verrous thromboembolism. 5 agents containing aspirin and, if antiinflammatory treatment was
We undertook this trial to compare six months of required, to use only ibuprofen. Ali the patients were informed
about the symptoms ofdeep-vein thrombosis and pulmonary em­
oral anticoagulant therapy after a second occurrence bolism. They were told to report immediately to the emergency
of deep-vein thrombosis or pulmonary embolism room if any such symptoms occurred, and patients receiving oral
with the same treatment continued indefinitely. The anticoagulant therapy were also asked to report all hemorrhagic
end points were recurrent thromboembolism, major complications. Follow-up evaluations by one of the investigators
or by a specially trained nurse or physiotherapist were scheduled
hemorrhagic complications, and death during four for 1.5, 3, 6, 9, 12, 24, 36, and 48 months after randomization.
years of follow-up. At each visit, the patients were asked about new symptoms of
venons thromboembolism and, ifthey were still receiving an an­
METHODS ticoagulant drug, about possible hemorrhage. They were also re­
minded of the symptoms of deep-vein thrombosis and pulmonary
Study Design embolism and reminded to corne to the emergency room if such
The portion of the Duration ofAnticoagulation (DURAC) tri­ symptoms occurred and to report bleeding episodes.
al that we describe here was a randomized, open trial of anti­
coagulant therapy in patients with second episodes of verrous End Points
thromboembolism, in which 16 medical centers in central Swe­ The principal end points of the study were major hemorrhage,
den participated. It was conducted in parallel with a study of an­ recurrent venons thromboembolism, and death during the four­
ticoagulation after a first episode of verrous thromboembolism,2 year period. Major hemorrhages were defined as episodes ofbleed­
and followed the same protocol except for the duration of treat­ ing that resulted in death or required hospitalization, treatment
ment. Consecutive patients at least 15 years of age who had acute with blood products or vitamin K, or any combination of these
pulmonary embolism or deep-vein thrombosis in the leg, the iliac outcomes.
veins, or both were included. Recurrent thromboembolic events were objectively verified by
The diagnostic procedures have been described previously.2 the same methods as the index events. In addition, to be consid­
Briefly, objective diagnosis based on the results of venography in ered confirmed, a recurrent deep-vein thrombosis had to be char­
the case of deep-vein thrombosis and on the results of angiogra­ acterized by one of the following: thrombus in the contralateral
phy or the combination of chest radiography and ventilation-per­ leg; thrombus in another deep vein of the same leg as the original
fusion lung scanning in the case of pulmonary embolism was re­ thrombus; or thrombus in the same vein as the original event,
quired. The exclusion criteria were identical to those in the study with proximal extension of at least 5 cm if the upper limit of the
of patients with the first episode of verrous thromboembolism.2 original thrombus had been visualized or, if the upper limit of the
Oral informed consent was obtained from all patients before en­ original thrombus had not been determined, the presence of a
rollment. constant filling defect surrounded by contrast medium. Recurrent
Randomization, which was stratified only according to medical pulmonary embolism had to be confirmed by defects in previous­
center, took place at the end ofhospitalization and was performed ly perfused areas, unless another scan during the intervening
centrally. A computer-generated allocation schedule was used to period had shown resolution of the original defects. Fatal pul­
assign patients, in blocks of 10, to receive oral anticoagulant ther­ monary embolism had to be confirmed by autopsy. Initial and
apy either for six months or indefinitely; the duration of therapy subsequent venograms in patients with confirmed and uncon­
was counted from the date when stable prothrombin times within firmed recurrences of deep-vein thrombosis and lung scans in
the target range were achieved. patients with pulmonary embolism were reviewed by an inde­
pendent radiologist who was blinded to the patients' treatment
Anticoagulant Therapy assignments and the order of the examinations.
The initial treatment of the verrous thromboembolism consist­ Patients who were lost to follow-up were repeatedly cross­
ed of unfractionated or low-molecular-weight heparin adminis­ checked against data in the national Death Registry; no deaths have
tered intravenously or subcutaneously for at least five days (until been missed. Names were also checked against the registry of hos­
the prothrombin time had been within the target range for two pitalizations. The ascertainment of recurrences or major hemor­
days). If the treating physician thought it was indicated, throm­ rhages is almost certainly complete.
bolytic therapy could be given at the start of the study. Patients An independent safety committee reviewed the number of pa­
with deep-vein thrombosis were provided with a graduated-com­ tients included and the number of major end points twice during
pression stocking and instructed to wear it during the day for at the study. The committee was instructed to stop the study in case
least one year. of a significant difference between the treatment groups in the
Oral anticoagulation with warfarin sodium or dicumarol was rate of major hemorrhages.
usually begun at the same time as heparin therapy; the target cho­
Statistical Analysis
sen for the international normalized ratio (INR) was 2.0 to 2.85,
partly because a pilot study showed an excess of hemorrhagic For the calculation of the required number of patients in each
complications when the INR exceeded that range.6 The analysis treatment group, we assumed an annual rate of recurrence of
0 of prothrombin times was performed as previously described,2 1 percent among patients receiving oral anticoagulation and 5 per­
(.9
LJ.J with use of thromboplastin reagents with international sensitivity cent among those not receiving such treatment, or a cumulative in­
a: indexes of 0.86 to 1.00. When a stable prothrombin time within cidence after four years of 4 percent and 18 percent, respectively.
(.9
J,
LJ.J
the target range had been achieved, the test was repeated weekly With an alpha error of 5 percent and a beta error of 20 percent
a: for the first three weeks and then at least once every four weeks. (two-tailed), we needed 88 patients per group; since we estimat­
CO
0 Oral anticoagulant therapy was discontinued after six months, ed that 20 percent would be lost to follow-up, recruitment ofll0

z without tapering, in the patients randomly assigned to six months patients per group was required.
a:
LJ.J
of therapy, usually at the time of the six-month visit. All statistical analyses were performed on an intention-to-treat
> Before anticoagulant therapy was initiated, we obtained plasma basis, although some patients in both groups received oral anti-
en
z
0
fC=
0
LJ.J
394 F e b r u a r y 6, 1997
@

204
ARTICLE 3 - LCA 2011

DURATION OF ORAL ANTICOAGULANT THERAPY AFTER A SECOND EPISODE OF VENOUS THROMBOEMBOLISM

coagulation for shorter or longer periods than called for in the


protocol, and some were discovered after randomization to have TABLE 1. CHARACTERJSTICS OF THE PATIENTS AT ENROLLMENT,
cancer. For statistical analysis, we used Wilcoxon's rank-sum test AccORDING TO THE DuRATION OF ASSIGNED TREATMENT.
and the log-rank test ( the Lifetest procedure in the SAS software
system) and Fisher's exact test for two groups. Patients were lost
to follow-up for a total of 442 months (4 percent of the total); 6 Mo INDEFINITE

these person-months were accounted for in the log-rank test. CHARACTERISTIC (N=111} (N=116}
The group in this study that was assigned to six months of ther­ mean ±SD
apy has also been compared with a group of patients in another
portion of the DURAC trial who had a first episode of venous Age (yr) 65.0c:12.4 64.0c:12.5
thromboembolism and were treated with oral anticoagulant Years since previous thromboembolic event 8.lc:11.8 6.4c:7.2
drugs for six months.2 The latter group has also completed four
no.(%)
years of follow-up and was recruited during the same period.
The protocols for these two groups have in all respects been Male sex 70 (63) 68 (59)
identical. Ninety-five percent confidence intervals are shown for Type of index event
all results. The study was approved by the regional and local eth­ Pulmonary embolism 17 (15) 17 (15)
ics committees. Deep-vein thrombosis 94 (85) 99 (85)
Proximal thrombosis 68 (72) 65 (66)
RESULTS Site of previous deep-vein thrombosis *
Ipsilateral leg 54 (59) 45 (47)
Enrollment took place from April 12, 1988, Contralateral leg 37 (41) 50 (53)
Temporary risk factort 22 (20) 21 (18)
through April 18, 1991; during this period, 227 pa­ Subsequent cancer 8 (7) 8 (7)
tients were randomly assigned to treatment groups. Family history of venous thromboembolism 24 (22) 22 (19)
Two patients assigned to indefinite anticoagulation Thrombolytic therapy 4 (4) 4 (3)
Therapy with low-molecular-weight heparin 3 (3) 8 (7)
had suspected congenital protein C deficiency, but
because of the difficulties of confirming this diagno­ *Of the patients with deep-vein thrombosis as the index event, three in
sis during treatment they were not withdrawn from the six-month group and four in the indefinite-treatment group had pre­
viously had pulmonary embolism.
the study. No congenital protein S or antithrombin
tTemporary risk factors were surgery, trauma, temporary immobiliza­
deficiency was detected. tion, travel, the receipt of estrogen, infection, Baker's cyst, and pregnancy;
According to the logbooks, which were available permanent risk factors were idiopathie venous thromboembolism and
venous insufficiency.
from 12 of the 16 medical centers, corresponding
to 84 percent of all patients (191 of 227), 63 per­
cent of patients evaluated were enrolled (191 of
301). The patients from the centers with missing
logbooks were equally divided bet ween the t wo are shown in Table 2. There was no statistically sig­
treatment groups. Pive eligible patients were not en­ nificant difference in mortality between the two treat­
rolled because the investigators did not have time to ment groups. No cases of fatal pulmonary embolism
enroll them. could be confirmed, although it was suspected in a
Of the 227 patients recruited for the study, 111 patient in the six-month group who died suddenly
were randomly assigned to six months of treatment at 27 months.
and 116 to indefinite treatment. The treatment There was a trend toward more major hemorrhag­
groups were sirnilar at entry (Table 1). In the six­ es in the group assigned to indefinite anticoagula­
month group, 10 patients received treatment for a tion. In the six-month group, only one of the three
longer period than intended (1 to 42 months long­ major hemorrhages occurred during anticoagulant
er); as a result, the mean duration of anticoagulation therapy ( an episode of vaginal bleeding, triggered by
was actually 7.7 months. In the group assigned to in­ an occult cancer). The remaining two episodes, bath
definite treatment, 26 patients had shorter periods of which were cerebral hemorrhages, occurred 14.5
of treatment (1 to 43 months shorter), resulting in and 18 months after the discontinuation of therapy;
a mean duration of treatment of 42.7 months dur­ one was fatal. In the group receiving anticoagulation
ing the 4 years of follow-up. The main cause for for an indefinite period, there were a fatal subarach­
these deviations was a refusa! by the patient to ad­ noid hemorrhage, a case of fatal hemorrhagic pan­
here to the protocol. The percentages of patients creatitis, an episode of severe epistaxis requiring hos­
who complied with the instructions for the use of pitalization, three gastrointestinal hemorrhages (two
compression stockings were 95 percent in the six­ of which required transfusions), two episodes of
month group and 94 percent in the indefinite-treat­ hematuria requiring hospitalization ( one of which
ment group at 3 months; 82 percent and 77 per­ occurred after cystoscopy), a post-traumatic sub­
cent, respectively, at 12 months; 55 percent and 43 cutaneous hematoma requiring hospitalization, and
percent at 24 months; and 38 percent and 37 per­ an episode of intraabdominal bleeding treated with
cent at 48 months ( there were no significant differ­ transfusions. In five of the patients with hemorrhag­
ences in these rates between the groups). ic complications, the intensity of anticoagulation
During the four years of follow-up, 26 patients was greater than the target range at the time of ad­
died and 14 dropped out. The principal end points mission (INR, 3.7 to 6.7). None of the patients with

Vol u m e 336 Number 6 395

205
iKB LECTURE CRITIQUE D'ARTICLE

The New England Journal of Medicine

hemorrhage received vitamin K alone without hos­ tributed over the three and a half years after the dis­
pitalization. continuation of anticoagulation. In the group as­
The difference in the rate of recurrent verrous signed to indefinite anticoagulation, there were only
thromboembolic events between the six-month group three recurrent thromboembolic events (at months
(20.7 percent; 95 percent confidence interval, 13.1 to 26, 29, and 42), all of which occurred 1 to 10
28.3 percent) and the group receiving therapy indef­ months after the premature discontinuation of anti­
initely (2.6 percent; 95 percent confidence interval, coagulant therapy. There was thus no recurrence
1.1 to 4.1 percent) was significant (P<0.001) after during anticoagulant therapy in any group. One of
four years of follow-up. the three events was fatal: a mesenteric-vein throm­
The cumulative probability of a recurrent event is bosis, verified by laparotomy, in a patient with dia­
shown in Figure 1. In the six-month group there was betes mellitus and cirrhosis of the liver, in whom the
a progressive accumulation of recurrent events, dis- anticoagulant therapy was discontinued prematurely
after 28 months, 1 month before the event occurred.
The remaining recurrences consisted of eight cases
of pulmonary embolism and eight cases of deep-vein
thrombosis in the same leg as the index event and
TABLE 2. FREQUENCY OF PRINCIPAL END POINTS AFTER FOUR nine in the contralateral leg. None of the recurrenc­
YEARS, AccORDING TO THE DURATION OF Ass!GNED TREATMENT. es occurred in a high-risk situation ( e.g., after sur­
gery or while the patient was immobilized).
6 Mo INDEFINITE RELATIVE RISK Three of the recurrences (all in the six-month
END POINT (N=111) (N=116) (95% Cl)* P VALUE
group) were detected at a follow-up visit and the re­
no. 1%1 mainder when the patients came to the emergency
room because they had new symptoms. In six pa­
Major hemorrhage 3 (2.7)t 10 (8.6) 0.3 (0.1-1.1) 0.084
tients in the six-month group and two in the group
Recurrence 23 (20.7) 3 (2.6):j: 8.0 (2.5-25.9) <0.001
In hospitals with 21 (22.1) 3 (3.1) 7.1 (2.2-22.9) <0.001 assigned to therapy of indefinite duration who came
logbooks§ to the emergency room because of new symptoms,
Death 16 (14.4) 10 (8.6) 1.7 (0.8-3.5) 0.21 venograms or lung scans did not demonstrate a re­
*Relative risks are expressed as the ratio of the number of patients with
currence. Four additional patients (all in the six­
the specified end point to the total number of patients in the six-mon th month group) were hospitalized because of new
group, divided by the corresponding ratio in the indefinite-treatment symptoms and filling defects on the venogram (two
group. CI denotes confidence interval.
patients) or perfusion defects on the lung scan (two
tTwo of the hemorrhages occurred after the discontinuation of oral an­
ticoagulation. patients). On subsequent review, these abnormali­
:t:All recurrences in this group occurred after the premature discontinu­ ties did not meet the criteria for a recurrence, how­
ation of anticoagulation. ever, and they are not included in the statistical anal­
§There were 95 patients in the six-month group and 96 in the indefinite­ ysis. Sixty-two percent of the prothrombin times
treatment group at these 12 hospitals.
were within the target range for oral anticoagulant
therapy (INR, 2.0 to 2.85).
The group assigned to six months of therapy in
this study was also compared with a group of pa­
30 tients treated for the same length of time and ac­
.t= cording to the same protocol who had had only one
=-=o
..0 à<
co� -
episode of venous thromboembolism at the time of
..0 enrollment. The difference after three and four years
20 . . ........�·······/"" ...---•
... .---·· . .
Q.l
0 u
.... C of follow-up did not reach statistical significance, ei­
a.. ..,./···i=;;x-month group
Q.l
....
Q.l
.... ... ...../ ther by the chi-square test (P = 0.2 for both time
r
·.;:::;
::i
u l,.. points) or by the log-rank test (P = 0.2), which gives
CO 10
"3 a:
Q.l
,...,.✓ more weight to late events.
E 'ô .•... .// The patients with recurrences did not differ signif­
::i
u icantly from the rest with respect to age, sex, wheth­
6 12 18 24 30 36 42 48 er the index event was a pulmonar y embolism or
0
deep-vein thrombosis, whether the index thrombus
(.9
LJ.J
Months was proximal or distal, whether the factor triggering
a:
(.9
Figure 1. Cumulative Probability of Recurrent Venous Throm­
the index thrombus was temporary or permanent,
J,
LJ.J
a: boembolism in Patients with a Second Episode, According to the length of time between the first thromboembol­
CO
0 the Duration of Assigned Anticoagulant Therapy. ic event and the index episode, and the presence or

z absence of a family history of verrous thromboem­
a:
LJ.J bolism. The numbers in these subgroups were too
>
en
z
small, however, for reliable analyses.
0
fC=
0
LJ.J
@ 396 · February 6, 1997

206
ARTICLE 3 - LCA 2011

DURATION OF ORAL ANTICOAGULANT THERAPY AFTER A SECOND EPISODE OF VENOUS THROMBOEMBOLISM

DISCUSSION Nonetheless, the occurrence of hemorrhages in


Because little is known about anticoagulant ther­ patients receiving anticoagulant therapy cannot be
apy in patients with second episodes of venous disregarded. Our results indicate that if 100 patients
thromboembolism, we studied such patients in a were treated indefinitely instead of for only six
separate trial. The demonstration of a difference or months, 0.43 episode of recurrent thromboembo­
equivalence in outcome between two groups of such lism would be averted per month, at a cost of 0.20
patients after random assignment to different, limit­ major hemorrhage per month (albeit not caused ex­
ed periods of anticoagulation - for example, six clusively by anticoagulant therapy). It would thus be
months as compared with one year - would require of value to investigate whether a reduction in the in­
many more patients than were included in this trial. tensity of anticoagulation - to a target INR of 1.5
Although long-term anticoagulation has been rec­ to 2.0 after, for example, one year - could eliminate
ommended after recurrent venous thromboembo­ the risk of bleeding while still offering the same pro­
lism,5 there is a justified fear that major hemorrhagic tective effect.
complications will result. With an intensity of anti­ Our results do not indicate which subgroups of
coagulation corresponding to an INR of 2.0 to 3.0, patients may have a special need for prolonged anti­
the incidence of major or fatal bleeding is 0.6 to 0.7 coagulation, partly because of the limited numbers
percent per month.1-7 With the target intensity used of patients in the study. It is possible that most pa­
in our trial (INR, 2.0 to 2.85), six major hemor­ tients who have second thromboembolic episodes
rhages occurred in patients who had had a first epi­ are at such a high risk for further recurrences that a
sode of venous thromboembolism during 3399 per­ division into subgroups would yield little informa­
son-months (incidence, 0.18 percent per month).2 tion. We were unable to demonstrate an increased
In the present study the actual total duration of an­ risk of recurrence after a second episode, as compared
ticoagulation during four years of follow-up was with the risk after a first episode, among patients
5561 person-months; there were 1 1 major hemor­ treated for six months according to identical proto­
rhages during treatment, for a monthly incidence of cols. This failure may reflect an insufficient number
0.20 percent. Any comparison with the results of of patients with second thromboembolic episodes,
previous studies must be made with great caution, or it may mean that no difference exists.
because of slight differences in the definitions of
major hemorrhage. When we took into account the Supported by grants from the Swedish Heart Lung Foundation, the
serious hemorrhages, which occurred even without Swedish Society of Medicine, the Karolinska Institute, Skandia, Trygg­
Hansa, Triolab, Nycomed, and Stago.
anticoagulation, the difference in the incidence of
major hemorrhages between the two study groups We are indebted to Professor Jack Hirsh of the Hamilton Civic Hos­
amounted only to a statistical trend. There is also a pitals Research Centre, McMaster University, far his constructive crit­
possibility of bias resulting from underestimation of icism of the study design, and to Professor Lean Polier and Dr. Jean
the incidence of hemorrhage in the six-month group, Thomson of the United Kingdom Reference Laboratory far Anticoag­
ulant Reagents and Control and Dr. A.M.H.P van den Besselaar of
since these patients were not actively questioned the Stichting Referentie-Instituut Laboratorium Onderzoek Anti­
about hemorrhages after the discontinuation of an­ stollingscontrole for their assistance with quality control.
ticoagulant therapy.
The risk of recurrent thromboembolism was, on APPENDIX
the other hand, significantly reduced when the oral The DURAC II Trial Study Group consisted of the following
anticoagulant therapy was continued indefinitely. We investigators: Danderyd Hospital, Danderyd - A. Carlsson,
C. Gustafsson, and A. Grëmdahl; Huddinge Hospital, Huddinge
tried to minimize the risk of bias due to the unblind­
- A.-S. Rhedin, E. Tornebohm, M. Holmstrom, and D. Lock­
ed study design by having the venograms and lung ner; Karolinska Hospital, Stockholm - S. Schulman, P Lindmark­
scans reviewed by an independent, blinded radiolo­ er, and H. Johnsson; Kiipi ng Hospital, Kiiping - P Nicol, J. Ko­
gist. Furthermore, ail but three of the recurrences bosko, B. Malmros, N. Arcini, and J. Saaw; Nacka Hospital,
were detected by physicians who were not involved in Stockholm - E. Loogna and R. Stig; Norrtalje Hospital, Norrtalje
- S. Viering; Nykiiping Hospital, Nykiiping - B. Ljungberg,
the study, and the number of negative examinations S. Wilhelmsson, and A. Ohlsson; Sabbatsberg Hospital, Stockholm
of possible recurrences was small in bath groups, in­ - H. Walter, K. Malmqvist, and F. Al-Khalili; St. Goran Hospital,
dicating that there was probably no tendency to over­ Stockholm - B. Leijd and A. Petrescu; Siidersjukhuset, Stockholm
diagnose recurrences in the six-month group. Except - J. Brohult, G. Larfars, and J. Hulting; Siidertalje Hospital,
Siidertalje - S.-G. Eklund, E. Svensson, and L. Dahlin; Uppsala
for the effects of any remaining bias, the intensity of
Academic Hospital, Uppsala - J. Boberg; Vasteras Central Hospi­
anticoagulation we used (target INR, 2.0 to 2.85) tal, Vasteras -::- S. Nordlander and B. Marjanovics; Orebro Region­
proved effective, since no patient actually receiving al Hospital, Orebro - O. Linder; Linkiiping Regional Hospital,
anticoagulant therapy had a confirmed recurrence. Linkiiping - K.-A. Jonsson and C. Malm; Lidkiiping Hospital,
Our results therefore suggest that long-term second­ Lidkiiping - M. Hjorth and A. Lindgren: Safety Committee -
B. Fagrell, Karolinska Hospital, and M. Kallner, Lowenstromska
ary prophylaxis is effective in patients with recurrent Hospital; Radiologie Assessment - S. Granqvist, Ersta Hospital;
venous thromboembolism and that it does not entail Steering Committee - J. Boberg, J. Brohult, S.-G. Eklund,
a high risk of hemorrhagic complications. B. Fagrell, H. Johnsson, B. Ljungberg, D. Lockner, P Nicol,

Volume 336 Number 6 397

207
iKB LECTURE CRITIQUE D'ARTICLE

The New England Journal of Medicine

S. Schulman (chair and coordinator), S. Wilhelmsson, and coagulation after deep vein thrombosis: a randomized study. Acta Med
B. Wadman, Orebro Regional Hospital; Statistical Analysis - Scand 1985;217:547-52.
M. Snyder, Tadiran Information Systems, Givat Shmuel, Israel. 4. Johansson J, Johnsson H, Wilhelmsson S. Diagnos och behandling
av vends tromboembolism vid svenska internmedicinska kliniker - en
oversikt. Lakartidningen 1987;84:22-5.
REFERENCES 5. Hyers TM, Hull RD, Weg JG. Antithrombotic therapy for verrous
thromboembolic disease. Chest 1993;102:Suppl:408S-425S. [Erratum,
1. Research Committee of the British Thoracic Society. Optimum dura­ Chest 1993;103:1636.]
tion of anticoagulation for deep-vein thrombosis and pulmonary embo­ 6. Schulman S, Stigendal L, Jansson J-H, Brohult J. Haemorrhagic and
lism. Lancet 1992;340:873-6. thromboembolic complications versus intensity of treatment of venous throm­
2. Schulman S, Rhedin A -S, Lindmarker P, et al. A comparison of six weeks boembolism with oral anticoagulants. Acta Med Scand 1988;224:425-30.
with six months of oral anticoagulant therapy after a first episode of venous 7. Hull RD, Raskob GE, Rosenbloom D, et al. Heparin for 5 days as com­
thromboembolism. N Engl J Med 1995;332:1661-5. pared with 10 days in the initial treatment of proximal venous thrombosis.
3. Schulman S, Lockner D, Juhlin-Dannfelt A. The duration of oral anti- N Engl J Med 1990;322:1260-4.

0
(.9
LJ.J
a:
(.9
J,
LJ.J
a:
CO
0

z
a:
LJ.J
>
en
z
0
fC=
0 398 Fe b r ua r y 6, 1997
LJ.J
@

208
ARTICLE 3 - LCA 2011

QCM
1
1 Quelle(s) est(sont) la(les) caractéristique(s) qui ne correspond(ent) pas à l'étude
réalisée ici?
A - Essai clinique contrôlé.
B - Etude randomisée.
C - Etude en double aveugle.
D - Etude monocentrique.
E - Etude en deux groupes parallèles.

QCM
2
1 Quel était l'objectif des auteurs en réalisant cette étude ?
A - Etudier l'effet de la prescription d'un traitement anticoagulant oral sur le risque de récidive après
un premier épisode thromboembolique veineux.
B - Etudier l'effet de la prescription d'un traitement anticoagulant oral sur le risque de récidive après
un second épisode thromboembolique veineux.
C - Etudier l'effet de la durée du traitement anticoagulant oral sur le risque d'hémorragie majeure, de
récidive thromboembolique et de décès après un premier épisode thromboembolique veineux.
D - Etudier l'effet de la durée du traitement anticoagulant oral sur le risque d'hémorragie majeure, de
récidive thromboembolique et de décès après un second épisode thromboembolique veineux.
E - Etudier l'effet de la voie d'administration d'un traitement anticoagulant sur le risque de récidive

1
après un premier épisode thromboembolique veineux.

QCM Quel(s) biais potentiel(s) le déroulement de cette étude en « ouvert » peut-il


3 engendrer?
A - Biais de sélection.
B - Biais de suivi.
C - Biais de classement.
D - Biais de mémorisation.
E - Biais de confusion.

QCM 1 Quelle(s) est(sont) la(les) proposition(s) vraie(s) concernant le consentement des


4 patients dans cette étude?
A - Il a été obtenu chez tous les patients avant leur inclusion dans l'étude, ce qui est obligatoire.
B - Dans un essai de ce type, un consentement oral est suffisant.
C - Le retrait du consentement par les patients dans un essai de ce type n'est plus possible dès lors
qu'il a été donné avant l'inclusion.
D - L'obtention d'un consentement par les patients dispense les investigateurs de leur fournir une
information claire et adaptée.
E - Un consentement est obliqatoire dans toutes les études interventionnelles.

QCM 1 �ue signifie « faire une randomisation par blocs de 10 patients » dans cette étude
5
A - Tous les 10 patients, la durée de traitement allouée est modifiée.
B - Tous les 10 patients, une analyse intermédiaire est réalisée.
C - Tous les 10 patients, il y a autant de patients dans chacun des deux groupes.
D - Tous les 10 patients, la liste de randomisation est régénérée.
E - Tous les 10 patients, le centre d'inclusion est modifié.

QCM
6
1 Combien y a-t-il de liste(s) de randomisation dans cette étude?
A - Une seule.
B - Autant que de centres.
C - 1 O listes de randomisation.
D - 20 listes de randomisation.
E - On ne peut pas savoir avec les données de l'article.

209
iKB LECTURE CRITIQUE D'ARTICLE

QCM
7
1 A propos des analyses statistiques dans cette étude, quelle(s) est(sont) la(les)
proposition(s) vraie(s) ?
A - Le nombre de sujets nécessaires a été calculé pour une puissance de 80%.
B - Si la formulation avait été unilatérale, le nombre de sujets nécessaires n'en aurait pas été affecté.
C - Le risque de première espèce a été considéré à 5% dans cette étude.
D - Le type d'analyse des résultats jour un rôle dans le calcul du nombre de sujets nécessaires dans
une étude.
E - L'utilisation du test de Fisher dans cette étude par les auteurs tient au fait que les effectifs son1

1
faibles dans certains groupes.

QCM
Quelle(s) est(sont) la(les) proposition(s) vraie(s) ?
8
A - La différence en nombre de sujets retrouvée au final entre les deux groupes de patients es1
compatible avec une randomisation par blocs de 10 patients.
B - Il y a 14% de perdus de vue dans cette étude.
C - Le port des bas de contention était significativement plus important dans le groupe traité pendan1
6 mois que dans l'autre.
D - Il y avait significativement plus d'hommes dans le groupe traité pendant 6 mois.
E - 15% des patients ayant présenté une embolie pulmonaire était dans le groupe traité pendant 6
mois.

QCM
9
1 Y a-t-il une différence en termes de mortalité entre les deux groupes de patients ?
A - Oui, les décès sont plus nombreux dans le groupe traité pendant 6 mois.
B - Oui, le risque relatif de décès est> 1.
C - Non, l'intervalle de confiance du risque relatif de décès contient la valeur 1.
D - Non, la valeur du« p »est> 0,05.

1
E - On ne peut pas répondre avec les données présentées dans l'article.

QCM Comment interprétez-vous la phrase de la discussion sur la tendance aux


10 hémorragies majeures dans le groupe traité sur une longue période ?
A - Cette tendance est non-significative.
B - Cette tendance est significative dans cette étude.
C - Une augmentation du risque hémorragique (et donc des hémorragies majeures) dans le groupe
traité sur une longue période est plausible.
D - Une augmentation du risque hémorragique (et donc des hémorragies majeures) dans le groupe
traité sur une longue période est peu plausible.

I
E - Ce résultat découle d'un probable manque de puissance pour le critère considéré.

QCM
Comment aurait-on pu infirmer ou confirmer cette tendance ?
11
A - En augmentant le nombre d'inclusions dans l'étude.
B - En allongeant la durée du suivi.
C - En changeant de test statistique.
D - En incluant les perdus de vue dans l'analyse des résultats.

I
E - En excluant les perdus de vue de l'analyse des résultats.
0
(.9
LJ.J
a:
QCM L'intervalle de confiance du RR concernant la récidive (tableau 2) est
(.9 12 particulièrement large. Comment pourrait-on procéder pour le réduire ?
LJ.J
a:
CO
A - En augmentant la puissance de l'étude.
0
B - En diminuant la puissance de l'étude.
z C - En augmentant le nombre de sujets inclus.
a:
LJ.J
> D - En diminuant le risque alpha.

@
en
z
0 E - En auqmentant le risque alpha.
fC=
0
LJ.J

210
ARTICLE 3 - LCA 2011

Si au lieu de faire une analyse en intention de traiter (ITT) on avait fait une analyse
QCM
en fonction du traitement réellement effectué, cela aurait-il pu modifier les
13
conclusions concernant l'efficacité ?
A- Oui, on aurait probablement trouvé un résultat non significatif.
B- Oui, car il y a surestimation de l'effet du traitement dans l'analyse en ITT.
C- Oui, car les perdus de vue auraient été pris en compte dans l'analyse.
D- Non, car une analyse per-protocole aurait maximisée la différence, donc renforcé le résultat mis
en évidence ici en ITT.

1
E- On ne peut pas savoir, cela dépend de l'analyse que l'on effectuera à la place.

QCM Quelle(s) est(sont) la(les) limite(s) à l'application des résultats de cette étude à la
14 population générale ?
A - Etude réalisée dans un seul pays, qui plus est étranger.
B - Etude multicentrique.
C - Etude ancienne.
D - Meilleur suivi (clinique et biologique) dans les essais que« dans la vraie vie».

1
E - Evolution des méthodes diagnostiques actuelles.

QCM Quand on parle de l'applicabilité des résultats d'une étude, à quelle(s)


15 caractéristique(s) de celle-ci fait-on référence ?
A - Sa cohérence interne.
B - Sa cohérence externe.
C - Sa validité interne.
D - Sa validité externe.
E - Sa pertinence clinique.

211
iKB LECTURE CRITIQUE D'ARTICLE

Grille de correction QCM


(Questions à choix multiples)

A- F
....
:!!: C-
(.)
B-
V .
F Réponse: CD
Il s'agit ici d'un essai clinique contrôlé randomisé, en ouvert, multicentrique,
0 D- V en deux groupes parallèles (deux durées de traitement différentes).
E- F
A-
.
F Réponse: D
N B- F Dans cette étude, l'objectif poursuivi par les auteurs était de comparer deux durées
:!!: C- F différentes d'anticoagulation orale (6 mois versus indéfiniment) sur la récidive
(.)
0 D- V thromboembolique, les complications hémorragiques majeures et le décès, durant
E- F les 4 années de suivi des patients.
A-
B- V .
F Réponse: BC
Une étude en « ouvert» signifie qu'il n'y a pas d'aveugle : les patients et les
C- V
. médecins qui assurent le suivi sont donc au courant des traitements pris.
M
:!!: D- F Cela peut engendrer un biais dans le suivi des patients (les patients avec des
(.)
0 durées de traitement courtes par exemple pourraient être suivi plus fréquemment
E- F que les autres, ou inversement). Le biais de suivi est un sous-type de biais,
appartenant aux biais de classement.

"'"
A-
B-
V
F .
Réponse: AE
Le consentement est obligatoire dans les études interventionnelles et
:!!: C-
0 D-
(.)
F
F . interventionnelles à risques minimes (Loi Jardé et décrets d'application).
Le consentement est écrit, éclairé(= après information claire et adaptée),
révocable à tout moment sans entraîner de sanctions ou de perte de chance pour
E- V le patient.
A-
B-
F
F .
Réponse: C
La randomisation par blocs fait partie des modalités de randomisation
Lt) C- V « restreinte » (comme la randomisation par minimisation, par clusters ou par

.
:!!: D- F stratification).
(.)
0 La randomisation par blocs permet un équilibre des groupes dans le temps (les
E- F différences en termes de nombre de patients sont limitées dans le temps, ce qui
permet d'assurer plus encore la comparabilité initiale entre les groupes).
A- F
ID
:!!: C-
B- V
F
.
Réponse: B
Il y a ici une randomisation stratifiée sur le centre et dans ce cas, il est établi qu'il y
(.) a une liste de randomisation par strate, donc autant de listes de randomisation
0 D- F que de centres ici.
E- F
A-
.
V Réponse : ACE

..... B- F
. Puissance P= 1-bêta (1-20%= 80%)
:!!: C-
(.) D-
0
V
F . Risque alpha= risque de 1 ère espèce= 5%
En formulation unilatérale, il faut plus de sujets qu'en formulation bilatérale. En
revanche, le type d'analyse des données (ITT versus per protocole) n'influence
E- V
pas le nombre de sujets nécessaire.
0
(.9
LJ.J
a: A- V
B-
.
V Réponse: AB
(.9
J, CO
:!!: C-
LJ.J
a: F Les caractéristiques initiales des sujets à l'étude sont présentées dans le tableau
CO
0 (.)
N 0 D- F 1. Pas de tests statistiques associés (attention à l'inflation du risque alpha).
z
a:
LJ.J E- F
z
0

LJ.J
@

212
ARTICLE 3 - LCA 2011

A- F
a,
::!!: C-
B- F
V
.
Réponse: CD
Pas de différence significative en termes de mortalité entre nos deux groupes de
(.) patients, l'IC95% du RR contient la valeur 1, et le degré de significativité p est
0 D- V > 0,05.
E- F
A-
.
V Réponse: ACE

....
0 C-
B- F
V .Le résultat est présenté dans le tableau 2 (p = 0,084).
L'augmentation de risque est cependant plausible (plus on est traité longtemps
par anticoagulant, plus le risque d'hémorragie et donc d'hémorragie majeure est
::!!: D- F
(.)
0
E- V
.élevé).
Il s'agit probablement d'un manque de puissance (pour rappel, le NSN a été
calculé a priori sur le risque de récidive d'évènement thromboembolique, et non le
risque hémorragique).
A- V
........ B- V .
Réponse: AB
Augmentation de la puissance :
::!!: C- F - Allongement de la durée de suivi => observer plus d'évènements
(.)
0 D- F - Augmentation du nombre de sujets inclus avec durée de suivi identique
E- F
A- V
....
N

::!!: C-
B- F
V
.
Réponse: ACE
Dans la pratique, on ne joue que sur la puissance (et donc le nombre de sujets
(.) nécessaire) et pas sur le risque alpha (et encore moins quand il s'agit de
0 D- F l'augmenter).
E- V
A-
.
F Réponse: D

.... C-
B- F
F .Cela n'aurait pas modifié les conclusions de l'étude concernant l'efficacité.
En effet, une étude per-protocole (qui aurait donc été réalisé si l'ITT n'aurait pas
::!!: D- V été faite) aurait maximisé les différences entre les groupes, puisque la durée de
(.)
0 traitement aurait été plus longue dans le groupe « indéfini» et plus courte dans le
E- F groupe « 6 mois» :
- Risque de surestimation de l'efficacité du traitement indéfini
A- V
"'".... B- F .
Réponse: ACDE
Cette étude est ancienne, et les méthodes diagnostiques ont changé depuis, pour
::!!: C- V
(.)
0 D-
E-
V
V
.la TVP comme pour l'EP.
Elle a été réalisée dans un pays étranger (un seul pays, mais plusieurs centres).

A- F
.
Réponse: D
Quand on parle de « fiabilité» d'une étude, on fait référence à sa cohérence ou
B- F validité interne:
- Prise en compte des biais

.
C- F - Protocole de l'étude en adéquation avec la question posée...
....
Lt)
Quand on parle de son « applicabilié», on fait référence à sa validité externe:
::!!: D- V - Population cible de l'étude (critères d'éligibilité)

.
(.)
0 - Critère de jugement ...
La cohérence externe d'une étude correspond au parallèle qui est fait entre les
E- F .résultats de cette étude et ceux déjà connus dans la littérature.
La pertinence clinique est une notion plus vaste, à ne pas confondre avec la
significativité statistique (Le résultat de l'étude est-il important? Est-il intéressant
dans la pratique clinique?).

213
iKB LECTURE CRITIQUE D'ARTICLE

0
(.9
LJ.J
a:
(.9
J,
LJ.J
a:
CO
0


z
a:
LJ.J
>
en
z
0
fC=
0
LJ.J
@

214
Chapitre
37

ARTICLE 4 - LCA 2012

Amoxicillin plus clavulanic acid versus appendicectomy for +�


treatment of acute uncomplicated appendicitis: an open-label,
non-inferiority, randomised controlled trial
Corinne Vans, Caroline Barry*, Sophie Maitre*, Karine Pautrat, Mahaut Leconte, Bruno Costaglioli, Mehdi Karoui, Arnaud Alves, Bertrand Dousset,
Patrice Va/leur, Bruno Falissard, Dominique Franco

Summary
Background Researchers have suggested that antibiotics could cure acute appendicitis. We assessed the efficacy of loncet2011; 377, 1573-79
amoxicillin plus clavulanic acid by comparison with emergency appendicectomy for treatment of patients with seecommentpage1545
uncomplicated arute appendicitis. "Theseauthors contributed
equally
Methods In this open-label, non-inferiority, randomised trial, adult patients (aged 18-68 years) with uncomplicated HôpitalAntoine Béclère
acute appendicitis, as assessed by CT scan, were enrolled at six university hospitals in France. A computer-generated (Assistance Publique-Hôpitaux
de Paris and Université Paris XI),
randomisation sequence was used to allocate patients randomly in a 1:1 ratio to receive amoxicillin plus clavulanic Services de Chirurgie
acid (3 g per day) for 8-15 days or emergency appendicectomy. The primary endpointwas occurrence of postintervention (Prof CVons MD,
peritonitis within 30 days of treatment initiation. Non-inferiority was shown if the upper limit of the two-sided 95% CI Prof D Franco MD),
for the difference in rates was lower than 10 percentage points. Both intention-to-treat and per-protocol analyses were etde Radiologie (SMaitre MD),
Clamart, France; lnserm, U669,
done. This trial is registered with Clinica!Trials.gov, number NCTOO1356O3. Université Paris-Sud and
Université Paris Descartes, Paris,
Findings Of 243 patients randomised, 123 were allocated to the antibiotic group and 120 to the appendicectomy FranceAP-HP, Hôpital Paul
group. Four were excluded from analysis because of early dropout before receiving the intervention, Brousse, Villejuif, France
(CBarryPhD, Prof B Falissard MD);
leaving 239 (antibiotic group, 120; appendicectomy group, 119) patients for intention-to-treat analysis. Hôpital Lariboisière (Assistance
3O-day postintervention peritonitis was significantly more frequent in the antibiotic group (8%, n=9) than in the Publique-Hôpitaux de Paris and
appendicectomy group (2%, n=2; treatment difference 5• 8; 95% CI O• 3-12-1). In the appendicectomy group, despite Université Paris VII), Service
de Chirurgie, Paris, France
CT-scan assessment, 21 (18%) of 119 patients were unexpectedly identified at surgery to have complicated appendicitis
(KPautratMD, Prof AAlvesMD,
with peritonitis. In the antibiotic group, 14 (12% [7-1-18-61) of 120 underwent an appendicectomy during the first Prof PValleur MD); Hôpital
30 days and 30 (29% [21-4-38-91) of 102 underwent appendicectomy between 1 month and 1 year, 26 of whom had Cochin (Assistance
acute appendicitis (recurrence rate 26%; 18-0-34-7). Publique-Hôpitaux de Paris
and Université Paris V), Service
de Chirurgie, Paris, France
lnterpretation Amoxicillin plus clavulanic acid was not non-inferior to emergency appendicectomy for treatment (M LeconteMD,
of acute appendicitis. Identification of predictive markers on CT scans might enable improved targeting of Prof B Dousset MD);
antibiotic treatment. Hôpital Bicêtre (Assistance
Publique-Hôpitaux de Paris and
Université Paris XI), Service de
Funding French Ministry of Health, Programme Hospitalier de Recherche Clinique 2002. Chirurgie, Paris, France
(BCostaglioli MD); and
Introduction undergoing appendicectomy were readmitted for Le Kremlin Bicêtre and Hôpital
Henri Mondor (Assistance
Acute appendicitis is still the most common indication intestinal obstruction directly related to postoperative
Publique-Hôpitaux de Paris and
for surgery in patients admitted to hospital for acute adhesions.'·'° Avoidance of emergency appendicectomy Université Paris XII), Service
abdominal pain. In about 20% of cases, acute in patients with uncomplicated appendicitis, who de Chirurgie, Créteil, France
appendicitis is complicated, leading to local or diffuse otherwise would have had surgery, would therefore (MKarouiMD)

peritonitis;' most, however, are uncomplicated. improve the risk-benefit ratio of acute-appendicitis Correspondence to·
Prof CorinneVons, Setvice de
Although urgent appendicectomy is still the treatment. We compared the results of treatment
Chirurgie, HôpitalJean Verdier,
recommended treatment for acute uncomplicated with amoxicillin plus clavulanic acid with emer­ Avenue du 14Juillet,
appendicitis, several studies, including four randomised gency appendicectomy in a group of patients with Bondy 93143, France
trials,'-' have suggested that antibiotic treatment can uncomplicated acute appendicitis as assessed by CT. corinne.vons@jvr.aphp.fr

cure acute appendicitis or can be the first line of


treatment. Design limitations of previous studies, Methods
however, have decreased the relevance of their results, Patients
and consequently the current strategy for treatment of We undertook an open-label, non-inferiority, random­ For the trial protocol see http://
acute appendicitis has not been altered.' Although ised controlled trial. T he study took place in six academic www.medecine.u-psud.fr/fr/
recherche/les_publications/
emergency appendicectomy is well tolerated by most centres of the Assistance Publique-Hôpitaux de Paris, trialappendicitis.html
patients, it is nevertheless associated with a risk of France, and was approved by the ethics committee of
postoperative complications in about 2-23% of the Hôpital Bicêtre, Le Kremlin-Bicêtre, France. Ali
patients.'·' Additionally, over 10 y ears, 3% of patients patients provided signed, informed consent.

www.thelancet.com Vol 377 May 7, 2011 1573

215
iKB LECTURE CRITIQUE D'ARTICLE

243 randomised

1
1 1

+
120 allocated to appendicectomy
+
123 allocated to antibiotic treatment
119 had appendicectomy 120 received antibiotic treatment
1 did not have appendicectomy* 3 did not receive antibiotic treatment*

5 discontinued follow-up 4 discontinued follow-up


before 1 month before 1 month
1 withdrew consent
4 were lost to follow-up .- H
2 withdrew consent
1 at request of treating
physician
1 was lost to follow-up

'
114 assessed at 1 month 116 assessed at 1 month

10 discontinued follow-up 5 discontinued follow-up


between 1 month and 1 year; between 1 month and 1 year
ail were lost to follow-up
.- H
2 withdrew consent
2 were lost to follow-up
1 at request of treating
physician

'
104 completed 1-year follow-up 111 completed 1-year follow-up

J. J.
119 included in ITT analysis 120 included in ITT analysis

J. J.
98 included in per-protocol analysis 106 included in per-protocol analysis
21 were excluded 14 were excluded
13 did not completethe study 9 did not complete the study
6 after rereading of CT scan 5 after rereading of CT scan
2 did not complete the study and after
rereading of CT scan

Figure: Trial profile


ITT=intention to treat. *Withdrew consent before starting treatment.

Ali adults examined in the emergency department where the patient was admitted did a CT scan of patients'
and suspected to have an acute appendicitis were appendices according to the standard protocol of the
assessed for possible inclusion in the study. Patients hospitals. CT imaging was done with a 16-multidetector
were excluded if one of the following criteria were CT scanner in ail centres, except for one (Hôpital Antoine
present: age less than 18 years (no upper age limit); Béclère), which used a single-row-detector spiral CT
SeeOnlineforwebappendix antibiotic treatment 5 days before; allergy to �-lactam scanner (webappendix p 1).
antibiotics; known intolerance to amoxicillin plus A final diagnosis of uncomplicated acute appendicitis
clavulanic acid (nausea, vomiting); receiving steroid or required clear visualisation of the appendix (appendix
anticoagulant treatments; past history of inflammatory diameter >6 mm and no opacification of the appen­
bowel disease; pregnancy or a positive pregnancy test; dix in patients with enema), and absence of any of the
life expectancy less than 1 year; allergy to iodine or three following criteria of complicated appendicitis
blood creatinine 200 µmol/L or more; or inability to with peritonitis: extra luminal gas, periappendiceal
understand information about the protocol or to sign fluid, or disseminated intraperitoneal fluid. An
the consent form. appendix diameter greater than 15 mm was a criterion
Patients eligible for inclusion to the study were for exclusion from the study, because of risk of
informed of the protocol and invited to participate. After malignancy." Caecal-wall thickening, inflammation of
0
(.9
informed consent was obtained, a CT scan was done. periappendiceal fat, and presence of intraluminal
a:
LJ.J
Diagnosis of uncomplicated appendicitis was assessed stercoliths were also recorded, but were not
(.9
by CT imaging. An emergency radiologist in the hospital exclusion criteria.
a:
LJ.J

CO
0
1574 www.thelancet.com Vol 377 May 7, 2011
z
a:
>
LJ.J

en
z
0
fC=
0
LJ.J
@

216
ARTICLE 4 - LCA 2012

Randomisation and masking


Appendicectomy Antibiotic treatment
When a diagnosis of uncomplicated acute appendicitis group (n=119) group (n=120)
was made, patients were individually assigned to undergo
Age( years) 34(12) 31(9)
either appendicectomy or treatment with amoxicillin
Sex
plus clavulanic acid. The computer-generated random­
Men 70 (59%) 73 (61%)
isation code was produced by the trial statistician. To
Women 49(41%) 47 (39%)
ensure balance between the numbers in each group,
Body-mass index( kg/m') 241(41) 230(3 0)
black sizes of four were generated for allocation of
Employment status
patients to one of the two treatment groups; the
Full-time or part-timework 87 (73%) 83 (69%)
randomisation procedure was stratified by site, with an
Clinical symptoms on admission
equal allocation ratio. Opaque, sealed, and sequentially
numbered envelopes were provided to each trial site. To Sudden onset of pain* 59(50%) 57 (48%)

enrol a patient, an independent pharmacologist opened Mean pain scoreVAS(0-10)t 64(2 1) 6 3 (1 9)

the next consecutively numbered envelope. Body temperature >37•5°C 32 (28%) 38 (32%)
Lower-right quadrant-rebound tenderness 72 (62%) 56 (48%)

Procedures Biologicalfindings
Patients were admitted to hospital irrespective of the Leucocytes(10" /L) 13 1(34) 136 (36)
treatment assigned and were assessed twice a day while High CRP concentrationt 78 (68%) 76 (68%)
in hospital. They were discharged after resolution of Additional CTfindingsl
pain, fever, and any digestive symptoms. Appendicectomy Local caecal-wall thickening 14(13%) 17 (15%)
was done according to surgeons' standard practice Inflammation of periappendiceal fat 47 (44%) 49(44%)
(a McBurney incision or laparoscopy). Patients were lntraluminal stercolith 22 (21%) 19 (17%)
given one injection of amoxicillin plus clavulanic acid
Data are mean (SD) or numbers (%). We calculated percentages using non-missing data. VAS=visual analogue scale.
(2 g) at induction of general anaesthesia, but did not CRP=C-reactive protein. *Ali patients had abdominal pain, but only a proportion presented with sudden onset pain.
receive antibiotic treatment thereafter, unless complicated tlntensity of pain was measured with a horizontal 10-mm visual analogue scale, with 0 representing no pain, and
appendicitis was diagnosed during surgery, in which case 10 the worst pain ever experienced. îHig h CRP denotes concentrations above normal values as defined by hospital
laboratories; de-finition of high CRP was beyond a specific value; normal values differed between hospitals. §CT findings
patients were given postoperative antibiotics. additional to inclusion and exclusion criteria (appendix diameter >6 mm and no extra luminal gas, periappendiceal
Patients in the antibiotic treatment group received fluid, and disseminated intraperitoneal fluid).
amoxicillin plus clavulanic acid (3 g per day for patients
Table 1: Baseline characteristics ofthe intention-to-treat population
weighing <90 kg, and 4 g per day for patients a:90 kg), given
intravenously to those with nausea or vomiting, and orally
to ail others. 12-1'This drug combination was chosen because Appendicectomy Antibiotic- Difference (95% Cl)

of its efficacy for ambulatory treatment of uncomplicated group (n=119) treatment group
(n=120)
sigmoiditis. 13 If symptoms and abdominal tenderness did
not resolve after 48 h, immediate appendicectomy was Primary endpoint events

undertaken. If pain and fever resolved rapidly, patients 30-day post-therapeutic peritonitis 2(2%)' 9(8%)t 5•8(0J ta El)

were discharged. Patients continued the same antibiotic Incidence ofperitonitis

treatrnent at home, with the same dose, for 8 days, and Complicated appendicitis with peritonitis 21(18%)t 9 (8%)t -10·1 (-18}to-1})
identified at surgety
were seen on day 8; persistence of pain or fever prompted
Postoperative peritonitis 2 (2%)t 2 (2%)1 0 (-44 ta 44)
a CT scan and possible appendicectomy. In the absence of
these symptoms, a sustained high white-blood-cell count Data are number unless otherwise stated. *ln the appendicectomy group, two cases of postoperative peritonitis
or a high C-reactive-protein concentration resulted in occurred; these patients had postoperative localised peritonitis successfullytreated with antibiotics. tin the antibiotic
group, complicated appendicitis with peritonitis was identified during appendicectomy performed within 30 days of
extension of antibiotic treatment for a further 8 days.
treatment initiation in nine of 14 patients who did not show improvement. îDiscoveryof a complicated appendicitis
Persistence of similar biological disorders on day 15 with peritonitis in the appendicectomy group was not a primary endpoint. §Two patients in the antibiotic group, who
prompted appendicectomy without an additional CT scan. underwent secondary appendicectomy, had postoperative peritonitis.
Ali patients were seen systematically in consultations on
Table 2: Incidence of primary endpoint events and complicated appendicitis with peritonitis and
days 15, 30, 90, 180, and 360. postoperative peritonitis within 30 days after the start oftreatment in both groups
Histological examination of the appendix was done (intention-to-treat population)
after every appendicectomy. Definitive diagnosis of
uncomplicated acute appendicitis was based on the
presence of mucosal ulceration with neutrophil infiltration diagnosis of postoperative peritonitis was made with CT
restricted to the mucosa, or with a transmural extension. scan findings for patients with fever, abdominal pain, and
The primary binary endpoint was occurrence of peritonitis high concentrations of white-blood cells and C reactive
within 30 days of initial treatment. In the antibiotic group, protein. Signs of localised postoperative peritonitis on CT
diagnosis of peritonitis was done either by appendicectomy scans were densification of soft tissue with or without
when a complicated appendicitis was identified, or organised fluid collection (abscess) of the right iliac fossa.
postoperatively by CT scan. In the appendicectomy group, Appendicectomy done within 30 days of treatment

www.thelancet.com Vol 377 May 7, 2011 1575

217
iKB LECTURE CRITIQUE D'ARTICLE

uncomplicated appendicitis of 2%, 1617 a non-inferiority


Appendicectomy Antibiotic- p
group (n=119) treatment value margin of 10%, and a two-sided a risk of 0 • 05.18 How­
group (n=120) ever, we planned to enrol 250 patients because of the
Duration of pain* 170(1 07) 1 63 (1 35) 0·13 possible loss of patients after their inclusion.
Durationof ho spital stay 3 04(1 50) 3 96(4 87) 0•08 Study outcomes were assessed by bath intention-to­
Duration ofdisability 1045 (8 20) 9 82 (10 51) 0·25 treat and per-protocol analyses. The intention-to-treat
population included ail randomised participants who
Data are mean {SD), p value {Wilcoxontest). Duration in days. *Pain as assessed began a treatment (surgical treatment or at least one dose
with the visu al analogue score �4-
of antibiotics). A second reading of the CT scan was done
Table 3: Duration of post-therapeutic pain, hospital stay, and disability later by an assigned non-emergency radiologist, who was
(intention-to-treat population) masked to the patients' treatment or status, to confirm
initial CT scan diagnosis of uncomplicated appendicitis
Within 30 days Between 30 days made by the emergency radiologist. The per-protocol
(n=120) and lyear of population included ail patients who completed the study
follow-up (n=102)* (1 year), and for whom the second reading of a CT-scan
Number of patient s 14(12%; 71-18 6) 30 (29%; 214-38 9) confirmed the diagnosis of uncomplicated appendicitis.
(%; 95%(1) The primary analysis in this non-inferiority trial
Appendicitis (%; 95% Cl) 13 (11%; 64-177) 26 (25%; 18 0-347) compared the two study groups for the rate of peritonitis
Complicat edt 9 3 that occurred within 30 days of treatment initiation. The
Uncomplicated 4 23 95% Cls for absolute difference in percentages between
No appendicitis 4 the antibiotic-treatment group and the surgery group
Fibrous 4 were estimated according to the methodology used by
Altman and colleagues.19 Secondary binary endpoints
*120 patients in the antibiotic-treatment group minus 14 patientswho had an
appendicectomy during the first 30 days of follow-up and four who discontinued were similarly analysed. Wilcoxon tests were used to
follow-up before 1 month. tComplicated appendicitiswith peritonitis. compare durations. Webappendix pp 1-2 shows
management of missing data. Ali reported p values are
Table 4: Aspects of appendices during appendicectomies done in
44 of 120 patients treated initially with antibiotics (intention-to-treat two-sided and were not adjusted for multiple testing.
population) We did additional post-hoc analyses. Factors predictive
of complicated appendicitis in the appendicectomy group
were calculated. For the antibiotic-treatment group,
1mt1at10n in the antibiotic group was not a primary factors predictive of absence of improvement (patients
endpoint if complicated appendicitis with peritonitis was needing appendicectomy during the first 30 days after
not identified at surgery. start of antibiotic treatment, with a confirmed histological
Secondary endpoints were the number of days with a diagnosis of acute appendicitis), or of recurrence of
postintervention visual-analogue-scale pain score a:4 (on appendicitis (patients needing appendicectomy between
a 0-10 scale), 15 length of hospital stay and absence from 30 days and 1 year, with a confirmed histological diagnosis
work (total days including any additional hospital stays), of acute appendicitis) were also calculated. Univariate
incidence of complications other than peritonitis within logistic-regression models were used to assess the
1 year (postoperative wound abscess, incisional hernia, association between these events and each patient's
adhesive occlusion), and recurrence of appendicitis after baseline clinical characteristics. We used R software
antibiotic treatment (appendicectomy done between (version 2.7.0) for ail analyses.
30 days and 1 year of follow-up, with a confirmed
diagnosis of appendicitis). Role of the funding source
The sponsor of the study had no raie in study design, data
Statistical analysis collection, data analysis, data interpretation, or writing of
This study was based on the notion that antibiotic the report. CV, CE, BF, and DF had full access to ail data
treatment would not be inferior to appendicectomy in in the study and final responsibility for the decision to
relation to the primary efficacy outcome, with the use of submit for publication. Ali other authors could request
a prespecified non-inferiority margin-the upper limit of examination of any of the data elements.
the 95% CI for the difference in rates would not exceed
10 percentage points. Results
0
We calculated that a sample size of 200 patients would The figure shows the trial profile. 243 patients
(9
LJ.J give a power of 80% to establish whether antibiotic (aged 18-68 years) were enrolled into the study between
a:
(9 treatment was not inferior to appendicectomy in relation March 11, 2004, and January 16, 2007. Four refused to
LJ.J to the 30-day incidence of postintervention peritonitis. participate in the trial shortly after randomisation, therefore
a:
CO This sample size took into account an expected 239 patients constituted the intention-to-treat population.
0
30-day incidence of peritonitis after appendicectomy for Table 1 shows baseline characteristics of these patients.
z
a:
LJ.J
>
en 1576 www.thelancet.com Vol 377 May 7, 2011
z
0
fC=
0
LJ.J
@

218
ARTICLE 4 - LCA 2012

Table 2 shows incidence of primary endpoints and


Complicated Uncomplicated
incidence of complicated appendicitis with peritonitis appendicitis (n=21) appendicitis (n=98)
and postoperative peritonitis within 30 days after the start
Age(years) 38(13) 34(12)
of treatment in the intention-to-treat population. 30 day
Sex
postintervention peritomt1s was significantly more
Men 16(76%) 54 (55%)
frequent in the antibiotic group than in the
Women 5 (24%) 44(45%)
appendicectomy group.
Clinical symptoms on admission
24 (10%) of 239 patients did not complete the 1-year
Sudden onset of pain* 11(52%) 48 (48%)
study. 11 were excluded by re-reading of the CT-scan.
Mean pain score(0-l0)t 6 3(17) 64(2 2)
The remaining 204 patients constituted the per-protocol
Body temperature( >37°C) 9(43%) 23(24%)
population (figure; results are shown in web­
appendix pp 2-5). Lower-right quadrant-rebound tenderness 13(62%) 59 (61%)

Primary endpoint data were missing for nine patients Biological findings

(four in the antibiotic group and five in the Leucocyte counts(10 9/L) 13 9(2 6) 13 0 (3 6)

appendicectomy group). We did a sensitivity analysis to High CRP concentration+ 16(80%) 62(66%)

establish the effect of missing cases, excluding patients Additional appendix CT1îndings\

with missing data from the analysis. The rate of Local caecal-wall thickening 2(12%) 12(13%)
peritonitis within 30 days of treatment initiation lntlammation of periappendiceal fat 11(65%) 36(40%)
remained higher in the antibiotic-treatment group than lntraluminal stercolith 9(53%) 13(15%)
in the surgery group (difference 6-0 percentage points; C T -scannertype
95% CI 0-3-12-5; webappendix pp 5-6). Multidetector 17(81%) 71(72%)
For secondary endpoints, the median duration of severe
Data are mean {SD) or numbers {%). Comparison of the 21 cases of complicated appendicitiswith peritonitis versus
pain, days in hospital, and absence from work did not 98 cases of uncomplicated appendicitis or no appendicitis, identified at surgery. CRP=C-reactive protein. * Ali patients
differ between the two groups (table 3). Other had abdominal pain, but only some presented with sudden onset pain. tPain assessed with the visual analogue
postintervention complications included postoperative score >4. :j:High C-reactive protein de notes concentrations above normal values defined by hospital laboratories;
de-finition of high CRP was beyond a specific value; normal values differed between hospitals. §CTfindings additionalto
wound infection (two of 120 in the antibiotic group vs inclusion and exclusion criteria {appendix diameter >6 mm and no extra luminal gas, periappendiceal fluid, and
one of 119 in the appendicectomy group) and intestinal disseminated intraperitoneal fluid).
adhesive occlusion (one of 120 in the antibiotic group vs
Table 5:Association between riskfactors and complicated appendicitis with peritonitis in the
none in the appendicectomy group) during the 1-year appendicectomy group
follow-up. lncisional hernia did not occur in either group.
No significant differences were identified between the
two groups for any postintervention complications. webappendix p 7). No factors were associated with the
Table 4 shows the aspects of the appendices assessed in recurrence of appendicitis. No adverse events were
patients who had appendicectomies treated initially with deemed by the investigator as being related to CT­
antibiotics in the intention-to-treat population. Those who scanning or antibiotic treatment.
underwent appendicectomy between 1 month and 1 year
had the operation after a median of 4-2 months Discussion
(range 1-2-11-1). Overall, 81 (68%) of 120 patients did not Incidence of 30-day postintervention peritonitis, which
need an appendicectomy for acute appendicitis in the anti­ was the main judgment criterion, was significantly
biotic group during the 1-year follow-up. higher in the antibiotic-treatment group than in the
Post-hoc analyses showed that laparoscopie or appendicectomy group. This study showed that antibiotic
McBurney approach rates were similar in bath groups treatment with amoxicillin plus clavulanic acid was not
(webappendix pp 6 - 7). Logistic-regression analyses non-inferior to emergency appendicectomy for treatment
showed that CT-scanner type (multidetector vs single of acute uncomplicated appendicitis.
detector) was not significantly associated with Trials that show that acute appendicitis can be treated
misdiagnosed complicated appendicitis (p�0-42; table 5). successfully with antibiotics'-5 were weakened by several
Presence of a stercolith on preoperative CT scan was the design limitations. For example, diagnosis of
only factor associated with a significantly increased risk uncomplicated appendicitis was not supported by
of complicated appendicitis (table 5, p<0-0001). In the systematic CT-scan assessment, although researchers
antibiotic group, the presence of a stercolith was also the claimed to have treated uncomplicated appendicitis
only factor associated with failure of antibiotic treatment alone. 3 Therefore, we tried to avoid these limitations in
for appendicitis (table 6, p�0-0072). our study by using CT scans to select patients with
In the subgroup of patients without visualisation of a uncomplicated appendicitis before randomisation.
stercolith on initial CT scan, we identified no significant Multiple detector CT scanning is generally accepted as
difference in the incidence of 30-day postinter­ the best investigation to diagnose acute appendicitis,
vention peritonitis between the two groups (differ­ because it has a high sensitivity and specificity. 20 Indeed,
ence 2-9 percentage points; 95% CI -3-0 to 9-2; only 3% of patients allocated to surgery in our trial had

www.thelancet.com Vol 377 May 7, 2011 1577

219
iKB LECTURE CRITIQUE D'ARTICLE

No improvement of Without appendectomy Pane/: Research in context


appendicitis (n=13) duri ng the fi rst month
(n=102) Systematic review
Age(years) 35(13) 31 (9) Four trials comparing antibiotic treatment with emergency
Sex appendicectomy have been reported.'-5They all concluded that
Men 10(77%) 59 (58%) acute appendicitis can be treated successfullywith
Women 3 (23%) 43 (42%) antibiotics,'-5 and some suggested that antibiotics might be
Clinical symptoms on admission used as first-line treatment for unselected patients with acute
Sudden onset of pain* 8(62%) 47 (46%) appendicitis.4 A meta-analysis of three trials showed a trend
Mean pain score(0-l0)t 64(1 9) 6 2 (2 0) towards a lower risk of complications in the antibiotic-treated
Body temperature (>37°C) 6(46%) 29 (29%) groupthan in the surgical group.6 However, results of these
Lower-right quadrant-rebound tenderness 7(54%) 46(46%) trials had several protocol design limitations, especiallythe
Biological -findings
loose criteria chosen for the definition of acute appendicitis­
Leucocyte counts (109/L) 13 9(33) 13 5(37)
diagnosis of acute appendicitis was based on clinical
High CRP concentration+ 9(90%) 64(67%)
examination,"the clinical-biological score,5 and
ultrasonography of the right iliac fossa,' but a CT scan before
Additional appendix CT nndings\
randomisation was not used to confirm the diagnosis. Because
Local caecal-wall thickening 1(8%) 15 (16%)
of absence of morphological investigation in the surgical
1 ntlammation of periappendiceal fat 8(67%) 40(43%)
group of two large trials, 10-15% of patientsdid not have
lntraluminal stercolith 6(50%) 13 (14%)
appendicitis,45 and 39-48% had complicated appendicitis.34
Data are means {SD) or numbers {%). We calculated percentages using non-missing data. Comparison of 13 caseswith
High rate of protocol violation was also a limitation in one
absence of improvement after antibiotictreatment versus 102 without appendicectomy during the first month.
VAS=visual analogue scale. CRP=C-reactive protein. *Ali patients had abdominal pain, but only some presentedwith study-50% of patients allocated to antibiotic treatment
sudden onset pain. tPain assessedwith the visual analogue score >4. :j:High C reactive protein denotes concentrations underwent appendicectomy immediately after
above normal values as defined by hospital laboratories. §CT findings additional to inclusion and exclusion criteria randomisation.' Rate of patients lost to follow-up by 1 year in
two trials were problematic:34 in one the rate was very high'
{appendix diameter >6 mm and no extra luminai gas, periappendiceal fluid, and disseminated intraperitoneal fluid).

Table 6: Association between risk factors and absence of improvement of appendicitis in the and in the other it was not clearly reported. 3Therefore,
antibiotic-treatment group results from these studies might underestimate the true
recurrence rate. Consequently, whether antibiotics are a
genuinely valid alternative to appendicectomy for treatment
no appendicitis, which compares favourably with the
of acute uncomplicated appendicitis remains unclear.
10-15% reported in two previous studies.45
The study was limited by the short follow-up period. lnterpretation
Recurrence of appendicitis might have continued after Our trial is the first trial in which patients were included and
one year. Masking of participants or clinicians to randomised patients only after proven diagnosis of acute
treatment allocation was not possible, and research uncomplicated appendicitis by CT scanning. Treatment with
assessors were also not masked. amoxicillin and clavulanic acid was not as effective as
In our trial, two-thirds of patients in the antibiotic group emergency appendicectomy for treatment of acute
who needed an appendicectomy during the 30 days after appendicitis. Our results show that exploration of predictive
treatment mlt1at10n had complicated appendicitis, markers on CT scans might allow improvement in patient
consistent with previous studies.34 This finding could be selection for antibiotic-based treatment.
interpreted as a failure of the antibiotics to prevent
complications after non-operated acute uncomplicated
appendicitis; however, if this were the case, the rate of patients with complicated appendicitis who were
complicated appendicitis discovered during appendi­ erroneously included and randomised. Distinction
cectomy in the antibiotic group would be expected to be between uncomplicated and complicated appendicitis
higher than that identified in the appendicectomy group. remains difficult even with multiple-detector CT
In fact, complicated appendicitis was less frequent in the scans.21 22 Morphological diagnosis of appendiceal
antibiotic group than in the appendicectomy group perforation depends on indirect but late signs, which
(table 2). Altematively, complicated appendicitis might are very specific but have a low sensitivity; however,
already have been present in these patients at the time of Tsuboi and colleagues" have suggested that morph­
randomisation, despite not being diagnosed on CT scan, ological diagnosis could be improved. Additionally, in
and some were successfully treated with amoxicillin plus our trial and other reports, visualisation of a stercolith
clavulanic acid. on the initial CT scan predicted bath complicated
Therefore, our finding that antibiotic treatment with appendicitis in patients treated with appendicectomy 22
0 amoxicillin plus clavulanic acid was inferior relative to and failure in the antibiotic group.24 Even though
(.9
LJ.J appendicectomy in patients with uncomplicated acute complicated appendicitis can also be cured with
a:
(.9 appendicitis might be related to the small proportion of antibiotics, further trials of such treatment of acute
LJ.J
a:
CO
0 1578 www.thelancet.com Vol 377 May 7, 2011
z
a:
LJ.J
>
en
z
0
fC=
0
LJ.J
@

220
ARTICLE 4 - LCA 2012

appendicitis should focus on use of new diagnostic 8 Ming PC. Yan TY. Tat LH. Risk factors of postoperative infections
techniques for improved patient selection. in adu1ts with complicated appendicitis.
Surg Laparosc Endosc Percutan Tech 2009; 19: 244--4,'l.
The inferiority of antibiotic treatment versus 9 Parker MC. Ellis H, Maran BJ, et al. Postoperative adhesions:
appendicectomy could be also related to appendicitis ten-year follow-up of12,584 patients undergoing lower abdominal
resistant to amoxicillin plus clavulanic acid. Evidence surgery. Dis Colon Rectum 2001; 44: 822-29.
10 Leung TT, Dixon E, Gill M, et al. Bowel obstruction following
shows that resistance of Escherichia coli to this antibiotic appendectomy: what is the !rue incidence? Ann Surg 2009;
combination is increasing." Third-generation cepha­ 250: 51-53.
losporins could be used, although they are not yet 11 Pickhardt PJ, Levy AD, Rohrmann CA Jr., Kende Al. Primary
neoplasms of the appendix manifesting as acute appendicitis:
recommended. 26 cr findings with pathologie comparison. Radiology 2002; 224: 775-81.
Nearly a quarter of our patients who recovered after 12 Pelaez N, Pera M, Courtier R, et al. Applicability, safety and efficacy
antibiotic treatment had recurrence of appendicitis; this ofan ambulatory treatment protocol in patients with uncomplicated
finding is more than the 14% reported in previous acute diverticulitis. Cir Esp 2006; 80: 369-72.
13 Schug-Pass C, Geers P, Hugel 0, Lipperl H, Kockerling F.
studies.34 This difference could be explained by the high Prospective randomized trial comparing short-term antibiotic
rate of patients lost to 1-year follow-up in previous trials." therapy versus standard therapy for acute uncomp1icated sigmoid
Our results suggest that emergency appendicectomy diverticulitis. !nt J Colorectal Dis 2010; 25: 751-59.
14 Fraser JD, Aguayo P, Leys CM, et al. A complete course of
remains the gold standard for treatment of acute intravenous antibiotics vs a combination ofintravenous and oral
uncomplicated appendicitis (panel). antibiotics for perforated appendicitis in children: a prospective,
randomized trial. J Pediatr Surg 2009; 45: 1198-202.
Con tributors
15 Lingreen R, Grider )S. Retrospective review ofpatient self.reported
OI conceived. designed, implemented, and led the study. CV, SM, KP,
improvemenl and post-procedure findings for rnild (minimally
ML BC, MK, AA, BD, and PV contributed ta the reauitrnent, clinical invasive lumbar decompression). Pain Physician 2010; 13: 555-60.
care, and follow-up of patients. OI, CB, and DF analysed and managed
16 Aguilo J, Peiro S, Munoz C, et al. Adverse outcomes in the surgical
data. SM re-read all cr scans. BF designed the plan for statistical analysis, treatrnenl of acute appendicitis. Cir Esp 2005; 78: 312-17.
and CB did the statistical analysis. CV, CB, BF, and DF drafied the report,
17 Ingraham AM, Cohen ME, Bilimoria KY, PrittsTlA, Ko CT.
contributed to the interpretation ofresults, and prepared the report. Ali Esposito TJ. Comparîson ofoutcomes after laparoscopie versus
authors revîewed and approved the final version ofthe manuscript. open appendectomy for acute appendicitis al 222 ACS NSQIP
Conflicts of interest hospitals. Surgery 2010; 148: 625-35.
We declare that we have no conflîcts of interest. 18 Piaggio G. Elbourne DR, Altman DG, Pocock SJ, Evans SJ.
Reporting ofnoninferiority and equivalence randomized trials: an
Acknowledgments extension ofthe CONSORT slalement. JAMA 2006; 295: 1152-60.
We thank A Moschetto for help with identification ofpatients los! ta 19 Altman DG, Gore SM, Gardner MJ, Pocock SJ. Statistical guidelines
follow-up; Solene Fabre for her contribution to data management; for con tributors to medical journals. In: Altman DG, Machin D,
Laurent Becquemont for his constant support; and D Poussin, Bryant TN, Gardner MJ, eds. Statistics with Confidence: Confidence
R Balzarotti, A Carloni, J M Proske, I Dagher, S Gueroult, J M T hillois, Intervals and Statistical Guidelines. 2nd edn. London: BMJ Books;
P Taleb, S Servadjian, J L Bouillot, I Lorand, F Gayral, A Laurent, and 2000: 171-90.
D Cherqui for their contributions to the study. This trial was supported 20 Horion MD, Counter SF, Florence MG, Hart M). A prospective trial
by a granl from the Projet Hospitalier de Recherche Clinique of the of computed tomography and ultrasonography for diagnosing
French Ministry of Health (AOR 02 063) and Assistance appendicitis in the atypical patient. Am J Surg 2000; 179: 379-81.
Publique-Hôpitaux de Paris. 21 Pinto Lei te N, Pereira JM, Cunha R, Pinto P, Sirlin C. cr evaluation
of appendicitis and its complications: imaging techniques and key
References diagnostic findings. Am J Rœntgeool 2005; 185: 406-17.
1 Livingston EH, Woodward WA, Sarosi GA. Haley RW. Disconnecl 22 Bixby SD. Lucey BC, Soto )A, T heysohn JM, Ozonoff A.
behveen incidence ofnonperforated and perforated appendîcîtis: Varghese JC. Perforated versus nonperforated acute appendicîtîs:
implications for pathophysiology and management. Ann Surg 2007; accuracy ofmultidetector CT detection. Radiology 2006; 241: 780-86.
245: 886-92.
23 Tsuboi M, Takase K, Kaneda !, et al. Perforated and nonperforated
2 Eriksson S, Granstrom L. Randomized controlled trial of appendicitis: defect in enhancing appendiceal wal1: depiction with
appendicectomy versus antibiotic therapy for acute appendicitis. multi-detector row CT. Radiology 2008; 246: 142-47.
Br J Surg 1995; 82: 166-69.
24 Shindoh J, Niwa H, Kawai K, et al. Predictive factors for negative
Styrud ), Eriksson S, Nilsson I. et al. Appendectomy versus outcomes in initial non-operative management ofsuspected
antibiotic treatment in acute appendicitis: a prospective multicenter appendicitis.J Gastrointest Surg2009; 14: 309-14.
randomized controlled trial. WorldJ Surg 2006; 30: 1031-37.
25 Pitout JDD, Laupland KB. Extended-spectrum J,-lactamase-producing
4 Hansson ), Korner U, Khorram-Manesh A, Solberg A, Lundholm K. Enterobaderiaœae: an emerging public-health concern.
Randomized clinical trial of antibiotic therapy versus Lancet Infect Dis 2008; 8: 159-66.
appendicectomy as primary treatment of acute appendicitis
26 de Kraker ME, Wolkewitz M, Davey PG et al. Burden of
in unselected patients. BrJ Surg 2009; 96: 473-81.
antimicrobial resîstance in European hospitals: excess mortalîty and
5 Malik AA, Bari SU. Conservative management of acute length ofhospital stay associated with bloodstream infections due
appendicitis. J Gastroint<st Surg 2009; 13: 966-70. to Escherichia coli resistant to third-generation cephalosporins.
6 Varadhan KK, Humes DJ, Neal KR, Labo DN. Antibiotic therapy J Antimicrob Cliemother 2010; 66: 398---4-07.
versus appendectomy for acute appendicitis: a meta-analysis.
World J Surg 2010; 34: 199-209.
7 Konstantinidis KM, Anastasakou KA. Varias MN, Sambalis GH,
Georgiou MK, Xiarchos AG. A decade of1aparoscopic
appendectomy: presentation ofl,026 patients with suspected
appendicitis treated in a single surgica1 department.
J Laparoendosc Adv Surg Tech A 2008; 18: 248-58.

www.thelancet.com Vol 377 May 7, 2011 1579

221
iKB LECTURE CRITIQUE D'ARTICLE

QCM
1
1 Parmi les propositions suivantes, quelle(s) est(sont) celle(s) dont les informations
sont contenues dans le titre de cette étude ?
A - La population d'étude.
B - L'intervention.
C - Le groupe contrôle.
D - Le critère de jugement principal.

1
E - Le type d'étude et son design.

QCM
Quel est l'objet de cet article ?
2
A - Evaluation d'une stratégie diagnostique de l'appendicite aiguë.
B - Evaluation d'une stratégie thérapeutique de l'appendicite aiguë.
C - Evaluation d'une stratégie de dépistage de l'appendicite aiguë.
D - Evaluation et recherche de facteurs pronostiques de l'appendicite aiguë.
E - Evaluation de la prévalence des appendicites aiguës non compliquées vues aux urgences.

QCM 1 Quel est l'objectif de cette étude ?


3
A - Evaluer le meilleur traitement de l'appendicite aiguë entre chirurgie et antibiothérapie.
B - Montrer que !'antibiothérapie est supérieure à la chirurgie dans la prise en charge de
l'appendicite aiguë non compliquée, sur le risque de péritonite à 30 jours.
C - Montrer que !'antibiothérapie est au moins aussi efficace que la chirurgie dans la prise en charge
de l'appendicite aiguë non compliquée, sur le risque de péritonite à 30 jours.
D - Montrer que !'antibiothérapie est équivalente à la chirurgie dans la prise en charge de
l'appendicite aiguë non compliquée, sur le risque de péritonite à 30 jours.
E - Montrer que !'antibiothérapie est inférieure à la chirurgie dans la prise en charge de l'appendicite

1
aiguë non compliquée, sur le risque de péritonite à 30 jours.

QCM Quel(s) est(sont) le(s) élément(s) qui est(sont) en faveur du caractère éthique et
4 justifié de cette étude ?
A - Le traitement antibiotique n'avait jamais été correctement évalué dans cette pathologie.
B - Il y a des arguments qui existent a priori pour l'efficacité du traitement antibiotique.
C - Il existe des bénéfices a priori pour le traitement antibiotique (moins de complications).
D - L'antibiothérapie est un traitement non invasif.

1
E - Il v a eu approbation par un comité d'éthique.

QCM Parmi les proposition(s) suivante(s), quelle(s) est(sont) celle(s) qui


5 correspond(ent) à des critères d'inclusion dans cette étude ?
A - Etre majeur.
B - Etre un homme.
C - Ne pas être allergique aux bêta-lactamines.
D - Présenter une appendicite aiguë non compliquée au scanner.
E - Ne pas avoir de contre-indications à la réalisation d'un scanner avec injection de produit de

1
contraste iodé.

QCM Pour quelle(s) raison(s) les patients incapables de comprendre le protocole de


0 6 l'étude ont-ils été exclus de cette étude ?
(.9
LJ.J
a: A - Ils ne pouvaient pas donner leur consentement éclairé.
(.9

LJ.J
B - Il y avait un risque de biais de sélection.
a: C - Ils pouvaient ne pas être compliants/observants au protocole.
CO
0
D - Il y avait un risque de biais de classement.
z
a:
LJ.J E - Il y avait un risque de surestimation de l'efficacité de la chirurgie par rapport à !'antibiothérapie.
>

@
en
z
0
fC=
0
LJ.J

222
ARTICLE 4 - LCA 2012

QCM
7
1 Pourquoi cette étude a-t-elle du être réalisée en ouvert?
A - Car il s'agit d'une étude de non-infériorité.
B - Car l'un des traitements à l'étude était la chirurgie.
C - Car cela améliore le suivi des patients.
D - Car le fait de mettre en place un aveugle n'aurait pas été éthique.
E - Car cela coûte moins chez que de mettre en place un aveugle.

QCM
8
1 Quelle(s) est(sont) la(les) caractéristique(s) du critère de jugement principal?
A - Critère unique.
B - Critère composite.
C - Critère objectif.
D - Critère cliniquement pertinent.
E - Critère intermédiaire.

QCM 1 Le critère de jugement principal n'est pas évalué de la même manière dans les deux
9 groupes de patients. Quel(s) biais cela peut-il engendrer?
A - Biais de sélection.
B - Biais de classement.
C - Biais d'évaluation.
D - Biais de confusion.

1
E - Biais d'attrition.

QCM Dans l'article, les auteurs évoquent le promoteur de l'étude. Quel(s) est(sont)
10 son(ses) rôle(s)?
A - Il doit assurer le recrutement des patients.
B - Il doit contracter une assurance si cette dernière est nécessaire.
C - Il doit assurer le financement de l'étude.
D - Il doit assurer le suivi des patients inclus dans l'étude.
E - Il doit recueillir les autorisations nécessaires pour le déroulement de l'étude.

QCM J Quelle est l'incidence globale de la péritonite à 30 jours dans cette étude?
11
A- 2%
B- 5%
C- 8%
D- 10%

1
E- 20%

QCM Concernant le résultat du critère de jugement principal, quelle(s) est(sont) la(les)


12 proposition(s) vraie(s)?
A - Il a pu être obtenu chez l'ensemble des patients inclus dans l'étude.
B - Il est plus fréquent dans le groupe traitement antibiotique.
C - Il est significativement plus fréquent dans le groupe traitement antibiotique.
D - Vous pouvez conclure à la non-infériorité du traitement antibiotique par rapport à la chirurgie.
E - Vous pouvez conclure à la supériorité du traitement antibiotique par rapport à la chirurgie.

223
iKB LECTURE CRITIQUE D'ARTICLE

QCM I Quel(s) est(sont) le(s) facteur(s) associé(s) à un risque augmenté d'appendicite


13 compliquée?
A- L'âge.
B - Le sexe masculin.
C - Une température > 37 ° C.
D - La présence de stercolithes au scanner préopératoire.

1
E - Une CRP élevée.

QCM Quelle(s) explication(s) les auteur(s) donnent-ils pour expliquer le résultat négatif de
14 leur étude concernant le critère de jugement principal?
A- Existence de patients avec appendicite aiguë compliquée inclus (par erreur) dans l'étude.
B - Résistance de l'infection aux antibiotiques utilisés dans cette étude.
C - Le fort taux de perdus de vue dans leur étude.
D - Une durée de suivi trop courte.

1
E - Ils n'en donnent aucune explication dans l'article.

QCM La limitation que signalent les auteurs concernant le choix du traitement médical
15 vous paraît-elle pertinente?
A- Oui, le choix de l'antibiotique utilisé était discutable du fait de l'existence de résistances.
B - Oui, un autre traitement antibiotique aurait pu être choisi.
C - Non, car le traitement antibiotique alternatif évoqué par les auteurs n'est pas encore
recommandé.
D - Non, car ce n'est pas cet élément qui pourrait expliquer le résultat négatif de cette étude
concernant le critère de jugement principal.
E - Non, car il s'agit probablement d'un manque d'observance des patients du groupe traité par
antibiotiques seuls.

0
(.9
LJ.J
a:
(.9

LJ.J
a:
CO
0

z
a:
LJ.J
>

@
en
z
0
fC=
0
LJ.J

224
ARTICLE 4 - LCA 2012

Grille de correction QCM


(Questions à choix multiples)

....
A-
.
V Réponse: ABCE

::!!: C-
B- V
V .
Le titre d'un article doit être court (10-15 mots maximum), concis et précis.
Les éléments qui doivent y figurer sont souvent regroupés sous l'acronyme
0 D-
(.)
F «PICO» pour Population (ou maladie étudiée), Intervention, Contrôle,
Outcome (critère de jugement principal), auquel on ajoute souvent le type d'étude
E- V (et son design). Le résultat de l'étude ne doit en revanche pas y figurer.

N
A-
B-
F
V .
Réponse: B
L'objet d'un article médical est ce sur quoi porte cet article (de quel sujet traite-t-

.
::!!: C- F il?). Il ne faut pas le confondre avec l'objectif de l'étude !
(.)
0 D- F Par ailleurs, il est à noter qu'un même objet d'étude peut être abordé avec
E- F différents plans expérimentaux (façon dont l'étude est menée à bien).

.
A- F Réponse: C
M B- F Une étude de non-infériorité a été menée ici, où la question posée par les
::!!: C- V auteurs est de savoir si !'antibiothérapie est au moins aussi efficace (= non
(.)
0 D- F inférieure) à la chirurgie (qui est le traitement de référence) dans la prise en charge
E- F de l'appendicite aiguë non compliquée.
A-
B- V .
V Réponse: ABCDE
Les études de non-infériorité doivent être justifiées a priori, car elles nécessitent un
C-
D-
V
V .
design et une méthodologie particulière.
Les nouveaux traitements développés sur le marché ont souvent la même
"'" efficacité (les progrès sont minimes sur le plan thérapeutique) mais apportent
d'autres bénéfices (voie d'administration plus adaptée, moins de prises
::!!:
(.) quotidiennes, ... ). C'est dans ce sens que les études de non-infériorité sont
0
E- V . intéressantes.
Ici, le traitement de référence est la chirurgie et on peut difficilement faire mieux
(d'où l'étude de non-infériorité). En revanche, avec !'antibiothérapie, on peut
espérer diminuer les complications postopératoires, et donc améliorer la qualité de
vie du patient voire réduire la durée d'hospitalisation.
A-
B-
V
F .
Réponse: ACDE
Les critères d'inclusion sont présentés dans la partie « Méthodes» de l'article. Ils
Lt) C- V permettent, avec les critères de non-inclusion et d'exclusion, de définir la

.
::!!: D- V population source à partir de laquelle la population d'étude sera échantillonnée.
(.)
0 Les critères d'inclusion doivent tous être présents pour pouvoir participer à
E- V
. l'étude.
Les critères de non-inclusion doivent tous être absents.

.
A- V Réponse: AC
ID B- F Les patients incapables de comprendre le protocole ne pouvaient donner un

.
::!!: C- V consentement éclairé et donc suivre le protocole correctement.
(.)
0 D- F Il n'y a pas de notion de biais à introduire ici, car ces éléments sont indépendants
E- F du déroulement de l'étude et de la pathologie étudiée (appendicite aiguë).
A-
..... B-
F
V .
Réponse: BD
L'aveugle dans cette étude n'était pas possible et n'aurait pas été éthique, car
::!!: C-
0 D-
(.)
F
V . l'un des traitements à l'étude est la chirurgie.
Ainsi, il n'est pas éthique de faire des chirurgies « blanches » chez des patients
uniquement pour le maintien de l'aveugle = les risques sont beaucoup trop
E- F importants.
CO A-
::!!: B-
(.)
V
F .
Réponse: ACD
Le critère de jugement principal est la survenue d'une péritonite dans les 30
0 C- V jours suivants l'inclusion.

225
iKB LECTURE CRITIQUE D'ARTICLE

D- V . C'est un critère unique, objectif, cliniquement pertinent, plutôt fiable.


E- F
A-
B- V .
F Réponse: BC
Il existe trois grands types de biais : biais de sélection, biais de classement et
a, C- V biais de confusion. D'autres biais existent, mais qui sont des «sous-types» de

.
::!!: ces trois grands types de biais.
(.) D- F
0 Ici, du fait d'une évaluation différentielle du critère de jugement principal dans les
E- F deux groupes de patients à l'étude, on parle de biais d'évaluation, qui fait lui-
même partie des biais de classement.
A-
B-
F
V .
Réponse: BCE
Deux personnages importants dans les essais cliniques : le promoteur et

....
0
C-
D-
V
F . l'investigateur.
Le promoteur est une personne morale qui finance le déroulement de l'étude,
::!!: recueille les autorisations nécessaires à son déroulement, contracte une
(.) assurance obligatoire et désigne l'investigateur. Ce dernier a en charge la
0 rédaction du protocole de l'étude, le recrutement et le suivi des patients de l'étude,
E- V ainsi que la production des résultats. L'investigateur est généralement un
médecin, mais peut être un non-médecin, alors désigné par le CP P comme
personne compétente.
A- F
........ B-
::!!: C-
(.)
F .
V Réponse: B
L'incidence de la péritonite dans le groupe chirurgie est de 2% (9/119), de 8%
0 D- F dans le groupe antibiotique (9/12 0) et donc au global elle est de 11/2 39 soit 5%.
E- F
A-
B- V .
F Réponse: BC
Le critère de jugement principal n'a pas pu être obtenu chez 9 patients dans
....
N C-

::!!: D-
V
F . l'étude.
Il existe significativement plus de péritonites à 30 jours dans le groupe ATBpar
(.)
0
E- F
. rapport au groupe chirurgie (IC95% ne contient pas la valeur 0).
En revanche, on ne peut pas conclure à la non-infériorité du traitement ATBpar
rapport à la chirurgie car la borne supérieure de l' IC95% dépasse la valeur de 10%
(borne de non-infériorité définie a priori par les auteurs).
A-
B-
F
F .
Réponse: D
Il s'agit de répondre en utilisant les données du tableau V, mais surtout les
.... C- F explications fournies par les auteurs dans la discussion, où ils détaillent les
::!!: D-
(.)
0
V
. résultats de ces analyses.
Le seul facteur associé à un risque augmenté d'appendicite compliquée était la
E- F présence de stercolithes au scanner préopératoire (analyse en régression
logistique).

.
A- V Réponse: AB
...."'" B-
.
V Ces éléments sont évoqués par les auteurs dans la discussion de l'article.
::!!: C- F Une durée de suivi plus longue n'aurait rien changé à la mesure du critère de
(.)
0 D- F jugement principal car ce dernier concerne la survenue d'une péritonite dans les
E- F 30 jours suivant la prise en charge initiale.
A-
.
V Réponse: AB
Oui, cette limitation évoquée par les auteurs est légitime. En effet, il existe des
B- V
.... résistances connues à E. Coli pour l'association amoxicilline-acide clavulanique, et
0
(.9 Lt)
LJ.J
a: cet antibiotique a tout de même été utilisé dans cette étude. Par ailleurs, un autre
(.9
::!!: C- F
traitement antibiotique est évoqué par les auteurs, possiblement plus efficace et
LJ.J (.)
a:

.
CO 0 surtout vis-à-vis duquel E. Coli présente peu de résistances.
0
D- F
z Peut-être que si les auteurs avaient utilisé les C3G, le résultat n'aurait pas été le
a:
LJ.J même!
>
en
E- F
z
0
fC=
0
LJ.J
@

226
Chapitre
38

ARTICLE 5 - LCA 2013

Breastfeeding is Associated with lmproved Child Cognitive Development:


A Population-Based Cohort Study
Maria A. Quigley, BA, MSc 1 , Christine Hockley, BA1 , Claire Carson, BSc, MSc, PhD1 , Yvonne Kelly, BSc, PhD2 ,
Mary J. Renfrew, RGN, SCM, DN, BSc, PhD3 , and Amanda Sacker, BSc, PhD2
Objective To assess the association between breastfeeding and child cognitive development in term and preterm
children.
Study design We analyzed data on white singleton children from the United Kingdom Millennium Cohort Study.
Children were grouped according to breastfeeding duration. Results were stratified by gestational age at birth: 37 to
42 weeks (term, n = 11 101 ), and 28 to 36 weeks (preterm, n = 778). British Ability Scales tests were administered at
age 5 years (naming vocabulary, pattern construction, and picture similarities subscales).
Results The mean scores for all subscales increased with breastfeeding duration. After adjusting for confounders,
there was a significant difference in mean score between children who were breastfed and children who were never
breastfed: in term children, a two-point increase in score for picture similarities (when breastfed 2:4 months) and
naming vocabulary (when breastfed 2:6 months); in preterm children, a 4-point increase for naming vocabulary
(when breastfed 2:4 months) and picture similarities (when breastfed 2:2 months) and a 6-point increase for pattern
construction (when breastfed 2:2 months). These differences suggest that breastfed children will be 1 to 6 months
ahead of children who were never breastfed.
Conclusions ln white, singleton children in the United Kingdom, breastfeeding is associated with improved cog­
nitive development, particularly in children born preterm. (J Pediatr 2012;160:25-32).

M
any studies have assessed the association between breastfeeding and child cognitive development. On average,
breastfed children have an IQ that is approximately 5 points higher than children who were never breastfed.1'2
Most studies are observational, however, and after adjustment for confounders, particularly maternai education
and maternai IQ, this effect is weaker.
Two large and rigorous studies of breastfeeding and cognitive development, with very different study designs, gave conflicting
results. In a US national cohort study of 5475 children of normal birth weight, ever being breastfed was associated with almost
a 5-point higher child IQ, but this decreased after adjustment for confounders (mean difference, 0.5; 95% CI, -0.2-1.2).3 In
a cluster randomized trial of an intervention aimed at the promotion of breastfeeding in 13 889 children in Belarus, there
was a 6-point difference in the cluster-adjusted mean IQ between the intervention and contrai arms,4 suggesting that the inter­
vention was associated with a higher IQ.
Few studies of cognitive development have assessed whether there is a dose-response relationship for bath any breastfeeding
and exclusive breastfeeding. Here we present data for the association between the duration of any breastfeeding and exclusive
breastfeeding on cognitive development at age 5 years in a UK cohort of 11 879 children. We have adjusted for many factors
from pregnancy and throughout the life course of the child, which were potentially associated with cognitive development. Our
study is unique in that we stratified the population according to prematurity at birth. Prematurity is strongly associated with
infant feeding5-7 and cognitive development,8 and earlier studies have observed a larger effect of breastfeeding on cognitive
development in children barn preterm than in children barn at term.1'2

Methods
Millennium Cohort Study
The Millennium Cohort Study (MCS) is a nationally representative UK longitu­
dinal study of 18 818 infants barn in the United Kingdom.9 A random two-stage
sample of ail infants barn in England and Wales between September 2000 and Au­ From the 1National Perinatal Epidemiology Unit,
gust 2001 and in Scotland and Northern Ireland between November 2000 and Jan­ University of Oxford, Oxford, United Kingdom; 21nstitute
for Social and Economie Research, University of Essex,
uary 2002 who were alive and living in the United Kingdom at age 9 months was Essex, United Kingdom; and 3Mother and Infant
Research Unit, University of York, York, United Kingdom
Funded by the Policy Research Programme in the
Department of Health. The views expressed are not
necessarilythose of the Department. The authors declare
BAS British Ability Scales
no conflicts of interest.
MCS Millennium Cohort Study
NVQ National Vocational Qualification 0022-3476/$ - see front matter. Copyright© 2012 Mosby Inc.
Ali rights reser\led. 10.1016/j.jpeds.2011.06.035

25

227
iKB LECTURE CRITIQUE D'ARTICLE

drawn from Child Benefit registers. Child Benefit daims in the Children from non-white ethnie groups were excluded
United Kingdom caver virtually all children, except those in­ because of concerns about the validity of the BAS assessments
eligible because of recent or temporary immigrant status. The in these groups.11'12 In the MCS, the BAS assessments were
MCS does not caver births in which the infant died within the only available in English or Welsh, so we also excluded chil­
first 9 to 10 months after birth, but these constituted <1% of dren who did not speak English at home. Children who were
all births. 10 Stratified sampling by electoral ward (defined barn extremely preterm (gestation <28 weeks) were excluded
geographical area) was used, with over-sampling of ethnie mi­ because they are more likely to have had complex feeding
nority and disadvantaged areas. Children were recruited at patterns and developmental problems that may not have
approximately age 9 months (sweep 1), and detailed informa­ been accurately captured in the MCS data.
tion was collected on a range of socioeconomic and health fac­ Of the 18 818 children recruited at sweep 1, we excluded
tors with parental interview. Parents were interviewed again 522 multiples, 37 children for whom data were not available
when the children were 3, 5, and 7 years of age (sweeps 2-4). on their natural mother, 244 children with gestational age
<28 weeks or missing, 79 children with implausible data on
Infant Feeding. Breastfeeding initiation was assessed by birth weight, gestational age, or bath, and 3117 children
the sweep 1 question, "Did you ever try to breastfeed your who were not white. This yielded an eligible study population
baby?" Breastfeeding duration and exclusivity were estimated of 14 819 children recruited at sweep 1, of whom 11 951
by using the sweep 1 questions about the age of the infant (81%) participated in sweep 3. A further 72 children were ex­
when last given breast milk and when first given formula, cluded because they did not speak English at home at sweep 3.
other types of milk, and solid foods. Breastfeeding duration Thus, the study population was based on 11 879 children
after sweep 1 was assessed by using the sweep 2 question, (11 101 who were barn at term and 778 barn preterm). The
"How old was the child when s/he last had breast milk?" number of children with data on BAS subscales at sweep 3
The duration of "any breastfeeding" (ie, exclusive or partial was 11 705 for naming vocabulary, 11 720 for picture similar­
breastfeeding) and "exclusive breastfeeding" were grouped ities, and 11 658 for pattern construction (ie, 79% of the
in 2-month bands: never breastfed; <2.0 months; 2.0 to 3.9 eligible population who were recruited in sweep 1).
months; 2::4.0 months (exclusive breastfeeding for 4-6
months was recommended at the time of the study). In the Statistical Methods
term group, numbers were large enough for us to separate All analysis was conducted separately in children who were
children who were breastfed 2::4 months as: 4.0 to 5.9 months, barn at term (gestation 2::37 completed weeks) and children
6.0 to 11.9 months, and 2::12.0 months. No information was who were barn preterm (gestation 28-36 weeks). The mean
available about the types of formula fed to children who never BAS score for each subscale was estimated in each breastfeed­
were breastfed or in whom breastfeeding was supplemented. ing group. Linear regression was used to estimate the differ­
ence in mean BAS scores across breastfeeding groups after
Cognitive Development. Cognitive development was adjustment for baby's sex, birth weight, and gestational age
assessed at sweep 3 by using the British Ability Scales (BAS) at birth (in weeks), and the following potential confounders
Second Edition, which is a battery of individually administered and mediators.
tests of cognitive abilities and educational achievements First, adjustment was made for these pregnancy-related
suitable for use from ages 2 years 6 months to 17 years 11 and sociodemographic confounders: whether the pregnancy
months.11 '12 The tests have been validated by comparing the was planned; whether the baby was the first barn for the
results of the tests with the original version of BAS, the Wesch­ mother; maternal alcohol use (never, low, moderate, high 13 )
ler intelligence scale, and Wechsler Objective Reading Dimen­ and smoking in pregnancy (non-smoker, gave up when preg­
sions.11 Three BAS subscales were used in the MCS (naming nant, and <10, 10-19, 20-29, or 2::30 cigarettes per day);
vocabulary, picture similarities, and pattern construction); whether the baby had special/intensive care at birth; maternal
these assess core aspects of verbal abilities, pictorial reasoning, age (<20, 20-24, 25-29, 29-34, or 2::35 years); marital status of
and spatial abilities. The subscales are robust and individually mother (married, co-habiting, lone parent); and maternal
interpretable, helping us to understand the child's abilities in education (grouped as "no qualification/other" or one of 5
the 3 most significant information-processing skills.12 Trained National Vocational Qualification [NVQ] groups: NVQ 1
interviewers measured the subscales directly from the MCS and 2, equivalent to qualifications at the end of compulsory
children by using Computer-Assisted Personal Interviewing. schooling at age 16 years; NVQ 3, equivalent to "A level" qual­
The tests were not performed when the child had a learning dis­ ifications at the end of secondary school at age 18 years; NVQ
0
(.9
ability or severe behavioral problem or when the child did not 4, bachelor's degree or equivalent; NVQ 5, postgraduate
LJ.J
a: have the required level of English or Welsh vocabulary (the degree/diploma); social class (highest of mother/partner
(.9

LJ.J
tests were administered in these languages only). coded with the United Kingdom National Statistics Socio­
a: economic Class with 4 groups: managerial/professional,
CO
0
Exclusions and Loss to Follow-up. The analysis focused intermediate, routine/manual, never worked/long-term un­
z
a:
LJ.J
on the effects of breastfeeding in white, singleton children with employed); and whether languages other than English were
> a gestational age at birth of at least 28 completed weeks, for spoken in the household. Variables in this group were in­
en
z
0 whom the main respondent was the child's natural mother. cluded in the models when they were significantly (P < .05)
fC=
0
LJ.J 26 Quigley et al
@

228
ARTICLE 5 - LCA 2013

associated with the outcome after adjustment for other socio­ using the age-equivalents derived for the MCS
demographic and pregnancy-related variables in the model; population. 17' 18 For example, in a 1-month period, we
this model is referred to as partially adjusted. would expect the BAS scores of a typical 5-year-old child to
Second, adjustment was made for these potential mediators increase by 0.83 for naming vocabulary, 0.62 for picture
related to parenting and early years learning: mother's and fa­ similarities, and 1.81 for pattern construction. We also
ther's parenting beliefs and time spent doing childcare activ­ tested whether breastfeeding had a different association
ities as reported at sweep l; Condon maternal attachment with cognitive development in boys compared with girls, 19
questionnaire 14 at sweep l; frequency of mother and father but the interaction was not statistically significant and was
doing activities with the child at sweep 3 (eg, reading, draw­ not included in the models.
ing); mother's perceived parenting competence at sweep 3; All analyses allowed for the clustered, stratified sample by
maternal depression measured by using the Malaise Inventory using the "survey commands" in Stata software version 10
score 15 at sweep 1 and Kessler questionnaire 16 at sweep 3; (Stata Corporation, College Station, Texas). Thus, all Cls
child care at sweep 1 (none, nursery, child minder, informal); and P values account for clustering, and all proportions,
child's age in months when started formal child care (nursery, means, and regression coefficients are weighted by using
child minder, pre-school); and number of months since child sweep 3 weights. These weights allow for non-response at all
had started school and whether full-time or part-time. Vari­ sweeps. Non-response at sweep 3 was the largest source of
ables in this group were added to the partially adjusted models missing data. Of the children included in the analysis, <5%
when they were significantly (P < .05) associated with the had missing data on most of the potential confounders and
outcome after adjustment for the other parenting and early mediators. The only exception was for children in lone­
years variables; these models are referred to as fully adjusted. parent households who had data missing from fathers; these
A variable was considered statistically significant when any children were included as a separate category of the parenting
of its CO-efficients yielded a Wald test P value <.05. The vari­ variables for fathers.
ables that remained in the partially and fully adjusted final
models are given in the footnotes to Tables I and II. Finally, Results
the co-efficients from the fully adjusted regression models
were expressed as the equivalent progress one would expect Table III shows the descriptive characteristics in the term
in a month in an average 5-year-old child; this was clone by (n = 11 101) and preterm (n = 778) groups. Eight percent

Table I. Regression coefficients showing difference in mean BAS scores for breastfed compared with never breastfed
children (barn at term)
Any breastfeeding (partial or exclusive) Exclusive breastfeeding
Crude Coefficient Partially adjusted Fully adjusted Fully adjusted
Duration of breastfeeding Mean (n) (95% Cl) coefficient' (95% Cl) coefficientt (95% Cl) coefficientt (95% Cl)
BAS naming vocabulary scale n =10 944 n=10 929 n=10 416 n=10 416
Never 106.5 (3825) Reference Reference Reference Reference
<2.0 months 110.2 (2901) 3.7 (2.8-4.6) 0.7 (-0.1-1.5) 0.7 (-0.1-1.5) 1.1 (0.4-1.9)
2.0-3.9 months 111.8 (1047) 5.4 (4.1-6.6) 1.2 (0-2.4) 1.2 (0-2.4) 1.0 (0-2.0)
4.0-5.9 months1 113.0 (889) 6.5 (5.1-7.9) 1.2 (0-2.5) 1.0 (-0.3-2.3)
6.0-11.9 months 114.1 (1392) 7.7 (6.5-8.8) 2.2 (1.2-3.2) 2.0 (1.0-3.0) 1.6 (0.6-2.5)
2:12.0 months 114.2 (890) 7.7 (6.6-8.9) 2.4 (1.3-3.5) 2.4 (1.3-3.6)
BAS picture similarities scale n=10 957 n=10 949 n= 10 526 n=10 641
Never 79.9 (3836) Reference Reference Reference Reference
<2.0 months 82.4 (2901) 2.5 (1.8-3.2) 1.4 (0.7-2.1) 1.4 (0.7-2.1) 1.4 (O.7-2.0)
2.0-3.9 months 82.6 (1047) 2.7 (1.7-3.7) 1.0 (0.1-1.9) 0.9 (0-1.9) 1.4 (0.6-2.2)
4.0-5.9 months1 83.8 (889) 4.0 (3.0-5.0) 1.8 (0.9-2.8) 1.7 (0.8-2.7)
6.0-11.9 months 84.1 (1393) 4.2 (3.2-5.2) 2.0 (1.0-3.0) 1.9 (0.9-2.9) 2.0 (1.1-3.0)
2:12.0 months 83.9 (891) 4.0 (3.0-5.0) 1.7 (0.7-2.7) 1.9 (0.9-2.8)
BAS pattern construction scale n =10 902 n=10 887 n= 10 678 n= 10 678
Never 85.4 (3812) Reference Reference Reference Reference
<2.0 months 88.5 (2885) 3.1 (2.0-4.2) 0.9 (-0.2-2.0) 1.0 (-0.1-2.1) 1.1 (0.1-2.1)
2.0-3.9 months 90.4 (1042) 5.0 (3.6-6.4) 1.7 (0.4-3.0) 1.7 (0.3-3.0) 2.1 (O. 9-3.4)
4.0-5.9 months1 92.2 (886) 6.8 (5.2-8.4) 2.5 (1.0-4.0) 2.4 (0.8-3.9)
6.0-11.9 months 92.1 (1389) 6.7 (5.2-8.2) 2.0 (0.6-3.4) 2.0 (0.5-3.4) 1.4 (0-2.8)
2:12.0 months 91.3 (888) 5.9 (4.3-7.6) 1.1 (-0.5-2.7) 1.0 (-0.6-2.6)

'Ali models were adjusted for gestation, birth weight, baby's sex, mother's age (BAS naming vocabulary and BAS picture similarities only), household socioeconomic status, mother's education,
whether the baby was firstborn (BAS naming vocabulary and BAS picture similarities only), alcohol in pregnancy (BAS naming vocabulary and BAS pattern construction only), smoking in pregnancy
(BAS pattern construction only), admission to neonatal intensive care unit (BAS naming vocabulary and BAS pattern construction only), and language spoken al home (BAS naming vocabulary only).
tAII models were adjusted as in • with additional adjustment for BAS naming vocabulary: maternai belief al sweep 1 in the importance of stimulation and regular eating and sleeping patterns;
maternai reading with chiId and getting child to obey instructions al sweep 3; maternai de pression al sweep 3; maternai parenting competence al sweep 3; and chiId care al sweep 1; and whether
full/part lime al school. BAS picture similarities: getting chiId to obey instructions al sweep 3; maternai depression al sweep 3; chiId care al sweep 1; and months since started school. BAS pattern
construction: maternai belief al sweep 1 in the importance of talking to a baby and regular eating and sleeping patterns; maternai telling staries to chiId, painting/drawing with the chiId and spends
plenty of lime with chiId al sweep 3; maternai depression al sweep 3; months since started school; and whether full/part lime al school.
+For exclusive breastfeeding results, this category is 2:4 months.

Breastfeeding is Associated with lmproved Child Cognitive Development: A Population-Based Cohort Study 27

229
iKB LECTURE CRITIQUE D'ARTICLE

Table II. Regression coefficients showing difference in mean BAS scores for breastfed compared with never breastfed
children (bom preterm)
Any breastfeeding (partial or exclusive} Exclusive breastfeeding
Crude coefficient Partially adjusted Fully adjusted Fully adjusted
Duration of breastfeeding Mean (n} (95% Cl} coefficient" (95% Cl} coefficientt (95% Cl} coefficientt (95% Cl}
BAS naming vocabulary scale n = 761 n = 760 n = 745 n = 745
Never 106.2 (292) Reference Reference Reference Reference
<2.0 months 108.2 (245) 2.0 (-1.0-4.9) 0.8 (-1.9-3.5) 0.6 (-2.2-3.3) 1.6 (-1.0-4.3)
2.0-3.9 months 111.4 (69) 5.2 (1.8-8. 7) 2.2 (-1.1-5.6) 1.9 (-1.4-5.3) 1.4 (-1.8-4.5)
2:4.0 months 115.5 (155) 9.3 (6.3 to12.2) 5.0 (2.2-7. 7) 4.6 (1.7-7.5) 4.2 (0.8-7.6)
BAS picture similarities scale n = 763 n = 762 n = 758 n = 758
Never 78.8 (295) Reference Reference Reference Reference
<2.0 months 80.8 (245) 2.0 (-0.4-4.4) 1.8 (-0.5-4.1) 2.0 (-0.3-4.4) 2.8 (0.6-4.9)
2.0-3.9 months 84.5 (68) 5.7 (2.6-8.7) 4.2 (0.9-7.6) 4.7 (1.5-7.9) 2.1 (-1.8-5.9)
2:4.0 months 84.2 (155) 5.4 (3.0-7.9) 3.5 (0.7-6.4) 4.0 (1.2-6.8) 4.9 (2.3-7.6)
BAS pattern construction scale n = 756 n = 755 n = 727 n = 727
Never 80.6 (289) Reference Reference Reference Reference
<2.0 months 85.1 (245) 4.4 (0.1-8. 7) 3.7 (-0.4-7.8) 3.1 (-1.0-7.2) 3.0 (-1.0-7.0)
2.0-3.9 months 89.2 (67) 8.6 (3.9-13.2) 7.1 (2.4-11.8) 6.1 (1.2-10.9) 7.3 (2.4-12.2)
2:4.0 months 89.3 (155) 8.7 (3.4-14.0) 6.2 (0.8-11.5) 6.0 (1.0-11.1) 7.2 (1.7-12.6)

*Ali models were adjusted for gestation, birth weight, baby's sex, mother's age (BAS naming vocabulary and BAS picture similarities only), mother's education, household socioeconomic status (BAS
picture similarities only), whether the baby was firstborn (BAS naming vocabulary only), whether pregnancy was planned (BAS naming vocabulary and picture similarities only), alcohol in pregnancy
(BAS pattern construction only), smoking in pregnancy (BAS pattern construction only).
tAII models were adjusted as in* with additional adjustment for
BAS naming vocabulary: maternai belief al sweep 1 in talking-a baby and the importance of stimulation; maternai depression al sweep 3.
BAS picture similarities: maternai reading with chi Id al sweep 3 and child care al sweep 1; BAS pattern construction: maternai painting/drawing with child al sweep 3; and getting child-obey in­
structions al sweep 3.

of mothers reported moderate or high alcohol consumption breastfed for at least 12 months (difference = 7.7, Table I).
in pregnancy, and 23% of mothers smoked in pregnancy. The difference in means between each of the breastfeeding
Fourteen percent of mothers were !one parents, and 7% of groups and the never breastfed group became substantially
mothers had postgraduate degrees. Many of these smaller when partially adjusted for confounders, most notably
characteristics were similar in the preterm group. As maternai education (data available on request) and social
expected, the most striking differences in the groups were class, and decreased further when fully adjusted. However,
for mean birth weight and having special care at birth. there remained a two-point difference between children who
Mothers in the preterm group were more likely to have were breastfed for at least 6 months and children who were
smoked in pregnancy and Jess likely to have postgraduate never breastfed. Breastfeeding for at least 4 months was
degrees. The preterm group was also Jess likely to have been associated with a two-point increase in score for picture
breastfed ever (63% versus 68%), breastfed for at least 4 similarities (Table I). Any length of breastfeeding was
months (22% versus 31%) and exclusively breastfed for at associated with at least a one-point increase in score for
least 4 months (11 % versus 16%) compared with the term pattern construction, but there was no clear trend with
group. The variables related to parenting and early years increasing breastfeeding duration. The proportion of children
learning that remained in any of the 6 (two gestational exclusively breastfed for at least 4 months increased with the
groups; 3 BAS subscales) fully adjusted models are shown in duration of any (ie, partial or exclusive) breastfeeding from
Table III. There were no striking differences in these 38% in children breastfed for 4.0 to 5.9 months, to 53% in
variables between the term and preterm groups. children breastfed for 6.0 to 11.9 months and 65% in children
Many of these characteristics were associated with breast­ breastfed for at least 12 months. The association between
feeding duration (Table III). There were striking associations exclusive breastfeeding and BAS scores was broadly similar to
between longer duration of breastfeeding and the pregnancy that for any breastfeeding; for brevity, only the fully adjusted
being planned, not smoking in pregnancy, older maternai results are shown (Table I).
age, not being a !one parent, higher levels of education, and
higher social class. Mothers who breastfed for at least 4 Association between Breastfeeding and BAS
months were more likely to read to their child daily (61%) Scores in the Preterm Group
compared with mothers who never breastfed (45%). The mean scores for picture similarities and pattern construc­
0
(.9 tion tended to be lower in the preterm group (Table II)
LJ.J
a:
(.9
Association between Breastfeeding and BAS compared with the term group (Table I). In the fully
LJ.J
Scores in the Term Group adjusted models for the preterm group, breastfeeding for at
a: In the children born at term, the mean naming vocabul ary score
CO least 2 months was associated with a 4-point increase in
0
increased with breastfeeding duration from 106.5 in children score for picture similarities and a 6-point increase in score
z
a:
LJ.J
who were never breastfed to 114.2 in children who were for pattern construction. Breastfeeding for at least 4 months
>
en 28 Quigley et al
z
0
fC=
0
LJ.J
@

230
ARTICLE 5 - LCA 2013

Table III. Descriptive characteristics of the study population according to gestational age groups and breastfeeding
duration groups
Gestational age Any breastfeeding duration (months}
Term Preterm Never <2.0 2.0-3.9 :2:4.0
n=11 101 n = 778 n = 4204 n = 3200 n = 1123 n = 3352
Pregnancy-related*
Baby was firstborn, % 42 46 36 50 47 41
Pregnancy not planned, % 42 46 55 42 35 30
Maternai smoking in pregnancy, % 23 30 52 41 35 20
Maternai alcohol in pregnancy,t % 8 9 8 8 8 9
Mean birth weight, kg (SD) 3.5 (0.5) 2.5 (0.6) 3.4 (0.6) 3.4 (0.6) 3.4 (0.6) 3.5 (0.5)
Female baby, % 49 45 50 47 50 49
Admission to special care, % 6 51 8 10 10 7
Sociodemographic
Mean maternai age,* years (SD) 29 (5.8) 29 (6.2) 27 (6.0) 28 (5.6) 30 (5.6) 31 (4.9)
Lane parent,* % 14 16 25 13 9 5
Speak only English at home,§ % 99 99 99 99 99 98
Maternai postgraduate education, % 7 4 3 6 7 11
High parental occupation,,% 51 46 29 48 61 73
Parenting-strong maternai beliefs on importance of*:
Talking to a baby, % 84 81 78 84 85 89
Stimulation for baby's development, % 66 62 58 67 68 73
Regular eating and sleeping patterns, % 52 51 52 55 55 49
Maternai parenting competence§
Believes to be very good/better than average, % 52 44 42 49 56 62
Maternai activities and discipline with the child§
Reading (daily), % 52 51 45 52 51 61
Tell staries (daily), % 12 11 12 12 11 11
Painting/drawing (daily), % 8 9 9 8 6 8
Child obeys instructions (always), % 54 51 51 55 55 55
lime spent with child (plenty/just enough), % 66 65 69 64 63 66
Maternai depression? % 31 35 34 33 31 27
Childcare*
No childcare, % 60 66 69 58 53 56
Nursery/childminder, % 18 14 9 17 24 26
Informai childcare, % 22 21 22 25 23 17
Schooling§
Attends full lime, % 97 96 96 97 97 96
Months at school, mean (SD) 6.9 (2.6) 6.9 (2.6) 6.8 (2.6) 7.0 (2.6) 7.0 (2.5) 6.9 (2.5)

For brevity, many variables have been dichotomized in this table, but all categories have been included in models.
*Measured al Sweep 1.
tModerate or high maternai alcohol in pregnancy.
;Kessler score e,4 indicating medium to high psychological distress.
§Measured al Sweep 3.
1Mother or father is manager or professional or technical al sweeps 1 or 3.

was associated with a 4-point increase in score for naming for at least 6 months were approximately 2 to 3 months
vocabulary. A similar effect was observed across ail subscales ahead on naming vocabulary (Table IV). For pattern
for exclusive breastfeeding (Table II). Of the preterm construction, the effects were much smaller, and there was
children who were breastfed for at least 4 months, no clear trend with increasing breastfeeding duration.
approximately half (51%) were exclusively breastfed for at Preterm children who were breastfed for at least 2 months
least 4 months; of the preterm children breastfed for 2.0 to tended to be at least 6 months ahead of children who were
3.9 months, 58% were exclusively breastfed for at least 2 never breastfed on picture similarities and approximately 3
months. months ahead on pattern construction. When they were
breastfed for at least 4 months, preterm children were
How Do These Differences in BAS Scores Compare approximately 5 to 6 months ahead on naming vocabulary.
with the Progress of an Average 5-Year-Old Child?
The fully adjusted differences from Tables I and II have been
converted into age-equivalent scores that indicate the child's Discussion
developmental progress; these differences show how many Our results suggest that breastfeeding, particularly when it is
months ahead breastfed children are compared with prolonged, is associated with better child cognitive develop­
children who were never breastfed. In the term group, ment. The effect was smaller after adjustment for confounders,
children who were breastfed for at least 4 months tended to particularly maternai education and social class. Even after
be approximately 3 months ahead of children who were allowing for many known confounders, a two-point increase
never breastfed on picture similarities and children breastfed in BAS score at age 5 years was associated with prolonged

Breastfeeding is Associated with lmproved Child Cognitive Development: A Population-Based Cohort Study 29

231
iKB LECTURE CRITIQUE D'ARTICLE

Table IV. Number of months ahead a breastfed child will be compared with a never breastfed child according to BAS
subscale and gestational age group
Children born at term Children born preterm
Any breastfeeding Exclusive breastfeeding Any breastfeeding Exclusive breastfeeding
Duration of breastfeeding Months ahead Months ahead Months ahead Months ahead
BAS naming vocabulary scale n=10 414 n=10 414 n= 745 n= 745
Never Reference Reference Reference Reference
<2.0 months 1-2
2.0-3.9 months 1-2
4.0-5.9 monthst
6.0-11.9 months 2-3 2 5-6 5
2:12.0 months 3
BAS picture similarities scale n= 10 526 n=10 641 n= 758 n= 758
Never Reference Reference Reference Reference
<2.0 months 2-3 2-3 4
2.0-3.9 months 2-3 7-8
4.0-5.9 monthst 3
6.0-11.9 months 3 3 6-7 8
2:12.0 months 3
BAS pattern construction scale n=10 678 n=10 195 n= 727 n= 727
Never Reference Reference Reference Reference
<2.0 months <1
2.0-3.9 months 1 3 4
4.0-5.9 monthst
6.0-11.9 months <1 3 4
2:12.0 months <1

Results have been obtained by converting coefficients in Tables I and Il to months as follows: in a 1-month period, we would expect the BAS scores of a typical 5-year-old child to increase by 0.83 for
naming vocabulal'f, 0.62 for picture similarities, and 1.81 for pattern construction.1 5· 16
*Note that results have not been presented if the difference in mean in Table I or Il was not statistically significant al the 5% level.
tFor exclusive breastfeeding results and results in preterm group, this categol'f is a,4 months.

breastfeeding ( 2::4 months for picture similarities and 2:: at associated with ever breastfeeding was 2.7 points in children
least 6 months for naming vocabulary) in children who were of normal birth weight and 5.2 points in children with low
born at term. In preterm children, the effects were more strik­ birth weight. 1 Severa! large studies published since the
ing, even for those breastfed for at least 2 months. These meta-analysis show an association between breastfeeding
4'5 '2 1- 25
results, expressed as the equivalent progress one would expect and cognitive development, but others show no
3 26
in a month in an average 5-year-old child, suggest that on these effect. • As is the case with many studies, our data do not dis­
tests children who were breastfed will be a few months ahead of tinguish between feeding directly from the breast and other
children who were never breastfed. modes of receiving breast milk, such as via a tube, cup, or bot­
The main strengths of our study are the large sample size, tle. Thus, there may be some misclassification of breastfeed­
the separate effects of the duration of any breastfeeding and ing, particularly for the very preterm babies. By classifying
exclusive breastfeeding in the term and preterm groups, breastfeeding duration into 2 monthly bands, we hope to
and the adjustment for a wide range of factors that tap into have minimized such misclassification. Few studies of cogni­
multiple dimensions of the child's environment. The main tive development have analyzed the duration of any breast­
limitation is that the study was not randomized and thus is feeding and exclusive breastfeeding. In our study, both
prone to the problem of confounding. One of the strongest variables had a similar association with the study outcomes,
potential confounders is maternai IQ,3 although a strong although there was much overlap in these variables. Any
association between breastfeeding and child IQ has remained breastfeeding for 4.0 to 5.9 months was significantly associ­
after adjustment for maternai IQ in many studies. 1•20 Mater­ ated with picture similarities and pattern construction in
nai IQ was not measured in the MCS, but our estimates the term group, although only 38% of this group was exclu­
reduced substantially with adjustment for other confounders, sively breastfed for at least 4 months.
especially maternai education. There is likely to be some One potential mechanism for an effect of breastfeeding on
0 residual confounding because of maternai IQ and other cognitive development is that breast milk contains higher
(.9
LJ.J unmeasured confounders. However, the striking effect concentrations of essential long-chain polyunsaturated fatty
a:
(.9
observed in the preterm group is suggestive of at least some acids than formula milk. These have been shown to be essential
LJ.J
a:
CO
direct effect of breast milk. for brain development,27 and this is particularly important in the
0
Our data on BAS scores are not standardized and are there­ preterm baby. Sorne MCS babies may have received formula
z
a: fore not directly comparable with those from other studies. supplemented with artificial essential long-chain polyunsatu­
LJ.J
> However, our results are consistent with the findings of rated fatty acids, but evidence is lacking on the effectiveness of
en
z
0 a meta-analysis in which the average adjusted increase in IQ these on cognitive outcomes.28'29 Breast milk also contains
fC=
0
LJ.J 30 Quigley et al
@

232
ARTICLE 5 - LCA 2013

growth factors and hormones, lacking in formula, which influ­ fants: a statewide assessment for Massachusetts. Pediatrics 2006;118:
ence brain biochemistry and functional development.30 Alterna­ el048-54.
8. Bhutta AT, Cleves MA, Casey PH, Cradock MM, Anand KJ. Cognitive
tively, it could be the physical or social interaction associated
and behavioral outcomes of school-aged children who were barn
with breastfeeding that stimulates cognitive development. preterm: a meta-analysis. JAMA 2002;288:728-37.
Another potential mechanism is that formula feeding is associ­ 9. Plewis I (Ed). Millennium Cohort Study first survey: technical report on
ated with infantile infections and delayed developmental mile­ sampling. 4th edition. London: Centre for Longitudinal Studies, Insti­
stones in this population3 1'32 and others,2 and these could tute of Education 2007.
10. Office for National Statistics. Infant and perinatal mortality 2006:
affect early and, in turn, later cognitive development. A combi­
health areas, England and Wales. Health Stat Q 2007;35(Suppl):i-iv.
nation of these mechanisms could explain the size of effect here, 11. Elliott CD, Smith P, McCulloch K. British Ability Scales Second Edition
particularly in children born preterm. (BAS II): technical manual. London: NFER-Nelson; 1997.
In conclusion, we have observed an association between 12. Hill V. Through the past darkly: a review of the British Ability Scales
prolonged breastfeeding and higher cognitive development Second Edition. Child Adolesc Ment Health 2005;10:87-98.
13. Kelly Y, Sacker A, Gray R, Kelly J, Wolke D, Quigley MA. Light drinking
scores. In a field in which randomized studies are neither eth­
in pregnancy, a risk for behavioural problems and cognitive deficits at 3
ical nor feasible, this well-controlled, large cohort study adds years of age? !nt J Epidemiol 2009;38:129-40.
considerably to the evidence base on this tapie. Our results 14. Condon JT, Corkindale C. The assessment of parent-ta-infant attach­
imply that not breastfeeding will delay cognitive develop­ ment: development of a self-report questionnaire instrument. J Reprod
ment by a few months. Even allowing for some residual con­ Infant Psychol 1998;16:57-76.
15. Rutter M, Tizard J, Whitmore K. Education, health and behaviour. Lon­
founding, prolonged breastfeeding is likely to be associated
don: Longmans; 1970.
with a quantifiable improvement in child cognitive develop­ 16. Wang PS, Simon GE, Avorn J, Azocar F, Ludman EJ, McCulloch J, et al.
ment, particularly in children who were born preterm. These Telephone screening, outreach, and care management for depressed
improvements were apparent at a breastfeeding duration of 4 workers and impact on clinical and work productivity outcomes: a ran­
to 6 months in term children and a duration of 2 months in domized controlled trial. JAMA 2007;298:1401-11.
17. Hansen K, ed. Millennium Cohort Study First Four Surveys: a guide to
preterm children, in whom the rates of exclusive breastfeed­
the datasets. 5th ed. London: Centre for Longitudinal Studies, University
ing were relatively low. of London; 2010.
More research is needed on the association between breast­ 18. Jones EM, Schoon I. Child behaviour and cognitive development. ln:
feeding and child cognitive development to elucidate the Hansen K, Joshi H, eds. Millennium Cohort Study Third Survey: a user's
causal mechanisms and identify subgroups, such as preterm guide to initial findings. London: Centre for Longitudinal Studies,
University of London; 2008.
babies, who might benefit most from breastfeeding. This
19. Oddy WH, Li J, Whitehouse AJO, Zubrick SR, Malacova E. Breastfeed­
would require large studies collecting detailed infant feeding ing duration and academic achievement in a cohort of children at ten
data, including duration of partial and exclusive breastfeed­ years of age. Pediatrics 2011;127:el37-45.
ing, mode of receiving breast milk, and type of formula. ■ 20. Angelsen NK, Vik T, Jacobsen G, Bakketeig LS. Breast feeding and cogni­
tive development at age 1 and 5 years. Arch Dis Child 2001;85:183-8.
21. Quinn PJ, O'Callaghan M, Williams GM, Najman JM, Andersen MJ,
Submitted for publication Feb 12, 2011; last revision received May 31, 2011;
accepted Jun 23, 2011.
Bor W. The effect of breastfeeding on child development at 5 years: a co­
hort study. J Paediatr Child Health 2001;37:465-9.
Reprint requests: Maria A Quigley, BA, MSc, National Peri natal Epidemiology
22. Mortensen EL, Michaelsen KF, Sanders SA, Machover Reinisch J. The
Unit, University of Oxford, Old Road Campus, Headington, Oxford OX3 7LF,
UK. E-mail: maria.quigley@npeu.ox.ac.uk
association between duration of breastfeeding and adult intelligence.
JAMA 2002;287:2365-71.
23. Lawlor DA, Najman JM, Batty GD, O'Callaghan MJ, Williams GM,
References Bor W. Early life predictors of childhood intelligence: findings from
the Mater University study of pregnancy and its outcomes. Paediatr Peri­
1. Anderson JW, Johnstone B, Rernley DT. Breast-feeding and cognitive nat Epidemiol 2006;20:148-62.
development: a meta-analysis. Am J Clin Nutr 1999;70:525-35. 24. Vohr BR, Poindexter BB, Dusick AM, McKinley LT, Wright LL,
2. I p S, Chung M, Raman G, Chew P, Magula N, DeVine D, et al. Breastfeeding Langer JC, et al. Beneficial effects of breast milk in the neonatal intensive
and maternal and infant health outcomes in developed countries. Evidence care unit on the developmental outcome of extremely low birth weight
report/technology assessment no. 153. AHRQ publication no. 07-E007. infants at 18 months of age. Pediatrics 2006;118:115-23.
Rockville, MD: Agency for Healthcare Research and Quality; 2007. 25. Whitehouse AJO, Robinson M, Li J, Oddy WH. The effects of breast­
3. Der G, Batty GD, Deary ]J. Effect of breast feeding on intelligence in feeding duration on language ability to middle childhood. Paediatr Peri­
children: prospective study, sibling pairs analysis, and meta-analysis. nat Epidemiol 2011;25:44-52.
BMJ 2006;333:945. 26. Holme A, MacArthur C, Lancashire R. The effects of breastfeeding on
4. Kramer MS, Aboud F, Mironova E, Vanilovich !, Platt RW, Matush L, cognitive and neurological development of children at 9 years. Child
et al., Promotion of Breastfeeding Intervention Trial (PRO BIT) study Care Health Dev 2010;36:583-90.
group. Breastfeeding and child cognitive development: new evidence 27. Innis SM. Polyunsaturated fatty acids in human milk: an essential raie in
from a large randomized trial. Arch Gen Psychiatry 2008;65:578-84. infant development. Adv Exp Med Bio! 2004;554:27-43.
5. Oddy WH, Kendall GE, Blair E, de Klerk NH, Stanley FJ, Landau LI, et al. 28. Simmer K, Patole S, Rao SC. Longchain polyunsaturated fatty acid sup­
Breast feeding and cognitive development in childhood: a prospective plementation in infants barn at term. Cochrane Database of Systematic
birth cohort study. Paediatr Perinat Epidemiol 2003;17:81-90. Reviews 2008, Issue 1. Art. No.: CD000376. DOi: 10.1002/
6. Flacking R, Nyqvist KH, Ewald U. Effects of socioeconomic status on 14651858.CD000376.pub2.
breastfeeding duration in mothers of preterm and term infants. Eur J 29. Simmer K, Schulzke S, Patole S. Longchain polyunsaturated fatty acid
Public Health 2007;17:579-84. supplementation in preterm infants. Cochrane Database of Systematic
7. Merewood A, Brooks D, Bauchner H, MacAuley L, Mehta SD. Mater­ Reviews 2008, Issue 1. Art. No.: CD000375. DOi: 10.1002/
nai birthplace and breastfeeding initiation among term and preterm in- 14651858.CD000375.pub3.

Breastfeeding is Associated with lmproved Child Cognitive Development: A Population-Based Cohort Study 31

233
iKB LECTURE CRITIQUE D'ARTICLE

30. De Andraca !, Peirano P, Uauy R. Nutrition and care in the prenatal and 31. Quigley MA, Kelly Y), Sacker A. Breastfeeding and hospitalization for di­
neonatal period and later development: human milk is best for optimal arrheal and respiratory infection in the UK Millennium Cohort Study.
mental development. ln: Nutrition, health and child development. Re­ Pediatrics 2007;119:e837-42.
search advances and policy implications. Washington, DC: PAH O/Uni­ 32. Sacker A, Quigley MA, Kelly YJ. Breastfeeding and developmental de­
versity of the West Indies/The World Bank; 1998. p. 43-68 (Scientific lay: findings from the Millennium Cohort Study. Pediatrics 2006;118:
publication no. 566.). e682-9.

�go in THE ]DURNAL OF PEDIATRICS

Relationships of Doctors-in-Training with Pediatric Outpatients


Glaser HH, Lynn DB, Harrison GS. J Pediatr 1962;60:142-43

T he authors reported a mixed-methods study ofpediatric visits that directly observed the interactions ofinterns,
residents, and fellows with families and evaluated family perspectives via postvisit interviews. Although the inter­
actions were moderately satisfactory for the families, the families' real needs often were not expressed-an issue that
families still face today, as evidenced by the family-centered care movement. Interaction complexity, physician clarity,
and positive attributes (eg, responsiveness) increased with physician training. Because visit conditions were assumed
to be optimal, the influence ofsuch factors as visit length and continuity in the doctor-family relationship were not
explored, but their potential influence was discussed.
This study was a forerunner ofthe next 50 years ofresearch on doctor-family interaction, facilitated by advanced
technology, including audio or video recording ofvisits and sophisticated software to support rigorous analytic tech­
niques. These advances have allowed for objective assessment ofspecific critical aspects ofcommunication and con­
sideration of such influences as the ongoing doctor-family relationship, as well as physician, child, and parent
characteristics and communication styles. 1-3
Since the publication of this study, resident duty hours have been drastically reduced, leading to concerns about
continuity of care, residents' preparedness for the realities of medical practice, and ultimately patient outcomes
and satisfaction.4 For today's physicians managing the onslaught ofpediatric chronic diseases, such as obesity and
type 2 diabetes, communication skills are crucial to implementing recommended family-centered care approaches.
To inform their training, more studies are needed to examine how doctor-family interactions evolve into relationships
that optimize chronic disease visit satisfaction and outcomes. 5

Nina Litton, BS
Elizabeth D. Cox, MD, PhD
Department ofPediatrics
University ofWisconsin
School ofMedicine and Public Health
Madison, Wisconsin
10.1016/j.jpeds.2011.08.001
References

1. Roter DL, Hall JA, Aoki Y. Physician gender effects in medical communication. JAMA 2002;288:756-64.
2. Wissow LS, Bar-Din Kimel M. Assessing provider-patient-parent communication in the pediatric emergency department. Ambul Pediatr 2002;2:
323-9.
3. Cox ED, Smith MA, Brown RL. Evaluating deliberation in pediatric primary care. Pediatrics 2007;120:e68-77.
4. Cull WL, Mulvey HJ, Jewett EA, Zalneraitis EL, Allen CE, Pan RJ. Pediatric residency duty hours before and after limitations. Pediatrics 2006;118:
el805-ll.
5. DiMatteo MR. The role of effective communication with children and their families in fostering adherence to pediatric regimens. Patient Educ
Couns 2004;55:339-44.

0
(.9
a:
LJ.J

(.9

a:
LJ.J

CO
0

z
a:
>
LJ.J

en
z
0
fC= 32 Quigley et al
0
LJ.J
@

234
ARTICLE 5 - LCA 2013

QCM
1
1 Parmi les éléments suivants, le(s)quel(s) a(ont) pu justifier pour les auteurs la
réalisation de cette étude ?
A - Il n'existait pas encore d'études sur le sujet.
B - Cette étude est la première à analyser l'effet de l'allaitement sur le développement cognitif de
l'enfant selon la prématurité.
C - Les études déjà réalisées sur le sujet donnaient des résultats contradictoires.
D - Cette étude doit mieux prendre en compte les facteurs de confusion potentiels.

1
E - Cette étude a été menée sur un orand nombre d'enfants.

QCM
De quel type d'étude s'agit-il ?
2
A - Etude interventionnelle.
B - Etude observationnelle.
C - Etude épidémiologique descriptive.
D - Etude épidémiologique analytique.

1
E - Etude longitudinale.

QCM La variable d'exposition d'intérêt est l'allaitement maternel. Quelle(s) est(sont)


3 la(les) proposition(s) vraie(s) ?
A - Il a été recueilli rétrospectivement.
B - Il a été recueilli prospectivement.
C - Il a été recueilli par questionnaires standardisés.
D - Il a été recueilli par retour au carnet de santé de l'enfant.
E - Il n'a pas été recueilli de la même manière pour tous les enfants.

QCM
4
1 Quand le développement cognitif des enfants a-t-il été évalué dans cette étude ?
A - Lors de la troisième visite.
B - Au même âge pour tous les enfants.
C - 5 ans après l'inclusion dans l'étude.
D - Au moment de l'entrée à l'école primaire.
E - Lors d'une consultation avec un neuropsychologue.

QCM 1 Quelle(s) est(sont) la(les) proposition(s) vraie(s) concernant l'évaluation du


5 développement cognitif chez les enfants suivis dans cette étude ?
A - Il est recueilli de manière prospective.
B - Il est recueilli de manière standardisée et fiable.
C - Son recueil s'est basé sur l'utilisation d'outils validés.
D - Tous les domaines du traitement de l'information sont évalués.
E - Il existe probablement une courbe d'apprentissage chez les enquêteurs dans le recueil du
développement cognitif des enfants.

QCM I Les résultats ont été donnés séparément pour les prématurés et les nouveaux nés à
6 terme. Pourquoi les auteurs ont-ils procédé de la sorte ?
A - La prématurité est un facteur de confusion potentiel dans l'étude du développement cognitif des
enfants.
B - La stratification sur la prématurité permet d'augmenter la puissance des analyses.
C - La stratification sur la prématurité permet d'étudier l'effet de l'allaitement sur chaque sous-groupe
(prématurés versus non prématurés).
D - Cela permettait de limiter le biais de sélection.
E - Cela permettra de définir plus précisément une population cible de l'étude.

235
iKB LECTURE CRITIQUE D'ARTICLE

QCM
1 Sur les 18818 enfants recrutés à l'étape 1, 11951 ont participé à l'étape 3. Quelle(s)
7 en est(sont) la(les) conséquence(s) possible(s) sur les résultats de l'étude?
A - Possible biais de sélection.
B - Possible biais de confusion.
C - Possible biais de classement.
D - Généralisation difficile des résultats à l'ensemble de la population pédiatrique du Royaume-Uni.

1
E - Aucune conséquence dans cette étude.

QCM Quelle(s) conséquence(s) cette inclusion d'un nombre plus faible d'enfants (11951
8 contre 18818 initialement prévus) a-t-elle sur les éléments suivants?
A - Augmentation du risque alpha.
B - Diminution du risque alpha.
C - Augmentation du risque bêta.
D - Diminution du risque bêta.

1
E - Diminution de la puissance.

QCM Quelle(s) est(sont) la(les) proposition(s) vraie(s) concernant l'ajustement réalisé par
9 les auteurs lors des analyses dans cette étude ?
A - Les mêmes facteurs d'ajustement ont été utilisés lors du premier et lors du deuxième ajustement.
B - L'ajustement en deux étapes permet de respecter la temporalité entre les deux types de facteurs
d'ajustement utilisés.
C - L'impact différentiel des deux types de facteurs d'ajustement pourra être évalué.
D - Les résultats les plus intéressants sont les résultats partiellement ajustés.

I
E - Les résultats les plus intéressants sont les résultats complètement ajustés.

QCM Comment expliquez-vous que le pourcentage d'enfants admis en néonatalogie soit


10 beaucoup plus élevé chez les prématurés que dans l'autre groupe ?
A - Il s'agit d'un biais de sélection de la population d'étude.
B - Il n'y a pas eu d'appariement sur ce critère lors de la conduite du recrutement.
C - Il s'agit d'une différence liée au hasard.
D - Cette différence s'explique par la seule population des sous-groupes.
E - L'admission en néonatalogie est un facteur de confusion potentiel pour l'étude de la relation entre
âge gestationnel et allaitement.

QCM
11 I
Comment expliquez-vous l'absence de certaines valeurs dans la dernière colonne
du tableau 1?
A - Oubli des auteurs.
B - Catégories de référence utilisées pour le calcul des coefficients de régression.
C - Résultats non significatifs.
D - Absence de données pour les variables explicatives considérées.
E - On ne peut pas se prononcer.

Sur la troisième ligne du corps du tableau 1, comment interprétez-vous les


QCM coefficients de la régression linéaire, présentés sur la même ligne (< 2.0 mois),
12 coefficient brut 3,7 (IC95% = [2,8 ; 4,6]) et coefficient complètement ajusté 0,7 (IC95%
= [-0,1 ; 1,5])?
0
(.9
LJ.J
A- Cette donnée concerne la variable « Vocabulaire des noms» à l'âge de 5 ans.
a: B- Les résultats concernent les enfants allaités exclusivement au lait maternel.
(.9

LJ.J
a: C- En moyenne, les enfants allaités exclusivement au lait maternel ont un score de 3,7 points
CO
0 supérieur aux enfants allaités partiellement au lait maternel au test de « vocabulaire des noms»
z de l'échelle BAS.
a:
LJ.J
> D- L'ajustement sur tous les facteurs de confusion potentiels n'a pas modifié les résultats de base.
E- Il n'y a pas d'amélioration statistiquement significative au test de « vocabulaire des noms» de

@
en
z
0
fC= l'échelle BAS chez les enfants allaités (partiellement ou exclusivement) < 2 mois par rapport au)<
0
LJ.J enfants non allaités.

236
ARTICLE 5 - LCA 2013

QCM I Quelles sont les données de l'article en faveur d'un rôle causal de l'allaitement
13 maternel dans le « meilleur » développement cognitif de l'enfant ?
A - La temporalité/séquence temporelle.
B - La plausibilité biologique.
C - La cohérence externe
D - L'existence d'une relation dose-effet.
E - La spécificité de l'association.

QCM 1 Quel(s) facteur(s) de confusion potentiel(s) les auteurs n'ont-ils pas pris en compte
14 dans leur étude ?
A - Le niveau socioprofessionnel de la mère.
B - Le QI maternel.
C - La parité.
D - Le quartier de résidence de la mère.
E - La standardisation des résultats concernant les scores BAS.

QCM J Quel est le niveau de preuve de cette étude ?


15
A - Niveau de preuve 1.
B - Niveau de preuve 2.
C - Niveau de preuve 3.
D - Niveau de preuve 4.
E - Niveau de preuve 5.

237
iKB LECTURE CRITIQUE D'ARTICLE

Grille de correction QCM


(Questions à choix multiples)

A-
B- V .
F Réponse: BCDE
Des études ont déjà été menées sur le sujet, mais leurs méthodologies étaient
....
::!!: D-
C- V
V . différentes et les résultats contradictoires.
De plus, les facteurs de confusion n'ont pas toujours été bien pris en compte dans

.
(.)
0 ces études.
E- V L'originalité de cette étude est de tenir compte de la prématurité chez les enfants,
avec une analyse stratifiée sur ce critère.
A- F
N
::!!: C-
(.)
B-
F .
V Réponse: BDE
Etude épidémiologique, observationnelle, analytique, prospective, longitudinale, de
0 D- V type étude de cohorte.
E- V

M B-
A-
F .
V Réponse: AC
L'allaitement a été recueilli de façon rétrospective (questions au premier

.
::!!: C- V questionnaire sur l'exposition passée).
(.)
0 D- F Il a été recueilli de la même manière pour tous les enfants, prématurés comme non
E- F prématurés.
A- V
"" B-
::!!: C-
(.)
F .
V Réponse: AB
Le développement cognitif est évalué chez tous les enfants à l'âge de 5 ans, c'est-
0 D- F à-dire lors de la troisième visite prévue dans le protocole de l'étude.
E- F
A-
B- V .
V Réponse: ABC
Le recueil est standardisé et utilise l'échelle anglaise de capacités (BAS).
Lt)
C- V Seules trois sous-échelles de la BAS ont été utilisées dans cette étude, ciblant
::!!: D- F les trois plus signifiants domaines des outils de traitement de l'information
(.)
0
E- F
. (vocabulaire des noms, similarité d'images et construction de formes).
Les enquêteurs sont entraînés, ce qui permet de limiter l'effet« apprentissage»
des premiers entretiens, et donc possiblement un biais d'évaluation chez les
premiers enfants.
A-
B-
V
F .
Réponse: ACE
La prématurité est associée à une diminution du développement cognitif des
C- V enfants. Elle est donc un potentiel facteur de confusion dans l'étude du

.
ID
::!!: D- F développement cognitif des enfants.
(.) En stratifiant sur la prématurité, les auteurs s'affranchissent de ce biais et peuvent
0
ainsi mener des analyses sur chaque sous-groupe, permettant d'évaluer l'effet
E- V différentiel de l'allaitement sur le développement cognitif en fonction de la
prématurité. Une population-cible plus précise pourra ainsi être définie.

.....
A-
B-
V
F .
Réponse: AD
La population d'enfants qui n'a pas été évaluée sur le plan du développement
::!!: C- F cognitif est potentiellement différente de celle qui a été évaluée. Il en résulte donc
0
(.) un possible biais de sélection dans l'étude. Si tel est le cas, la généralisation
0 D- V
(.9
LJ.J
a:
(.9 des résultats à l'ensemble de la population pédiatrique du Royaume-Uni sera
LJ.J
E- F limitée/difficile.
a:
0

z
a:
A-
B-
V
F .
Réponse: ACE
Du fait de cette exclusion de patients potentiellement différents : on risque de
>
LJ.J
::!!: C- V conclure à tort à une différence qui n'existe pas réellement (augmentation du

.
en
z (.) risque alpha).
0 0 D- F
fC=
0 Le nombre de sujets inclus est moins important, donc diminution de la puissance
LJ.J E- V (et donc augmentation du risque bêta de deuxième espèce, correspondant au
@

238
ARTICLE 5 - LCA 2013

risque de conclure à tort à l'absence de différence alors qu'il en existe une).


A-
B- V .
F Réponse: BCE
Les auteurs ont réalisés ici deux ajustements successifs
C- V - Un premier pour les potentiels facteurs de confusion socio-démographiques et
D- F ceux associés à la grossesse (résultats partiellement ajustés)
a, - Un deuxième ajustement a été effectué pour les facteurs potentiels liés aux
:!!: parents et aux premières années d'apprentissage (résultats complètement

.
(.)
0 ajustés).
E- V Ces deux ajustements permettent d'évaluer séparément l'impact de ces deux
types de critères, et d'évaluer l'impact des deuxièmes critères en fonction de

. premiers (notion de temporalité, qui est respectée ici).


Les résultats les plus intéressants sont les résultats complètement ajustés.

....
0
A-
B-
F
F .
Réponse: D
La proportion d'enfants admis en néonatalogie est beaucoup plus élevée dans le
F groupe prématurés que chez les enfants nés à terme, car les prématurés sont par
:!!: C-
(.) D- V définition une population à risque, fragile, pour laquelle une prise en charge en
0 néonatalogie est souvent indiquée. Il ne s'agit en aucun cas d'un biais de sélection
E- F de la population d'étude.
A- F
.
Réponse: D

........
B- F Les catégories de référence sont celles où il est inscrit« Reference» dans le
C-
:!!: D-
(.)
F
V . tableau.
Les cases vides dans la dernière colonne du tableau sont des variables pour
0 lesquelles il n'existait pas de données dans l'étude, autrement dit il n'y avait aucun
E- F enfant qui a bénéficié d'un allaitement maternel exclusif entre 4 et 5,9 mois et.:: 12
mois.
A- V
.
Réponse: AE

....
B- F
. La catégorie de référence est« absence d'allaitement ».

.
N
C- F La catégorie étudiée ici est« allaitement< 2 mois».
:!!: D- F Il existe de meilleurs résultats au test de« vocabulaire des noms» chez les
(.)
0 enfants allaités< 2 mois par rapport à ceux non allaités, mais ces résultats ne
E- V persistent pas après ajustement sur les facteurs de confusion potentiels.
Rae.e.el : ce sont les résultats complètement ajustés qu'il faut regarder!
A-
B-
V
V .
Réponse: ABCD
Dans les études épidémiologiques, on ne peut jamais conclure à la causalité. En
.... C- V revanche, on pourra réunir un faisceau d'arguments en faveur de cette relation
:!!: D- V
. causale = ce sont les critères de Bradford-Hill.

.
(.)
0 Il en existe une dizaine qui doit être recherchés .
E- F La séquence temporelle est le seul critère de Bradford-Hill« obligatoire», la
spécificité de la relation étant celui qui est le plus difficile à obtenir.
A- F
"'"....
B- V
:!!: C-
(.)
0 D-
F
F
.
Réponse: B
Les auteurs évoquent ce possible biais de confusion dans leur discussion.
E- F
A- F

....
Lt)
B-
.
V Réponse: B
La grille de la HAS concernant les niveaux de preuve et grades de
:!!:
(.)
0
C- F
. recommandation des études doit être connue au moment de passer les ECNi.
Elle a déjà été présentée dans un précédemment QCM (s'y référer).
D- F

E- F

239
iKB LECTURE CRITIQUE D'ARTICLE

0
(.9
LJ.J
a:
(.9
J,
LJ.J
a:
CO
0


z
a:
LJ.J
>
en
z
0
fC=
0
LJ.J
@

240
Chapitre
39

ARTICLE 6 - LCA 2014

Rapid Blood-Pressure Lowering in Patients


with Acute Intracerebral Hemorrhage
Craig S. Anderson, M.D., Ph.D., Emma Heeley, Ph.D., Yining Huang, M.D.,Jiguang Wang, M.D.,
Christian Stapf, M.D., Candice Delcourt, M.D., Richard Lindley, M.D., Thompson Robinson, M.D.,
Pablo Lavados, M.D., M.P.H., Bruce Neal, M.D., Ph.D.,Jun Hata, M.D., Ph.D., Hisatomi Arima, M.D., Ph.D.,
Mark Parsons, M.D., Ph.D., Yuechun Li, M.D.,Jinchao Wang, M.D., Stephane Heritier, Ph.D., Qiang Li, B.Sc.,
Mark Woodward, Ph.D., R.John Simes, M.D., Ph.D., Stephen M. Davis, M.D., andJohn Chalmers, M.D., Ph.D.,
for the INTERACT2 lnvestigators>'-

ABSTRACT

BACKGROUND

Whether rapid lowering of elevated blood pressure would improve the outcome in The a uthors' affiliations are listed in the
patients with intracerebral hemorrhage is not known. Appendix. Address reprint requests to Dr.
Anderson at the George Institute for Global
METHODS Health, Royal Prince Alfred Hospital and
the University of Sydney, P.O. Box M201,
We randomly assigned 2839 patients who had had a spontaneous intracerebral Missenden Rd., Sydney NSW 2050, Austra­
hemorrhage within the previous 6 hours and who had elevated systolic blood pressure lia, oratcanderson@georgeinstitute.org.au.
to receive intensive treatment to lower their blood pressure (with a target systolic ''lnvestigators in the second Intensive
level of <140 mm Hg within 1 hour) or guideline-recommended treatment (with a Blood Pressure Reduction in Acute Cere­
target systolic level of<180 mm Hg) with the use ofagents ofthe physician's choosing. bral Hemorrhage Trial (INTERACT2) are
listed in the Supplementary Appendix,
The primary outcome was death or major disability, which was defined as a score available at NEJM.org.
of3 to 6 on the modified Rankin scale (in which a score of0 indicates no symptoms,
This article was published on May 29,
a score of 5 indicates severe disability, and a score of 6 indicates death) at 90 days. 2013, at NEJM.org.
A prespecified ordinal analysis of the modified Rankin score was also performed.
N Engl J Med 2013;368:2355-65.
The rate of serious adverse events was compared between the two groups. DOi: 10.1056/NEJMoal214609
Copyright © 2013 Massachusetts Medical Society.
RESULTS

Among the 2794 participants for whom the primary outcome could be determined,
719 of 1382 participants (52.0%) receiving intensive treatment, as compared with
785 of 1412 (55.6%) receiving guideline-recommended treatment, had a primary
outcome event (odds ratio with intensive treatment, 0.87; 95% confidence interval
[CI], 0.75 to 1.01; P=0.06). The ordinal analysis showed significantly lower modi­
fied Rankin scores with intensive treatment (odds ratio for greater disability, 0.87;
95% CI, 0.77 to 1.00; P=0.0 4). Mortality was 11.9% in the group receiving intensive
treatment and 12.0% in the group receiving guideline-recommended treatment.
Nonfatal serious adverse events occurred in 23.3% and 23.6% of the patients in the
two groups, respectively.
CONCLUSIONS

In patients with intracerebral hemorrhage, intensive lowering of blood pressure


did not result in a significant reduction in the rate of the primary outcome of
death or severe disability. An ordinal analysis of modified Rankin scores indi­
cated improved functional outcomes with intensive lowering of blood pressure.
(Funded by the National Health and Medical Research Council of Australia;
INTERACT2 ClinicalTrials.gov number, NCT00716079.)

N ENGLJ MEO 368;25 NEJM.0RG JUNE 20, 2013 2355

241
iKB LECTURE CRITIQUE D'ARTICLE

The NEW ENGLAND JOURNAL of MEDICINE

A
CUTE INTRACEREBRAL HEMORRHAGE, tabase associated with a secure Web-based ran­
which is the least treatable form of stroke, domization system. The data were checked to
affects more than 1 million people confirm the eligibility of the patient, and several
worldwide annually, 1, with the outcome deter­
2
key clinical variables were recorded before the
mined by the volume and growth of the underlying system assigned a participant to intensive or
hematoma,3-s Blood pressure often becomes ele­ guideline-recommended management of blood
vated after intracerebral hemorrhage,6 frequently pressure with the use of a minimization algo­
reaching very high levels, and is a predictor of rithm to ensure that the groups were balanced
outcome.7-11 On the basis of the results of the with respect to country, hospital, and time (�4
pilot-phase study, Intensive Blood Pressure Re­ hours vs. >4 hours) since the onset of the intra­
duction in Acute Cerebral Hemorrhage Trial 1 cerebral hemorrhage. In participants who were
(INTERACTl), -14 we conducted the main-phase
12
assigned to receive intensive treatment to lower
study, INTERACT2, 5 to determine the safety and
1
their blood pressure (intensive-treatment group),
effectiveness of early intensive lowering of blood intravenous treatment and therapy with oral
pressure in patients with intracerebral hemor­ agents were to be initiated according to pre­
rhage. specified treatment protocols that were based on
the local availability of agents, with the goal of
METHODS achieving a systolic blood-pressure level of less
than 140 mm Hg within 1 hour after randomiza­
TRIAL DESIGN tion and of maintaining this level for the next
INTERACT2 was an international, multicenter, 7 days. In participants who were assigned to re­
prospective, randomized, open-treatment, blinded ceive guideline-recommended treatment (stan­
end-point trial. Details of the design have been dard-treatment group), blood-pressure-lowering
published previously 5, and are summarized in
1 16
treatment was to be administered if their systolic
the Supplementary Appendix, available with the blood pressure was higher than 180 mm Hg; no
full text of this article at NEJM.org. In brief, we lower level was stipulated.18-20 All participants
compared the effect of a management strategy were to receive oral antihypertensive agents (or
targeting a lower systolic blood pressure within topical nitrates) within 7 days (or at discharge
1 hour with the current guideline-recommended from the hospital if that occurred before 7 days),
strategy, which targets a higher systolic blood even if the agents had to be administered
pressure, in patients who had a systolic blood through a nasogastric tube; combination treat­
pressure between 150 and 220 mm Hg and who ment with an angiotensin-converting-enzyme
did not have a definite indication for or contra­ inhibitor and a diuretic was recommended if
indication to blood-pressure-lowering treatment that treatment was not contraindicated and if no
that could be commenced within 6 hours after different drugs were specifically required, with
the onset of spontaneous intracranial hemor­ the goal of achieving a systolic blood pressure of
rhage; the diagnosis of intracranial hemorrhage less than 140 mm Hg during follow-up for the
was confirmed by means of computed tomogra­ prevention of recurrent stroke.
phy (CT) or magnetic resonance imaging (MRI).
Patients were excluded if there was a structural ASSESSM ENTS

cerebral cause for the intracerebral hemorrhage, Demographic and clinical characteristics were
if they were in a deep coma (defined as a score of recorded at the time of enrollment. The severity
3 to 5 on the Glasgow Coma Scale [GCS], 7 in 1
of the stroke was assessed with the use of the
which scores range from 3 to 15, with lower GCS 7 and the National Institutes of Health
1

scores indicating reduced levels of consciousness), Strolœ Scale 1 (NIHSS, on which scores range
2

if they had a massive hematoma with a poor from O to 42, with higher scores indicating a
prognosis, or if early surgery to evacuate the he­ more severe neurologie deficit) at baseline, at 24
0
(.9 matoma was planned. Written informed consent hours, and at 7 days (or at the time of discharge,
LJ.J
a:
(.9
was obtained from each patient or legal surro­ if that occurred before 7 days). Brain CT (or MRI)
LJ.J gate (before randomization or as soon as possi­ was performed according to standard techniques
a:
CO
0
ble afterward) in accordance with national regu­ at baseline (to confirm the diagnosis) in all pa­
lations. tients, and at 24±3 hours in a subgroup of pa­
z
a:
LJ.J Investigators entered baseline data into a da- tients who were being treated at sites at which
>
en
z
0 2356 N ENGLJ MED 368;25 NEJM.ORG JUNE 20, 2013
fC=
0
LJ.J
@

242
ARTICLE 6 - LCA 2014

RAPID BP LOWERING IN INTRACEREBRAL HEMORRHAGE

repeat scanning was either part of routine prac­ perfect health), with the use of population-based
tice or approved for research. Participants were preference weights for the United Kingdom.24
followed up in persan or by telephone at 28 days The safety outcomes of primary interest were
and at 90 days by trained local staff who were early neurologie deterioration (defined as an
unaware of the group assignments. Participants increase from baseline to 24 hours of4 or more
who did not receive the assigned treatment or who points on the NIHSS or a decrease of 2 or more
did not adhere to the protocol were followed up points on the GCS) and episodes of severe hypo­
in full, and their data were included in the analy­ tension with clinical consequences that required
ses according to the intention-to-treat principle. corrective therapy with intravenous fluids or
vasopressor agents. The difference in the vol­
OUTCOME ME ASURES ume of the hematoma from baseline to 24 hours
The primary outcome measure was the propor­ was assessed in a prespecified subgroup of par­
tion of participants with a poor outcome, defined ticipants who underwent repeat brain imaging.
as death or major disability. Major disability was
defined as a score of 3 to 5 on the modified STUDY OVERSIGHT
Rankin scale at 90 days after randomization. The study was conceived and designed by the ex­
Scores on the modified Rankin scale range from ecutive committee (see the Supplementary Appen­
0 to 6, with a score of0 indicating no symptoms; dix), whose members, along with selected principal
a score of 5 indicating severe disability, confine­ investigators from various countries, developed
ment to bed, or incontinence; and a score of the protocol (which is available at NEJM.org) and
6 indicating death. The protocol specified "death conducted the study. The study was approved by
or severe disability in patients treated within the ethics committee at each participating site.
4 hours of onset of intracranial hemorrhage" as The corresponding author wrote the first draft of
the key secondary outcome.15 However, during the manuscript, and other authors provided in­
the course of the trial, ordinal approaches to the put. All the authors made the decision to submit
analysis of the modified Rankin scores gained the manuscript for publication. Experienced re­
acceptance in stroke trials. Therefore, in the fi­ search staff monitored the study for quality and
nal statistical analysis plan, 16 which was written for the integrity of the accumulation of clinical
before the initiation of data analysis, the key sec­ data according to the study protocol. Monitoring
ondary outcome was redefined as physical fonc­ for serious adverse events was performed routine­
tion across all seven levels of the modified ly, and any events that occurred were confirmed
Rankin scale, as determined with the use of an according to regulatory and Good Clinical Prac­
ordinal analysis.22 tice requirements, as outlined in the Supplemen­
Other secondary outcomes were all-cause mor­ tary Appendix. There was no commercial support
tality and cause-specific mortality (classified at for the study. Study data were collected, moni­
a central location, according to the definitions tored, and analyzed by the INTERACT2 Project
provided in the Supplementary Appendix, by in­ Office and by statisticians at the George Institute
dependent adjudication experts who reviewed for Global Health, who vouch for the accuracy
submitted medical documents); five dimensions and completeness of the data and the fidelity of
of health-related quality of life (mobility, self­ the study to the protocol.
care, usual activities, pain or discomfort, and
anxiety or depression), as assessed with the use STATISTICAL ANALYSIS
of the European Quality of Life-5 Dimensions We estimated that with a sample of 2800 partici­
(EQ-SD) questionnaire, 23 with each dimension pants, the study would have at least 90% power
graded according to one of three levels of sever­ to detect a 14% relative reduction (a difference of
ity (no problems, moderate problems, or extreme 7 percentage points) in the primary outcome, from
problems); the duration of the initial hospital­ 50% in the standard-treatment group to 43% in
ization; residence in a residential care facility at the intensive-treatment group, assuming a between­
90 days; poor outcomes at 7 days and at 28 days; grou p difference in systolic blood pressure of
and serious adverse events. The health statuses 13 mm Hg, a rate of nonadherence to treatment
from each subscale of the EQ-SD were trans­ of 10%, and an overall loss to follow-up of 3%,
formed into a single utility value as a fraction of with a type I error rate of 5% and with the use of
1 (with 0 representing death and 1 representing a two-sided significance test. The data were ana-

N ENGLJ MED 368;25 NEJM.0RG JUNE 20, 2013 2357

243
iKB LECTURE CRITIQUE D'ARTICLE

The NEW ENGLAND JOURNAL of MEDICINE

lyzed with the use of SAS software, version 9.2, also analyzed with the use of an unadjusted
according to the intention-to-treat principle.16 proportional-odds regression model across all
The primary analysis of the effect of treat­ levels of the scale, after we checked that the as­
ment on the primary outcome was unadjusted sumption of a common proportional odds was
and is reported as an odds ratio with associated not violated.25 For sensitivity purposes, the pri­
95% confidence intervals. We tested for signifi­ mary outcome was analyzed after adjustment for
cance using a standard chi-square test of pro­ randomization strata and prognostic baseline
portions (with a two-sided alpha level of 5%). variables (age, region, NIHSS score, time from
The scores on the modified Rankin scale were onset of the intracranial hemorrhage to random-

Table 1. Baseline Characteristics of the Participants.'�

Guideline­
Intensive Recommended
Blood-Pressure Blood-Pressure
Lowering Lowering
Characteristic (N=1399) (N=l430)
Time from onset of ICH ta randomization-hr
Median 3.7 3.7
1 nterquartile range 2.8-4.8 2.9-4.7
Age-yr 63.0±13.1 64.1±12.6
Male sex-no.(%) 898(64.2) 882(61.7)
Recruited from China-no.(%) 947(67.7) 973(68.0)
Blood pressure-mm Hg
Systolic 179±17 179±17
Diastolic 101±15 101±15
NIHSS scoret
Median 10 11
1 nterquartile range 6-15 6-16
GCS scoret
Median 14 14
1 nterquartile range 12-15 12-15
H istory of hypertension -no./total no.(%) 1012/1398(72.4) 1036/1428(72.5)
Current use of antihypertensive drugs-no./total no.(%) 627 /1398(44.8) 647 /1428(45.3)
Prior intracerebral hemorrhage-no./total no.(%) 115 /1398(8.2) 114/1428(8.0)
Prior ischemic or undifferentiated stroke-no./total no.(%) 157 /1398(11.2) 166/1428 (11.6)
Prior acute coronary event-no./total no.(%) 39/1398(2.8) 42/1428 (2.9)
Diabetes mellitus-no./total no.(%) 155/1398 (11.1) 150/1428(10.5)
Use of warfarin anticoagulation-no./total no.(%) 50/1398(3.6) 31/1428(2.2)
Use of aspirin or other antiplatelet agent-no./total no.(%) 123 /1398(8.8) 142/1428(9.9)
Baseline hematoma volume-ml
Median 11 11
1 nterquartile range 6-19 6-20
Deep location of hematoma-no./total no.(%)§ 1084/1294(83.8) 1098/1319(83.2)
0 Left hemisphere site of hematoma-no./total no.(%) 644/1294(49.8) 669/1319(50.7)
(.9
LJ.J
a: lntraventricular extension of hemorrhage-no./total no.(%) 371/1294(28.7) 369/1319(28.0)
(.9

LJ.J
a: ;, There were no significant differences between the groups in any of the characteristics listed here. ICH denotes intra­
CO cerebral hemorrhage.
0
t Scores on the National Institutes of Health Stroke Seale(NIHSS) range from 0(normal neurologie status) ta 42(coma
z with quadriplegia).
a:
LJ.J
> t Scores on the Glasgow Coma Scale(GCS) range from 15 (fully conscious) ta 3 (deep coma).
en § Deep location refers ta location in the basal ganglia or thalamus.
z
0
fC=
0
LJ.J
@ 2358 N ENGLJ MED 368;25 NEJM.ORG JUNE 20, 2013

244
ARTICLE 6 - LCA 2014

RAPID BP LOWERING IN INTRACEREBRAL HEMORRHAGE

ization, volume and location of the hematoma, effect on the primary outcome in eight pre­
and presence or absence of intraventricular hem­ specified subgroups by adding an interaction
orrhage). The primary outcome was also analyzed term in an unadjusted logistic-regression model.
according to various alternative cutoff points on The effects of treatment on relative and absolute
the modified Rankin scale that have been used changes in hematoma volume were assessed by
previously: a score of 0, 1, 2, or 3 as compared means of an analysis of covariance. The baseline
with scores of 4, 5, and 6 grouped together26 volume of the hematoma and the time from the
and a score of O or 1 as compared with a score onset of the intracerebral hemorrhage to the CT
of 2, 3, 4, 5, or 6. 27 were included as covariates, since both predict
We assessed the heterogeneity of the treatment hematoma growth.4 The relative change in hema-

Table 2. Treatment of Patients with lntracerebral Hemorrhage.

Guideline-
Intensive Recommended
Blood-Pressure Blood-Pressure
Lowering Lowering
Variable (N=1399) (N=l430) PValue
Time from ICH ta start oftreatment - hr <0.001
Median 4.0 4.5
lnterquartile range 2.9-5.1 3.0-7.0
Time from randomization ta start oftreatment- hr <0.001
Median 0.1 0.3
lnterquartile range 0.0--0.39 0.0-2.8
Blood-pressure-lowering treatment during first 24 hr- no. (%)
Any intravenous treatment 1260 (90.1) 613 (42.9) <0.001
Use ofa single intravenous agent 849 (60.7) 421 (29.4) <0.001
Type ofintravenous agent used
Alpha-adrenergic antagonist, such as urapidil 454 (32.5) 191 (13.4)
Calcium-channel blocker, such as nicardipine or 227 (16.2) 122 (8.5)
nimodipine
Combined alpha- and beta-blocker, such as labetalol 202 (14.4) 83 (5.8)
Nitroglycerin 209 (14.9) 59 (4.1)
Diuretic, such as furosemide 174 (12.4) 94 (6.6)
Nitroprusside 169 (12.1) 28 (2.0)
Hydralazine 82 (5.9) 50 (3.5)
Other 85 (6.1) 44 (3.1)
Medical and surgical treatment during the first 7 days-
no./total no. (%)
Intubation 96/1379 (7.0) 93/1400 (6.6) 0.74
Admission ta an intensive care unit 532/1379 (38.6) 529/1400 (37.8) 0.67
Prophylactic treatment for deep-vein thrombosis 306/1379 (22.2) 304/1400 (21.7) 0.76
Compression stockings 147/1379 (10.7) 146/1400 (10.4) 0.84
Subcutaneous heparin 248/1379 (18.0) 245/1400 (17.5) 0.74
Use ofintravenous mannitol 855/13 79 (62.0) 864/1400 (61.7) 0.88
Hemostatic therapy'' 57/1379 (4.1) 40/1400 (2.9) 0.07
Any surgical intervention 77/13 79 (5.6) 77/1400 (5.5) 0.92
Evacuation or decompression ofthe hematoma 43/1379 (3.1) 38/1400 (2.7) 0.53
Insertion ofa ventricular drain 41/13 79 (3.0) 44/1400 (3.1) 0.80
Decision ta withdraw active treatment and care 75/1379 (5.4) 46/1400 (3.3) 0.005

;, Hemostatic therapy included the use offresh-frozen plasma, vitamin 1(, and recombinant tissue factor VIia.

N ENGLJ MED 368;25 NEJM.ORG JUNE 20, 2013 2359

245
iKB LECTURE CRITIQUE D'ARTICLE

The NEW ENGLAND JOURNAL of MEDICINE

toma volume was log-transformed to remove in the Supplementary Appendix). The baseline
skewness after the addition of the value 1.1 to characteristics were balanced between the two
eliminate negative values. The nominal level of groups (Table 1). The primary outcome was de­
significance for all analyses was P<0.048, since termined for 1 382 of the participants (98.5%) in
two interim analyses were performed in which the intensive-treatment group and for 1412 (98.3%)
the Haybittle-Peto efficacy stopping rule was in the standard-treatment group.
used.16
BLOOD-PRESSURE-LOWERING TREATMENT
AND ACHIEVED BLOOD-PRESSURE LEVELS
RESULTS
As shown in Table 2, the median time from the
S TUDY POPULATION onset of the intracerebral hemorrhage to the ini­
From October 2008 through August 2012 , a total tiation of intravenous treatment was shorter in the
of2839 participants (mean age, 6 3.5 years; 62.9% intensive-treatment group than in the standard­
men) were enrolled at 144 hospitals in 21 coun­ therapy group (4.0 hours [interquartile range, 2.9 to
tries; 1403 participants were randomly assigned 5.1] vs. 4.5 hours [interquartile range, 3.0 to 7.0],
to receive early intensive treatment to lower their P<0.001); the median time from randomization
blood pressure, and 1436 were assigned to re­ to the initiation of treatment was also shorter in
ceive guideline-recommended treatment (Fig. S1 the intensive-treatment group (6 minutes [inter-

Table 3. Primary, Secondary, and Safety Outcomes at 90 Days.'�

Guideline-
Intensive Recommended
Blood-Pressure Blood-Pressure
Lowering Lowering Odds Ratio
Variable (N=1399) (N=l430) (95%CI) PValue
Primary outcome: death or major disability- no./total no. (%)t 719/1382 (52.0) 785/1412 (55.6) 0.87 (0.75-1.01) 0.06
Secondary outcomes
Score on the modified Rankin scale- no./total no. (%)t 0.87 (0.77-1.00) 0.04
0: No symptoms at all 112/1382 (8.1) 107/1412 (7.6)
1: No substantive disability despite symptoms 292/1382 (21.1) 254/1412 (18.0)
2: Slight disability 259/1382 (18.7) 266/1412 (18.8)
3: Moderate disability requiring some help 220/1382 (15.9) 234/1412 (16.6)
4: Moderate-severe disability requiring assistance with daily 250/1382 (18.1) 268/1412 (19.0)
living
5: Severe disability, bed-bound and incontinent 83/1382 (6.0) 113/1412 (8.0)
6: Death by 90 days 166/1382 (12.0) 170/1412 (12.0)
Death- no./total no. (%) 166/1394 (11.9) 170/1421 (12.0) 0.99 (0.79-1.25) 0.96
Health-related quality of life§
Problems with mobility- no./total no. (%) 767/1203 (63.8) 821/1231 (66.7) 0.88 (0.74-1.04) 0.13
Problems with self-care- no./total no. (%) 563/1202 (46.8) 635/1230 (51.6) 0.83 (0.70--0.97) 0.02
Problems with usual activities- no./total no. (%) 731/1203 (60.8) 814/1231 (66.1) 0.79 (0.67--0.94) 0.006
Problems with pain or discomfort- no./total no. (%) 477/1197 (39.8) 552/1227 (45.0) 0.81 (0.69--0.95) 0.01

0
Problems with anxiety or depression- no./total no. (%) 406/1192 (34.1) 463/1220 (38.0) 0.84 (0.72-1.00) 0.05
(.9
LJ.J
a: Overall health utility score 0.60±0.39 0.55±0.40 0.002
(.9

LJ.J
Living in residential care facility- no./total no. (%) 108/1222 (8.8) 114/1248 (9.1) 0.96 (0.73-1.27) 0.80
a:
CO
0
Duration of initial hospitalization- days 0.43

z Median 20 19
a:
LJ.J
> 1 nterquartile range 12-35 11-33
en
z
0
fC=
0
LJ.J

2360 N ENGLJ MED,68;2, NEJM.ORG JUNE2O,2O1'

246
ARTICLE 6 - LCA 2014

RAPID BP LOWERING IN INTRACEREBRAL HEMORRHAGE

Table 3. (Continued.)

Guideline-
Intensive Recommended
Blood-Pressure Blood-Pressure
Lowering Lowering Odds Ratio
Variable (N=1399) (N=l430) (95%CI) PValue
Safety outcomes - no./total no. (%)
Neurologie deterioration in first 24 hr, 198/1369 (14.5) 211/1395 (15.1) 0.95 (0.77-1.17) 0.62
Nonfatal serious adverse events Il 326/1399 (23.3) 338/1430 (23.6) 0.92
Any neurologie deterioration from intracerebral 47/1399 (3.4) 55/1430 (3.8) 0.49
hemorrhage'"'
Recurrent intracerebral hemorrhage 4/1399 (0.3) 4/1430 (0.3)
lschemic or undifferentiated stroke 8/1399 (0.6) 8/1430 (0.6)
Acute coronary event 5/1399 (0.4) 5/1430 (0.3)
Other cardiovascular disease 22/1399 (1.6) 26/1430 (1.8)
Noncardiovascular disease 160/1399 (11.4) 152/1430 (10.6) 0.49
Severe hypotensiontt 7/1399 (0.5) 8/1430 (0.6)

;, Plus-minus values are means ±SD. Ali odds ratios are unadjusted.
t The modified Rankin scale evaluates global disability and functioning; scores range from O (no symptoms) ta 6 (death); the primary out­
came of death or major disability was assessed as a score on the modified Rankin scale of 3 ta 6 at 90 days.
t The difference between the groups in scores across all seven levels of the modified Rankin scale was determined with the use of a logistic­
regression analysis of the ordinal data.
Possible responses in each domain were "no problems," "moderate problems," or "extreme problems"; for these analyses, the latter two
levels were combined as "any problems." The overall health utility score was calculated with the use of population norms from the United
l(ingdom.
, Neurologie deterioration was defined as an increase from baseline ta 24 hours of 4 or more points on the National Institutes of Health
Stroke Scale or a decline of 2 or more points on the Glasgow Coma Scale.
Nonfatal serious adverse events included those that were life-threatening, required inpatient hospitalization or prolongation of an existing
hospitalization, or resulted in disability or a medical or surgical intervention; a patient cou Id have more than one event.
'"' This category includes clinician-reported neurologie deterioration in a patient with cerebral mass effect or extension of the hematoma.
tt Severe hypotension was defined as hypotension with clinical consequences (including acute renal failure) that required corrective therapy
with intravenous fluids, vasopressors, or hemodialysis.

quartile range, 0 to 39] vs. 19 minutes [inter­ participants in the intensive-treatment group than
quartile range, 0 to 167]). More patients in the in the standard-treatment group (75 participants
intensive-treatment group than in the standard­ [5.4%] vs. 46 participants [3.3%], P=0.005).
treatment group received two or more intrave­
nous agents to lower their blood pressure (26.6% CLINICAL OUTCOMES AND SERIOUS ADVERSE EVENTS

vs. 8.1%, P<0.001). The mean systolic blood-pres­ At 90 days, 719 of the participants (52.0%) in the
sure levels differed significantly between the two intensive-treatment group, as compared with 785
groups from 15 minutes to day 7 after random­ (55.6%) in the standard-treatment group, had a
ization (Fig. S2 in the Supplementary Appendix); poor outcome (odds ratio with intensive treat­
at 1 hour, the mean systolic blood pressure was ment, 0.87; 95% confidence interval [CI], 0.75 to
150 mm Hg in the intensive-treatment group (with 1.01; P=0.06) (Table 3). The ordinal analysis
462 patients [33.4%] achieving the target blood showed a significant favorable shift in the distri­
pressure of <140 mm Hg) as compared with bution of scores on the modified Rankin scale
164 mm Hg in the standard-treatment group (a with intensive blood-pressure-lowering treatment
difference of 14 mm Hg, P<0.001). As shown in (pooled odds ratio for shift to higher modified
Table 2, there were no significant differences be­ Rankin score, 0.87; 95% CI, 0.77 to 1.00; P=0.04)
tween the two groups with respect to other aspects (Table 3, and Fig. S3 in the Supplementary Ap­
of medical care during the 7 days after random­ pendix). Adjusted analyses showed consistency in
ization, except that a decision to withdraw active the treatment effect with respect to the primary
treatment and care was made in the case of more and key secondary outcomes in logistic-regression

N ENGL I MED �68:2i; NEIM.ORG IUNE 20. 20n 2361

247
iKB LECTURE CRITIQUE D'ARTICLE

The NEW ENGLAND JOURNAL of MEDICINE

models that included prognostic variables and cerebral hemorrhage (61.4% and 65.3%, respec­
various cutoff points on the modified Rankin tively). The effects of intensive lowering of blood
scale (Table Sl in the Supplementary Appendix). pressure were consistent across all prespecified
In the assessment of the five domains of the subgroups (Fig. 1). There were no significant
EQ-SD, participants in the intensive-treatment differences between the two groups in any of the
group reported fewer problems and had signifi­ other outcomes studied. The numbers of serious
cantly better overall health-related quality of life adverse events, including episodes of severe hy­
at 90 days than did those in the standard-thera­ potension (which occurred in <1% of the par­
py group (mean [±SD] utility score, 0.60±0.39 vs. ticipants), were also balanced between the two
0.55±0.40; P=0.002) (Table 3). groups (Table 3).
The rate of death from any cause was similar
in the intensive-treatment group and the stan­ HEMATOMA OUTCOMES

dard-treatment group (11.9% and 12.0%, respec­ The prespecified subgroup of participants who
tively) (Table 3), as was the percentage of these underwent repeat brain imaging for an assess­
deaths attributed to the direct effect of the intra- ment of the between-group difference in hema-

Guideline­
Intensive Recommended P Value for
Subgroup Treatment Treatment Odds Ratio (95% Cl) Homogeneity
no. ofevents (%)
Age 1 0.76

;_·-
<65 yr 340 (43.3) 352 (46.7) .1. 0.87 (0.71-1.06)

-
a,65 yr 379 (63.6) 433 (65.7) 0.91 (O. 72-1.15)
Region 1 0.97
China 431 (45.8) 480 (49.6) .J. 0.86 (0.72-1.03)
Other 288 (65.5) 305 (68.7) ..... 0.86 (0.65-1.14)
1
Time to randomization
<4 hr 435 (54.3) 465 (56.7) ·--
1
0.91 (O. 75-1.10)
0.48

_1
a,4 hr 284 (48.9) 320 (54.1) 0.81 (0.65-1.02)
-1
Baseline systolic blood pressure 1 0.90
<180 mm Hg 372 (50.0) 400 (53.8)
- 0.86 (O. 70-1.05)
.1,

"180 mm Hg 347 (54.4) 385 (57.6) '1 0.88 (O. 70-1.09)


H istory of hypertension 1 0.12
,-
1_
Yes 524 (52.5) 555 (54.3) 0.93 (0.78-1.11)

-----
No 194 (50.7) 228 (58.9) 1 0.72 (0.54-0.95)
1
Baseline NIHSS score 1
0.48
<15 393 (39.8) 440 (44.3) 0.83 (O.70-0.99)
"15 324 (82.9) 341 (83.4) 1 - 0.96 (0.67-1.40)
1 -
Baseline hematoma volume 0.57
,_
1
<15 ml 285 (39.3) 309 (42.0) 0.90 (O. 73-1.10)
-,
_1-
"15 ml 383 (69.1) 416 (73.4) 0.81 (0.63-1.05)

...
Baseline hematoma location 1 0.76
Deep 568 (53.1) 614 (56.9) ..1. 0.86 (O. 73-1.02)

<G
Others 100 (47.6) 111 (49.8) 0.92 (0.63-1.34)
Total 719 (52.0) 785 (55.6) 0.87 (0.75-1.01)

0.5 1.0 2.0

Intensive Guideline-
Treatment Recommended
Better Treatment
Better
0
(.9
LJ.J
a: Figure 1. Effect of Early Intensive Blood-Pressure-Lowering Treatment on the Primary Outcome, According to Prespecified Subgroups.
(.9
The primary outcome of the study was death or major disability, defined as a score of 3 to 6 on the modified Rankin scale (in which a
LJ.J
a: score ofO indicates no symptoms, a score ofS indicates severe disability, and a score of6 indicates death) at 90 days. Each percentage is
CO
0 based on the number of people in that subgroup. The black squares represent point estimates (with the area of the square proportional to
z the number of events), and the horizontal lines represent 95% confidence intervals. The diamond incorporates the point estimate, repre­
a:
LJ.J
> sented by the vertical dashed line, as well as the 95% confidence intervals, of the overall effects within categories. Scores on the National
en
z Institutes of Health Stroke Scale (NIHSS) range from O (normal neurologie status) to 42 (coma with quadriplegia).
0
fC=
0
LJ.J
@
2362 N ENGLJ MED 368;25 NEJM.ORG JUNE 20, 2013

248
ARTICLE 6 - LCA 2014

RAPID BP LOWERING IN INTRACEREBRAL HEMORRHAGE

toma growth from baseline to 24 hours consisted of blood pressure. 8 However, given the critical
of 491 of the 1399 participants with 90-day out­ nature and rapid evolution of bleeding in the
corne data (35.1%) in the intensive-treatment brain, a somewhat surprising finding was the
group and 473 of the 1430 participants with 90- absence of a significant difference in the effect
day outcome data (33.1%) in the standard-treat­ of treatment between patients who underwent
ment group. The mean hematoma volumes were randomization early (within 4 hours after the
15.7±15.7 ml and 15.1±14.9 ml in the two groups, intracerebral hemorrhage) and those who under­
respectively, at baseline and 18.2±19.1 ml and went randomization later. This could reflect either
20.6±24.9 ml, respectively, at 24 hours (Table S2 the limited power of the subgroup analyses or
and Fig. S4 in the Supplementary Appendix). The true independence of the effect of the intervention
difference in hematoma growth between the from the time of initiation of treatment. Since
groups in the 24 hours after baseline was not early intensive lowering of blood pressure did not
significant (relative difference, 4.5% [95% CI, have a clear effect on reducing the growth of the
-3.1 to 12.7; P=0.27], and absolute difference, hematoma, a key determinant of early death,
1.4 ml [95% CI, -0.6 to 3.4; P=0.18], after adjust­ there may be other mechanisms at play, such as
ment for prognostic variables). neuroprotection or a reduction in edema, that
result in the later positive clinical outcomes
DISCUSSION with this treatment. The ongoing Antihyper­
tensive Treatment of Acute Cerebral Hemorrhage
In this trial involving patients with intracranial (ATACH) II trial29 is expected to provide addi­
hemorrhage, early intensive lowering of blood tional information on the role of intensive lower­
pressure, as compared with the more conserva­ ing of blood pressure within 4.5 hours after the
tive level of blood-pressure control currently rec­ onset of a intracerebral hemorrhage, but future
ommended in guidelines, did not result in a sig­ evaluations of the treatment in patients with intra­
nificant reduction in the rate of the primary cerebral hemorrhage that are conducted in the
outcome of death or major disability. However, in prehospital setting or at more extended periods
an ordinal analysis of the primary outcome, in after onset than were tested in INTERACT2 may
which the statistical power for assessing physical be warranted.
functioning was enhanced, there were signifi­ The current trial has several strengths, includ­
cantly better functional outcomes among pa­ ing the large sample size, central concealment of
tients assigned to intensive treatment to lower treatment assignments, and high rates of follow­
their blood pressure than among patients as­ up and adherence to treatment. Furthermore,
signed to guideline-recommended treatment. • 22 28
the collection of data on serious adverse events,
Furthermore, there was significantly better phys­ including hypotension, ensured that any poten­
ical and psychological well-being among patients tial harms were reliably detected and quantified.
who received intensive treatment. These results In addition, the range of drug therapies used
are consistent with observational epidemiologic and of outcomes assessed in participants from a
findings associating high blood-pressure levels variety of hospitals in different countries en­
with poor outcomes among patients with intra­ hances the generalizability of the final results.
cerebral hemorrhage7-11 and indicate that early Sorne limitations should also be noted. First,
intensive lowering of blood pressure in this pa­ although the option to use a range of available
tient population is safe. drug therapies rather than a single agent was a
There was no clear evidence of heterogeneity strength of the study, it introduced complexity in
in the effect of treatment in any prespecified assessing the ways in which the effects may have
subgroup - not even in the subgroup defined varied across different agents. Moreover, in the
according to region ( China vs. elsewhere). More­ open (unblinded) assignment of interventions
over, there was no evidence of a significant effect that led to earlier and more intensive, as com­
modification according to a history or no his­ pared with less intensive, control of blood pres­
tory of hypertension - a finding that is relevant sure, the outcomes may have been confounded
because it has been postulated that patients with by differences in the management strategies that
hypertension have an upward shift in cerebral were used for the two groups after randomiza­
autoregulation and possibly an increased risk of tion, other than those that were documented.
cerebral ischemia related to intensive lowering Second, although we used established scales and

N ENGLJ MED368;25 NEJM.ORG JUNE20,2013 2363

249
iKB LECTURE CRITIQUE D'ARTICLE

The NEW ENGLAND JOURNAL of MEDICINE

objective criteria, some bias may have been in­ Supported by a program grant (571281), project grants
(512402 and 1004170), a Senior Principal Research Fellowship
troduced in the assessment of key outcomes. (to Dr. Anderson), and a Principal Research Fellowship (to Dr.
Third, the difference in the blood-pressure levels Neal) from the National Health and Medical Research Council
achieved between the two groups may have been (NHMRC) of Australia. Drs. Neal, Arima, and Parsons are re­
cipients of Future Fellowships from the Australian Research
attenuated by the use of an active-comparator Council. Dr. Hata is a recipient of a Postgraduate Fellowship
control group and the concomitant use of addi­ from the HighBlood Pressure Research Council of Australia.
tional agents with blood-pressure-lowering Dr. Huang reports receiving reimbursement for travel expenses
from Osaka Pharmaceuticals; Dr. Jiguang Wang, receiving con­
properties (e.g., mannitol) or hemostatic proper­ sulting fees from Novartis, Omron Healthcare, Pfizer, and Talœ­
ties (e.g., recombinant tissue factor VIIa); if this da, grant support from Novartis, Omron Healthcare, and Pfizer,
is so, however, the magnitude of the benefit of lecture fees from A&D Pharma, Omron Healthcare, Novartis,
Pfizer, and Servier, and reimbursement for travel expenses from
early intensive blood-pressure-lowering treat­ Pfizer and Takeda; Dr. Lavados, receiving grant support from
ment could be greater in settings in which only Lundbeck, payment for manuscript preparation from BMJ, and
the very highest levels of blood pressure are payment for advisory board membership from Bristol-Myers
Squibb; and Dr. Davis, receiving lecture fees from Boehringer
treated in the hyperacute phase of stroke. Ingelheim, Sanofi-Aventis, and EVER Neuro Pharma. No other
In summary, early intensive lowering ofblood potential conflict of interest relevant to this article was reported.
pressure did not result in a significant reduction Disclosure forms provided by the authors are available with
the full text of this article at NEJM.org.
in the rate of the primary outcome of death or We thank the patients who participated in this trial and their
major disability, but an ordinal analysis of relatives; the clinical and research teams of the various emer­
gency departments, intensive care units, stroke units, and neu­
scores on the modified Rankin scale did suggest
rology departments; Vlado Perkovic, Stephen MacMahon, and
that intensive treatment improved functional Gary Ford for their support; the staff of Apollo Medical Imaging
outcomes. Intensive lowering of blood pressure Technology in Melbourne, Australia, for their support of the
MiStar software used in the CT analyses; and Beijing MedSept
was not associated with an increase in the rates Consulting for developing the interactive voice-activated system
of death or serious adverse events. that was used for the randomization process in China.

APPENDIX

The authors' affiliations are as follows: George Institute for Global Health (C.S.A., E.H., C.D., R.L., B.N., J.H., H.A., S.H., Q.L., M.W.,
J.C.) and National Health and Medical Research Council Clinical Trials Centre (R.J.S.), University of Sydney, and the Neurology Depart­
ment, Royal Prince Alfred Hospital (C.S.A., C.D.), Sydney, the Departrnent of Neurology, John Hunter Hospital, University of Newcastle,
Newcastle, NSW (M.P.), and MelbourneBrain Centre, Royal Melbourne Hospital and University of Melbourne, Melbourne, VIC (S.M.D.)
- ail in Australia; the Departrnent of Neurology, Peking University First Hospital,Beijing (Y.H.), the Shanghai Institute of Hyperten­
sion, Rui Jin Hospital, Shanghai Jiaotong University, Shanghai (Jiguang Wang), the Departrnent of Neurology,Baotou Central Hospital,
Baotou (Y.L.), and the Departrnent of Neurology, Yutian County Hospital, Tangshan, Hebei Province (Jinchao Wang) - ail in China;
the Departrnent of Neurology, Assistance Publique-Hôpitaux de Paris-Hôpital Lariboisière and DHU NeuroVasc Paris-Sorbonne, Uni­
versité Paris Diderot-Sorbonne Paris Cité, Paris (C.S.); the Departrnent of Cardiovascular Sciences and NIHRBiomedical Research Unit
for Cardiovascular Sciences, University of Leicester, Leicester, United Kingdom (T.R.); Servicio de Neurologfa, Departamento de Me­
dicina, Clinica Alemana, Universidad del Desarrollo, and Universidad de Chile, Santiago (P.L.) - both in Chile; the Departrnent of
Environmental Medicine, Graduate School of Medical Sciences, Kyushu University, Fukuoka, Japan (J.H.); and the Departrnent of Epi­
demiology, Johns Hopkins University, Baltimore (M.W.).

REFERENCES

1. Qureshi AI, Tuhrim S, Broderick JP, use predictor of 30-day mortality. Stroke mortality and admission blood pressure
Batjer HH, Hondo H, Hanley DF. Sponta­ 1993;24:987-93. in patients with acute stroke. J lntern Med
neous intracerebral hemorrhage. N Engl J 6. Qureshi AI, Ezzeddine MA, Nasar A, 2004;255:257-65.
Med 2001;344:1450-60. et al. Prevalence of elevated blood pres­ 10. Fogelholm R, Avikainen S, Murros K.
2. Liu M, Wu B, Wang WZ, Lee LM, sure in 563,704 adult patients with stroke Prognostic value and determinants of first­
Zhang SH, Kong LZ. Stroke in China: epi­ presenting to the ED in the United States. day mean arterial pressure in spontane­
demiology, prevention, and management Am J Emerg Med 2007;25:32-8. ous supratentorial intracerebral hemor­
strategies. Lancet Neural 2007;6:456-64. 7. Zhang Y, Reilly KH, Tong W, et al. rhage. Stroke 1997;28:1396-400.
3. Brott T, Broderick J, Kothari R, et al. Blood pressure and clinical outcome 11. Ohwaki K, Yano E, Nagashima H,
Early hemorrhage growth in patients with among patients with acute strolœ in Inner Hirata M, Nakagomi T, Tamura A. Blood
intracerebral hemorrhage. Stroke 1997; Mongolia, China. J Hypertens 2008;26: pressure management in acute intracere­
28:1-5. 1446-52. bral hemorrhage: relationship between
0
(.9 4. Broderick JP, Diringer MH, Hill MD, 8. Okumura K, Ohya Y, Maehara A, elevated blood pressure and hematoma
LJ.J
a: et al. Determinants of intracerebral hem­ Wakugami K, Iseki K, Takishita S. Effects enlargement. Stroke 2004;35:1364-7.
(.9
orrhage growth: an exploratory analysis. of blood pressure levels on case fatality 12. Anderson CS, Huang Y, Wang JG, et al.
LJ.J
a: Strolœ 2007;38:1072-5. after acute stroke. J Hypertens 2005;23: IntensiveBlood Pressure Reduction in Acute
CO
0 5. Broderick JP, Brott TG, Duldner JE, 1217-23. Cerebral Haemorrhage Trial (INTERACT):
Tomsick T, Huster G. Volume of intracere­ 9. Vemmos KN, Tsivgoulis G, Spengos a randomised pilot trial. Lancet Neural
z
a:
LJ.J
bral hemorrhage: a powerful and easy-to- K, et al. U-shaped relationship between 2008;7:391-9.
>
en
z
0
fC=
0
LJ.J 2364 N ENGLJ MED 368;25 NEJM.0RG JUNE 20, 2013
@

250
ARTICLE 6 - LCA 2014

RAPID BP LOWERING IN INTRACEREBRAL HEMORRHAGE

13. Anderson CS, Huang Y, Arima H, et al. et al. Guidelines for the management of 24. Dolan P, Gudex C, Kind P, Williams
Effects of early intensive blood pressure­ spontaneous intracerebral hemorrhage in A. A social tariff for EuroQol: results
lowering treatment on the growth of hema­ adults: 2007 update: a guideline from the from a UK general population survey. Dis­
toma and perihematomal edema in acute American Heart Association/American cussion paper 138. York, United King­
intracerebral hemorrhage: the Intensive Stroke Association Stroke Council, High dom: University of York Centre for Health
Blood Pressure Reduction in Acute Cere­ Blood Pressure Research Council, and the Economies, September 1995.
bral Haemorrhage Trial (INTERACT). Quality of Care and Outcomes in Re­ 25. Woodward M. Epidemiology: study
Strolœ 2010;41:307-12. search lnterdisciplinary Working Group. design and data analysis. 2nd ed. Boca
14. Arima H, Anderson CS, Wang JG, et al. Stroke 2007;38:2001-23. Raton, FL: Chapman & Hall/CRC, 2005:
Lower treatment blood pressure is associ­ 19. Morgenstern LB, Hemphill JC III, 587-91.
ated with greatest reduction in hematoma Anderson C, et al. Guidelines for the 26. IST-3 Collaborative Group. The bene­
growth after acute intracerebral hemor­ management of spontaneous intracere­ fits and harms of intravenous thromboly­
rhage. Hypertension 2010;56:852-8. bral hemorrhage: a guideline for health­ sis with recombinant tissue plasminogen
15. Delcourt C, Huang Y, Wang J, et al. care professionals from the American activator within 6 h of acute ischaemic
The second (main) phase of an open, ran­ Heart Association/American Strolœ Asso­ stroke (the Third International Stroke
domised, multicentre study to investigate ciation. Stroke 2010;41:2108-29. Trial [IST-3]): a randomised controlled
the effectiveness of an INTEnsive blood 20. Steiner T, Kaste M, Forsting M, et al. trial. Lancet 2012;379:2352-63. [Erratum,
pressure Reduction in Acute Cerebral Recommendations for the management Lancet 2012:380:730.J
haemorrhage Trial (INTERACT2). !nt J of intracranial haemorrhage. 1. Spontane­ 27. Hacke W, Kaste M, Fieschi C, et al.
Strolœ 2010;5:110-6. ous intracerebral haemorrhage. Cerebro­ Randomised double-blind placebo-con­
16. Anderson C, Heeley E, Heritier S, et vasc Dis 2006;22:294-316. [Erratum, Cere­ trolled trial of thrombolytic therapy with
al. Statistical analysis plan for the sec­ brovasc Dis 2006;22:461.J intravenous alteplase in acute ischaemic
ond INTEnsive blood pressure Reduction 21. Brott T, Adams HP Jr, Olinger CP, et stroke (ECASS Il). Lancet 1998;352:1245-
in Acute Cerebral hemorrhage Trial al. Measurements of acute cerebral infarc­ 51.
(INTERACT2): a large-scale investigation tion: a clinical examination scale. Stroke 28. Howard G, Waller JL, Voeks JH, et al.
to solve longstanding controversy over the 1989;20:864-70. A simple, assumption-free, and clinically
most appropriate management of elevated 22. Bath PMW, Lees KR, Schellinger PD, interpretable approach for analysis of
blood pressure in the hyperacute phase of et al. Statistical analysis of the primary modified Rankin outcomes. Strolœ 2012;
intracerebral hemorrhage. !nt J Stroke outcome in acute stroke trials. Stroke 43:664-9.
2013 January 7 (Epub ahead of print). 2012;43:1171-8. [Erratum, Stroke 2012; 29. Qureshi AI, Palesch YY. Antihyperten­
17. Teasdale G, Jannett B. Assessment of 43(9):elO0.J sive Treatment of Acute Cerebral Hemor­
coma and impaired consciousness: a prac­ 23. Rabin R, de Charro F. EQ-5D: a mea­ rhage (ATACH) Il: design, methods, and
tical scale. Lancet 1974;2:81-4. sure of health status from the EuroQol rationale. Neurocrit Care 2011;15:559-76.
18. Broderick J, Connolly S, Feldmann E, Group. Ann Med 2001;33:337-43. Copyright © 2013 Massachusetts Medical Society.

AN NEJM APP FOR iPHONE


The NEJM Image Challenge app brings a popular online feature to the smartphone.
Optimized for viewing on the iPhone and iPod Touch, the Image Challenge app lets
you test your diagnostic skills anytime, anywhere. The Image Challenge app
randomly selects from 300 challenging clinical photos published in NEJM,
with a new image added each week. View an image, choose your answer,
get immediate feedback, and see how others answered.
The Image Challenge app is available at the iTunes App Store.

N ENGLJ MED368;25 NEJM.ORG JUNE20,2013 2365

251
iKB LECTURE CRITIQUE D'ARTICLE

QCM
1
1 Quelle(s) est(sont) la(les) caractéristique(s) de cette étude ?
A - Essai clinique contrôlé randomisé.
B - Etude multicentrique.
C - Etude en ouvert.
D - Essai en cross-over.
E - Etude de supériorité.

QCM
2
1 Quel(s) est(sont) le(s) principe(s) d'une randomisation par minimisation ?
A - A chaque nouveau patient inclus dans l'étude, la randomisation l'alloue au groupe de traitemen1
pour lequel cette allocation engendre le moins de différences possibles entre les groupes à
l'étude.
B - Tous les n patients, le nombre de sujets dans chaque groupe de traitement est identique.
C - Il s'agit d'une stratification a minima permettant une égalisation dynamique des groupes au cours
de l'étude.
D - Il s'agit non plus de randomiser des sujets mais des groupes de sujets.

I
E - Il s'agit d'une méthode de randomisation restreinte.

QCM Pourquoi avoir choisi les critères « pays d'origine, hôpital d'origine et délai depuis
3 le début de l'hémorragie cérébrale » comme bases pour cette minimisation ?
A - Il s'agit de facteurs de confusion potentiels.
B - Il s'agit de facteurs pronostiques potentiels dans cette pathologie.
C - Il s'agit de facteurs de risque potentiels dans cette pathologie.
D - L'un des objectifs poursuivis étaient de rendre comparables initialement les groupes sur ces
critères.
E - L'analyse du critère de jugement principal pouvait ainsi s'effectuer de manière indépendante de
ces variables.

Q M
� I Pourquoi l'analyse du critère principal a-t-elle été faite en situation bilatérale ?
A - Il s'agit d'une étude de supériorité, ce type d'analyse y est donc approprié.
B - Un test bilatéral est toujours préférable à un test unilatéral.
C - Il est impossible de savoir quelle stratégie de réduction tensionnelle est supérieure ou inférieure
à l'autre a priori.
D - Il s'agit d'une étude réalisée en ouvert, ce type d'analyse est donc le seul à pouvoir être réalisé.
E - La robustesse des résultats est plus importante avec une analyse en situation bilatérale.

QCM
5
1 Quelle(s) est(sont) la(les) proposition(s) vraie(s) concernant les analyses
intermédiaires réalisées par les auteurs dans cette étude ?
A - Elles étaient légitimes car elles ont été planifiées et inscrites dans le protocole de l'étude.
B - Les analyses intermédiaires ne permettent d'arrêter une étude en cours que si les résultats
montrent une toxicité supérieure de l'un des deux traitements.
C - Les analyses intermédiaires portent sur le critère principal d'évaluation.
D - Pour réaliser des analyses intermédiaires, le nombre de patients inclus doit être identique à celui
sur lequel sera réalisée l'analyse finale.
0
E - Il y a une dimension éthique à la réalisation d'analyses intermédiaires au cours d'études de ce
(.9
LJ.J
type.
a:
(.9

LJ.J
a:
CO
0

z
a:
LJ.J
>

@
en
z
0
fC=
0
LJ.J

252
ARTICLE 6 - LCA 2014

QCM 1 Pourquoi le seuil de signification retenu pour l'analyse principale est-il de 0,048?
6
A - Il y a eu réalisation de deux analyses intermédiaires au cours de l'étude.
B - Il s'agit d'une erreur des auteurs lors de la rédaction du protocole d'étude.
C - Les comparaisons multiples, du fait des analyses intermédiaires, ont entraînées une inflation du
risque alpha qu'il convient de prendre en compte.
D - Il s'agit d'un seuil de significativité recalculé sur la valeur de la puissance a posteriori.
E - Avec l'inflation du risque alpha, un risque alpha corrigé à 0,048 équivaut à un risque alpha à
0,05.

QCM
7
1 Quelle(s) est(sont) la(les) caractéristique(s) du critère de jugement principal choisi
par les auteurs dans cette étude?
A - Critère objectif.
B - Critère reproductible.
C - Critère multiple.
D - Critère composite.
E - Critère clinique.

QCM
8
1Qu'entraîne le choix d'un critère de jugement principal composite, de manière
générale?
A - Augmentation de la puissance statistique.
B - Diminution de la puissance statistique.
C - Augmentation du nombre de sujets nécessaires.
D - Diminution du nombre de sujets nécessaires.
E - Comparaison favorisée avec les autres études sur le même suiet.

QCM
9
1 Quelle(s) est(sont) la(les) proposition(s) vraie(s)?
A - Le traitement intensif était mis en route en moyenne plus rapidement après l'hémorragie
cérébrale que le traitement standard.
B - Il y a eu un défaut de randomisation car il existe une différence significative sur le délai entre
tirage au sort et début du traitement (alors qu'il y a eu minimisation sur ce critère).
C - Tous les patients du groupe intensif ont atteint l'objectif tensionne 1.
D - La pression artérielle moyenne était significativement plus faible dans le groupe traitemen
intensif que dans l'autre groupe, de 15 minutes à 7 jours après randomisation.
E - Le nombre de traitements intraveineux différents pris pour faire baisser la tension artérielle étai
significativement plus élevé dans le groupe intensif que dans le groupe standard.

QCM I Comment a été obtenu le résultat de l'OR concernant le critère de jugement


1o principal?
A - 719/1382 + 785/1412
B - (719/1382) / (785/1412)
C - (719/1382) X (785/1412)
D - (719 X 627) / (663 X 785)
E - (719/627) X (663/785)

253
iKB LECTURE CRITIQUE D'ARTICLE

QCM
11
1 Comment interprétez-vous les conséquences des antécédents d'hypertension
connue sur l'intérêt ou non d'un traitement antihypertenseur intensif (figure 1)?
A - L'effet semble différentiel selon l'existence ou non d'antécédents connus d'hypertension.
B - En présence d'antécédents d'hypertension artérielle, il n'y a pas de différence significative entre
les deux groupes de traitement (intensif versus standard).
C - En l'absence d'antécédents d'hypertension artérielle, le traitement intensif semble être un facteur
protecteur sur la survenue des évènements (décès ou handicap majeur).
D - Le traitement intensif est significativement plus efficace que le traitement standard chez les
patients sans antécédents connus d'hypertension artérielle.
E - Le traitement intensif n'a aucun intérêt par rapport au traitement standard chez les patients avec

1
antécédents d'hypertension artérielle.

QCM
Que pouvez-vous dire à propos de la durée d'hospitalisation (tableau 3)?
12
A - Dans le groupe intensif, les patients n'ont jamais été hospitalisés moins de 12 jours.
B - La moitié des patients du groupe intensif ont été hospitalisés pendant au moins 20 jours.
C - Dans le groupe intensif, l'écart interquartile pour la durée d'hospitalisation est égal à 23 jours.
D - La durée maximale d'hospitalisation des patients du groupe intensif était de 35 jours.
E - La médiane est un indice de dispersion de la durée d'hospitalisation dans ce cas présent.

QCM I Pourquoi avoir utilisé une échelle de « qualité de vie liée à la santé » comme critère
13 de jugement secondaire dans cette étude?
A - Cela permet une évaluation plus globale du patient.
B - Cela permet de conclure sur l'étude en cas de non-significativité sur le critère de jugemen1
principal.
C - Cela permet d'aider de juger de l'opportunité de recourir à un traitement (aide à la décision,
balance bénéfices/risques).
D - Cela permettra d'évaluer l'opportunité de conduire une nouvelle étude en prenant ce critère
secondaire comme critère de jugement principal.
E - Cela permet d'augmenter la puissance de l'étude.

Au vu des résultats de cette étude, pensez-vous qu'il faudrait modifier les


QCM
recommandations en vigueur sur la stratégie de la prise en charge des pressions
14 artérielles élevées à la phase aiguë de l'AVC hémorragique?
A- Oui, le traitement intensif réduit le risque de mauvais pronostic dans cette pathologie (décès ou
handicap sévère).
B- Oui, le traitement intensif, même s'il n'a pas d'effet significatif sur le risque de mauvais pronostic,
entraîne une meilleure qualité de vie chez les patients que le traitement standard.
C- Oui, mais seulement chez les patients ne présentant pas d'antécédent d'hypertension artérielle.
D- Non, les données issues de cette étude ne permettent pas d'envisager de changement de
pratiques dans ce domaine.
E- Non, et par ailleurs c'est la seule étude sur ce sujet, donc même s'il elle s'était révélée positive,
elle n'aurait tout de même pas permis de faire changer les pratiques.

0
(.9
LJ.J
a:
(.9

LJ.J
a:
CO
0

z
a:
LJ.J
>

@
en
z
0
fC=
0
LJ.J

254
ARTICLE 6 - LCA 2014

Grille de correction QCM


(Questions à choix multiples)

A- V
....
:!!: C-
B- V
V
.
Réponse: ABCE
Il s'agit ici d'un essai clinique contrôlé, randomisé, international
(.) (multicentrique), en ouvert, avec un plan expérimental en deux groupes
0 D- F parallèles.
E- V
A-
B- F .
V Réponse: ACE
La randomisation par minimisation est une des méthodes de randomisation dite
N
:!!:
C-
D-
V
F .restreinte
Il s'agit d'un
(par opposition à une randomisation« simple»).
type particulier de randomisation par stratification permettant une
(.) égalisation dynamique des groupes. En effet, à chaque nouveau patient inclus,
0
ce dernier sera alloué à un groupe de traitement de telle sorte que les différences
E- V entre les groupes à l'étude soient les plus minimes possibles (donc de façon à ce
que les groupes soient les plus similaires possibles).
A-
B- V .
V Réponse: ABDE
Les critères utilisés pour la minimisation sont effectivement de potentiels facteurs
M C- F de confusion et facteurs pronostiques dans la prise en charge de l'hémorragie

.
:!!: cérébrale.
(.) D- V
0 Il est donc important de les prendre en compte dès le début de l'étude, afin de
E- V rendre les groupes comparables sur ces critères et de permettre l'interprétation du
critère de jugement principal de façon indépendante de ces critères.

"'"
A-
B- F .
V Réponse: AC
On réalise un test en situation bilatérale quand on ne sait pas dans quel sens
:!!: C- V une différence entre deux traitements va se produire. C'est le cas dans les
(.)
0 D-
E-
F
F
.essais de supériorité.
Un test unilatéral doit être justifié quand il est réalisé, et n'est indiqué que dans
les études de non-infériorité (où le sens de la différence est connu).
A-
B- F .
V Réponse: ACE
Les analyses intermédiaires doivent toujours être prévues a priori dans le
Lt) C- V protocole. Il doit être signifié quand elles devront être réalisées, avec quel(s)

.
:!!: objectif(s) et comment seront analysé les résultats.
(.) D- F
0 Elles peuvent permettre d'arrêter une étude pour efficacité, toxicité ou futilité (=
E- V inutilité). Elles permettent également de vérifier le taux d'inclusion des patients et
le taux d'écart au protocole.
A-
B- F .
V Réponse: ACE
La répétition des analyses statistiques au cours d'une étude entraîne une inflation
ID C- V du risque alpha (risque de conclure à tort à une différence alors qu'il n'y en a

.
:!!: pas).
(.) D- F
0 Il faut donc prendre en compte cette inflation du risque alpha lors du design de
E- V l'étude, particulièrement quand on sait que des analyses intermédiaires vont être
réalisées. Plusieurs méthodes existent.
A-
B- V .
V Réponse: ABDE
Le critère de jugement principal est la proportion de participants avec un
..... C- F mauvais pronostic défini par la mort ou un handicap majeur (évalué par

.
:!!: l'échelle de Rankin).
(.) D- V
0 C'est donc un critère composite (mort OU handicap majeur), fiable, clinique,
E- V reproductible, objectif, cliniquement pertinent (contexte des AVC), défini a
priori et adapté à la question posée.

255
iKB LECTURE CRITIQUE D'ARTICLE

CO
A-
B- F .
V Réponse: AD
En prenant un critère de jugement principal composite, on augmente le nombre
::!!: C- F d'évènements potentiels entrant en compte dans la définition « d'un cas» : il y a
0 D-
(.)

E-
V
F
.plus d'observations, donc on augmente la puissance statistique.
Le NSN s'en trouve diminué, car son calcul doit être basé sur l'incidence de tous
les critères composants le critère de jugement principal.

.
A- V Réponse: ADE
a, B- F Seuls 34,4% des patients du groupe intensif ont atteint l'objectif tensionnel (<
::!!: C- F 140mmHg). Ils étaient plus à avoir reçu > 2 traitements par voie IV par rapport aux
(.)
0 D- V patients du groupe standard, et le traitement était initié en moyenne plus tôt après
E- V randomisation et après hémorragie cérébrale que chez ceux du groupe standard.

.
A- F Réponse: D
....
.
0 B- F Il faut reconstruire le tableau de contingence correspondant.
::!!: C- F Attention à ne pas vous laisser piéger avec les valeurs d'incidences qui vous sont
(.)
0 D- V données dans le tableau (elles auraient été utiles directement pour un calcul de
E- F RR).
A-
B- V .
V Réponse: ABC
Il s'agit ici de l'interprétation des résultats d'une analyse en sous-groupes
........
C- V réalisés chez les patients en fonction de leur statut tensionnel (présence ou non
::!!: D-
(.)
0
F
.d'ATCD d'HTA).
Les analyses en sous-groupes ne sont réalisées qu'à visée exploratoire et ne
doivent pas servir à conclure. Elles sont en revanche utiles pour mener des
E- F études ultérieures par l'identification de groupes chez lesquels les traitements
pourraient se révéler plus efficaces.

....
N
A-
B- V .
F Réponse: BC
Médiane = indice de position (on parle aussi de 2 ème quartile pour qualifier la
::!!: C-
(.) D-
0
V
F .médiane)
50% des valeurs observées sont inférieures à la médiane, 50% sont supérieures
(ici, on peut donc dire que la moitié des patients du groupe intensif ont été
E- F hospitalisé pendant au moins 20 jours)

.
A- V Réponse: ACD
....
M B- F On ne conclut jamais sur les critères secondaires dans les études. L'analyse
::!!: C- V portant sur ces critères est réalisée à visée exploratoire, et peut servir de base
(.)
0 D- V pour de prochaines études (en utilisant ces critères secondaires - s'ils se révèlent
E- F intéressants - comme critères principaux).
A-
B- F .
F Réponse: DE
L'analyse du critère de jugement principal dans cette étude est négative (pas de
"'".... C- F
différence significative en termes de décès ou handicap majeur). Aucune
::!!:
(.) D- V .modification des pratiques ne sera donc instaurée sur la base de cette étude.
D'autres études devraient être menées sur le sujet de façon à se prononcer de

.
0 façon plus « fiable» sur la question.
E- V Par ailleurs, il est à noter que cette étude est pertinente cliniquement, avec une
bonne faisabilité et une bonne puissance.

0
(.9
LJ.J
a:
(.9

LJ.J
a:
CO
0

z
a:
LJ.J
>
en
z
0
fC=
0
LJ.J
@

256
Chapitre
40

ARTICLE 7 - LCA 2015

BMJ Open Association among work exposure,


alcohol intake, smoking
and Dupuytren's disease in a large
cohort study (GAZEL)
Alexis Descatha, 1 • • Matthieu Carton, 1 • Zakia Mediouni, 1 • • Christian Dumontier, 4
2 3 2 2 3

Yves Roquelaure, 5 Marcel Goldberg, 1 • Marie Zins, 1 • Annette Leclerc 1 •


2 2 2

Ta cite: Descatha A, ABSTRACT


Carton M, Mediouni Z, et al. Strengths and limitations of this study
Objectives: ln view of the debate of factors in
Association among work
Dupuytren's disease, we aimed to describe its ■ Limitation: Self-reported diagnosis, and possible
exposure, alcohol intake,
relationship with certain occupational factors, alcohol residual confounding (genetic factors mainly).
smoking and Dupuytren's
disease in a large cohort intake and smoking. ■ Strength: The longitudinal design the relatively
study (GAZEL). BMJ Open Selling: The French GAZEL cohort (employees of large size of the cohort.
2014;4:e004214. Electricité de France and Gaz de France). ■ Strength: Analyses on women.
doi:10.1136/bmjopen-2013- Participants: Participants of the cohort who
004214 answered a questionnaire in 2012, that is, 13 587
participants (73.7% of the questionnaire sent). ln
► Prepublication history for 2007, self-assessed lifetime occupational Dupuytren 's disease is characterised by
this paper is available online. biomechanical exposure was recorded (carrying loads, chronic contracture of the fourth and fifth
Ta view these files please manipulating a vibrating tool and climbing stairs), as fingers of the hand towards the palm,
visit the journal online well as alcohol intake, smoking and diabetes mellitus.
(http://dx.doi.org/10.1136/ usually accompanied by thickening of the
Analyses were performed on high alcohol intake,
bmjopen-2013-004214). palmar skin. 1 It has a clear genetic back­
smoking and duration of relevant work exposure,
ground.2-4
Received 10 October 2013 stratified by gender.
Since its description by Guillaume
Revised 9 December 2013 Primary and secondary outcome measures:
From a specific question on Dupuytren's disease Dupuytren in 1831 following Henry Cline
Accepted 20 December 2013
assessed in 2012, the outcome measures were self­ senior and Sir Astley Cooper, there has been
reported Dupuytren's disease (yes/no) and disabling controversy regarding biomechanical work
Dupuytren's disease (including surgery). exposure which might contribute to the
Resulls: A total of 10 017 men and 3570 women, development of this disorder.5 An exhaustive
aged 64-73 years, were included; the mean age for review and a meta-analysis were conducted to
men was 68 years and for women was 65 years. address this controversy, and was concluded
Among men, the following were significantly that there is good evidence of an association
associated with Dupuytren's disease: age (OR 1.03 between vibration exposure and Dupuytren's
(1.00; 1.06)), diabetes (OR 1.31 (1.07; 1.60)), heavy 6 7
disease. However, some authors still con­
drinking (OR 1.36 (1.10; 1.69)) and over 15 years of
sider that occupational exposure, including
manipulating a vibrating tool at work (OR 1.52 (1.15;
2.02)); except for diabetes, the association with these vibration, is not a risk factor for Dupuytren's
factors was stronger for disabling Dupuytren's disease disease in manual workers. 1 8 9 These
(or surgery), with OR 1.07 (1.03; 1.11), 1.71 (1.25; authors argued there are still conflicting
2.33) and 1.98(1.34; 2.91 ), respectively, for age, heavy results and that evidence is based only on
drinking and over 15 years of manipulating a vibrating two longitudinal studies. The role of alcohol
tool at work. Among the 3570 women included, 160 consumption and smoking are also a matter
CrossMark reported Dupuytren's disease (4.5%). The number of of debate, 9 10 although one large longitu­
cases in the group of women was tao low to reach dinal study found a clear relationship
conclusions, although the findings seemed similar for between such exposure and Dupuytren's
age, diabetes and vibration exposure. disease.11
For numbered affiliations see Conclusions: ln this large French cohort study,
end of article. We used data from a large cohort study to
Dupuytren's disease in men was associated with high
describe the prevalence of Dupuytren's
levels of alcohol consumption and exposure to hand­
Correspondance ta transmitted vibration. lt is likely that the same applied disease, and to analyse its association with
Professor Alexis Descatha; to women. certain risk factors, including exposure to
alexis.descatha@uvsq.fr vibration, alcohol intake and smoking.

257
iKB LECTURE CRITIQUE D'ARTICLE

METHODS alcohol-intake category was taken into consideration if


Population the participant had increased consumption during the
The GAZEL cohort comprises employees of Electricité study period.
de France (EDF) and Gaz de France (GDF), the French Diabetes mellitus was self-reported every year from
national utility for energy production and distribution 1989.
(GAZEL stands for GAZ and ELectricité). The company
employs workers in various trades and of different socio­
Outcomes
economic status. At baseline in 1989, the cohort
In 2012, a specific question on Dupuytren's disease was
included 20 625 volunteers, men aged 40-50 years and
asked: "(l) Have you ever had Dupuytren's disease
women 35-50 years, and 18 428 of them are still followed
(thickening of the palmar skin, nodes or contracture of
up. In January of each year since then, the participants
the fourth finger of the hand)? (2) if yes, do you have
have completed a general self-administered question­
any limitations because of it? (3) Have you had surgery
naire about their lifestyle, health and occupational
for it?"
situation.12
We considered two outcomes, that is, Dupuytren's
In the present study, we included only the participants
disease (yes or no) based on the answer to the first ques­
who answered the 2012 GAZEL questionnaire (which
tion; and a three-category variable: no Dupuytren's
included a question about Dupuytren's disease).
disease (reference), Dupuytren's disease without surgery
and without limitations and Dupuytren's disease with
Potential risk factors surgery or limitations.
Information on gender and age (in 2012) was collected
through the general questionnaire. Occupational risk
factors were assessed in the 2007 questionnaire. Data on Analyses
nine different types of biomechanical exposure were Univariate and multivariate analyses were stratified on
available, including the number of years of exposure gender for both outcomes. For the multinomial regres­
during their working lives (carrying loads, bending sion model, all the risk factors previously described were
trunk, drive a vehicle, kneeling, climbing stairs, climbing included, except 'control exposure' variables. Statistical
ladder, working with arm over the shoulder, carrying Analysis Software was used for all statistical analyses
load on the shoulder and manipulating a vibrating (SAS, V9.3, SAS Institute Inc, Cary, North Califomia,
tool). In this study of Dupuytren's disease, we analysed USA). Associations were considered statistically signifi­
the potential role of manipulating a vibrating tool. As cant if the p value was less than 0.05. OR and their 95%
information about forceful activity was not available, car­ CI were computed.
rying loads was considered to be a proxy for forceful
work and was also taken into account. Climbing stairs,
an irrelevant exposure for Dupuytren's disease, was also RESULTS
used as a 'control exposure' to check the lack of rela­ The 13 587 participants who answered the GAZEL ques­
tionship. For these variables, three categories were con­ tionnaire in 2012 constituted the sample (10 017 men
sidered for men based on duration of exposure: that is, and 3570 women). The participation rate was 73.7%
never exposed, exposed but for less than 15 years and (18 428 questionnaires sent in 2012). The participants
exposed for 15 years or more. In view of the number of were aged 59-73 years (mean age 68 years for men and
exposed women in the cohort, the exposure for women 65 years for women).
was only considered as yes or no. In addition, at incep­ Of the 10 017 men included, 839 reported
tion of the cohort in 1989, a 'yes or no' question about Dupuytren's disease (8.4%), including 342 who reported
manipulating vibrating tools was also available, and com­ surgery or limitations (3.4%). Age, diabetes mellitus,
puter work was used as control exposure. heavy drinking and over 15 years of manipulating a
Data for alcohol consumption were available for each vibrating tool at work were significantly associated with
year since 1992, and three categories were also consid­ self-reported Dupuytren's disease, with a dose-effect rela­
ered on the basis of the distribution observed. Only tionship (table 1). Similar results were found when a
heavy drinkers were taken into account based on the yes/no question was used at the inception of the cohort
results of a previous study 13 : less than 3 glasses a day of in 1989. As expected, none of the 'control exposure'
any alcohol, 3-4 glasses of wine or beer, 5 or more variables were associated with Dupuytren's disease.
0
(.9
glasses of wine/beer or 3 glasses or more of spirits a day. Reported durations of exposure to carrying loads and
LJ.J
a: If a participant had increased his alcohol consumption smoking habits were not found to be associated with
(.9

LJ.J
between 1992 and 2012, the highest category was taken Dupuytren's disease. The associations were stronger
a: into consideration. Data on smoking had been collected when considering disabling Dupuytren's disease (or
CO
0
at inception in 1989 and grouped into three categories: surgery) than for Dupuytren's disease without reported
z non-smoker or former smoker, 1-20 cigarettes/cigars or surgery or disability (table 2). Figure 1 shows a clear
a:
LJ.J
> pipes per day and over 20 cigarettes/cigars or pipes per dose effect in relation to duration of exposure, using a
en
z day. As for alcohol consumption, the highest 5-year step.
0
fC=
0
LJ.J
@ 2 Descatha A, Carton M, Mediouni Z, et al. BMJ Open 2014;4:e004214. doi:10.1136/bmjopen-2013-004214

258
ARTICLE 7 - LCA 2015

Table 1 Univariate and multivariate analyses of Dupuytren's disease(yes vs no) and available factors assessed in the
previous period in men
OR (univariate OR (multivariate analysis
N (total) N Per cent analyses, 95% Cl) logistic model, 95% Cl)*
Aget 1.03(1.01 ta 1.06) 1.03(1.00 ta 1.06)
Diabetes
No 8581 692 8.06 1 1
Yes 1436 147 10.24 1.30(1.08ta 1.57) 1.31(1.07 ta 1.60)
Smoking habits(pack/day):j:
Non-smoker(or former smoker) 6055 488 8.06 1 1
Smoker <1 2670 229 8.58 1.07(0.91 to 1.26) 1.05(0.88 to 1.24)
Smoker �1 1246 117 9.39 1.18(0.96 to 1.46) 1.05(0.83 to 1.32)
Drinking habits(glass/day):j:
<3 2551 174 6.82 1 1
3 or 4 glasses of wine/beer 4864 411 8.45 1.26(1.05ta 1.52) 1.22(1.01 ta 1.48)
�5 glasses of wine/beer 2577 249 9.66 1.46(1.19ta 1.79) 1.36 (1.10 ta 1.69)
or �3 glasses of spirits
Carrying loads(assessed in 2007), number of years of exposure
No 6812 565 8.29 1 1
1-15 years 1026 89 8.67 1.05(0.83 to 1.33) 0.95(0.74 to 1.22)
>15 years 1393 129 9.26 1.13(0.92 to 1.38) 0.91(0.71 to 1.16)
Climbing stairs(assessed in 2007), number of years of exposure
No 7281 618 8.49 1
1-15 years 810 63 7.78 0.91(0.69 to 1.19)
>15 years 1147 102 8.89 1.05(0.85 to 1.31)
Manipulating vibrating tools(assessed in 2007), number of years of exposure
No 7630 614 8.05 1 1
1-15 years 772 76 9.84 1.25(0.97 to 1.60) 1.25(0.95 to 1.65)
>15 years 781 88 11.27 1.45(1.15ta 1.84) 1.52(1.15 ta 2.02)
Carrying loads(assessed in 1989)
No 8888 737 8.29 1
Yes 1129 102 9.03 1.10(0.88 to 1.36)
Manipulating vibrating tools(assessed in 1989)
No 9278 760 8.19 1
Yes 739 79 10.69 1.34(1.05ta 1.71)
Computer work(assessed in 1989)
No 5270 444 8.43 1
Yes 4747 395 8.32 0.99(0.86 to 1.14)
Data in italics: p<0.05.
*Madel included all variables shown.
tAge as continuous variable and OR associated with an increase of one unit.
:j:Maximum consumption reached.

Of the 3570 women included, 160 reported conclusion, although assoc1at10ns appeared similar to
Dupuytren's disease (4.5%), including 78 who reported those observed in men.
surgery or limitations (2.2%). Associations were found The study had some limitations. The major limitation
to be weak, although age, diabetes and vibration expos­ came from the fact that the diagnosis was self-reported,
ure were still significant (tables 3 and 4); however, only a without any confirmation by physical examination by a
small number of women were heavy drinkers or occupa­ physician. In most cases, Dupuytren's disease is easily
tionally exposed. diagnosed, with no major differential diagnoses,
although it might be a previous hand trauma, campto­
DISCUSSION dactyly and tendovaginitis stenosans in a fixed flexion
The study confirmed that Dupuytren's disease in men is position, for example. In addition, we considered the
associated with high levels of alcohol consumption and fourth digit only.14 This lack of confirmation may have
exposure to hand-transmitted vibration in this large led to an underestimation of the prevalence of the dis­
French cohort study, after adjustment for age and dia­ order but it was probably limited, considering that the
betes, whereas smoking habits and other types of occu­ prevalence of this disorder in our study was comparable
pational exposure were not. This is one of the first with that observed for the same age category in the
studies to analyse risk factors among women, the general population.9 15 A possible residual confounding
number of exposed cases was too small to draw any effect should also be discussed: information regarding

Descatha A, Carton M, Mediouni Z, et al. BMJ Open 2014;4:e004214. doi:10.1136/bmjopen-2013-004214 3

259
® EDITIONS VERNAZOBRES-GREGO

N
Cl)
0
.i::,.
;;,;;
Table 2 Univariate and multivariate analyses of Dupuytren's disease (without limitations or surgery, with limitations or surgery, compared with reference class: no OJ
r
Dupuytren's disease) and available factors assessed in the previous period in men rn
(")
Dupuytren's disease without limitations or surgery Dupuytren's disease with limitations or surgery ---l
C
::rJ
N Per OR (univariate OR (multivariate analysis Per OR (univariate OR (multivariate analysis rn
(total) n cent analyses, 95% Cl) logistic model, 95%CI)* n cent analyses, 95% Cl) logistic model, 95% Cl)* (")
::rJ
Aget 10017 496 4.95 1.01 (0.98 to 1.04) 1.00 (0.97 to 1.04) 343 3.42 1.07 (1.03 to 1.11) 1.07 (1.03 to 1.11) =i
Diabetes
i.5
C
rn
No 8581 405 4.72 1 1 287 3.34 1 1 0
Yes 1436 91 6.34 1.38 (1.09 to 1.74) 1.41 (1.10 to 1.82) 56 3.90 1.19 (0.89 to 1.60) 1.18 (0.87 to 1.59) )>
Smoking habits (pack/day):j: �
Non-smoker (or former 6055 292 4.82 1 1 196 3.24 1 1 c=5
r
smoker) rn
Smoker <1 2670 132 4.94 1.03 (0.83 to 1.27) 1.04 (0.83 to 1.30) 97 3.63 1.13 (0.88 to 1.45) 1.06 (0.81 to 1.37)
Smoker :::1 1246 68 5.46 1.15 (0.88 to 1.51) 1.06 (0.79 to 1.43) 49 3.93 1.23 (0.90 to 1.70) 1.04 (0.74 to 1.46)
0 Drinking habits (glass/day):j:
"'
a,
C, <3 2551 103 4.04 1 1 71 2.78 1 1
"' 3 or 4 glasses of 4864 264 5.43 1.37 (1.08 to 1.73) 1.32 (1.03 to 1.68) 147 3.02 1.11 (0.83 to 1.47) 1.09 (0.81 to 1.47)
;,, wine/beer
0
"';::. 2:5 glasses of wine/beer 2577 125 4.85 1.24 (0.95 to 1.62) 1.12 (0.84 to 1.50) 124 4.81 1.78 (1.32 to 2.40) 1.71 (1.25 to 2.33)
0
:::, or :::3 glasses of spirits
_;;;: Carrying loads (assessed in 2007), number of years of exposure
;;;:
a, No 6812 350 5.14 1 1 215 3.16 1 1
CL

'"·
15·
C
1-15 years 1026 48 4.68 0.91 (0.67 to 1.25) 0.88 (0.63 to 1.22) 41 4.00 1.27 (0.90 to 1.79) 1.06 (0.73 to 1.52)
>15 years 1393 61 4.38 0.86 (0.65 to 1.14) 0.79 (0.56 to 1.09) 68 4.88 1.56 (1.18 to 2.07) 1.08 (0.76 to 1.52)
_N
Climbing stairs (assessed in 2007), number of years of exposure

� No 7281 358 4.92 1 260 3.57 1
Cl:, 1-15 years 810 42 5.19 1.05 (0.75 to 1.45) 21 2.59 0.72 (0.46 to 1.13)
� >15 years 1147 58 5.06 1.03 (0.78 to 1.37) 44 3.84 1.08 (0.78 to 1.50)
-& Manipulating vibrating tools (assessed in 2007), number of years of exposure
êl
No 7630 377 4.94 1 1 237 3.11 1 1
_,. 1-15 years 772 38 4.92 1.02 (0.72 to 1.43) 1.05 (0.72 to 1.52) 38 4.92 1.62 (1.14 to 2.30) 1.56 (1.07 to 2.29)
-:,;.
c,; >15 years 781 40 5.12 1.07 (0.77 to 1.50) 1.20 (0.81 to 1.78) 48 6.15 2.05 (1.49 to 2.82) 1.98 (1.34 to 2.91)
0
0
_,. Carrying loads (assessed in 1989)
,,.

CL
No
Yes
8888 437 4.92
1129 59 5.23
1
1.07 (0.81 to 1.42)
300 3.38
43 3.81
1
1.14 (0.82 to 1.58)
�- Manipulating vibrating tools (assessed in 1989)
0
:... No 9278 453 4.88 1 307 3.31 1
w Yes 739 43 5.82 1.23 (0.89 to 1.69) 36 4.87 1.51 (1.06 to 2.16)
� Computer work (assessed in 1989)
2.
0
"C No 5270 262 4.97 1 182 3.45 1
a,
:::,
Yes 4747 234 4.93 0.99 (0.83 to 1.19) 161 3.39 0.98 (0.79 to 1.22)
N
g Data in italics: p<0.05.
w
*Madel included all variables shown.
0
_,. tAge as continuous variable and OR associated with an increase of one unit.

_,. :j:Maximum consumption reached.
ARTICLE 7 - LCA 2015

"""' ____________________________
Figure 1 Proportion of
Dupuytren's disease depending
on duration of vibration exposure
.
,. _ _
96"-
in the working lite (5-year step).

--
94%-

.,,.--;.-� ..----
- -
---i---- ..----
- -
--1

88"-

86%-

84%- -

Noexposure less than s years s to 15 years over 15 yea rs

Dupuytren's disease with disability or surgery ■ Dupuytren's disease without disability or surgery
■ No Dupuytren's disease

Table 3 Univariate and multivariate analyses of Dupuytren's disease (yes vs no) and available factors assessed in the
previous period in women
OR (univariate analyses, OR (multivariate analysis
N (total) n Per cent 95% Cl) logistic model, 95% Cl)*
Aget 3570 160 4.48 1.05 (1.01 to 1.09) 1.05 (1.01 to 1.10)
Diabetes
No 3252 140 4.31 1 1
Yes 318 20 6.29 1.49 (0.92 to 2.42) 1.71 (1.04 to 2.81)
Smoking habits (pack/day):j:
Non-smoker (or former smoker) 2626 115 4.38 1 1
Smoker <1 711 34 4.78 1.10 (0.74 to 1.62) 1.16 (0.76 to 1.77)
Smoker 2'.1 187 8 4.28 0.98 (0.47 to 2.03) 0.96 (0.43 to 2.11)
Drinking habits (glass/day):j:
<3 2423 103 4.25 1 1
3 or 4 glasses of wine /beer 843 39 4.63 1.09 (0.75 to 1.59) 0.83 (0.54 to 1.27)
2'.5 glasses of wine/beer 271 17 6.27 1.51 (0.89 to 2.56) 1.17 (0.64 to 2.12)
or 2'.3 glasses of spirits
Carrying loads (assessed in 2007)
No 2995 131 4.37 1
Yes 151 11 7.28 1.72 (0.91 to 3.25)
Climbing stairs (assessed in 2007)
No 3024 137 4.53 1
Yes 116 6 5.17 1.15 (0.50 to 2.66)
Manipulating vibrating tools (assessed in 2007)
No 3163 142 4.49 1 1
Yes 4 2 50.0 21.28 (2.98 to 152.19) 17.17 (2.35 to 125.62)
Carrying loads (assessed in 1989)
No 3433 153 4.46 1
Yes 137 7 5.11 1.15 (0.53 to 2.51)
Manipulating vibrating tools (assessed in 1989)
No 3555 159 4.47 1
Yes 15 1 6.67 1.53 (0.20 to 11.67)
Computer work (assessed in 1989)
No 885 39 4.41 1
Yes 2685 121 4.51 1.02 (0.71 to 1.48)
Data in italics: p<0.05.
*Madel included all variables shown.
tAge as continuous variable and OR associated with an increase of one unit.
:j:Maximum consumption reached.

Descatha A, Carton M, Mediouni Z, et al. BMJ Open 2014;4:e004214. doi:10.1136/bmjopen-2013-004214 5

261
iKB LECTURE CRITIQUE D'ARTICLE

Table 4 Univariate and multivariate analyses of Dupuytren's disease (wrthout limitations or surgery, with limitations or surgery, compared wrth reference class: no
Dupuytren's disease) and available factors assessed in the previous period in women
Dupuytren's disease without limitations or surgery Dupuytren's disease with limitations or surgery
N OR (univariate OR (multivariate analysis Per OR (univariate OR (multivariate analysis
(total) n Per cent analyses, 95% Cl) logistic model, 95% Cl)* n cent analyses, 95% Cl) logistic model, 95% Cl)*
Aget 3570 82 2.30 1.04 (0.98 to 1.09) 1.04 (0.98 to 1.10) 78 2.18 1.06 (1.01; 1.12) 1.07 (1.01 ta 1.13)
Diabetes
No 3252 75 2.31 1 1 65 2.00 1 1
Yes 318 7 2.20 0.97 (0.45; 2.13) 1.18 (0.53 to 2.61) 13 4.09 2.09 (1.14 ta 3.83) 2.27 (1.22 ta 4.24)
Smoking habits (pack/day):j:
Non-smoker (or 2626 62 2.36 1 1 53 2.02 1 1
former
smoker)
Smoker <1 711 16 2.25 0.96 (0.55 to 1.67) 0.99 (0.54 to 1.82) 18 2.53 1.26 (0.73 to 2.16) 1.36 (0.76 to 2.41)
Smoker ?:1 187 3 1.60 0.68 (0.21 to 2.19) O.78 (0.24 to 2.55) 5 2.67 1.32 (0.52 to 3.35) 1.15 (0.41 to 3.27)
Drinking habits (glass/day):j:
<3 2423 51 2.10 1 1 52 2.15 1 1
3 or 4 glasses 843 23 2.73 1.30 (0.79 to 2.14) 1.06 (0.60 to 1.87) 16 1.90 0.89 (0.50 to 1.56) 0.63 (0.33 to 1.20)
of wine/beer
?:5 glasses of 271 8 2.95 1.43 (0.67 to 3.05) 1.30 (0.57 to 3.00) 9 3.32 1.58 (O.77 to 3.25) 1.04 (0.46 to 2.39)
wine/beer
or ?:3 glasses
of spirrts
Climbing stairs (assessed in 2007)
No 3024 69 2.28 1 68 2.25 1
Yes 116 2 1.72 0.76 (0.18 to 3.14) 4 3.45 1.54 (0.55 to 4.31)
Manipulating vibrating tools (assessed in 2007)
No 3163 70 2.21 1 1 72 2.28 1 1
Yes 4 1 25.00 21.57 (1.93 ta 240.79) 18.69 (1.61 ta 216.66) 1 25.00 21.00 (1.88 ta 234.10) 15.87 (1.36 ta 184.70)
Canrying loads (assessed in 1989)
No 3433 78 2.27 1 75 2.18 1
Yes 137 4 2.92 1.29 (0.47 to 3.59) 3 2.19 1.01 (0.31 to 3.24)
Manipulating vibrating tools (assessed in 1989)
No 3555 81 2.28 1 78 2.19 1
Yes 15 1 6.67 2.99 (0.39 to 23.05) 0 0.00 0.00 (0.00; Not calculable)
Computer work (assessed in 1989)
No 885 20 2.26 1 19 2.15 1
Yes 2685 62 2.31 1.02 (0.61 to 1.70) 59 2.20 1.02 (0.61 to 1.73)
Data in italics: p<0.05.
*Madel included all variables shown.
tAge as continuous variable and OR associated with an increase of one unit.
:t:Maximum consumption reached.

0
(.9
LJ.J
a:
(.9
J,
LJ.J
a:
CO
0


z
a:
LJ.J
>
en
z
0
f'=
0
LJ.J
@

262
ARTICLE 7 - LCA 2015

genetic factors, such as family history of Dupuytren's In addition to the well-established genetic factors, and
disease, hand trauma, epilepsy and anticonvulsant drug despite the limitations discussed, this study emphasised
intake, that are considered to be associated with the role of occupational hand-transmitted vibration
Dupuytren's disease, was not available. However, an asso­ exposure and alcohol consumption in Dupuytren's
ciation between these factors and vibration exposure disease. The question of compensation in some cases
and alcohol intake seems unlikely. with documented high levels of exposure should be
One of the strengths of our study is the relatively large reviewed, as should improvements of working conditions
size of the cohort. Since we had only one measure of with a view to prevention.
Dupuytren's disease in 2012, that is, the number of
reported cases of Dupuytren's disease, we studied factors Author affiliations
1Université de Versailles St-Quentin, Versailles, France
associated with prevalent cases. However, assessment of 2Centre for Research in Epidemiology and Population Health (CESP), U1018,
work exposure 5 years before evaluation of the outcome,
"Population-Based Epidemiological Cohorts" Research Platform, INSERM,
and the regular evaluation of alcohol intake and Villejuif, France
smoking throughout the follow-up period enabled us to 3AP-HP, Occupational Health Unit/EMS (Samu92), University Hospital of Paris
be confident about the associations observed. Those West Suburb, Garches, France
4Plastic and Hand Department, Nice University, St Roch Hospital, Nice, France
were confirmed by information collected at inception, 5Laboratory of Ergonomies and Epidemiology in Occupational Health, LUNAM
that is, 23 years before.
University, University of Angers, Angers, France
One important finding was confirmation in a large
study of the association between alcohol consumption Acknowledgements The authors would like ta thank EDF-GDF, especially the
and Dupuytren's disease among men, with a Service Général de Médecine de Contrôle and the 'Caisse centrale d'action
dose-response relationship.11 13 16 Although we might sociale du personnel des industries électrique et gazière'. They would ais□ like
discuss the arbitrary eut-off,17 the association with ta thank the 'Population-Based Epidemiological Cohorts' research platform
responsible for the GAZEL Cohort Study.
reported limitations (or surgery) was a new finding
because it has been described by clinicians before, but Contributors Ali authors contributed significantly ta the manuscript and
approved the final version. MZ, MC and MG were involved in the data
rarely reported in large cohort studies.1 18 19 Diabetes
collection, improved the analyses and commented the manuscript. AD
seemed to be related to the occurrence of Dupuytren's initiated the work, performed the main analyses and drafted the manuscript.
disease but not with limitations in men. Interestingly, it ZM, CD and AL discussed the project, improved the analyses and commented
was associated with limitations in women. Ever smoking the manuscript.
and heavy smoking were not found to be associated with Fundings The GAZEL Cohort Study was funded by EDF-GDF and INSERM
Dupuytren's disease, which was unexpected considering and received grants from the 'Cohortes Santé TGI R Programme.'
the possible ischaemic aetiology of Dupuytren's disease, Compeling interest None.
and the contrary findings in some recent studies.11 16
Ethics approval Comité Consultatif National d'Ethique pour les Sciences de la
Absence of a relationship could be due to the small
Vie et de la Santé.
number of very heavy smokers (61 men and 26 women
Provenance and peer review Not commissioned; externally peer reviewed.
smoked 2 packs/day or more).
In terms of occupational exposure, only vibration was Data sharing statement No additional data are available.
found to be related to Dupuytren's disease. Previous Dpen Access This is an Open Access article distributed in accordance with
studies have shown that high cumulative occupational the Creative Gommons Attribution Non Commercial (CC BY-NC 3.0) license,
exposure to vibration (intensity x duration) was asso­ which permits others ta distribute, remix, adapt, build upon this work non­
commercially, and license their derivative works on different terms, provided
ciated with Dupuytren's disease.13 20-23 Although expos­
the original work is properly cited and the use is non-commercial. See: http://
ure to vibration during the working life was creativecommans.arg/licenses/by-nc/3. 0/
self-reported, it corresponded to a very specific expos­
ure, probably with a low memory effect (workers tend to
remember correctly this type of precise exp osure).
Hand-vibration transmitting tools in our cohort were
REFERENCES
1. Townley WA, Baker R, Sheppard N, et al. Dupuy1ren's contracture
mostly screw tools, common drills and (infrequently) unfolded. BMJ 200 6;332:397-400.
2. Gudmundsson KG, Jonsson T, Arngrimsson R. Guillaume
pneumatic drills, where strenuous hand grip increases Dupuy1ren and linger contractures. Lance/ 2003;362: 165-8.
vibration damage. The role of high levels of vibration 3. Dolmans GH, Werker PM, Hennies HC, et al. Wnt signaling and
exposure is plausible, especially as a result of the local Dupuy1ren's disease. N Engl J Med 2011 ;365:307-17.
4. Eaton C, Seegenschmiedt MH, Bayai A, et al., ed. Dupuytren's
hyp oxia and chronic ischaemia hyp othesised m disease and related hyperproliferative disorders-principles,
Dupuytren's contracture.4 Similar figures for the research, and clinicat perspectives. Berlin, New York: Springer,
2011.
strength of the association found in published studies 5. Dembe A. Occupation and disease: how social factors affect the
support the plausibility of a possible causal relationship.7 conception of work-related disorders. Yale, CT: Yale University
Carrying loads was studied because, with some tasks, Press, 1996.
6. Liss GM, Stock SR. Can Dupuy1ren's contracture be work-related?:
such exposure is associated with manual work, and review of the evidence. Am J lnd Med 1996;29:521-32.
heavy forceful exposure during the working life was not 7. Descatha A, Jauffret P, Chastang J-F, et al. Should we consider
Dupuy1ren's contracture as work-related? A review and
available in the GAZEL cohort. However, no relationship meta-analysis of an old debate. BMC Musculoskelet Disord
was found here. 2011;12:96.

Descatha A, Carton M, Mediouni Z, et al. BMJ Open 2014;4:e004214. doi:10.1136/bmjopen-2013-004214 7

263
iKB LECTURE CRITIQUE D'ARTICLE

8. Burge PD. Dupuytren's disease. J bone Joint Surg Br 16. Burke FD, Proud G, Lawson IJ, et al. An assessment of the effects
2004;86:1088-9. of exposure to vibration, smoking, alcohol and diabetes on the
9. Hindocha S, mcgrouther DA, Bayat A. Epidemiological evaluation of prevalence of Dupuytren's disease in 97,537 miners. J Hand Surg
Dupuytren's disease incidence and prevalence rates in relation to Eur Vol 2007;32:400-6.
etiology. Hand 2009;4:256-69. 17. International Drinking Guidelines (Internet). (cité 2013 déc 6). http://
10. Hart MG, Hooper G. Clinical associations of Dupuytren's disease. www.icap.org/table/lnternationaldrinkingguidelines
Postgrad Med J 2005;81 :425-8. 18. Weinstein AL, Haddock NT, Sharma S. Dupuytren's disease in the
11. Godtfredsen NS, Lucht H, Prescott E, et al. A prospective study Hispanie population: a 10-year retrospective review. Piast Reconstr
linked bath alcohol and tobacco to Dupuytren's disease. J Clin Surg 2011 ;128:1251-6.
Epidemiol 2004;57:858-63. 19. Lanting R, van den Heuvel ER, Westerink B, et al. Prevalence of
12. Goldberg M, Leclerc A, Bonenfant S, et al. Cohort profile: the Dupuytren disease in the Netherlands. Piast Reconstr Surg
GAZ EL Cohort Study. /nt J Epidemio/ 2007;36:32-9. 2013;132:394-403.
13. Lucas G, Brichet A, Roquelaure Y, et al. Dupuytren's disease: 20. Chanut JC. Dupuytren's disease. Arch Mal Prof1963;24:621-5.
persona! factors and occupational exposure. Am J lnd Med 21. Cocco PL, Frau P, Rapallo M, et al. Occupational exposure to
2008;51 :9-15. vibration and Dupuytren's disease: a case-controlled study. Med Lav
14. Rayan GM. Clinical presentation and types of Dupuytren's disease. 1987;78:386-92.
Hand Clin 1999;15:87-96, vii. 22. Thomas PR, Clarke D. Vibration white linger and Dupuytren's
15. Lanting R, Broekstra DC, Werker PMN, et al. A systematic review contracture: are they related? Occup Med (Lond) 1992;42:155-8.
and meta-analysis on the prevalence of Dupuytren disease in the 23. Bovenzi M. Hand-arm vibration syndrome and dose-response
general population of western countries. Piast Reconstr Surg 20 Nov relation for vibration induced white linger among quarry drillers and
2013. Epub ahead of print. stonecarvers. ltalian Study Group on Physical Hazards in the Stone
lndustry. Occup Environ Med 1994;51:603-11.

0
(.9
LJ.J
a:
(.9
J,
LJ.J
a:
CO
0


z
a:
LJ.J
>
en
z
0
fC=
0
LJ.J
@

264
ARTICLE 7 - LCA 2015

QCM
1
1 De quel type d'étude s'agit-il?
A - Etude observationnelle descriptive.
B - Etude observationnelle analytique.
C - Etude de cohorte.
D - Etude cas-témoins.
E - Etude transversale.

QCM
2
1 La population de la cohorte GAZEL est-elle représentative de la population
générale active française?
A - Oui, car la population est issue d'une entreprise française.
B - Oui, car tous les métiers y sont représentés.
C - Oui, car la prévalence de la maladie de Dupuytren retrouvée dans l'étude est similaire à celle de
la population générale française.
D - Non, car la population d'étude n'a pas été sélectionnée parmi la population générale active
française.
E - Non, il va en France des personnes de moins de 40 ans qui font partie de la population active.

QCM 1 Quel(s) facteur(s) de risque de maladie de Dupuytren est(sont) recherché(s) dans


3 cette étude?
A - L'exposition professionnelle aux vibrations.
B - Le tabagisme.
C - Le diabète.
D - Les antécédents familiaux de maladie de Dupuytren.
E - La consommation d'alcool.

QCM
4
1 Quelle(s) est(sont) la(les) principale(s) limite(s) concernant la variable d'intérêt?
A - Son recueil par l'utilisation de questionnaires.
B - Son caractère déclaratif.
C - Son recueil de manière rétrospective.
D - L'absence de données médicales attestant son caractère effectif.
E - Sa faible prévalence.

QCM 11 n'y avait donc pas d'élément objectif pour valider (ou non) la maladie de
5 Dupuytren chez les sujets l'ayant déclaré. Quel(s) biais cela peut-il engendrer?
1

A - Biais de sélection.
B - Biais de classement.
C - Biais de mémorisation.
D - Biais de suivi.
E - Biais de confusion.

QCM
6
1 Dans la tableau 1, concernant la manipulation d'outils vibrants (évaluée en 2007),
quelle(s) est(sont) la(les) proposition(s) vraie(s)?
A - La catégorie de référence est la non manipulation.
B - Cette variable est continue, exprimée en années.
C - La durée de manipulation d'outils vibrants n'est pas importante concernant l'évaluation du risque
de développer une maladie de Dupuytren dans la cohorte GAZEL.
D - C'est être exposé plus de 15 ans qui est un facteur de risque de développer une maladie de
Dupuytren.
E - L'association entre exposition > 15 ans et maladie de Dupuytren persiste après ajustement.

265
iKB LECTURE CRITIQUE D'ARTICLE

QCM
7
1
Quelle(s) est(sont) la(les) proposition(s) vraie(s) à partir des données du tableau 1?
A - Le diabète est significativement associé à la maladie de Dupuytren.
B - Le tabagisme est significativement associé à la maladie de Dupuytren.
C - La consommation de > 3 verres d'alcool fort est un facteur de risque indépendant de maladie de
Dupuytren.
D - Dans ce tableau, aucun facteur protecteur de la maladie de Dupuytren n'a été mis en évidence.
E - Aucun résultat ajusté n'est présenté dans ce tableau.

QCM I Chez les femmes, comment interprétez-vous les résultats concernant la


8 manipulation d'outils vibrants (évaluée en 2007)?
A - Ils ne sont pas interprétables, l'IC95% est trop large.
B - Le faible nombre d'évènements dans le groupe manipulant des outils vibrants explique l'intervalle
de confiance aussi large associé à l'OR.
C - La manipulation d'outils vibrants quelle que soit la durée d'exposition, est un facteur de risque de
maladie de Dupuytren.
D - La manipulation d'outils vibrants quelle que soit la durée d'exposition, est un facteur protecteur
de la maladie de Dupuytren.
E - La manipulation d'outils vibrants est significativement associée à la maladie, de manière
indépendante.

QCM
9
1Quelle(s) est(sont) la(les) variable(s) incluse(s) dans l'analyse multivariée?
A - Le sexe.
B - L'âge.
C - Le diabète.
D - Le tabagisme.
E - La consommation d'alcool.

QCM 1 Les OR pour le diabète chez l'homme (tableau 1) sont peu différents en analyse
10 univariée et multivariée. Pourquoi?
A - Parce que le diabète est un facteur de confusion de la maladie de Dupuytren.
B - Parce que le diabète est un facteur pronostique de la maladie de Dupuytren.
C - Parce que le diabète est un facteur de risque indépendant de maladie de Dupuytren.
D - Parce que les autres facteurs d'ajustement n'exercent pas d'effet de confusion sur le diabète.
E - Parce que la prévalence du diabète dans cette population d'étude est plus faible qu'en population
générale.

Quel(s) élément(s) peu(ven)t expliquer le fait que le taux de la maladie des sujets
QCM
non exposés aux outils vibrants en 2007 soit plus faible chez la femme que chez
11 l'homme?
A- Car il y a moins de femmes inclues dans cette étude que d'hommes.
B- Car il existe un effet propre du sexe.
C- Car les femmes utilisent moins les outils vibrants que les hommes.
D- Car il existe possiblement une sous-déclaration chez les femmes.
E- Car il existe possiblement une sur-déclaration chez les hommes.

La relation entre la manipulation d'outils vibrants et la maladie de Dupuytren est


0

QCM
(.9
LJ.J
a:
plus forte lorsque les sujets déclarent avoir été opérés ou présentent une limitation
12
(.9

LJ.J
a: dans leurs activités. Pourquoi?
CO
0
A- Le fait d'avoir été opéré favorise une sur-déclaration.
z B- Le diagnostic est plus probable chez ces sujets.
a:
LJ.J
> C- Il y a moins de facteurs de confusion chez ces patients.

@
en
z
0 D- Les outils vibrants favorisent les formes sévères, nécessitant une prise en charge chirurgicale ou
fC=
0 responsables d'un handicap chez les sujets.
LJ.J
E- L'ajustement n'a pas été fait sur les mêmes facteurs.

266
ARTICLE 7 - LCA 2015

QCM 1 En quoi le fait de ne pas avoir tenu compte de l'utilisation d'antiépileptiques peut
13 avoir faussé les conclusions de l"étude?
A - Les patients diabétiques sont plus souvent sous antiépileptiques.
B - Les antiépileptiques sont un facteur de confusion potentiel.
C - Les alcooliques consomment peut être plus d'antiépileptiques.
D - Les données recueillies par questionnaire concernant la maladie auraient été différentes.

1
E - Il y aurait eu beaucoup moins de sujets volontaires pour participer à l'étude.

QCM Quel(s) élément(s) de ce travail plaide(nt) pour une relation causale entre la
14 manipulation d'outils vibrants et la maladie de Dupuytren?
A - Cohérence externe.
B - Plausibilité biologique.
C - Relation dose-effet.
D - Spécificité de la relation.

1
E - L'existence de preuves expérimentales chez l'animal.

QCM Quelle(s) est(sont) la(les) proposition(s) vraie(s) concernant la référence n° 13 de cet


15 article?
A - Elle ne comporte que trois auteurs.
B - Elle est référencée selon la norme« Vancouver».
C - L'article auquel elle fait référence a été publié en 2008.
D - Cette référence concerne la maladie de Dupuytren.
E - L'article en question fait 7 paqes.

267
iKB LECTURE CRITIQUE D'ARTICLE

Grille de correction QCM


(Questions à choix multiples)

A- F
....
:!!: C-
(.)
B-
V .
V Réponse: BC
C'est une étude épidémiologique observationnelle de type étude de cohorte
0 D- F prospective (cohorte GAZEL).
E- F

N
A-
B- F .
F Réponse: DE
La population n'est ici pas représentative de la population active française, car
:!!: C-
0 D-
(.)
F
V .elle ne représente que celle travaillant dans une entreprise donnée.
Les salariés y ont été sélectionnés sur la base du volontariat, et de nombreuses
caractéristiques (âge par exemple) laissent à penser que cette population n'est pas
E- V représentative de la population active française.
A- V
M
:!!: C-
(.)
B-
V .
V Réponse: ABCE
Les ATCD familiaux de maladie de Dupuytren, de même que les facteurs
0 D- F génétiques, n'ont pas été recherchés dans cette étude.
E- V

.
A- F Réponse: BD
"" B- V La maladie de Dupuytren est recueillie par déclaration des sujets interrogés sur les
:!!: C- F questionnaires de l'enquête. Il n'y a pas de vérification« médicale» de l'existence
(.)
0 D- V de la maladie (on ne demande pas aux sujets de justifier leur diagnostic avec un
E- F CR médical par exemple).
A- F
Lt)
:!!: C-
(.)
B-
F .
V Réponse: B
Il peut ici y avoir un biais de classement, un sujet étant classé comme étant
0 D- F malade alors qu'en réalité il n'a pas la maladie de Dupuytren, ou inversement.
E- F

.
A- V Réponse: ADE
B- F
. La catégorie de référence est celle pour laquelle il est noté 1 dans la partie« OR».
ID
:!!: C- F On parle de facteur de risque quand l'OR est> 1 avec un IC95% qui ne contient
(.)
0 D- V pas la valeur 1. Cela est retrouvé pour l'exposition > 15 ans, en univarié et
E- V multivarié (donc persistance des résultats après ajustement).
A- V
..... B-
:!!: C-
(.)
V .
F Réponse: ACD
Les résultats des OR en analyse multivariée sont des résultats ajustés. Ils
0 D- V permettent d'identifier les facteurs de risque indépendants de la maladie d'intérêt.
E- F
A-
B- V .
F Réponse: BCE
Chez les femmes, la manipulation d'outils vibrants n'a été catégorisée qu'en deux:

0
CO
:!!:
C-
D-
V
F . oui/non. La durée d'exposition n'a pas été recherchée.
Il y a très peu de femmes exposées aux outils vibrants ayant présentées une
(.9 maladie de Dupuytren. Ceci explique la largeur importante de l'IC95% qui

.
LJ.J
a: (.)
(.9 0 accompagne l'OR (tableau 3).
LJ.J
a: E- V L'exposition aux outils vibrants est un facteur de risque (OR> 1) de maladie de
0 Dupuytren chez les femmes, association qui persiste après ajustement (donc FDR
z indépendant de maladie de Dupuytren).
a:
LJ.J

z
0

LJ.J
@

268
ARTICLE 7 - LCA 2015

A-
B- V .
F Réponse: BCDE
Les analyses ont été stratifiées sur le sexe (d'où présentation de deux tableaux
a, C- V de résultats à chaque fois, distinguant le sexe). Il n'y a donc pas d'ajustement sur

.
:!!: le sexe.
(.) D- V
0 Dans l'analyse multivariée sont inclus tous les facteurs de risque précédemment
E- V décrits, à l'exception des variables « contrôle d'exposition » (travail sur
ordinateur, transport de charges).
A-
B-
F
F .
Réponse: CD
L'analyse multivariée montre que le diabète est un facteur de risque
.... C- V indépendant de maladie de Dupuytren chez les hommes (OR > 1, avec IC95% ne
:!!: D-
(.)
0
V
. contenant pas la valeur 1).
Cette valeur proche de la valeur en univariée montre qu'il n'y a pas d'effet
E- F confusion des autres variables (comme le tabac ou l'alcool par exemple) sur la
relation entre diabète et maladie de Dupuytren.
A-
.
F Réponse: BDE
........ B- V On se trouve ici chez les sujets non exposés (donc pas d'utilisation d'outils
:!!: C-
(.)
0 D-
F
V . vibrants, que ce soit chez les hommes ou chez les femmes).
Il existe aussi possiblement des facteurs de confusion comme l'âge ou la
E- V consommation d'alcool par exemple.
A-
B-
F
V .
Réponse: BD
Le diagnostic est plus probable chez ces sujets dans le sens où une prise en
.... C- F charge chirurgicale ou une reconnaissance d'incapacité nécessitent généralement
:!!: D- V des examens médicaux et une prise en charge médicale adaptée, qui laisse
(.)
0 penser que le diagnostic est plus «fiable ».
E- F

A-
.
F Réponse: BC

....
M

:!!:
C-
B- V
V . Les auteurs évoquent les antiépileptiques dans la conclusion.
Effectivement, ils peuvent être des facteurs de confusion dans l'étude de la
(.) D- F survenue de la maladie de Dupuytren. En effet, les alcooliques sont plus sujets à
0 consommer des antiépileptiques que d'autres patients.
E- F
A- V
"".... B- V .
Réponse: ABC
:!!: C-
(.)
0 D-
V
F
.
Il est fait référence ici aux critères de Braford Hill qui sont à connaître.
Dans les études observationnelles, on ne peut jamais conclure à la causalité. En
revanche, on va chercher un faisceau d'arguments en faveur de cette causalité.
E- F
A-
B- V .
F Réponse: BCDE
Les références sont indexées dans l'ordre dans lequel elles apparaissent pour
.... C- V
. la première fois dans le texte.
:!!: D- V Le style le plus fréquemment utilisé pour la mise en page des références est le

.
(.)
0 style Vancouver (utilisé ici).
E- V Les généralités sur la présentation des références doivent être connues, car ce
sont des questions faciles !

269
iKB LECTURE CRITIQUE D'ARTICLE

0
(.9
LJ.J
a:
(.9
J,
LJ.J
a:
CO
0


z
a:
LJ.J
>
en
z
0
fC=
0
LJ.J
@

270
Chapitre
41

ARTICLE 8 - LCA 1 / 2016

American Journal of Epidemiology Vol. 169, No. 10


© The Author 2009. Published by the Johns Hopkins Bloomberg School of Public Health. DOi: 10.1093/aje/kwp040
Ali rights reserved. For permissions, please e-mail: journals.permissions@oxfordjournals.org. Advance Access publication April 2, 2009

Original Contribution

Maternai Consumption of Coffee and Caffeine-containing Beverages and Oral


Clefts: A Population-based Case-Control Study in Norway

Anne Marte W. Johansen, Allen J. Wilcox, Rolv T. Lie, Lene F. Andersen, and Christian A. Drevon

Initial/y submitted August 11, 2008; accepted for publication February 2, 2009.

A large, population-based case-contrai study of facial clefts was carried out in Norway between 1996 and 2001.
The study included 573 cases-377 with cleft lip with or without cleft palate and 196 with cleft palate only-and 763
randomly selected contrais. Maternai consumption of coffee and other caffeine-containing beverages in early
pregnancy was recorded shortly after birth. Compared with that for no coffee consumption, the adjusted odds
ratios for cleft lip with or without cleft palate were 1.39 (95% confidence interval: 1.01, 1.92) for less than 3 cups
a day and 1.59 (95% confidence interval: 1.05, 2.39) for 3 cups or more. Coffee consumption was not associated
with risk of cleft palate only (for 2>3 cups vs. none, adjusted odds ratio= 0.96, 95% confidence interval: 0.55, 1.67).
Tea consumption was associated with a reduced odds ratio of bath cleft lip with or without cleft palate and cleft
palate only. There was little evidence of an association between caffeine exposure and clefts when all sources of
caffeine were considered. Adjustment for known confounding factors in general had minor effects on risk esti­
mates. Still, the authors could not rule out the possibility of uncontrolled confounding by factors associated with the
habit of drinking coffee.

caffeine; cleft lip; cleft palate; coffee; pregnancy

Abbreviations: Cl, confidence interval; CLP, cleft lip with or without cleft palate; CPO, cleft palate only.

Orofacial clefts are among the most common birth de­ crease in risk (11). According to a recently published
fects, and the prevalence in Norway (2.2 per 1,000 live­ article, maternai caffeine intake during pregnancy was as­
births) is particularly high. The etiology of clefts is sociated with fetal growth restriction (12).
complex and largely unknown. The high risk of recurrence Coffee is a commonly consumed beverage among preg­
of clefts among first-degree relatives (as much as 56 times nant women, and even a small increase in malformation risk
the background prevalence) suggests a strong genetic com­ could be a matter of concern. We used data from a population ­
ponent ( 1 ). However, environmental factors such as maternai based case-contrai study to evaluate the association of m a ­
nutrition (2-4), vitamin supplements (5), smoking (6), and ternai consumption o f coffee and caffeinated beverages in
binge alcohol consumption (7) also appear to contribute. early pregnancy with the risk of delivering an infant with an
Coffee consumption is relatively high in Norway. In the orofacial cleft.
latest nationwide study, average coffee intake was half a liter
a day, with peak intake among those aged 40--60 years (8). MATERIALS AND METHODS
Data from animal studies suggest that large single doses of
caffeine may cause palatal clefts as well as other birth de­ Ali infants barn with facial clefts in Norway are treated at
fects (9), although studies of coffee consumption in humans government expense in surgical centers at university hospi­
have provided little evidence of teratogenic effects ( 10). In tals located in Oslo and Bergen. In collaboration with these
a systematic review of 3 studies of orofacial clefts and caf­ 2 centers, we identified ail babies barn from 1996 to 2001
feine, high coffee intake was associated with a slight in- who were referred for treatment for either cleft lip with or

Correspondence to Anne Marte Wetting Johansen, Department of Nutrition, lnstitute of Basic Medical Sciences, Faculty of Medicine, University of
Oslo, PO Box 1046, 0316 Oslo, Norway (e-mail: a.m.w.johansen@medisin.uio.no).

1216 AmJ Epidemiol 2009;169:1216-1222

271
iKB LECTURE CRITIQUE D'ARTICLE

Maternai Caffeine Consumption and Oral Clefts 1217

without cleft palate (CLP) or cleft palate only (CPO). Con­ in unconditional logistic regression models. All beverages
trols were recruited during the same period by randomly were summarized and were analyzed in the same way, as
selecting approximately 4 births per 1,000 from the National follows. "Cups per day" was computed from reported num­
Medical Birth Registry (which includes all births in the ber of cups consumed per day, per week (divided by 7), or
country). These births served as controls for both case per month (divided by 30). Women who reported consuming
groups, with the target of 2 controls per case of CLP (nearly less than 1 cup per month were categorized as consuming
4 controls for each case of CPO). Both cases and controls zero. The cups-per-day variable was analyzed as a continu­
were recruited during their first weeks of life. ous variable. Finally, a 3-category variable was created:
Our present study was approved by the regional ethics 0 cups per day (reference category), more than O but less
review board, the Norwegian Data Inspectorate, and the than 3 cups per day, and 3 or more cups per day. Trends
US National Institute of Environmental Health Sciences across the categories were evaluated, with zero as the
Review Board. All participating mothers provided informed reference.
consent. An estimate of caffeine from all sources was computed
from the data on coffee, tea, and caffeinated soft drinks.
Participants Caffeine content was estimated as 100 mg per cup of coffee,
40 mg per cup of tea, and 20 mg per cup of caffeinated soft
There were 676 women in Norway who delivered infants drink based on values from the Norwegian Health Author­
requiring surgery for orofacial clefts during 1996-2001. We ities Web page (http://www.matportalen.no/Emner/Gravide
excluded 24 mothers who did not speak Norwegian or (in Norwegian)). Risk of clefts was evaluated per 100-mg
whose infant died after birth, leaving 652 eligible mothers. increase in caffeine intake (continuous variable) and for the
Of these, 88% (n = 573) agreed to participate. We ran­ categories > 100-<500 mg and 2:500 mg of caffeine rela­
domly selected 1,022 control mothers of livebirths via the tive to 0 -100 mg.
national Medical Birth Registry within 6 weeks of delivery. Adjustments were made for potential confounders (fac­
After excluding 16 who were not Norwegian speakers or tors associated with clefts in other studies, most of which
whose infant died, 1,006 mothers of controls were eligible, were also associated in our study), namely, dietary vitamin
of whom 76% (n = 763) agreed to participate. Data on in­ A (quartiles), dietary folate (quartiles), folie acid supple­
take of coffee and other caffeinated beverages were avail­ ment (400 �Lg/day, yes or no), vitamin supplement use
able for all participating mothers of cases and controls. We (yes or no), consumption of alcohol in early pregnancy
identified other birth defects among the cleft cases by using (number of drinks per sitting), smoking (ordinal linear with
3 data sources: the Medical Birth Registry (based on de­ 5 categories: none; passive only; and 1-5, 6-10, and 2:11
livery records and hospital records from the first week of cigarettes a day), nausea during the first trimester (yes or
life), medical records at the hospital performing the correc­ no), employment in early pregnancy (yes or no), education
tive surgery, and mother's questionnaire. Accompanying (ordinal linear with 6 categories), father's incarne (ordinal
defects were reported for 17% of CLP cases and 40% of linear with 3 categories), and year of birth. Evaluations of
CPO cases. Cases of clefts without accompanying defects possible interactions with coffee intake were carried out for
have been categorized as isolated clefts. use of folie acid supplements and smoking. In evaluating the
effects of coffee or tea separately, we adjusted for the other
Data collection (categorized as number of cups per day). Because CLP and
CPO are considered etiologically distinct outcomes, we con­
Mothers completed a 32-page questionnaire covering de­ ducted separate analyses for each (1). Separate analyses
mographic characteristics, reproductive history, and expo­ were also performed for isolated clefts (i.e., excluding those
sures during pregnancy (including smoking, alcohol with accompanying defects). Because oral clefts are rela­
consumption, coffee intake, medication use, and occupa­ tively rare birth defects, odds ratios are close approxima­
tional and household exposures). Median time from delivery tions of relative risks. All statistical analyses were
to completion of the questionnaire was 14 weeks for cases performed by using SPSS 14.0 software (SPSS Inc.,
and 15 weeks for controls. The questionnaire included items Chicago, Illinois).
on maternal consumption of caffeine-containing beverages
(coffee, tea, and soft drinks) during the first 3 months of
pregnancy. For each beverage, there was 1 question with 5 RESULTS
response categories: none, number of cups per day, number
of cups per week, number of cups per month, and number Women who gave birth to infants with CLP were taller,
of cups per year (without specifying the size of the cup). less educated, and less likely to work during the first tri­
0
(.9 An English translation of the questionnaire is available mester compared with mothers who gave birth to healthy
LJ.J
a:
(.9
online (http://www.niehs.nih.gov/research/atniehs/labs/epi/ controls (Table 1). Compared with mothers of controls,
LJ.J
studies/ncl/ncl_pregnancy_en.pdf). fewer mothers of CLP cases used a folie acid supplement,
a: and they were more often coffee consumers and smokers.
CO
0
Statistical methods Fewer mothers of CLP and CPO cases drank tea compared
z
a:
with mothers of controls (Table 1).
LJ.J
> The risk of delivering offspring with an orofacial cleft Maternal coffee consumption was associated with an in­
en
z was estimated by odds ratios with 95% confidence intervals creased risk of CLP. In the adjusted analyses, the odds ratio
0
fC=
0
LJ.J
Am J Epidemiol 2009;169:1216-1222
@

272
ARTICLE 8 - LCA-1 2016

1218 Johansen et al.

Table 1. Demographic and Other Characteristics of Participants in the Case-Contrai Study of Maternai Consumption of Caffeine-containing
Beverages and Oral Clefts, Norway, 1996-2001

Clef! Lip With or Without Clef! Palate Only Control Group


Clef! Palate (n = 377) (n = 196) (n = 763)
Median Median Median
Mean Mean
(25th, 75th % (25th, 75th % Mean (SD) (25th, 75th %
(SD) (SD)
percentile)" percentile)" percentile)"
Mother's characteristics
Coffee consumption before 3.0 (1.0, 4.1) 3.0 (1.0, 5.0) 3.0 (1.0, 4.3)
pregnancy, cups/day
Coffee consumption during 2.0 (0.7, 4.0) 2.0 (0.4, 3.0) 2.0 (0.7, 3.0)
the first trimester, cups/day
Coffee consumers during 56.0 49.0 45.7
the first trimester
Tea consumption during the 1.0 (0.4, 2.0) 1.0 (0.3, 2.0) 1.0 (0.4, 2.0)
first trimester, cups/day
Tea consumers during the 62.1 62.2 71.7
first trimester
Soft drink consumption in the 0.6 (0.3, 2.0) 0.6 (0.3, 1.0) 0.6 (0.3,1.5)
first trimester, cups/day
Soft drink consumers during 77.1 70.9 73.1
the first trimester
Folie acid supplement use 13.1 15.8 19.0
during the first trimester
(2>400 µg)
Multivitamin use during the 32.6 36.2 36.6
first trimester
Smoking during the first 44.1 36.8 31.9
trimester'
Alcohol consumption, 2.0 (1 .0, 2.0) 1.0 (1.0, 2.0) 1.0 (1.0, 2.0)
drinks/sitting
Age at delivery, years 28.9 (4.9) 28.9 (5.1) 29.2 (4.8)
Height, cm 168.6 (5.7) 166.9 (6.6) 167.7 (6.0)
Prepregnancy weight, kg 67.2 (12.9) 66.2 (13.6) 66.0 (11.3)
Body mass index, kg/m2 23.6 (4.3) 23.8 (4.5) 23.4 (3.7)
Education less than 18.8 11.2 11.0
high school
Working during the 76.3 79.5 83.1
first trimester
Father's incarne <250,000 52.6 54.5 47.3
Norwegian kroner
Other birth defects 16.7 39.8 5.0

Abbreviation: SD, standard deviation.


a lntake among consumers only.
b Ali levels of active smoking versus nonsmoking and passive smoking.

of CLP increased by 7% per-cup increase in daily coffee found no evidence of an association between maternal cof­
intake (adjusted odds ratio= 1.07, 95% confidence interval fee consumption during the first trimester and the risk of
(CI): 1.00, 1.16). Compared with those for women with zero CPO (Table 2).
coffee consumption, the adjusted odds ratios of CLP were Consumption of caffeine-containing tea was associated
1.39 (95% CI: 1.01, 1.92) for daily coffee consumption of with a decrease in the odds ratio of both CLP and CPO
less than 3 cups a day and 1.59 (95% CI: 1.05, 2.39) for (Table 2). Compared with no tea intake, daily tea intake of
consumption of 3 or more cups a day (Table 2), and inspec­ 3 or more cups gave adjusted odds ratios of 0.55 (95% CI:
tion of categories of coffee intake confirmed that there was 0.32, 0.95) for CLP and 0.58 (95% CI: 0.31, 1.07) for CPO.
a trend in risk by dose (P,renct= 0.013 in the adjusted anal­ Soft drinks that contain caffeine were positively associated
yses). The association between coffee consumption and with both types of facial clefts, although with confidence
CLP persisted among nonsmokers (among whom there intervals that did not exclude 1 (Table 2).
would presumably be no residual confounding by smoking) Table 3 shows maternal intake of caffeine from all bev­
and among mothers of isolated cleft cases (Table 2). We erages in relation to cleft risk. Although there was

Am J Epidemiol 2009;169:1216-1222

273
® EDITIONS VERNAZOBRES-GREGO

N
--J
.i::,.
;;,;;
):. OJ
:l r
rn
c... (")
---l
C
::rJ
rn
(")
::rJ
=i
Table 2. Maternai Consumption of Caffeine-containing Coffee, Tea, and Soft Drinks Du ring the First Trimester and Odds Ratios of Cleft Lip With or Without Cleft Palate and Cleft Palate Only, i.5
...
1\)
0 Norway, 1996-2001 C
0 rn
5l?
0
en Clef! Lip With or Without Clef! Palate Clef! Palate Only
)>
(0
Ali Cases lsolated" Cases Ali Cases lsolated" Cases �
� c=5
T
Crude Adjustedc Crude Adjustedc Crude Adjustedc Crude Adjustedc r
Analysis Analysis Analysis Analysis Analysis Analysis Analysis Analysis rn
1\) (n = 377/763)0 (n = 318/653) (n = 314/763) (n = 263/653) (n = 196/763) (n = 178/653) (n = 118/763) (n = 108/653)
1\)
1\) Odds 95% Odds 95% Odds 95% Odds 95% Odds 95% Odds 95% Odds 95% Odds 95%
Ratio Cl Ratio Cl Ratio Cl Ratio Cl Ratio Cl Ratio Cl Ratio Cl Ratio Cl

Coffee, per-cup increase 1.11 1.04, 1.18 1.07 1.00, 1.16 1.09 1.00, 1.17 1.09 1.00, 1.17 1.00 0.92, 1.09 0.98 0.88, 1.09 0.95 0.84, 1.07 0.94 0.82, 1.09
Coffee, categoricald
>0-<3 cups/day 1.37 1.03, 1.81 1.39 1.01, 1.92 1.41 1.05, 1.90 1.47 1.05, 2.07 1.17 0.83, 1.66 1.26 0.85, 1.86 1.11 0.72, 1.70 1.24 0.77, 1.99
::>3 cups/day 1.80 1.29, 2.53 1.59 1.05, 2.39 1.85 1.29, 2.64 1.67 1.08, 2.58 1.07 0.68, 1.70 0.96 0.55, 1.67 0.88 0.48, 1.61 0.91 0.45, 1.85
Pfor trend <0.001 0.013 <0.001 <0.001 0.566 0.760 0.879 0.877
Tea, per-cup increase 0.85 0.76, 0.94 0.86 0.76, 0.98 1.01 0.97, 1.05 1.01 0.97, 1.05 0.86 0.75, 0.99 0.82 0.70, 0.96 0.81 0.67, 0.98 0.79 0.64, 0.97
Tea, categoricald
>0-<3 cups/day 0.68 0.52, 0.88 0.74 0.55, 1.01 0.65 0.49, 0.86 0.72 0.52, 0.99 0.65 0.46, 0.91 0.66 0.45, 0.95 0.64 0.43, 0.97 0.64 0.41, 1.01

*
::>3 cups/day 0.50 0.31, 0.80 0.55 0.32, 0.95 0.49 0.30, 0.82 0.53 0.30, 0.94 0.68 0.39, 1.18 0.58 0.31, 1.07 0.49 0.23, 1.05 0.45 0.20, 1.01
Pfor trend 0.001 0.014 0.001 0.011 0.033 0.025 0.018 0.020 :s:
Soft drinks, per-cup increase 1.04 0.97, 1.11 1.05 0.96, 1.14 1.04 0.97, 1.11 1.04 0.95, 1.14 1.03 0.96, 1.12 1.05 0.95, 1.15 1.06 0.97, 1.15 1.06 0.96, 1.18
Soft drinks, categoricald
>0-<3 cups/day 1.20 0.90, 1.62 1.16 0.84, 1.62 1.23 0.90, 1.69 1.17 0.82, 1.67 0.85 0.60, 1.22 0.84 0.56, 1.24 1.15 0.72, 1.83 1.14 0.69, 1.89 0

::>3 cups/day 1.44 0.93, 2.23 1.43 1.44 0.82, 2.51 1.15 0.70, 2.40 1.43 0.65, 3.13
1.48 0.88, 2.49 0.90, 2.27 0.68, 1.96 1.30 1.36 0.69, 2.67

Pfor trend 0.086 0.144 0.107 0.193 0.928 0.788 0.371 0.384 (1)

0
0
Abbreviation: Cl, confidence interval. :::J
Cf>
a No accompanying malformations. C
3
b Ali parenthetical information is expressed as number of mothers of cases/number of mothers of contrais.
"8.
0 Odds ratios were adjusted for maternai nausea, smoking, alcohol consumption, folie acid supplement use, multivitamin supplement use, coffee consumption (in the analysis of tea and soft

:::J
drinks), tea consumption (in the analysis of coffee and soft drinks), dietary folate, dietary vitamin A, work status during the first trimester, educational level, incarne level (father), and year of Ol
birth. :::J
C.
d
Reference category: O cups/day. 0
iil.
0
ro
......
1\)

(0
ARTICLE 8 - LCA-1 2016

1220 Johansen et al.

a positive association in the crude analysis, the associ­


?fi- ation was reduced after adjustment. We also considered
� (J 0
CX) mothers who reported drinking coffee during the year be­
ci fore pregnancy but not during the first trimester. There was
� .Q
only a weak, positive association with risk of CLP in this
0 -c 1ii
C\J
m
group (adjusted odds ratio = 1.21, 95% CI: 0.80, 1.85)
0 0 a: ci
(Table 4).
a,
a,
?fi­
"' (.J
a, N
CX)
ci DISCUSSION
(!) CX)
r--- CX) Maternai intake of coffee during the first 3 months of the
ci ci
pregnancy was associated in a dose-response manner with
(!) risk of delivering an infant with CLP. In contrast, we found

C\i no evidence of an association between coffee intake and risk
(") "q"- LO of CPO. The association between coffee and CLP was only
L!) L!) r---
0 ci "q" slightly decreased by adjustments for confounders, and it
ci
persisted for nonsmokers and the subset of infants with iso­
., lated CLP.
.,"'
Q)

(.J
L!) L!)
There is no known mechanism by which coffee intake
<( � N
C\i
might increase the risk of CLP. Effects on homocysteine is
?fi-
� (J 0 (J) 0 C") one potential pathway. Evidence suggests that maternai
a, L!) r--- (!)
:, ci ci ci CO hyperhomocysteinemia may be linked to increased risk
0 ci of CLP (13). Coffee intake increases the plasma concen­
.<:: ., 0 CX) N <D
� :g:; m CX) "! tration of homocysteine (14-16), as does smoking (15),
ci 0 a: ci ci
a well-established risk factor for CLP (17). Folie acid sup­
.<:: <D
et:!
N
q
plements are consistently associated with reduced risk of
� ?fi- N CLP (18), and such supplements reduce plasma homocys­
Q_ � (J r---.-
:.J
'"'
Ql
0,
ci
�- � �
ci ci CO
teine (15). In the present study, the association between
high coffee intake and CLP was slightly stronger for
ci
ü ., 0 women who did not take a folie acid supplement (crude
L!) a, N
ë :g:; q a, �
(/)
0 0 a: ci odds ratio = 1.99, 95% CI: 1.30, 3.04), although this in­
N ._,.
teraction did not approach statistical significance (P for
a: L!)
(/)
":
C\i
interaction = 0.89).
,:,
,:, N <D CO
Consumption of caffeine-containing tea was strongly as­
0 CX) a, C')
,:, ci ci sociated with a reduced risk of both CLP and CPO. Potential
!:: ci
(lj
., 0
health benefits of tea have been linked to its high content of
::, CX)
0 :g:; q antioxidants (19). This is not a likely explanation for the
Ql :5 0 a: reduced cleft risk, however, because coffee has an even
E §:
0 ._,. higher total content of antioxidants than tea does (20).
� 0 "'.! 0
1?i ?fi- C\i The association of tea with lower risk of both types of clefts
ü: � o CO
a,
0.r---r (!)
m "q"
C') may reflect the presence of unmeasured confounding fac­
Ql a. ci ci ci CO
ci; :::; ci tors. Tea drinkers may have more healthy habits; consumers
Ol
!:: ., 0 L!) of high quantities of tea in our study were aider, more ed­
·c
:, :g:; q ucated, and drank less alcohol per sitting compared with
0
0 a:
Ql
!:: (!) 0
nonconsumers. Furthermore, the diet of consumers of high
"'.! L!)
quantities of tea contained more of every macronutrient and
j
ü
C\i
almost every micronutrient compared with the diet of non­
ë consumers (data not shown).
!:: ci
0 ., 0 CX)
The association of coffee with CLP appears to be inde­
:g_ :g:; q pendent of the role of caffeine. We found no association
E 0 a:
:,
(/) between total caffeine intake and risk of CLP (reflecting
!::
0 the combination of the positive association with coffee and
ü Ol the negative association with tea). Only 5 women drank
cil E
E 0 decaffeinated coffee exclusively, too few for a separate
0 ,:,

� y
L!) Ol
E i
!:: analysis. When we combined data on decaffeinated coffee
0 0 with those on caffeinated coffee, the odds ratios for CLP
0 0 .Q
were slightly increased, consistent with the association
A �I a..
of coffee and CLP being unrelated to caffeine intake (data
not shown).

Am J Epidemiol 2009;169:1216-1222

275
iKB LECTURE CRITIQUE D'ARTICLE

Maternai Caffeine Consumption and Oral Clefts 1221

Table 4. Maternai Coffee Consumption Before and During Pregnancy and Odds Ratios of Cleft Lip With or Without Cleft Palate, Norway, 1996-
2001

Crude Odds Ratio 95%CI Adjusted" Odds Ratio 95%CI

Never consumers (cases/contrais= 112/280b): did not consume


coffee before pregnancy or during the first trimester0
Quitters (cases/contrais= 57/135): consumed coffee the year 1.06 0.72, 1.54 1.21 0.80, 1.85
before pregnancy but not during the first trimester
Stable consumers (cases/contrais= 208/348): consumed coffee 1.49 1.13, 1.97 1.53 1.10, 2.12
both the year before pregnancy and during the first trimester
Stable high consumers (cases/contrais= 78/110): consumed ::0,3 cups 1.77 1.23, 2.55 1.61 1.04, 2.49
of coffee/day both the year before pregnancy and during the first trimester

Abbreviation: Cl, confidence interval.


a Adjusted for maternai nausea, smoking, alcohol consumption, folie acid supplement use, multivitamin supplement use, dietary folate, dietary
vitamin A, tea consumption, work status during the first trimester, educational level, incarne level (father), and year of birth.
b Ali parenthetical information is expressed as number of mothers of cases/number of mothers of contrais.
c Reference category.

By the same token, high-quantity coffee consumers (>3 analyses, but adjustment using categorized variables did not
cups/day) were older, less educated, smoked more, and alter the results.
drank more alcohol per sitting compared with nonconsum­ A meta-analysis of 3 studies on maternal coffee consump­
ers. Even though we adjusted for possible confounding tion and orofacial clefts found a slight increase in the risk of
factors, we cannot rule out the possibility of residual con­ clefts (11). All 3 studies used 0 cups as the reference cate­
founding by known factors such as smoking or confounding gory. When high coffee intake was compared with low in­
by unmeasured factors. Although we did not control for diet, take, the pooled odds ratio was 1.2 (95% CI: 0.9, 1.6). One
there was no evidence of a poorer diet among consumers of of the studies provided results for CLP separately, with an
high quantities of coffee, who actually reported eating more adjusted odds ratio for CLP of 1.3 (95% CI: 0.9, 1.9) asso­
vegetables, less sugar, and more of many essential nutrients ciated with more than 3 cups of coffee a day (11). The 2
(data not shown). other studies combined both types of clefts in their analyses.
Another potential source of bias in this study cornes from In the report by Kurppa et al. (21), drinking more than 4
possible selective participation of controls. While participa­ cups of coffee a day had no association with risk of clefts
tion was relatively high (88% for cases and 76% for con­ (unadjusted odds ratio = 1.0, 95% CI: 0.6, 1.6), whereas,
trols), the lower participation of controls leaves room for according to McDonald et al. (22), more than 3 cups of
differential participation by coffee drinking. However, it is coffee daily resulted in an adjusted odds ratio of 1.4 (95%
unlikely that such selection would occur for one type of CI: 0.7, 2.7).
facial cleft and not the other. Coffee was strongly associated A recent cohort study from Denmark found that coffee
with CLP but not with CPO in our data. This specificity has intake was associated with a reduced risk of CLP (23). The
been found for other factors associated with facial clefts (6). authors observed an odds ratio of 0.66 (95% CI: 0.27, 1.62)
By the same argument, the lack of specificity for the tea when comparing daily intake of more than 5 cups of coffee
association (which was protective for both types of facial with no intake. The Danish study had the advantage of a pro­
clefts) raises the question of whether this association might spective design, although one cost of this design was a rela­
be due to some unmeasured bias. tively small number of cases (134 with CLP).
Women may reduce their coffee consumption as they de­ In summary, results from our study showed a dose­
velop pregnancy symptoms of nausea and vomiting. Given dependent association between coffee consumption during
that closure of the lip and palate occurs relatively late in the the first trimester and increased risk of CLP. This association
first trimester (8-12 weeks after the last menstrual period) was specific to CLP, with no association found between
(1), it is possible that reported coffee intake is greater than coffee consumption and risk of CPO. There was little or
actual consumption at the crucial stage of embryonic de­ no evidence for an association between caffeine from other
velopment. This bias would tend to weaken the observed types of beverages and CLP. Even with extensive adjust­
association. ments for confounders, we cannot eliminate the possibility
Our study had the advantage of enrolling mothers soon that the associations between coffee consumption and risk
0
(an average of 15 weeks) after delivery. In addition, ques­ of CLP are due to uncontrolled confounding by factors as­
(.9
LJ.J tions on coffee and other caffeinated beverages constituted sociated with the habit of drinking coffee. Still, considering
a:
(.9 only a small part of the questionnaire, with no specific em­ our results and the prior mixed evidence for a coffee effect
LJ.J
a: phasis on these beverages that would be expected to bias on clefts, women cannot be assured that maternal coffee
CO
0
reporting. Another strength of the study was collection of consumption is entirely benign for the developing fetus.
extensive data on potential confounders such as folie acid Other clefts studies now in progress should give close atten­
z
a:
LJ.J supplement use, alcohol consumption, and smoking. Con­ tion to a possible association of coffee consumption with
> founders were adjusted for as continuons variables in our facial clefts.
en
z
0
fC=
0
Am J Epidemiol 2009;169:1216-1222
LJ.J
@

276
ARTICLE 8 - LCA-1 2016

1222 Johansen et al.

ACKNOWLEDGMENTS 8. Norwegian Directorate of Health. Norkost 1997 Nationwide


Dietary Survey Among Women and Men Aged 16-79 Years [in
Author affiliations: Department of Nutrition, Institute of Norwegian]. Oslo, Norway: Norwegian Directorate of Health.
Basic Medical Sciences, Faculty of Medicine, University of (Report no. 2/1999). (http://www.helsedirektoratet.no/vp/
Oslo, Oslo, Norway (Anne Marte W. Johansen, Lene F. multimedia/archive/00003/IS-0168_3745a.pdf).
Andersen, Christian A. Drevon); Epidemiology Branch, 9. Nehlig A, Debry G. Effects of coffee and caffeine on fertility,
National Institute ofEnvironmental Health Sciences/National reproduction, lactation, and development. Review of human
and animal data [in French]. J Gynecol Obstet Biol Reprod
Institutes of Health, Durham, North Carolina (Allen J.
(Paris). 1994;23(3):241-256.
Wilcox); Section for Epidemiology and Medical Statistics, 10. Nehlig A, Debry G. Consequences on the newborn of chronic
Department of Public Health and Primary Health Care, maternai consumption of coffee during gestation and lactation:
University of Bergen, Bergen, Norway (Rolv T. Lie); and a review. J Am Coll Nutr. 1994;13(1):6-21.
Medical Birth Registry of Norway, Norwegian Institute of 11. Browne ML. Maternai exposure to caffeine and risk of con­
Public Health, Bergen, Norway (Rolv T. Lie). genital anomalies: a systematic review. Epidemiology. 2006;
This work was supported by the Research Council of 17(3):324-331.
Norway (grant 166026/VS0); the Freia Medical Founda­ 12. CARE Study Group. Maternai caffeine intake during preg­
tion; the Throne-Holst Foundation for Nutrition Research; nancy and risk of fetal growth restriction: a large prospective
the thematic area of perinatal nutrition, Faculty of Medi­ observational study. BMJ. 2008;337:a2332.
13. Verkleij-Hagoort A, Bliek J, Sayed-Tabatabaei F, et al.
cine, University of Oslo, Oslo, Norway; and Nutrigenom­
Hyperhomocysteinemia and MTHFR polymorphisms in as­
ics, Network of Excellence, FP6, Food Quality and Safety sociation with orofacial clefts and congenital heart defects:
(NuGO FP6-506360). This research was supported in part a meta-analysis. Am J Med Genet A. 2007;143(9):952-960.
by the Intramural Research Program of the National Insti­ 14. Grubben MJ, Boers GH, Blom HJ, et al. Unfiltered coffee
tutes of Health, National Institute of Environmental Health increases plasma homocysteine concentrations in healthy
Sciences. volunteers: a randomized trial. Am J Clin Nutr. 2000;71(2):
Conflict of interest: none declared. 480-484.
15. Refsum H, Nurk E, Smith AD, et al. The Hordaland Homo­
cysteine Study: a community-based study of homocysteine, its
determinants, and associations with disease. J Nutr. 2006;
136(6 suppl):1731S-1740S.
REFERENCES 16. Urgert R, van Vliet T, Zock P L, et al. Heavy coffee con­
sumption and plasma homocysteine: a randomized controlled
1. Sivertsen A, Wilcox AJ, Skjaerven R, et al. Familial risk of trial in healthy volunteers. Am J Clin Nutr. 2000;72(5):
oral clefts by morphological type and severity: population 1107-1110.
based cohort study of first degree relatives. BMJ. 2008; 17. Little J, Cardy A, Munger RG. Tobacco smoking and oral
336(7641):432-434. clefts: a meta-analysis. Bull World Health Organ. 2004;
2. Johansen AM, Lie RT, Wilcox AJ, et al. Maternai dietary in­ 82(3):213-218.
take of vitamin A and risk of orofacial clefts: a population­ 18. Johnson CY, Little J. Folate intake, markers of folate status and
based case-control study in Norway. Am J Epidemiol. 2008; oral clefts: is the evidence converging? /nt J Epidemiol. 2008;
167(10):1164-1170. 37(5):1041-1058.
3. Shaw GM, Carmichael SL, Laurent C, et al. Maternai nutrient 19. Mukhtar H, Ahmad N. Tea polyphenols: prevention of cancer
intakes and risk of orofacial clefts. Epidemiology. 2006;17(3): and optimizing health. Am J Clin Nutr. 2000;71(6 suppl):
285-291. 1698S-1702S.
4. Krapels IP, Vermeij-Keers C, Muller M, et al. Nutrition and 20. Halvorsen BL, Carlsen MH, P hillips KM, et al. Content of
genes in the development of orofacial clefting. Nutr Rev. 2006; redox-active compounds (ie, antioxidants) in foods consumed
64(6):280-288. in the United States. Am J Clin Nutr. 2006;84(1):95-135.
5. Wilcox AJ, Lie RT, Solvoll K, et al. Folie acid supplements 21. Kurppa K, Holmberg PC, Kuosma E, et al. Coffee consump­
and risk of facial clefts: national population based case-control tion during pregnancy and selected congenital malformations:
study. BMJ. 2007;334(7591):464. a nationwide case-control study. Am J Public Health. 1983;
6. Lie RT, Wilcox AJ, Taylor J, et al. Maternai smoking and oral 73(12):1397-1399.
clefts: the role of detoxification pathway genes. Epidemiology. 22. McDonald AD, Armstrong BG, Sloan M. Cigarette, alcohol,
2008;19(4):606-615. and coffee consumption and congenital defects. Am J Public
7. Deroo LA, Wilcox AJ, Drevon CA, et al. First-trimester ma­ Health. 1992;82(1):91-93.
ternai alcohol consumption and the risk of infant oral clefts 23. Bille C, Olsen J, Vach W, et al. Oral clefts and life style
in Norway: a population-based case-control study. Am J factors-a case-cohort study based on prospective Danish
Epidemiol. 2008;168(6):638-646. data. Eur J Epidemiol. 2007;22(3):173-181.

Am J Epidemiol 2009;169:1216-1222

277
iKB LECTURE CRITIQUE D'ARTICLE

QCM l II s'agit d'une étude :


1
A - Randomisée.
B - Rétrospective.
C - Observationnelle.
D - Etiologique.
E - Prospective.

QCM
2
1Dans cette étude, les cas sont les nouveau-nés :
A - Présentant une fente labio-palatine à la naissance opérés dans les centres hospitaliers
universitaires d'Oslo et de Bergen.
B - De mère qui consommaient plus de 3 tasses de café par jour au premier trimestre de grossesse.
C - Dont la mère a accouché dans les maternités des centres hospitaliers universitaires d'Oslo et de
Bergen.
D - Indemnes de fente labio-palatine à l'issue de la grossesse.
E - Décédés après la naissance.

QCM
3
1Dans cet article, les facteurs d'exposition d'intérêt incluent :
A - La consommation de thé au cours du troisième trimestre de la grossesse.
B - La supplémentation vitaminique, au cours du premier trimestre de la grossesse.
C - La consommation de boissons contenant de la caféine au cours du premier trimestre de la
grossesse.
D - Le tabagisme au cours du premier trimestre de la grossesse.
E - La consommation de café au cours du premier trimestre de la grossesse.

QCM I L'information sur la consommation quotidienne de café au cours du premier


4 trimestre de grossesse :
A - A été de nature déclarative.
B - A été recueillie de manière prospective.
C - A été extraite de la base de données du registre national des naissances.
D - A été quantifiée en nombre de tasses.

1
E - A été recueillie uniquement chez les mères de nouveau-nés avec une fente labio-palatine.

QCM
Le choix d'une étude de type cas-témoin a été guidé par le(s) fait(s) suivant(s) :
5
A - La prévalence de la fente labio-palatine à la naissance est faible.
B - Ce type d'étude permet de montrer une relation causale.
C - Ce type d'étude ne présente généralement pas de biais.
D - La consommation de café au cours du premier trimestre de grossesse est fréquente.

1
E - Le niveau d'exposition aux facteurs de risque étudiés peut être déterminé précisément.

QCM Dans cette étude, approximativement deux témoins ont été recrutés pour un cas de
6 fente labiale (avec ou sans fente palatine) dans le but :
A - De limiter un potentiel biais de sélection lié aux sujets perdus de vue en cours de suivi.
0
(.9
B - De calculer des risques relatifs.
LJ.J
a:
(.9
C - De réduire la largeur de l'intervalle de confiance des odds ratios estimés.
LJ.J
D - D'augmenter les chances de mettre en évidence une différence entre les cas et les témoins.
a:
CO
0
E - De procéder à un aooariement sur les facteurs de confusion potentiels.
z
a:
LJ.J
>

@
en
z
0
fC=
0
LJ.J

278
ARTICLE 8 - LCA-1 2016

QCM 1 D'après le tableau 1 :


7
A - Avant la grossesse, 75% des femmes consommaient au moins une tasse de café par jour.
B - La fréquence du tabagisme maternel actif au cours du premier trimestre de grossesse était de
31,9% dans le groupe témoin.
C - 79,5% des mères travaillant durant le premier trimestre de grossesse ont donné naissance à un
nouveau-né avec une fente palatine seule (FPS).
D - 50% des mères du groupe témoin consommaient au moins deux tasses de café quotidiennement
pendant le premier trimestre de grossesse.
E - 573 cas de fente labio-palatine (FLP) ou fente palatine seule (FPS) ont été inclus au total dans
cette étude.

Pourquoi le tabagisme actif est-il un facteur de confusion potentiel de l'association


QCM
observée entre la consommation de café au cours du premier trimestre de
grossesse et le diagnostic de fente labio-palatine à la naissance dans cette étude ?
8
A- Car la prévalence du tabagisme actif au premier trimestre de grossesse diffère entre les cas et
les témoins dans cette étude.
B- Car le tabagisme est un facteur de risque de fentes labio-palatines identifié dans la littérature.
C- Car il est possible que les femmes fumeuses consomment plus de café que les non fumeuses.
D- Car l'information sur le tabagisme a été recueillie rétrospectivement par questionnaire dans cette
étude.
E- Car le tabagisme passif et l'absence de tabagisme ont été regroupés au sein d'une seule et
même catégorie dans cette étude.

Quelle(s) stratégie(s) ont utilisé(s) les auteurs pour s'affranchir de l'effet du facteur
QCM
de confusion « tabagisme actif au cours du premier trimestre de grossesse » dans
9
cette étude ?
A- L'estimation d'odds ratios bruts.
B- Un test de tendance sur la consommation de café.
C- L'appariement de témoins à chaque cas.
D- La restriction aux mères non-fumeuses.
E- L'ajustement à l'aide d'un modèle de réoression loqistique multivariée non-conditionnelle.

En analyse multivariée (tableau 2), les auteurs indiquent qu'il existe une relation
QCM croissante entre l'odds ratio de fente labiale (avec ou sans fente palatine, FPL) et la
10 consommation de café codée en tasses par jour. Sur quelle(s) preuve(s) repose
cette affirmation ?
A- Le recouvrement partiel des intervalles de confiance à 95% des odds ratios ajustés pour les
catégories >0-<3 tasses et plus, respectivement.
B- L'exclusion de l'échantillon d'analyse des mères ne consommant pas de café pendant le premier
trimestre de la grossesse.
C- L'odds ratio de fente labiale chez les femmes consommant 3 tasses par jour ou plus de café par
rapport aux femmes consommant moins de 3 tasses par jour est de 1,59 (IC95% 1,05 - 2,39).
D- L'estimation ponctuelle de l'odds ratio ajusté égale, respectivement, à 1,00 pour Otasses, 1,39
pour >0-<3 tasses, et 1,59 pour 3 tasses et plus.
E- Le degré de signification (valeur de p) du test de tendance (soit 0,013).

QCM I Le risque de conclure à tort à la responsabilité de la consommation de café au cours


11 du premier trimestre de la grossesse dans cette étude peut s'expliquer par :
A - Le risque d'erreur statistique de première espèce (alpha).
B - Le caractère rétrospectif du recueil des données.
C - L'existence d'une relation entre la dose de caféine ingérée quotidiennement et l'odds ratio de
fente labiale.
D - L'existence de facteurs de confusion résiduels méconnus.
E - Un défaut de puissance statistique.

279
iKB LECTURE CRITIQUE D'ARTICLE

Sur la base des informations données dans cet article, quel(s) facteur(s) de
QCM
confusion potentiel(s) supplémentaire(s) les auteurs auraient-ils pu prendre en
12
compte?
A- Les antécédents familiaux.
B- La consommation de café au deuxième trimestre.
C- L'homocystéinémie chez la mère.
D- L'âge gestationnel.

1
E- L'activité physique.

QCM
Quels sont les biais potentiels dans cette étude?
13
A - Biais de sélection des populations étudiées.
B - Biais lié à la présence de facteurs de confusion.
C - Biais de classement sur les critères définissant les cas.
D - Biais de classement sur l'exposition, lié à l'absence de souvenir.
E - Biais d'attrition des populations étudiées.

Citez le(s) argument(s) en faveur de la nature causale de l'association, retrouvée


QCM dans cette étude, entre la consommation de café pendant le premier trimestre de la
14 grossesse et le risque accru de fente labiale (avec ou sans fente palatine, FLP) à la
naissance:
A- L'ajustement sur les facteurs de confusion connus.
B- L'existence d'une relation dose-effet statistiquement significative.
C- La séquence temporelle entre l'exposition et l'évènement de santé étudié.
D- Le risque de fente labio-palatine induit par l'exposition à une dose unique élevée de caféine chez
l'animal.

1
E- L'absence d'association similaire entre la consommation de café et de fente palatine seule.

QCM Parmi les implications potentielles de cette étude pour la prévention des fentes
15 labio-palatines, il paraît pertinent
A - De réaliser une étude randomisée portant sur la consommation de thé versus café chez les
femmes enceintes.
B - D'inciter les femmes enceintes à consommer plus de trois tasses de thé par jour pendant le
premier trimestre de la grossesse.
C - De renforcer la surveillance échographique morphologique de l'extrémité céphalique chez les
femmes enceintes consommant plus de trois tasses de café par jour.
D - De conseiller d'éviter les boissons contenant de la caféine au cours du premier trimestre de
grossesse.
E - D'informer les femmes enceintes concernées sur l'absence de preuve de l'innocuité d'une
consommation de café supérieure à trois tasses par jour.

0
(.9
LJ.J
a:
(.9

LJ.J
a:
CO
0

z
a:
LJ.J
>

@
en
z
0
fC=
0
LJ.J

280
ARTICLE 8 - LCA-1 2016

Grille de correction QCM


(Questions à choix multiples)

A- F
B-
:!!: C-
V
V
.
Réponse: BCD
Etude épidémiologique, observationnelle, analytique (étiologique) de type cas-
(.)
0 D-
E-
V
F
. témoin
Les études cas-témoins sont toujours rétrospectives

N B-
A-

:!!: C-
F .
V Réponse: A
CAS= tous les enfants traités pour une fente labiale avec ou sans fente palatine
F associée, dans les centres chirurgicaux des hôpitaux universitaire d'Oslo et de

.
(.)
0 D- F Bergen
E- F L'information se trouve dans la partie « Méthodes »
A-
.
F Réponse: CE
M
B-
:!!: C-
F
V . Facteurs d'exposition= facteurs influençant la survenue de la maladie
Facteurs d'exposition d'intérêt= ceux étudiés par les auteurs dans cette étude
D- F
. (café et thé, au cours du premier trimestre - 3 premiers mois - de grossesse)
(.)
0
Variables d'ajustement= facteurs d'exposition mesurés car étant de potentiels
E- V facteurs de confusion, sur lesquels les auteurs devront ajuster leurs analyses

.
A- V Réponse: AD
"" B- F Exposition= consommation de café=> recueil rétrospectif dans les études cas-
:!!: C- F témoin
(.)
0 D- V NB : il est important que le recueil de l'exposition soit identique entre les cas et les
E- F témoins, pour éviter un biais de classement différentiel
A-
B- F .
V Réponse: AD
Les études ca-témoin sont adaptées pour l'étude des maladies rares et des
Lt)
:!!:
(.)
C-
D-
F
V . expositions
L'un des
fréquentes
points faibles de ce type d'étude est justement le grand nombre de biais
0 qu'elle est susceptible d'engendrer
E- F Aretenir : les études épidémiologiqueslobservationnelles ne permettent JAMAIS de
conclure à la causalité !
A-
B- F .
F Réponse: CD
Appariement de ca avec> 1 témoin= augmentation de la PUISSANCE de
ID C- V l'étude Uusqu'à 3-4 témoins) :
:!!: D- V Réduction de la largeur de l'IC95%
(.)
0 Plus de chance de mettre en évidence une différence qui existe entre cas
E- F et témoins

A-
.
F Réponse: BE
B- V
.L'interprétation des tableaux et figures doit être maîtrisée dans la L CAaux ECNi
C-
..... D-
:!!:
F
F .Le tableau 1 décrit les caractéristiques de la population d'étude
Les propositions A et D sont fausses car les données présentes dans ce tableau
(.)
ne concernent que les consommatrices de café (certaines femmes appartenant au
0
E- V .groupe témoin n'en consomment pas)
Pour la proposition C, il faut lire le tableau comme ceci : « Parmi les femmes ayant
accouché d'un enfant avec fente palatine seule, 79,5% travaillaient au premier
trimestre de grossesse)

.
A- F Réponse: BC
CO B- V Facteur de confusion = facteur lié à la fois à l'exposition et à la maladie
:!!: C- V (attention, ne doit pas faire partie de la chaîne causale entre le facteur d'exposition

.
(.)
0 D- F et la maladie)
E- F Peut entraîner un biais de confusion

281
iKB LECTURE CRITIQUE D'ARTICLE

. Les auteurs considèrent généralement comme facteurs de confusion les facteurs


de risque connus de la maladie (à prendre en compte a priori lors de la
planification de l'étude)
A-
B-
F
F .
Réponse: DE
Prise en compte possible des facteurs de confusion (de manière générale) :
C-
D-
F
V .
A priori:
Restriction de la population d'étude (critères d'inclusion, de non-inclusion et

.
a,
d'exclusion)
:!!:
(.)
0
E- V
. Appariement des cas avec les témoins sur ces facteurs de confusion potentiels
Randomisation (+/- stratifiée)

.
A posteriori :

. Analyse multivariée
Analyse stratifiée
A- F
.
Réponse: DE

....
0

:!!:
B-
C-
F
F . Il faut regarder la colonne « Analyse ajustée» pour« Tous les cas»
Il y a bien une relation croissante (~augmentation du risque) avec la
(.)
0
D-
E-
V

V
. consommation de café (car la valeur de l'OR augmente)
Ici, il faut aussi regarder la valeur du « p de tendance», car les IC95% des OR se
recouvrent
A- V Réponse: ABD
........ B- V
.
Plusieurs éléments pourraient intervenir:
C- F Le hasard (risque alpha de première espèce) du fait des fluctuations
:!!:
(.) D- V
. d'échantillonnage)

.
0 un biais de confusion liés à des facteurs de confusion
E- F
un biais de classement (étude rétrospective)
A- V
.... B-
.
N
F Réponse: A
:!!:C- F Le rôle génétique dans la survenue de fente labio-palatine est évoqué par les
(.)
0 D- F auteurs dans l'introduction
E- F

....
M
A-
B- V .
V Réponse: ABD
Pas de biais de classement sur la définition des cas car elle est objective et la
:!!:
(.)
0
C-
D-
F
V . problématique du« non cas» ne se pose a priori pas .
Pas de biais d'attrition du fait de l'absence de perdus de vue (étude rétrospective,
tous les sujets inclus sont interrogés)
E- F NB: il existe de nombreux biais dans les études cas-témoin

.
A- F Réponse: BD
"".... B- V Cette question fait référence aux critères de Bradford-Hill, qui sont à connaître
:!!:C- F pour les ECNi
(.)
0 D- V Rappel: on ne peut jamais conclure à la causalité dans les études épidémiologiques, on
E- F a seulement un faisceau d'arguments en faveur de cette causalité
A- F

.
Réponse: DE

....
Lt)
B- F
.
La réalisation d'un essai randomisé ne serait pas éthique dans ce contexte
Du fait du faible niveau de preuve de ce type d'étude (niveau de preuve 3), il
0 :!!: C- F n'est pas possible de recommander une consommation de thé ou un suivi

.
(.9
(.)
LJ.J
a: 0 échographique chez les femmes
(.9
D- V En revanche, l'information et le conseil sur la consommation de café pendant le
LJ.J
a: premier trimestre de grossesse peuvent être délivrés (principe de précaution)
CO
0
E- V
z
a:
LJ.J
>
en
z
0
fC=
0
LJ.J
@

282
Chapitre
42

ARTICLE 9 - LCA 2 / 2016

Preliminary Communication

Lung Volume Reduction Coil Treatment vs Usual Care


in Patients With Severe Emphysema
The REVOLENS Randomized Clinical Trial
Gaëtan Deslée, MD, PhD; Hervé Mal, MD, PhD; Hervé Dutau, MD, PhD; Arnaud Bourdin, MD, PhD; Jean Michel Vergnon, MD, PhD;
Christophe Pison, MD, PhD; Romain l<essler, MD, PhD; Vincent Jounieaux, MD, PhD; Luc Thiberville, MD, PhD; Sylvie Leroy, MD; Armelle Marceau, MD;
Sophie Laroumagne, MD; Jean Pierre Mallet, MD; Sy lvain Dukic, PhD; Coralie Barbe, MD; Julie Bulsei, PharmD; Damien Jolly, MD, PhD;
Isabelle Durand-Zaleski, MD, PhD; Charles Hugo Marquette, MD, PhD; for the REVOLENS Study Group

C: Editorial page 139


IMPORTANCE Therapeutic options for severe emphysema are limited_ Lung volume reduction C Author Video Interview and
using nitinol coils is a bronchoscopie intervention inducing regional parenchymal volume JAMA Report Video at
reduction and restoring lung recoiL jama.com

C Supplemental content at
OBJECTIVE Ta evaluate the efficacy, safety, cost. and cost-effectiveness of nitinol coils in jama.com
treatment of severe emphysema_
C CMEQuizat
jamanetworkcme.com and
DESIGN, SITTING, AND PARTICIPANTS Multicenterl:1 randomized superiority trial comparing
CMEQuestions page 196
coils with usual care at 10 university hospitals in France_ Enrollment of patients with emphysema
occurred from March ta October 2013, with 12-month follow-up (last follow-up, December 2014)_

INTERVENTIONS Patients randomized ta usual care (n = 50) received rehabilitation and


bronchodilators with or without inhaled corticosteroids and oxygen; those randomized ta
bilateral coil treatment (n = 50) received usual care plus additional therapy in which
approximately 10 coils per lobe were placed in 2 bilateral lobes in 2 procedures_

MAIN OUTCOMES AND MEASURES The primary outcome was improvement of at least 54 m in
the 6-minute walk test at 6 months (1-sided hypothesis test)_ Secondary outcomes included
changes at 6 and 12 months in the 6-minute walk test. lung function. quality of life as
assessed by St George's Respiratory Questionnaire (range, 0-100; 0 being the best and 100
being the worst quality of life; minimal clinically important difference. 2:4). morbidity,
mortality, total cost. and cost-effectiveness_

RESULTS Among 100 patients. 71 men and 29 women (mean age, 62 years) were included_ At
6 months. improvement of at least 54 m was observed in 18 patients (36%) in the coil group
and 9 patients (18%) in the usual care group, for a between-group difference of18% (1-sided
95% Cl. 4% ta oo; P = _03)_ Mean between-group differences at 6 and 12 months in the coil
and usual care groups were +0_09 L (95% Cl. 0_05 L ta oo) (P = DOl) and +0_08 L (95% Cl.
0_03 L ta oo) (P = _002) for forced expiratory volume in the first second. +21 m (95% Cl.
-4 m ta oo) (P = _06) and +21 m (95% Cl. -5 m ta oo) (P = -12) for 6-minute walk distance. and
-13-4 points (95% Cl. -8 points ta oo) and -10_6 points (95% Cl. -5_8 points ta oo) for
St George's Respiratory Questionnaire (1-sided P < _001 for bath)_ Within 12 months. 4 deaths
occurred in the coil group and 3 in the usual care group_ The mean total 1-year per-patient
cost difference between groups was $47 908 (95% Cl. $47 879-$48 073) (P < _001); the
incremental cost-effectiveness ratio was $782 598 per additional quality-adjusted life-year_
Author Affiliations: Author
affiliations are listed at the end of this
CONCLUSIONS AND RELEVANCE ln this preliminary study of patients with severe emphysema article.
followed up for 6 months. bronchoscopie treatment with nitinol coils compared with usual Group Information: Members of the
care resulted in improved exercise capacity with high short-term costs_ Further investigation REVOLENS Study Group are listed at
the end of this article.
is needed ta assess durability of benefit and long-term cost implications_
CorrespondingAuthor: Gaëtan
Deslée, MD, PhD, Service de
TRIAL REGISTRATION clinicaltrials_gov Identifier: NCT01822795 Pneumologie, INSERM U903, Hôpital
Universitaire de Reims, 45 Rue
Cognacq-Jay, 51092 Reims, France
JAMA. 2016;315(2):175-184. doi:10.1001/jama.2015.17821 (gdeslee@chu -re ims.fr).

283
iKB LECTURE CRITIQUE D'ARTICLE

E
mphysema,a key component of chronic obstructive pul­ domization system with fixed blacks of 4. The main inclu­
monary disease, is characterized by lung tissue inelas­ sion criteria were bilateral emphysema, postbronchodilator
ticity, air trapping, and hyperinflation, causing dys- forced expiratory volume in the first second (FEV ) of less than
1

pnea, exercise limitation, and impaired quality of life. 50% predicted,residual volume (RV) of greater than 220% pre­
Management of severe emphysema represents a challenge be­ dicted, and formai pulmonary rehabilitation within the pre­
cause of limited efficacy of currently available treatments. Lung vious 12 months (eBox in Supplement 2).
FEV1 forced expiratory volume in the volume reduction surgery Emphysema was quantified in each lobe using the Na­
first second demonstrated improved tional Emphysema Treatment Trial visual assessment score. 7 1

FVC forced vital capacity overall survival and better The most severely affected lobe of each lung was targeted for
QALY quality-adjusted life-year
clinical andfunctional out­ coi! treatment and the upper lobe was chosen when ipsilat­
comes, particularly in pa­ eral scores were the same. Scoring and targeting were deter­
RV residual volume
tients with upper lobe- mined by each site. No computed tomography densitometry
TLC total lung capacity
predominant emphysema analysis was used in this study.
and low exercise capacity.1•2 However, lung volume reduction
surgery is associated with significant morbidity and mortality. Usual Care Group
A number of minimally invasive interventional strategies, in­ Patients were treated at the discretion of the patient's physi­
cluding endobronchial valves,3• 4 airway bypass,5 biological cian in compliance with international guidelines; ie, they re­
sealants,6 thermal vapor ablation,7 and endobronchial coils,s-14 ceived prerandomization rehabilitation, inhaled bronchodi­
havebeen evaluated. Endobronchial valves showed clinically sig­ lators, and influenza and pneumococcal vaccination, with or
nificant improvements in selected patients with upper lobe­ without inhaled corticosteroids and with or without oxygen,
predominant emphysema 4 and with intact fissures.3•4 according to the degree of severity and exacerbation rate.
Shape-memory nitinol coils are nonblocking devices bron­
choscopically delivered into subsegmental airways to induce Intervention Coil Group
regional parenchymal volume reduction, enhance lung re­ Patients in the coi! group received the same treatment as the
coil, and reestablish small airway tethering. To date, coils have usual care group and also received coi! treatment within 15 days
been investigated in 5 nonrandomized studies8· , and 1 ran­
11 13
after randomization. The contralateral treatment was com­
domized, controlled 90-day crossover study.12•14 These stud­ pleted 1 to 3 months after the first. Ali coi! insertion proce­
ies reported that coi! treatment provided improvement in qual­ dures were conducted under general anesthesia using fluoros­
ity of life, exercise capacity, and lung function. copyto guide placement (eFigures 1 and 2 in Supplement 2). Two
High costs are associated with lung volume reduction strat­ sizes of coi! (100 mm and 125 mm; PneumRx/BTG) were avail­
egies for severe emphysema. 2• Acceptance of new therapies
15
able. Approximately 10 coils per targeted lobe were delivered.
should consider evidence of cost-effectiveness. Because the The coi! group received amoxicillin/clavulanic acid,2 g (or clin­
health economic evidence base for bronchoscopie interven­ damycin,600 mg,and gentamycin,5 mg/kg,if allergie to amoxi­
tional strategies is minimal, the current study design in­
15
cillin),immediately before the procedure. Chest radiographywas
cluded a cost-effectiveness analysis. performed within 2 hours of and at 24 hours after the proce­
The REVOLENS trial (Réduction Volumique Endobronchique dure (eFigure 3 in Supplement 2). In the absence of significant
par Spirales) was designed to evaluate the efficacy, safety, cost, complications,patients were discharged at the discretion of the
and cost-effectiveness of coi! treatment in severe emphysema. attending physician.

Follow-up
Ali patients were assessed at baseline and at 1,3,6,and 12 months
Methods
after baseline. Ali patients underwent medical examination,
Study Oversight 6-minutewalk test on room air,chest x-ray,and pulmonaryfunc­
Ten sites throughout France participated in the study. This tion tests according to international guidelines. 18 Patients com­
study was approved by the Ethics Committee of Dijon Est I and pleted dyspnea questionnaires using the modified Medical Re­
by the French Agency for Medicines and Health Products. A search Council dyspnea scale and the Baseline Dyspnea Index/
website was accessible to participants and referring physi­ Transition Dyspnea Index. The modified Medical Research
cians (http://www.euroemphysema.com). Enrollment of par­ Council dyspnea scale grades 5 different levels of dyspnea based
ticipants started in March 2013 and was completed in Octo­ on thecircumstancesinwhichit arises:grade 0,"I onlyget breath­
ber 2013. The last follow-up visit was in December 2014. An less with strenuous exercise"; grade 1, "1 get short of breath when
0
(.9
LJ.J independent data and safety monitoring board monitored hurrying on level ground orwalking up a slight hill";grade2, "On
a:
(.9 events and reviewed efficacy results. The trial protocol has been level ground,I walk slower than people of the same age because
LJ.J
a: previously published16 and is available in Supplement 1. Ali par­ of breathlessness,or I have to stop for breath when walking at my
CO
0 ticipants provided written informed consent. own pace on the level"; grade 3, "1 stop for breath after walking
z about 100 yards or after a few minutes on level ground"; grade
a:
LJ.J
> Patient Population and Randomization 4,"1 am too breathless to leave the house orl am breathless when
en
z Eligible patients were randomized in a 1:1 fashion to receive dressing;' Quality of life was assessed using the St George's Re­
0
fC= usual care or coils using a centralized computer-generated ran- spiratory Questionnaire,ranging from 0 to 100 with higher scores
0
LJ.J
@
17/:; bm::arnm

284
ARTICLE 9 - LCA-2 2016

indicating worse qualityof life (0 being the best and 100 being the for each group by plotting average utility values at baseline, 6
worst qualityof life, and -4 points considered a minimal clinically months, and 1 year. The difference in QALYs was estimated as the
important difference), and the EuroQol 5 Dimensions Question­ difference in the area between the utilitycurves for the 2 groups.
naire provided a utilityvalue on a scale ranging from 0 (death) to A cost-effectiveness analysis was conducted to estimate in­
1 (full health). Ali patients had a thoracic computed tomography cremental costs per incremental QALY. Incremental costs were
scan at baselineand the coi! group also had one at 6 months. Medi­ taken as the difference in per-patient costs between groups.
cations and oxygen use were recorded at each visit. Patients in Baseline characteristics, QALYs, and costs are described
both groups continued their regular treatment. using counts (and proportions), means (with standard devia­
tions or 95% confidence intervals), or medians (with inter­
Study End Points quartile ranges). Differences in costs and QALYs were tested
The primary outcome was improvement of at least 54 m in the using standard parametric or nonparametric tests (t test or
6-minute walk test at 6 months. The cutoff to define a responder Mann-Whitney test) as appropriate and are described as means
was based on data from Redelmeier et al19 showing that the dis­ (with 95% confidence intervals). The incremental cost differ­
tances needed to differ by 54 m for the average patient to stop ence and generated 95% confidence intervals were calcu­
rating themselves as "about the same" and start rating themselves lated using nonparametric bootstrapping with 1000 replica­
as either "a little bit better" or "a little bit worse;' Secondary end tions. An acceptability curve was generated based on the
points were changes at 6 and 12 months from baseline in the bootstrap results. Statistical significance for differences among
6-minutewalk distance, pulmonaryfunction tests (FEV 1, forced a priori comparisons was set at P = .05 (2-sided).
vital capacity [FVC], RV, total lung capacity [ TLC], and RV/TLC),
dyspnea (modified Medical Research Council dyspnea scale and Statistical Analyses
Baseline Dyspnea Index/Transition Dyspnea Index), and qual­ The statistical power to demonstrate a superior success rate (1-
ity of life (St George's Respiratory Questionnaire and EuroQol 5 sided hypothesis test) in the primaryend point for the coi! group
Dimensions Questionnaire) in each group. vs the usual care group was anticipated to be 90% with a sig­
The safety outcomes included ail nonserious and serious nificance of a = .05 at a total sample size ofl00 patients, based
adverse events. In the coi! group, serious adverse events were on the hypothesis of a 37% end-point achievement in the coi!
stratified by occurrence within 30 days vs after 30 days to 12 group and 5% in the usual care group and with 30% of patients
months. A composite score included any of the following se­ unable to perform the 6-minute walk test or lost to follow-up
rious adverse events occurring within 24 hours after treat­ at 6 months. The hypothesis of a 37% primary end-point
ment: death, pneumothorax requiring chest tube placement achievement in the coi! group was based on data provided by
for more than 7 days or surgical treatment, hemoptysis greater PneumRx in 2012. One-sided statistical tests were considered
than 150 mL, and invasive ventilation for more than 24 hours. appropriate in view of the favorable results of previous smaller
A second composite score also included the following serious studies 9·14,21 and confirmed by a recent meta-analysis.22 The
adverse events occurring within 12 months in both groups: sample size was calculated using Nquery software, version 7.0
death, hemoptysis greater than 150 mL, pneumonia requir­ (Statistical Solutions Ltd).
ing hospitalization, pneumothorax requiring chest tube place­ Variables are presented using means with standard devia­
ment for more than 7 days or surgical treatment, invasive ven­ tions or raw numbers and percentages. Differences at base­
tilation for more than 24 hours, and lung transplantation. line between groups were analyzed using the x2 test, t test, or
Fisher exact test.
Economie Evaluation For the primaryend point, intention-to-treat analyses were
The prospective economic evaluation was concurrent with the conducted using a multiple imputation method for missing data
randomized trial, in accordance with the CHEERS statement.20 using SAS procedures PROC MI and PROC MIANALYSE (SAS ver­
The prospective analysis was conducted from the health care sion 9.3, SAS Institute Inc). A logit mode! was used to impute
perspective to determine the cost per quality-adjusted life­ the outcome for participants who did not perform the 6-minute
year (QALY) gained with coils compared with usual care over walk test at 6 months, based on the parameters ofFEV 1, FVC,
a 1-year period. Both hospital and nonhospital resources were RV, St George's Respiratory Questionnaire total score, modi­
considered. Procedure costs for coi! treatment were obtained fied Medical Research Council dyspnea scale, and Baseline Dys­
with a bottom-up microcosting approach that identified ail rel­ pnea Index/Transition Dyspnea Index. Ten imputations were
evant cost components of the procedure and valued each com­ performed. Bivariable logistic models were then fitted with the
ponent for ail individual patients using duration of the proce­ imputed values using treatment group as the predictor vari­
dure, staff, medical devices, and type of operating room as able. An additional maximum bias analysis considering pa­
variables. Unit costs are presented in eTable 1 in Supplement tients who did not perform the 6-minute walk test to be non­
2. Ali costs are in 2014 US dollars (US $1 = €0.754 in 2014) and responders for the primary end point was also conducted.
are not discounted because of the short time horizon. The secondary end points for efficacy (1-sided test) and
Health outcomes are valued in QALYs. Health-related qual­ safety (2-sided test) outcomes were analyzed using the x2 test,
ity of life was assessed using the EuroQol 5 Dimensions self­ ttest, orFisher exact test, or Wilcoxon test when applicable, with
administered questionnaires at baseline, 6 months, and 1 year. no data imputation. For quantitative end points, mean differ­
The utility values are based on French tariffs forthe correspond­ ences and 1-sided 95% confidence intervals were reported. Ali
ing EuroQol 5 Dimensions scores. Utility curves were obtained end points were assessed by intention-to-treat analysis.

jama.com JAMA January 12, 2016 Volume 315, Number 2 177

285
iKB LECTURE CRITIQUE D'ARTICLE

Figure. Flow of Participants in the REVOLENS Study

116 Patients consented ta study screening

16 Excluded
9 Lung carcinoma or pulmonary nodule on
thoracic CT scan requiring follow-up CT scan
1 Systolic pulmonary artery pressure >50 mm Hg
1 Residual volume <220%
1 FEV1 >50%, residual volume <220%, and pulmonary
nodule on thoracic CT scan requiring follow-up CT scan
1 Nonbilateral emphysema
1 Extrapulmonary disease compromising survival
or evaluation
1 Contraindication ta general anesthesia
1 Eligible but study closed at the lime of randomization

100 Randomized

CT indicates computed tomography;


50 Randomized ta receive coil 50 Randomized ta receive FEV1 , forced expiratory volume in the
treatment usual care first second.
47 Received bilateral coil 50 Received usual care as
treatment randomized 'The reasons for not performing
3 Received unilateral coil bilateral treatment were death
treatment a before second treatment (n = 1),
anaphylactic shock at induction of
47 Followed up at 6 ma 49 Followed up at 6 ma anesthesia for the second coil
3 Died prior ta 6-mo follow-up 1 Died prior ta 6-mo follow-up treatment (n = 1) (further analyses
demonstrated allergy to penicillin),
and pneumonia after the first coil
44 Followed up at 12 ma 47 Followed up at 12 ma treatment leading to unwillingness
1 Died prior ta 12-mo follow-up 2 Died prior ta 12-mo follow-up
2 Not available for follow-up b of the patient to undergo a second
coil treatment (n = 1).
b These 2 patients were alive at 12
50 lncluded in primary analysis 50 lncluded in primary analysis
months but did not attend the
planned visit at 12 months.

An independent data monitoring team ensured 100% tients in the usual care group achieved a 6-minute walk test im­
source verification of the data. Statistical analyses were per­ provement of at least 54 m at 6 months. Using multiple impu­
formed according to a prespecified statistical analysis plan tation for missing data, 18 patients (36%) in the coi! group and
(available in Supplement 3). No intermediary statistical analy­ 9 patients (18%) in the usual care group achieved a 6-minute walk
ses were conducted. A 1-sided P < .05 was considered statis­ test improvement of at least 54 m at 6 months (P = .03), with a
tically significant for the efficacy analysis. No adjustment of mean between-group difference of18% (95% CI, 4% to oo) (Table 2
significance level was used for the secondary end points, which and eFigure 4 in Supplement 2). In a maximum bias analysis con­
were then exploratory. A 2-sided P < .05 was considered sta­ sidering patients who did not perform the 6-minute walk test to
tistically significant for baseline between-group compari­ be nonresponders for the primary end point, thePvalue was .03.
sons and for safety analyses. SAS software, version 9.3 (SAS The primary end point was therefore achieved.
Institute Inc) was used for statistical analysis.
Secondary Efficacy End Points
The secondary efficacy end points at 6 and 12 months are
shown in Table 2. At 6 months, improvements from baseline
Results
were significant in the coi! group compared with the usual care
Patients and Procedures group in the 6-minute walk test (when analyzed as percent
Of 116 patients who consented, 100 patients were random­ change but not when analyzed by distance walked), FEV 1, FVC,
ized to the coi! (n = 50) or usual care (n = 50) groups (Figure). RV, RV/TLC, modified Medical ResearchCouncil dyspnea scale,
Baseline characteristics are shown in Table 1. Among the 50 Transition Dyspnea Index, and St George's Respiratory Ques­
patients randomized to the coi! group, 4 7 patients received bi­ tionnaire (allP < .05). At 12 months, improvements from base­
0
(.9
LJ.J lateral and 3 received unilateral coi! treatment (Figure), for a line were significant in the coi! group compared with the usual
a:
(.9 total of 97 procedures (eTable 3 in Supplement 2). A mean of care group for FEV 1, FVC, RV, RV/TLC, modified Medical Re­
LJ.J
a: 9.8 (SD, 1.3) coils per procedure were placed. The mean pro­ search Council dyspnea scale, and St George's Respiratory
CO
0 cedure time was 54 (SD, 17) minutes. Questionnaire (allP < .05) but not for the 6-minute walk test.
z Quantitatively, the mean between-group differences for the
a:
LJ.J
> Primary End Point secondary end points in the coi! and usual care groups were
en
z Six-minute walk test results were available for 44 patients in each at 6 and 12 months, respectively, 11% (95% CI, 6% to oo; P = .001)
0
fC= group at 6 months. Sixteen patients in the coi! group and 8 pa- and 11% (95% CI, 5.2% to 00; P = .002) for FEV 1, -7% (95% CI,
0
LJ.J
@
17R 14.M.4. l;m11;:arv1? ?()1h \/nl11m,:i.�7r:;; l\l11mh,:i.r? i::am;:a rnm

286
ARTICLE 9 - LCA-2 2016

Table 1. Baseline Participant Characteristics a


Coil Treatment Usual Care Abbreviations: FEV 1 , forced
Characteristics (n = 50) (n = 50) expiratory volume in the first second;
Age,y 62.1(8.3) 61.9(7.3) FVC. forced vital capacity;
Men, No.(%) 39(78) 32(64) RV, residual volume; TLC. total
lung capacity.
Pack-years smoked 44(19) 46(21)
a Values are shown as mean (SD)
Body mass index b 22.5(4.1) 23(4.3) unless otherwise indicated. There
6-Minute walk test distance, m 300(112)' 326(121) were no between-group differences
Modified Medical Research Council in baseline characteristics
dyspnea scale score, No.(%)d (2-sided test).
1 0 1(2} ° b Body mass index was calculated as
weight in kilograms divided by
2 11(22) 13(26)
height in meters squared.
3 28(56) 25(50)
'The 6-minute walk test was
4 11(22) 11(22) conducted with 1 patient receiving
Baseline Dyspnea Index score' 4.4(2.1) 4.1(1.9) oxygen in error, and the patient was
retained for further follow-up and
FEV 1 , % predicted 25.7(7.5) 27.4(6.2)
included in analyses.
FEV 1 ,L 0.75(0.25) 0.77(0.22)
d The modified Medical Research
FVC, % predicted 67.4(16.5) 72(20.1) Council dyspnea scale grades 5
FVC, L 2.45(0.61) 2.53(0.82) different levels of dyspnea based on
the circumstances in which it arises.
FEV ,/FVC ratio 0.31(0.09) 0.32(0.08)
See Methods section of text for
RV, % predicted 271.2(38.1) 269.3(44.3) description.
RV,L 6.2(0.86) 6(1.18) e One patient with a modified Medical
TLC, % predicted 141.7(16.6) 143.6(18) Research Council dyspnea scale
score of 1 was included in error but
TLC,L 8.85(1.03) 8.66(1.35) was included in the follow-up and
RV/TLC ratio 0.70(0.06) 0.69(0.07) analyses.
St George's Respiratory Questionnaire score9 'The Baseline Dyspnea Index uses 5
Impact 49.4(17.2) 44.9(16.7) grades (0-4) for 3 categories,
functional impairment, magnitude
Activity 81.8(11.5) 78.5(13.7) of task, and magnitude of effort,
Symptoms 58.2(17.1) 56.2(19.8) with a total score of O to 12. Higher
Total 60.8(12.8) 57.1(14.1) scores indicate less dyspnea.
Emphysema score" g The St George's Respiratory
Questionnaire (range, 0-100) has 3
Righi upper lobe 2.9(0.7) 3.2(0.8) component domains (impact,
Middle lobe 2.1(1) 2.3(0.8) activity, and symptoms) measuring
Righi lower lobe 2.2(0.9) 2.2(0.8) quality of life. Higher scores indicate
worse quality of life.
Left upper lobe 2.9(0.8) 3(0.7)
h A visual score from O to 4 was
Left lower lobe 2.3(0.9) 2.2(1) assigned to each lobe, based on the
Heterogeneous, No.(%); 17(34) 16(32) extent of tissue destruction, where
Treatments, No.(%) 0 = no emphysema, 1 = 1% to 25%
emphysematous, 2 = 26% to 50%,
Oxygen therapy 32(64) 29(58) 3 = 51% to 75%, and 4 = >75%.
Long-action �-agonists 49(98) 48(96) ; Emphysema was classified as
Long-acting muscarinic antagonists 45(90) 42(84) heterogeneous if there was a
difference of greater than 1 point
1 nhaled corticosteroids 46(92) 43(86)
between ipsilateral lobes.
-2% to-oo;P = .009) and-7% (95%CI, -2.6% to-oo;P = .003) Safety Outcomes
for RV, 8% (95% CI, -2.7% to oo; P = .048) and 7.1% (95% CI, Serious adverse events are presented in Table 3 and nonseri­
-2.2% to oo; P = .09) for the 6-minute walk test, -13.4 points ous adverse events are presented in eTable 4 in Supplement 2.
(95% CI, -8 points to -oo; P < .001) and -10.6 points (95% CI, Pneumonia was the most frequent serious adverse events, in­
-5.8 points to -oo; P < .001) for quality of life assessed by the duding 11 events in 9 patients (18%) in the coi! group and2 events
St George's Respiratory Questionnaire, -0.45 units (95% CI, in 2 patients (4%) in the usual care group within 1 year, with a
-0.17 units to-oo; P = .01) and-0.4 units (95%CI, -0.05 units difference between groups of 14% (95% CI, 2%-26%; P = .03).
to -oo; P = .02) for dyspnea assessed by the modified Medical Overall, at least 1 serious adverse event occurred within 1 year
Research Council scale, and 1.6 points (95% CI, 0.54 points in 26 patients (52%) in the coi! group and in 19 patients (38%)
to oo; P = .04) and 1.1 points (95%CI, -0.5 points to oo; P = .08) in the usual care group, with a between-group difference of 14%
for the Transition Dyspnea Index. (95%CI, -5% to 33%; P = .16). The serious adverse event com­
A post hoc analysis did not find any difference regarding posite score within 12 months induded 17 events in 14 patients
efficacy between homogeneous and heterogeneous emphy­ (28%) in the coi! group and 8 events in 6 patients (12%) in the
sema (eTable 2 in Supplement 2). usual care group, with a difference between groups of 16%

jama.com JAMA January 12, 2016 Volume 315, Number 2 179

287
iKB LECTURE CRITIQUE D'ARTICLE

Table 2. Primary and Secondary lntention-to-Treat Efficacy End Points


Coi l Treatment Usual Care Diffe rence
Outcomes (n = 50) (n = 50) (1-Sided 95% Cl) PValue'
P rimary End Point
6-Mi nute walk test, �54m improveme nt, 18(36) 9(18) 0.18(0.04 to oo) .03
No.(%)"
Secondary End Points al 6 mo, Mean (95% Cl)
6-Mi nute walk test improveme nt,m 18(-6to 43) -3(-221016) 21(-4to oo) .06
%Change 9(-1to 20) 1(-6to 9) 8(-2.7 to oo) .048
Dyspnea
Modified Medical Research Cou nci l -0.5(-0.8to -0.2) -0.1(-0.3to 0.1) -0.45(-0.17to -oo) .01
dyspneascale score
T ransition Dyspnea I ndex total score' 0.8(-0.3to 2.0) -0.8(-1.6to 0) 1.6(0.54 to oo) .04
Pu lmonary fu nction
FEV,, L 0.06(0.02to 0.11) -0.03(-0.05to 0) 0.09(0.05to oo) .001
%Change 9(4to 14) -3(-6tol) 11(6to oo) .001
FVC,L 0.26(0.11to 0.40) 0.05(-0.12to 0.22) 0.21(0.03to oo) .03
%Change 15(7to 21) 5(-2to 12) 10(1.5to oo) .01
RV,L -0.52(-0.74 to -0.31) -0.15(-0.41to 0.11) -0.37(-0.09to -oo) .01
%Change -9(-12to -5) -2(-6to 2) -7(-2to -oo) .009
ne, L -0.34(-0.50to -0.18) -0.14(-0.35to 0.06) -0.20(0.03to -oo) .09
%Change -4(-6to -2) -2(-4tol) -2.0(0.3 to -oo) .10
RV /nC ratio -0.04 (-0.05 to -0.02) -0.01(-0.03to 0.01) -0.03(-0.01to -oo) .01
%Change -5(-8to -3) -1(-4to 2) -5.2(-1.5to -oo) .01
Quality of lite
St George's Respi ratory Question nai re score
Total -11.1(-15.9to -6.2) 2.3(-1.3to 5.9) -13.4(-8 to -oo) <.001
Impact -12.5(-18.1to -6.8) 1.7(-2.2to 5.6) -14.0(-9 to -oo) <.001
Activity -11.3(-16.3to -6.2) 0.7(-2.7to 4.1) -12.0(-7 to -oo) <.001
Symptoms -4.7(-11.5 to 2.1) 4.3(-2.5to 11.0) -9.0(-1.1to -oo) .04
Secondary End Points al 12 mo, Mean (95% Cl)
6-Mi nute walk test improveme nt,m -2(-29to 25) -23(-42to -4) 21(-5to oo) .12
%Change -0.05(-10to 10) -7.2(-13to -1) 7.1(-2.2to oo) .09
Dyspnea
Modified Medical Research Cou nci l -0.5(-0.8to -0.1) -0.1(-0.3to -0.1) -0.4(-0.05to -oo) .02
dyspneascale score
T ransition Dyspnea I ndex total score' -0.2(-1.9to 1.4) -1.3(-2.2to -0.3) 1.1(-0.5 to oo) .08
Pu lmonary fu nction
FEV,, L 0.05(0.01to -0.10) -0.03(-0.06to 0.01) 0.08(0.03to oo) .002
%Change 8(3to 13) -3(-8to 2) 11(5.2to oo) .002
FVC,L 0.27(0.12to 0.43) 0(-0.17to 0.17) 0.27(0.07 to oo) .008
%Change 14(7to 21) 4(-3to 9) 10(2.4to oo) .02
RV,L -0.47(-0.67 to -0.26) -0.11(-0.35to 0.12) -0.36(-0.10to -oo) .004
%Change -9(-12to -5) -2(-5tol) -7(-2.6 to -oo) .003
ne, L -0.29(-0.49to -0.09) -0.09(-0.31to 0.13) -0.20(0.04to -oo) .06
%Change -3(-5to -1) -1(-3to 1) -2(0.3to -oo) .06
RV /nC ratio -0.03 (-0.05 to -0.02) 0(-0.02to 0.01) -0.03(-0.01to -oo) .007
%Change -5(-7to -2) 0(-3to 2) -5(-1.6 to -oo) .008
Quality of lite
0
St George's Respi ratory Question nai re score
(.9
LJ.J
a: Total -9.1(-14.1to -4.2) 1.5(-1.8to 4.7) -10.6(-5.8to -oo) <.001
(.9
Impact -10.8(-16.4to -5.1) 1.8(-2.5to 6.0)) -12.6(-6.8to -oo) <.001
LJ.J
a: Activity -9.4(-11.3to -4.4) 2.8(0.0to 5.6) -12.2(-7.5to -oo) <.001
CO
0
Symptoms -4.2(-11.5 to 3.0) -3.9(-8.7to 0.9) -0.3(6.7 to -oo) .45
z
a:
LJ.J
Abbreviations: FEV1 , forced expiratory vo lume in the firs t second; FVC, forced b Mu l tip le impu tation for missing data.
> vi tal capaci ty; RV, residual vo lume; TLC, to tal lung capaci ty . 'The Transi tion Dyspnea Index evaluates changes from the Base il ne Dyspnea
en
z 'One-sided tes ting (x2or Wi cl oxon W tes ts ). Index. Higher scores indicate less dyspnea.
0
fC=
0
LJ.J

um bm::arnm

288
ARTICLE 9 - LCA-2 2016

Table 3. Serious Adverse Events a

Coil Treatment (n = 50) Usual Care (n = 50)


No. of Events
Patients, Patients, No. of Events Difference, %
Events No.(%) s30 d >30 d to 12 mo No.(%) al 12 mo (95%(1)" P Value
Chronic obstructive pulmonary disease 13(26) 4 12 11 (22) 13 4(-13to 21) .64
exacerbation
Pneumothorax 3(6) 3 l' 1(2) 1 4(-4to 12) .62
Hemoptysis 1(2) 1 0 0 0 2(-2106) .99
Thoracic pain 2(4) 1 1 2(4) 2 -2(-9to 5) .99
Pneumonia 9(18) 5 6 2(4) 2 14(2to 26) .03
Cardiovascular 1(2) 1 0 3(6) 3 -4(-12to 4) .62
Other 8(16) 2 7 6(12) 7 4(-10to 18) .56
Unknown 1(2) 0 1 0 0 2(-2106) .99
Total 26(52) 17 28 19(38) 28 14(-5to 33) .16
Deaths 4(8) 1d 3e 3(6)' 3 2(-8to 12) .99
Composite score within 24h
Death 0 0
Pneumothorax requiring chest tube 1(2) 1
placement >7 d
Hemoptysis >150ml 0 0
1 nvasive ventilation >24h 0 0
Total 1(2) 1
Composite score within 12mo
Death 4(8) 4 3(6) 3 2(-8to 12) .99
Pneumothorax requiring chest tube 1(2) 1 0 0 2(-2106) .99
placement >7 d
Hemoptysis >150ml 0 0 0 0
1 nvasive ventilation >24h 1(2) 1 3(6) 3 -4(-12to 4) .62
Pneumonia requiring hospitalization 9(18) 11 2(4) 2 14(2to 26) .03
Lung transplantation 0 0 0 0
Total 14(28) 17 6(12) 8 16(1to 31) .046
a Data are shown as No.of events and No.of patients with al least 1serious dThe cause of death was peritonitis.
adverse event. Serious adverse events are stratified by occurrence within 30 eThe causes of death were chronic obstructive pulmonary disease
days or between 30days and 12months alter treatment.Two-sided tests exacerbation, mesenteric ischemia, and unknown.
were used for safety analyses.
'The causes of death were chronic obstructive pulmonary disease exacerbation
b Difference between groups in the percentage of patients with events through in all 3cases, associated with hepatitis in 1case and associated with
12months. mesenteric ischemia in 1case.
'Recurrence of pneumothorax alter a first pneumothorax within 1month alter
procedure.

(95% CI, 1%-31%; P = .046). Within 12 months, 4 deaths (8%) oc- treatment is shown as a scatter plot of the mean cost and QALY
curred in the coi! group and 3 deaths (6%) in the usual care group, differences in eFigure SA and the acceptability curve is shown
with a difference between groups of 2% (95% CI, -8% to 12%; in eFigure SB in Supplement 2.
P = .99). The most frequent nonserious adverse event was mild
self-resolving hemoptysis ( < 5 mL) within 30 days afterthe pro-
cedure (48%).
Discussion
Health Economie Evaluation To our knowledge, this is the first randomized multicenter
The health economic evaluation was based on data from all 50 study assessing the 6-month efficacy, 1-year safety, and cost­
patients in each group. At 1 year, the mean cost difference per effectiveness of endobronchial coi! treatment in severe emphy­
patient was $47 908 (95% CI, $47 879-$48 073; P < .001) sema. Among patients followed up for 6 months, broncho­
(Table 4). The change in mean QALYs at 1 year was 0.038 (95% scopie treatment with nitinol coils compared with usual care
CI, 0.038-0.040) in the coi! group vs -0.023 (95% CI, -0.025 resulted in improved exercise capacity with high short-term
to -0.023) in the usual care group. The mean difference in QALYs costs. One of the main strength of this study is the complete­
between the 2 groups was 0.061 (95% CI, 0.061-0.064; P = .02). ness of follow-up at both 6 and 12 months. Coi! treatment was
The 12-month incremental cost-effectiveness ratio was associated with a significant decrease in lung hyperinflation and
$782 598 per QALY (95% CI, $663 496-$1 327212 per QALY). sustained improvement in quality of life. The magnitude of
The uncertainty associated with the cost-effectiveness of coi! changes in lung function and quality of life were very similar

jama.com JAMA January 12, 2016 Volume 31S, Number 2 181

289
iKB LECTURE CRITIQUE D'ARTICLE

Table 4. Resource Utilization and Costs by Randomization Group Over a 12-Month Period
Coil Treatment Usual Care Difference
Resources (n = 50) (n = 50) (95%(1) PValue'
Total length of stay, mean(SD), d
First coil treatment 3.1(1.6) NA
Second coil treatment 3.6(2.5) NA
Patients with 15(30)" 9(18)" 6 .16
�l rehospitalization,
No.(%)
No. of rehospitalizations
per patient
Mean(SD) 0.5(1) 0.2(0.5) 0.3(0.3 to 0.3) .21
Median(IQR) 0(0-1) 0(0-1)
Hospital costs, mean(SD), US$'
First coil treatment
Medical devices 20 214(1943) NA
Staff 598(158)
Operating room 560(147)
Hospital stays 2882(3084)
Median(IQR) 1399(1399-3094)
Second coil treatment Abbreviations: IQR, interquartile
range; NA, not applicable.
Medical devices 18 395(5061) NA
'P values were derived from 2-sided t
Staff 523(191) tests for equality of means.
Operating room 492(178) bThe total number of
Hospital stays 2883(3053) rehospitalizations was 26 among 15
Median(IQR) 1399(1399-3094) patients with a mean length of
hospital stay of 7.3 days (SD, 10.8
Rehospitalization 1882(4195) 910(2675) 972(952 to 1042) .14 days) and a median of 4 (IQR, 1-9) in
Median(IQR) 0(0-1170) 0(0-0) the coil group. The total number of
Consultation costs 1259(1397) 1309(1603) -50(-69 to -32) .85 rehospitalizations was 11 among 9
patients with a mean length of
Median(IQR) 658(403-1448) 601(345-1561) hospital stay of 3.5 days (SD, 3.8)
Transportation costs 351(420) 160(251) 191(191 to 210) .01 and a median of 2 (IQR, 0 -8) in the
Median(IQR) 211(0-590) 0(0-253) usual care group (2-sided P = .17 for
the difference in length of stay
Home oxygen costs 2947(2553) 2706(2564) 241(212 to 275) .49 between the coil and usual care
Monitoring tests 670 (95) 688(48) -19(-21 to -19) .29 groups).
lmaging 166(27) 139(9) 28(28 to 28) <.001 'Costs are in 2014 US dollars; US
Total 1-y costs 53 821(10475) 5912(3529) 47 908(47 879 to 48 073) <.001 $1 = €0.754 in purchasing power
parity.

to results of uncontrolled studies assessing bilateral coi! our inclusion criteria of an RV of greater than 220% predicted
treatment9·14 and to the results ofa recent meta-analysis.22 The was more restrictive than in previous coi! treatment studies.22
changes in quality oflife in our study were higher than usually Overall, our population was a unique severely hyperinflated and
observed in endobronchial lung volume reduction clinical homogeneous emphysema population relative to other large
trials.3•4 Because our study was designed to mirror real-life clini­ lung volume reduction trials.
cal decision making, computed tomography assessments were There were several limitations to this study. First, the pre­
conducted by each investigator without central reading center specified statistical analysis for efficacy was 1-tailed. Based on
or proprietary software analyses. Collateral ventilation was not this method, the trial met its prespecified primary end point
evaluated because fissure integrity did not influence response for success at 6 months. However, additional larger studies with
to coi! treatment.11 There was no difference in efficacy be­ longer follow-up using 2-tailed statistical analyses are needed
tween heterogeneous and homogeneous emphysema, as pre­ to draw a definitive conclusion regarding the long-term effi­
viously shown.9•22 To evaluate coils as a therapeutic option cacy of coi! treatment. Second, this study was neither sham
0
(.9
LJ.J for patients typically excluded from lung volume reduction controlled nor blinded, which needs to be considered for the
a:
(.9 trials, we did not exclude patients with 6-minute walk test interpretation of the 6-minute walk test, which is effort de­
LJ.J
a: results of less than 140 m, diffusing capacity of the lungs for pendent. Third, the 6-minute walk test method was a single
CO carbon monoxide of less than 20% predicted, lower lobe­ test with no supplemental oxygen, and the cutoffto define a
0
z predominant emphysema, homogeneous emphysema, hypox­ responder was 54 m.19 The lack ofpractice ofa second 6-min­
a:
LJ.J
> emia, hypercapnia, or a1-antitrypsin deficiencyor patients tak­ ute walk test has been shown to increase the variance of this
en ing anticoagulation drugs (except for vitamin K antagonists) or measure.23 The American Thoracic Society guidelines recom­
z
0
fC= antiplatelet drugs with aspirin or clopidogrel. On the other hand, mend a standard oxygen titration protocol to determine walk
0
LJ.J
@
un bm::arnm

290
ARTICLE 9 - LCA-2 2016

oxygen prescription, which was used in other lung volume re­ for lung volume reduction surgery.1,2 The rate of pneumonia
duction randomized trials.1·4 The 54-mcutoffis twice the most was very similar to that recently reported in a meta-analysis
recent minimal clinically important difference standards for ofl40 patients treated with coils. 22 Ali cases of pneumonia re­
the 6-minute walk test, which are between 25 m and 30 m. 24 solved with medical care. The mechanisms involved in pneu­
Finally, a key factor influencing our 6-minute walk test out­ monia may result from local airway irritation, subsegmental
corne may have been prebaseline pulmonary rehabilitation, airway closure, tension-induced inflammation, or local ische­
which was an inclusion criterion in our study. In a recent meta­ mia rather than from an infectious mechanism. Additional
analysis, the mean change in the 6-minute walk test result af­ studies assessing pneumonia or lung opacities associated with
ter rehabilitation in chronic obstructive pulmonary disease was coi! treatment are needed to better understand the mecha­
estimated to be 43.9 m. 25 Our study showed a relatively mod­ nisms, risk factors, and short-term and long-term evolution.
est magnitude of change, with a between-group difference of Our study also demonstrated the feasibility of bilateral coi!
21 m in the 6-minute walk test at both 6 and 12 months, which treatment in this severely ill population; 94% of patients as­
was statistically significant at 6 months when analyzed as per­ signed to the coi! group completed bilateral treatment.
cent change but not when analyzed by change in distance The study design included a health economic analysis to
walked and not significant at 12 months (although our study inform health care payers. The short duration of the follow-up
was not powered for a 12-month end point). Compared with precluded any robust conclusion on the long-term efficiency
the meta-analysis on coi! treatments, 22 our 6-minute walk dis­ of the procedure because the procedure and device costs
tance changes from baseline were much lower at both 6 and should be allocated over the total duration of clinical benefit.
12 months, whereas the changes in lung function and quality If we assumed that the QALYs gain could be maintained over
of life were in the same range. Finally, the absence of system­ at least 3 years with identical follow-up costs in both groups,
atic prespecified continuation of rehabilitation after random­ the incremental cost-effectiveness ratio would decrease to
ization could be regarded as an issue for the assessment of the about $270 000 per QALY, close to the incremental cost­
long-term benefits of the intervention. effectiveness ratio reported for lung volume reduction surgery
When the between-group differences in the secondary end in the United States. 30 This cost-effectiveness ratio at 1 year and
points were compared with validated minimal clinically im­ modeled to 3 years would not be considered efficient enough
portant differences in chronic obstructive pulmonary dis­ to warrant adopting the technology by most countries. Imple­
ease, the improvement in quality of life assessed by the mentation of this technique in a large-scale emphysema popu­
St George's Respiratory Questionnaire was largely higher than lation is likely to require this additional data given the high per­
4 points26 at both 6 and 12 months (means, -13.4 and -10.6 patient cost in the short run and the uncertain effect on total
points, respectively) and the improvement in dyspnea as­ health care expenditures. Therefore, our study included both
sessed by the Transition Dyspnea Index was higher than 1 unit27 a crossover and an extended (5-year) follow-up including a
at both 6 and 12 months (means, 1.6 and 1.1 units, respec­ health economic analysis of ail treated patients.
tively). The mean between-group differences in changes in RV
at 6 and 12 months were both7% and roughly reached the mini­
mal clinically important difference, which is a change be­
Conclusions
tween 6.1%and8.6%. 28ForFEV1, the mean between-groupdif­
ferences were 0.09 Lat 6 months and 0.08 Lat 12 months and In this preliminary study of patients with severe emphysema
did not reach the minimal clinically important difference of followed up for 6 months, bronchoscopie treatment with ni­
0.11. 29 tinol coils compared with usual care resulted in improved ex­
The magnitude and severity of serious and nonserious ad­ ercise capacity with high short-term costs. Further investiga­
verse events in this study were consistent with previous coi! tion is needed to assess durability of benefit and long-term cost
studies, 22 similar to endobronchial valves, 3,4 and far less than implications.

ARTICLE INFORMATION Hôpital Universitaire de Strasbourg, Strasbourg, for the integrity of the data and the accuracy of the
Author Affiliations: Service de Pneumologie, France (l<essler); Service de Pneumologie, Hôpital data analysis.
INSERM U903, Hôpital Universitaire de Reims, Universitaire d'Amiens, Amiens, France Study concept and design: Deslée, Barbe, Jolly,
Reims, France (Deslée); Service de Pneumologie, (Jounieaux); Service de Pneumologie, Hôpital Durand-Zaleski, Marquette.
Hôpital Universitaire Bichat, Paris, France Universitaire de Rouen, Rouen, France (Thiberville); Acquisition, analysis, or interpretation of data:
(Mal, Marceau); Service d'Oncologie Thoracique, Service de Pneumologie, IRCAN, UMR CNRS 7284/ Deslée, Mal, Dutau, Bourdin, Vergnon, Pison,
Maladies de la Plèvre, Pneumologie lnserm Ul081, Team 3, Hôpital Universitaire de Nice l<essler, Jounieaux, Thiberville, Leroy, Marceau,
lnterventionnelle, Hôpital Universitaire de Sophia Antipolis, Nice, France (Leroy, Marquette); Laroumagne, Mallet, Dukic, Barbe, Bulsei,
Marseille, Marseille, France (Dutau, Laroumagne); Département de Pharmacovigilance, Hôpital Durand-Zaleski, Marquette.
Département de Pneumologie et Addictologie, Universitaire de Reims, Reims, France (Dukic); Drafting of the manuscript: Deslée, Barbe, Jolly,
PhyMedExp, lnserm Ul046, CNRS UMR, Hôpital Département de Méthodologie, Pôle Recherche­ Durand-Zaleski, Marquette.
Universitaire de Montpellier, Montpellier, France Innovations, Hôpital Universitaire de Reims, Reims, Critica/ revision of the manuscript for important
(Bourdin, Mallet); Service de Pneumologie, Hôpital France (Barbe, Jolly); URC Eco ldF, Unité de intel/ectual content: Deslée, Mal, Dutau, Bourdin,
Universitaire de Saint-Étienne, Saint-Étienne, Recherche Clinique en Économie de la Santé d'ile de Vergnon, Pison, l<essler, Jounieaux, Thiberville,
France (Vergnon); Clinique Universitaire de France, AP-HP Paris, Paris, France (Bulsei, Leroy, Marceau, Laroumagne, Mallet, Dukic, Bulsei,
Pneumologie, Pôle Thorax et Vaisseaux, lnserm Durand-Zaleski). Durand-Zaleski, Marquette.
1055, Hôpital Universitaire de Grenoble Alpes, Author Contributions: Dr Deslée had full access to Statistica/ analysis: Barbe, Bulsei, Jolly,
Grenoble, France (Pison); Service de Pneumologie, all of the data in the study and takes responsibility Durand-Zaleski.

jama.com JAMA January 12, 2016 Volume 315, Number 2 183

291
iKB LECTURE CRITIQUE D'ARTICLE

Obtained funding: Deslée, Barbe, Jolly, Fourrier, MD, PhD, Eric Hachulla, MD, PhD, Nicolas effective up to 12 months following treatment. PLoS
Durand-Zaleski, Marquette. Roche, MD, PhD, Daniel Dusser, MD, PhD. One. 2015;10(4):e0122656.
Administrative, technical, or material support: Mal, Additional Contributions: We thank Cedric 15. Pietzsch JB, Garner A, Herth FJF.
Dutau, Pison, Laroumagne, Mallet, Dukic, Barbe, Carbonneil, PhD (Direction Générale de l'Offre de Cost-effectiveness of endobronchial valve therapy
Jolly. Soins, French Ministry of Health), for his support in for severe emphysema. Respiration. 2014;88(5):
Study supervision: Deslée, l<essler, Jolly, the REVOLENS study. Dr Carbonneil did not receive 389-398.
Durand-Zaleski, Marquette. any compensation for his contribution. 16. Deslee G, Barbe C. Bourdin A, et al.
Conflict of lnterest Disclosures: Ali authors have Cost-effectiveness of lung volume reduction coil
completed and submitted the ICMJE Form for REFERENCES treatment in emphysema. Rev Mal Respir. 2012;29
Disclosure of Potential Conflicts of lnterest. 1. Naunheim l<S, Wood DE, Mohsenifar Z, et al. (9):1157-1164.
Ors Deslée and Marquette report involvement as Long-term follow-up of patients receiving
investigators in previous studies sponsored by 17. National Emphysema Treatment Trial Research
lung-volume-reduction surgery vs medical therapy Group. Patients at high risk of death after
PneumRx and receipt of travel reimbursements and for severe emphysema by the National Emphysema
speaker fees for educational sessions from lung-volume-reduction surgery. N Engl J Med. 2001;
Treatment Trial Research Group. Ann Thorac Surg. 345(15): 1075-1083.
PneumRx. Dr Dutau reports receipt of consultant 2006;82(2):431-443.
fees from Novatech. Dr Bourdin reports advisory 18. Quanjer PH, TammelingGJ, Cotes JE, et al. Lung
board membership and participation as an 2. Fishman A, Martinez F, Naunheim I<, et al. volumes and forced ventilatory flows. Eur Respir J.
investigator in clinical trials sponsored by A randomized trial comparing lung-volume­ 1993;6(suppl 16):5-40.
GlaxoSmithl<line, Boehringer lngelheim, Novartis, reduction surgery with medical therapy for severe
emphysema. N Engl J Med. 2003;348(21):20S9- 19. Redelmeier DA, Bayoumi AM, Goldstein RS,
and AstraZeneca. Dr Pison reports support for Guyatt GH. lnterpreting small differences in
lectures and travel from Pulmonx. No other 2073.
functional status: the six minute walk test in chronic
disclosures were reported. 3. Herth FJ, Noppen M, Valipour A, et al. Efficacy lung disease patients. Am J RespirCritCore Med.
Funding/Support: The REVOLENS Study was predictors of lung volume reduction with Zephyr 1997;155(4): 1278-1282.
supported by an academic grant from the French valves in a European cohort. Eur Respir J. 2012;39
(6): 1334-1342. 20. Husereau D, Drummond M, Petrou S, et al.
Ministry of Health (Direction Générale de l'Offre de Consolidated Health Economie Evaluation
Soins, PSTIC-2012), which required a randomized 4. Sciurba FC, Ernst A, Herth FJ, et al. Reporting Standards (CHEERS)-explanation and
trial design associated with an economic evaluation A randomized study of endobronchial valves for elaboration. Value Health. 2013;16(2):231-250.
including a cost-effectiveness analysis. The coils advanced emphysema. N Engl J Med. 2010;363(13):
were purchased from the manufacturer, 1233-1244. 21. l<nottnerus JA, Bouter LM. The ethics of sample
PneumRx/BTG. size: 2-sided testing and 1-sided thin king. JClin
5. Shah PL, Slebos DJ, Cardoso PF, et al. Epidemiol. 2001;54(2):109-110.
Role of the Funder/Sponsor: The French Ministry Bronchoscopie lung-volume reduction with Exhale
of Health had full access to the results of the study airway stents for emphysema (EASE trial). Lancet. 22. Slebos DJ, Hartman JE, l<looster I<, et al.
but had no involvement in the design and conduct 2011;378(9795):997-1005. Bronchoscopie coil treatment for patients with
of the study; collection, management, analysis, and severe emphysema. Respiration. 2015;90(2): 136-145.
6. Come CE, l<ramer MR, Dransfield MT. et al.
interpretation of the data; preparation, review, or A randomised trial of lung sealant vs medical 23. Chancira D, Wise RA, l<ulkarni HS, et al.
approval of the manuscript; or decision to submit therapy for advanced emphysema. Eur Respir J. Optimizing the 6-min walk test as a measure of
the manuscript for publication. 2015:46(3):651-662. exercise capacity in COPD. Chest. 2012;142(6): 1545-
Group Information: The members of the 1552.
7. Snell GI, Hopkins P. Westall G, et al. A feasibility
REVOLENS Study Group include all authors and and safety study of bronchoscopie thermal vapor 24. Holland AE, Spruit MA, Troosters T. et al.
Hervé Vallerand, MD, Sandra Dury, MD, Jeanne ablation. Ann Thorac Surg. 2009;88(6):1993-1998. An official European Respiratory Society/American
Marie Perotin, MD, François Lebargy, MD, PhD Thoracic Society technical standard: field walking
(Hôpital Universitaire de Reims); Johanna Pradelli, 8. Herth FJ, Eberhard R, Gompelmann D, et al. tests in chronic respiratory disease. Eur Respir J.
MD, Matthieu Buscot, MD, Pierre Walter, MD, Bronchoscopie lung volume reduction with a 2014;44(6): 1428-1446.
Michel Poudenx, MD (Hôpital Universitaire de dedicated coi 1. Ther Adv Respir Dis. 2010:4(4):225-
231. 25. McCarthy B, Casey D, Devane D, et al.
Nice); Marie Christine Dombret, MD, Frédérique Pulmonary rehabilitation for chronic obstructive
Servin, MD, Marie Pierre Debray, MD, Cécile 9. Deslee G, l<looster I<, Hetzel M, et al. Lung pulmonary disease.Cochrane Database Syst Rev.
Chenivesse, MD (Hôpital Universitaire Bichat, volume reduction coil treatment for patients with 2015;2:CD003793.
Paris); Alain Palot, MD, Carine Gomez, MD, Philippe severe emphysema. Thorax. 2014;69(11):980-986.
Astoul, MD (Hôpital Universitaire de Marseille); 26. Jones PW. St George's Respiratory
10. l<looster I<, Ten Hacken NH, Slebos DJ. The lung Questionnaire: MCID.COPD. 2005;2(1):75-79.
Nathalie Lesavre, MD (Centre d'investigation volume reduction coil for the treatment of
Clinique 1409, AP-HM, Marseille); Anne Sophie emphysema. Expert Rev Med Devices. 2014;11(5): 27. Mahler DA, Witek TJ J r. The MCID of the
Gamez, MD, Philippe Torodo, MD, Christophe 481-489. Transition Dyspnea Index is a total score of one
Brousse, MD, Clément Broissin, MD (Hôpital unit.COPO. 2005;2(1):99-103.
Universitaire de Montpellier); Yoann Thibaut, MD, 11. l<ontogianni I<, Gerovasili V, Gompelmann D,
et al. Effectiveness of endobronchial coil treatment 28. Hartman JE, Ten Hacken NH, l<looster I<, et al.
Fabrice Di Palma, MD, Frédéric Costes, MD (Hôpital The minimal important difference for residual
Universitaire de Saint-Etienne); Amandine Briault, for lung volume reduction in patients with severe
heterogeneous emphysema and bilateral volume in patients with severe emphysema. Eur
MD, François Arbib, MD (Hôpital Universitaire de Respir J. 2012;40(5):1137-1141.
Grenoble); Michele Porzio, MD, Benjamin Renaud­ incomplete fissures. Respiration. 2014;88(1):52-60.
Picard, MD (Hôpital Universitaire de Strasbourg); 12. Shah PL, Zoumot Z, Singh S, et al. 29. Donohue JF. Minimal clinically important
Bénédicte Toublanc, MD, Géraldine François, MD Endobronchial coils for the treatment of severe differences in COPD lung function.COPD. 2005;2
(Hôpital Universitaire d'Amiens); Antoine Cuvelier, emphysema with hyperinflation (RESET). Lancet (1):111-124.
MD, PhD, Sarny Lachkar, MD (Hôpital Universitaire Respir Med. 2013;1(3):233-240. 30. Ramsey SD, Berry I<, Etzioni R, et al. Cost
0 de Rouen); Margaux Verdier, Michael Maizieres, 13. Slebos DJ, l<looster I<, Ernst A, et al. effectiveness of lung-volume-reduction surgery for
(.9
LJ.J PhD, Delphine Gras, PhD (monitoring team, Hôpital Bronchoscopie lung volume reduction coil patients with severe emphysema. N Engl J Med.
a: Universitaire de Reims); Philippe Benoit, MD 2003;348(21):2092-2102.
(.9 treatment of patients with severe heterogeneous
LJ.J
(Pharmacie, Hôpital Universitaire de Reims); Annick emphysema. Chest. 2012;142(3):574-582.
a: Leclainche (data manager, Hôpital Universitaire de
CO
0
Reims). Data and safety monitoring board: François 14. Zoumot Z, Kemp SV, Singh S, et al.
Endobronchial coils for severe emphysema are
z
a:
LJ.J
>
en
z
0
fC=
0
LJ.J
@
184 JAMA January 12, 2016 Volume 315, Number 2 jama.com

292
ARTICLE 9 - LCA-2 2016

QCM
1
1Cette étude peut être considérée comme :
A - Innovante.
B - Une étude en soins courants ou habituels.
C - Multicentrique.
D - Invasive.
E - lnterventionnelle.

Q M
� I Cet article présente les résultats d'un essai :
A- En aveugle.
B- Clinique.
C- Ouvert.
D- Randomisé.
E- Sur deux groupes parallèles.

QCM
3 1 L'(les) objectif(s) de cette étude étai(en)t :
A - De comparer la réduction de volume pulmonaire par spirales à la réduction du volume
pulmonaire obtenue par d'autres techniques chez des patients emphysémateux sévères.
B - De comparer les complications survenant durant 6 mois chez des patients emphysémateux
sévères, notamment lorsqu'ils ont bénéficié d'un traitement de réduction du volume pulmonaire
par spirales.
C - De comparer la réduction du volume pulmonaire par spirales à un traitement médical bien mené
selon les recommandations internationales, chez des patients emphysémateux sévères.
D - D'estimer les coûts des traitements par spirales dans les hôpitaux français chez des patients
emphysémateux sévères.
E - D'évaluer l'efficacité et la tolérance du traitement par spirales chez des patients emphysémateux
sévères.

QCM
4
1Quels étaient les critères d'inclusion dans cette étude ?
A - Avoir un traitement par bronchodilatateur et corticoïde inhalé.
B - Avoir un emphysème pulmonaire homogène.
C - Avoir un emphysème pulmonaire bilatéral.
D - Avoir une oxygénothérapie de longue durée.
E - Avoir une perte de plus de 50% de la FEV1 après bronchodilatateur.

QCM
5
1Le(s)quel(s) des éléments suivants a(ont) été utilisé(s) pour calculer le nombre de
sujets nécessaires dans cette étude ?
A - Une attrition de la population d'étude de 37% à six mois.
B - Un risque alpha de 5%.
C - Une différence attendue d'amélioration d'au moins 32%, entre les deux groupes, à l'épreuve de
marche de 6 minutes sans oxygène.
D - Des analyses en situation bilatérale.
E - Un risque bêta à 20%.

Q M I Cet essai thérapeutique a utilisé lors de son analyse principale :



A- Une approche per protocole.
B- Des tests statistiques unilatéraux.
C- Des tests statistiques bilatéraux.
D- Une approche selon le biais maximum.
E- Une aooroche en intention de traiter.

293
iKB LECTURE CRITIQUE D'ARTICLE

Les auteurs indiquent avoir réalisé une analyse supplémentaire selon l'hypothèse
QCM
du biais maximum. Théoriquement, dans ce type d'analyse, un patient qui n'a pas
7 effectué le test de marche de 6 minutes était considéré comme:
A- Exclu de l'analyse du critère de jugement principal, quel que soit son groupe dans l'essai.
B- Un échec pour le critère de jugement principal, dans le groupe« spirales».
C- Un succès pour le critère de jugement principal, dans le groupe« spirales».
D- Un succès pour le critère de jugement principal, dans le groupe« soins habituels».
E- Un échec pour le critère de iuoement principal, dans le qroupe« soins habituels».

QCM
8
1 Cet essai clinique a permis la comparaison de nombreux critères de jugements et
de sécurité:
A - Ces éléments ont été analysés de manière identique.
B - Les analyses ont permis l'ajustement sur les facteurs de confusion potentiels.
C - Il existe un risque d'inflation du risque alpha, compte tenu du nombre de tests effectués.
D - Les analyses multivariées ont confirmé les résultats des analyses univariées.
E - Toutes les analyses présentées sont valides, car les deux groupes de patients étaient
initialement comparables.

QCM
9
1
Cette étude s'est intéressée à la qualité de vie (QV) des sujets emphysémateux
inclus et suivis:
A - La QV, mesurée par l'EuroQoL, comprenait cinq domaines ou dimensions.
B - La QV a été mesurée spécifiquement grâce au questionnaire respiratoire de Saint George.
C - La« QV respiratoire» comportait trois dimensions : impact, activité, symptômes.
D - La« QV respiratoire» était significativement plus mauvaise dans le groupe« spirales».
E - La« QV respiratoire» pouvait être évaluée comme un score global codé de O à 100.

QCM
10
1
Les comparaisons effectuées au cours de l'analyse de cette étude:
A - Ont porté sur le périmètre de marche des patients mesuré dans des conditions standardisées.
B - Ont montré un gain moyen de périmètre de marche de 8 mètres au test de marche de 6 minutes
sans oxygène entre les deux groupes, en faveur du groupe« spirales».
C - Ont porté sur la réalisation possible d'une marche de plus de 54 mètres en moins de 6 minutes
sans oxygène.
D - Ont permis de comparer des différences de gain ou de perte dans la distance de marche,
mesurées au test de marche de 6 minutes sans oxygène.
E - Ont porté sur la majoration de la distance de marche au test de marche de 6 minutes sans
oxygène d'au moins deux fois la différence minimale cliniquement significative.

QCM
11
1En termes d'efficacité à 6 mois, cette étude a montré:
A - Une amélioration moyenne de 9% de la distance de marche mesurée par le test de marche de 6
minutes sans oxygène dans le groupe« spirales».
B - Une amélioration de la distance de marche au test de marche de 6 minutes sans oxygène,
lorsque cette variable est traitée de manière qualitative.
C - Un doublement du pourcentage de patients réussissant à améliorer la distance parcourue au test
de marche de 6 minutes sans oxygène d'au moins 54 mètres.
D - Une amélioration de la distance de marche au test de marche de 6 minutes sans oxygène
0
(.9 lorsque cette variable est traitée de manière quantitative.
LJ.J
a: E - Une amélioration de 1% de la distance de marche mesurée par le test de marche de 6 minutes
(.9

LJ.J sans oxygène, dans le groupe« soins habituels».


a:
CO
0

z
a:
LJ.J
>

@
en
z
0
fC=
0
LJ.J

294
ARTICLE 9 - LCA-2 2016

QCM
12
1 Quels sont les éléments qui ont pu limiter l'évaluation des réponses aux
traitements?
A - Une étude non réalisée en aveugle.
B - Un choix de patients particulièrement graves.
C - La randomisation.
D - Un effet centre.
E - Un biais de classement sur le critère de iuoement principal.

QCM I Néanmoins, cette étude :


13
A - Pose le problème de la signification clinique de tels résultats.
B - Est qualifiée de préliminaire par les auteurs.
C - Montre une disparition de l'effet sur le périmètre de marche lors de sa mesure à 12 mois.
D - Montre une différence statistique avec un effectif non conforme aux hypothèses testées.

1
E - Montre des résultats qui ne seraient pas forcément significatifs en situation bilatérale.

QCM Quelle(s) est(sont) la(les) principale(s) limite(s) à l'application en pratique de cette


14 étude aux emphysémateux sévères?
A - Un contexte thérapeutique obsolète dans cette étude.
B - Une quantité d'effet relativement faible du traitement par spirales.
C - La sélection des patients capables de supporter des gestes sous anesthésie générale.
D - Le caractère multicentrique de l'étude.
E - L'absence de standardisation des tests de marche.

Cette étude rapporte une amélioration, à 6 mois, d'au moins 54 mètres, de la


distance parcourue au test de marche de 6 minutes, chez 36% des patients du
QCM groupe « spirales » et chez 18% des patients du groupe « soins habituels ». Il est
15 possible de conclure à la supériorité du traitement par spirales comparativement
aux soins habituels car les bornes de l'intervalle de confiance à 95% de la différence
du pourcentage entre les deux groupes (4% à + l'infini) :
A - Excluent la valeur neutre de 1.
B - Incluent 95% des patients de l'échantillon.
C - Excluent la valeur neutre de O.
D - Excluent le seuil de non infériorité de l'essai.
E - Incluent l'estimation ponctuelle de cette différence de 18.

295
iKB LECTURE CRITIQUE D'ARTICLE

Grille de correction QCM


(Questions à choix multiples)

.... B- F .
A- V Réponse: ACDE
S'agissant d'une nouvelle stratégie thérapeutique, on peut considérer cette étude

.
:!!: C- V comme innovante.
(.)
0 D- V On parle d'étude invasive si l'intervention réalisée nécessite une lésion de
E- V l'organisme.
A- F
N
:!!: C-
B- V
V
.
Réponse: BCDE
On parle d'essai en ouvert lorsqu'il n'y a pas d'aveugle. Il n'était pas ici éthique
(.) de réaliser une fibroscopie chez les patients du groupe contrôle, car il s'agit d'un
0 D- V examen plutôt invasif qui peut avoir des risques pour le patient.
E- V

M
A-
B- F .
F Réponse: DE
Cette étude évalue l'efficacité à 6 mois et les effets secondaires (tolérance) durant
:!!: C- F 1 an d'un traitement de réduction du volume pulmonaire (spirales) par rapport au

.
(.)
0 D- V traitement de référence (recommandations en vigueur au moment de l'étude).
E- V L'aspect économique de cette procédure est également évalué.
A-
.
F Réponse: CE
B- F Dans cette étude, les critères d'inclusion étaient :
C- V Un emphysème bilatéral ;
"'" D- F Un volume expiré forcé après bronchodilatateur (1ère seconde- FEV1) de
:!!: moins de 50% de la théorique ;
(.)
0 Un volume résiduel de plus de 220% de la théorique ;
E- V Une réhabilitation pulmonaire au cours des deux mois précédents.
Rappel : les critères d'inclusion doivent TOUS être présents pour pouvoir être inclus
dans une étude !

Lt)
A-
B- V .
F Réponse: BC
Les éléments pour calculer un nombre de sujets nécessaires dans une étude :
:!!: C- V Risque alpha ;
(.) D- F Risque bêta/ Puissance ;
0
Taille de l'effet à mettre en évidence ;
E- F
Variance ou écart-type selon le type de variable.
A- F
ID
:!!: C-
B- V
F
.
Réponse: BDE
Les auteurs se placent dans la situation la plus défavorable au moment de
(.) l'analyse. Si le résultat en sort significatif, il le sera donc dans toutes les autres
0 D- V situations « plus favorables ».
E- V
A- F
..... B-
:!!: C-
(.)
F .
V Réponse: BD
Il s'agit de se situer dans la situation la plus défavorable au moment de
0 D- V l'analyse.
E- F
A-
.
0
(.9
LJ.J
F Réponse: CE
a:
(.9
J,
B- F Dans cette étude, les deux groupes de patients étaient initialement comparables

.
CO
LJ.J
a: :!!: C- V (du fait d'une randomisation bien menée).
La comparaison des deux populations à l'aide du tableau 1 doit s'effectuer« à vue
0 D- F
0 (.)
N
<(
z
a:
d'œil », il ne faut pas réaliser de tests statistiques (possible inflation du risque
E- V alpha).
>
LJ.J

z
0

LJ.J
@

296
ARTICLE 9 - LCA-2 2016

a, B- V .
A- V Réponse: ABCE
La QV est significativement meilleure dans le groupe « spirales» que dans le

.
::!!: C- V groupe « soins habituels».
(.)
0 D- F La QV est mesurée par un questionnaire de St George et un questionnaire
E- V EuroQoL.
A- V
....
0 B- F .
Réponse: ADE
::!!: C-
0 D-
(.)
F
V
.Le périmètre de marche est mesuré dans des conditions standardisées .
L'évaluation porte sur une amélioration de plus de 54 mètres au test de marche
de 6 minutes à 6 mois.
E- V
A- V
........ B- V
::!!: C-
0 D-
(.)
V
V
.
Réponse: ABCDE
Pour répondre, il faut se référer au tableau 2.
E- V
A- V
....
N

::!!: C-
B- F
F
.
Réponse: AE
La mesure du critère de jugement principal est un critère objectif: il peut donc en
résulter un mauvais classement du sujet pour ce critère (« biais de
0 D-
(.)
F classement»).
E- V

....
M
A-
B- V .
V Réponse: ABCE
Les résultats ne sont plus significatifs à 12 mois (significativité clinique qui peut
::!!: C-
0 D-
(.)
V
F .donc être questionnée).
Un test bilatéral à une moins forte puissance qu'un test unilatéral. Un test unilatéral
E- V nécessite un nombre de sujets moins important qu'un test bilatéral.

...."'"
A-
B- V .
F Réponse: BC
Il s'agit d'une étude innovante, le contexte thérapeutique est donc loin d'être
::!!: C-
(.) D-
0
V
F .obsolète
Les tests
!
de marche étaient réalisés de manière standardisée dans cette étude, et
le caractère multicentrique renforce en réalité sa validité externe et son
E- F extrapolabilité !
A- F

....
Lt)
B-
.
F Réponse: C
La valeur neutre est O quand il s'agit de l'étude d'une différence. Attention à ne
::!!: C-
(.)
0
V
. pas se faire avoir!
On peut donc ici conclure à la su périorité du traitement par « spirales» sur les
D- F soins habituels (critère de jugement principal dans cette étude).

E- F

297
iKB LECTURE CRITIQUE D'ARTICLE

0
(.9
LJ.J
a:
(.9
J,
LJ.J
a:
CO
0


z
a:
LJ.J
>
en
z
0
fC=
0
LJ.J
@

298
Chapitre
43

ARTICLE 10 - LCA 1 / 2017

American Journal of Epidemiology Vol. 178, No. 7


©The Author 2013. Published by Oxford University Press on behalf of the Johns Hopkins Bloomberg School of DOi: 10.1093/aje/kwto96
Public Health. Ali rights reserved. For peITT1issions, please e-mail: journals.permissions@oup.com. Advance Access publication:
August 13, 2013

Brief Original Contribution

Early-Onset Alopecia and Amyotrophie Lateral Sclerosis: A Cohort Study

Elinor Fondell*, Kathryn C. Fitzgerald, Guido J. Falcone, Éilis J. O'Reilly, and Alberto Ascherio
* Correspondence to Dr. Elinor Fondell, Department of Nutrition, Harvard School of Public Health, 655 Huntington Avenue, Building Il, Boston,
MA02115 (e-mail: efondell@hsph.harvard.edu).

Initial/y submitted January 29, 2013; accepted for publication April 30, 2013.

A recent meta-analysis of 7 genome-wide association studies on early balding (alopecia) revealed single nucle­
otide polymorphism variants in the region of the amyotrophie lateral scierosis (ALS) gene TAR DNA-binding protein
43 (TARDBP/TDP-43). We therefore explored the association of early-onset alopecia and ALS in the Health Pro­
fessionals Follow-up Study, a large cohort of 51,529 US men. ln 1992, the participants (then aged 46-81 years)
were asked to report their hair line pattern at age 45 years. During the follow-up period (1992-2008), 42 men were
diagnosed with ALS. Of those, 13 had reported no alopecia, 18 had reported moderate alopecia, and 11 had reported
extensive alopecia at age 45 years. Those who reported extensive alopecia had an almost 3-fold increased risk of
ALS compared with those who reported no alopecia (relative risk = 2.74, 95% confidence interval: 1.23, 6.13). Fur­
thermore, we observed a linear trend of increased risk of ALS with increasing level of balding at age 45 years
(P1 ,end = 0.02). ln conclusion, men with early-onset alopecia seem to have a higher risk of ALS. The mechanisms
underlying this association deserve further investigation.

alopecia; amyotrophie lateral sclerosis; cohort studies; male-pattern baldness; motor neuron disease

Abbreviation: ALS, amyotrophie lateral sclerosis.

Amyotrophie lateral sclerosis (ALS) is a neurodegenera­ MATERIALS AND METHODS


tive disease with a median survival of 1.5-3 years after diag­
nosis (1). The lifetime risk of ALS ranges from 1 in 1,000 to Study population
1 in 400 according to different estimates (2, 3). The cause of The Health Professionals Follow-up Study is a longitudinal
ALS is largely unknown, and there is no effective treatment to study of 51,529 male health professionals (dentists, optom­
date. Severa! observations suggest a link between early balding etrists, osteopaths, podiatrists, pharmacists, and veterinarians ),
(alopecia) and ALS. ALS affects al! motor neurons and cranial aged40-75 years at enrollment, who completed a mailedques­
nerves except those that Jack androgen receptors (4); a repeat tionnaire about lifestyle and medical history in 1986 and sim­
expansion in the androgen receptor gene causes spinobulbar ilar biennial questionnaires since then (10).
muscular atrophy (5), a nonfatal motor neuron disease similar
to ALS, but does not cause ALS (6). Other mutations in the
androgen receptor gene and increased sensitivity of the androgen Alopecia assessment
receptor are linked to alopecia (7, 8). Furthermore, in a recent
meta-analysis of 7 European genome-wide association studies, In 1992, participants reported their balding status at age 45
a single nucleotide polymorphism in the area of the ALS gene years by choosing from 5 crown-view pictograms based on
TARDNA-bindingprotein43 (TARDBPIIDP43)(9)waslinked Norwood's classification of male-pattern baldness (Norwood's
to alopecia. No previous studies have directly examined the 1, III, IV, V, and VII) (11) (Figure 1). The original 5-category
association between alopecia and ALS. We therefore explored classification of alopecia was collapsed into 3 categories as
the association between early-onset alopecia and ALS among follows: no alopecia (Norwood's 1), moderate alopecia (Nor­
participants in a large cohort of US men. wood's III or IV), and extensive alopecia (Norwood's V or

1146 Am J Epidemiol. 2013;178(7):1146-1149

299
iKB LECTURE CRITIQUE D'ARTICLE

Alopecia and Amyotrophie Laierai Sclerosis 1147

No alopecia Moderate alopecia Extensive alopecia on death certificates in the majority of instances in which
code 335.2 was listed as a cause or contributory cause of death
(13).

Data analysis
Figure 1. Pictograms used to assess level of balding in the Health Person-time was calculated from the date of retum of the
Professionals Follow-up Study in 1992. Pictograms are based on 1992 questionnaire until the date of first onset of ALS symp­
Norwood's classification of male-pattern baldness. (No alopecia =
Norwood's I; moderate alopecia = Norwood's Ill or IV; and extensive toms (37 cases), death from ALS or any other cause (5 cases),
alopecia = Norwood's V or VI1). This figure is reproduced from Norwood or the end of follow-up (December 31, 2008). Cox propor­
(11), with permission from Wolters Kluwer Health, copyright 1975. tional hazards regression was used to estimate relative risks
and 95% confidence intervals for different stages of alopecia
in relationship to ALS. We stratified the Cox models by age
in single years to obtain better age adjustment.
There are few established risk factors for either alopecia
or ALS. Smoking has been suggested to increase the risk of
VII) for analysis purposes. This study was approved by the ALS (14), as well as alopecia (15). High premorbid body mass
human subjects committee at the Harvard School of Public index (weight (kg)/height (m)2) (16) and vitamin E intake (17)
Health (Boston, Massachusetts). have been reported to be associated with a lower ALS risk.
However, these variables are not known to be associated with
alopecia and were therefore included in secondary analysis
Ascertainment of ALS only. In a subanalysis, we excluded users of finasteride, a drug
that blocks dihydrotestosterone production and that is used
In each biennial follow-up questionnaire, participants were to treat enlarged prostate and alopecia; in this subanalysis,
asked to report a specific list of medically diagnosed condi­ we used as baseline the date of retum of the 1996 question­
tions and "any other major illness." ALS was added to the list naire, which was the first to inquire about finasteride use.
of specific conditions beginning in 2000. We requested per­ In total, we identified 42 cases of ALS in 565,125 person­
mission to contact the treating neurologists for release of rele­ years contributed by 40,046 men. Analyses were performed
vant medical records from participants who reported a diagnosis by using SAS, version 9.2, software (SAS Institute Inc., Cary,
of ALS on the open question on major illnesses or on the North Carolina).
specific question about ALS. Because of the rapidly progres­
sive nature of the disease (median survival, 1.5-3 years) (1), RESULTS
many participants with ALS died before we could send the
request for release of medical records, so the request was sent The distribution of baseline characteristics was similar across
to the closest family members. After obtaining permission, alopecia groups (Table 1). Of the 42 participants diagnosed
we asked the treating neurologists to complete a questionnaire with ALS during the follow-up period, 13 reported no alope­
to confirm the diagnosis of ALS and to rate the certainty of the cia at age 45 years, 18 reported moderate alopecia, and 11
diagnosis (definite, probable, or possible) and send medical reported extensive alopecia (Table 2). The crude incidence rate
records. Starting in 2004, the questionnaire was modified to of ALS increased with age as follows: below 60 years, 1.3
include the El Escorial diagnostic criteria (12). The final con­ cases/100,000 person-years; 60-70 years, 3.0 cases/100,000
firmation for our study purposes was made by a neurologist person-years; and 70 years or older, 7.1 cases/100,000 person­
with experience in ALS diagnosis on the basis of the review years. Participants reporting extensive alopecia had an almost
of medical records. We relied on the diagnosis made by the 3-fold increased risk of ALS compared with those reporting
treating neurologist if the information in the medical record no alopecia (relative risk adjusted for age and smoking=
was insufficient or if it could not be obtained. Only partici­ 2.74, 95% confidence interval: 1.23, 6.13). When additional
pants with definite or probable ALS were included as cases. adjustments were made for body mass index and vitamin E
When we were unable to confirm (i.e., obtain a copy of the intake, results were similar (relative risk= 2.75, 95% confi­
medical record or the neurologist's questionnaire) incident dence interval: 1.23, 6.15). Further, we observed a signifi­
self-reported ALS, we classified the participant as having cant linear trend across increasing levels of balding at age 45
"possible ALS" and excluded him from the analysis unless years and risk of ALS (P1rend= 0.02) (Table 2). When we
death occurred during follow-up and ALS was listed on the used 5 alopecia categories instead of 3, the results were sim­
0
(.9
death certificate. ilar (P for linear trend= 0.03). To avoid the potential influ­
LJ.J
a:
(.9
Vital status of the participants was determined by auto­ ence of alopecia-associated drug use, we excluded finasteride
LJ.J
mated linkage with the National Death Index. The underly­ users in a secondary analysis (2 cases among 716 users). In
a: ing and contributing causes of death were coded according this analysis (which required moving the baseline from 1992
CO
0
to the International Classification of Diseases, Ninth Revi­ to 1996, when finasteride use was first assessed), the multi­
z sion. All individuals with code 335.2 (motor neuron disease) variable adjusted relative risk of ALS comparing extensive
a:
LJ.J
> listed as the underlying or contributing cause of death were alopecia with no alopecia was 2.85 (95% confidence interval:
en
z
0
considered to have had ALS. In a previous validation study 1.10, 7.41). Approximately 95% of participants in the Health
fC= (13), it was found that ALS was the primary diagnosis listed Professionals Follow-up Study are of Caucasian descent. We
0
LJ.J
@
Am J Epidemiol. 2013;178(7):1146-1149

300
ARTICLE 10 - LCA-1 2017

1148 Fondell et al.

Table 1. Age-Standardized Characteristics of Study Participants at Baseline According to Level of Balding at Age
45 Years in the Health Professionals Follow-up Study, 1992-2008

NoAlopecia ModerateAlopecia ExtensiveAlopecia


(n= 17,568 men) (n= 16,980 men) (n= 5,498 men)
Baseline Characteristic % Mean (SD) % Mean (SD) % Mean(SD)

Participants 43.9 42.4 13.7


Age in 1992, years 60.1 (9.6) 60.1 (9.7) 60.7 (9.9)
Body mass indexa,b 25.4 (3.2) 25.4 (3.1) 25.7 (3.4)
Current smoker' 9.7 9.0 7.8
Vitamin E supplement useb 21.2 20.8 19.8

Abbreviation: SD, standard deviation.


a
Calculated as weight (kg}/height (m)2.
b
Age-standardized value.

therefore performed additional analysis excluding all non­ ethnie and racial groups, and further studies should be con­
Caucasian participants (1 ALS case), but the results remained ducted to explore this association. As in all observational studies,
similar to the main results (relative risk = 2.44, 95% confidence there might be unmeasured confounding by unknown predictors
interval: 1.07, 5.58). ofALS.
Our results are consistent with the involvement of andro­
DISCUSSION gens in the etiology of ALS, a hypothesis that has been pro­
posed previously (4, 18-20). A possible link between alopecia
In this large cohort ofmale health professionals, self-reported and ALS is the TARDBIPTDP-43 gene. In a recent meta­
early-onset alopecia was associated with a higher risk of ALS. analysis of7 genome-wide association studies including more
Our study benefits from prospective case ascertainment and than 12,800 individuals ofEuropean ancestry, a single nucle­
thereby includes both slow-progressing and fast-progressing otide polymorphism (rs12565727) in the area ofthe ALS gene
cases. Alopecia at age 45 years was self-reported retrospectively TARDBITDP-43 was linked to alopecia (9). This single nucle­
by participants aged 46-81 years; however, because partici­ otide polymorphism was not found to be in high linkage dis­
pants did not have ALS at the time of exposure assessment, any equilibrium (defined as R2 > 0.8) with genetic variants within
differences in reporting are likely nondifferential with respect TARDBPITDP-43. Linkage disequilibrium was evaluated by
to ALS. single nucleotide polymorphism annotation and proxy search
In this study, information on alopecia was available at age (21). However, given their physical proximity, it is still pos­
45 years only. Further information on changes ofalopecia sta­ sible for rs12565727 to influence TARDBPITDP-43 through
tus over time, especially alopecia assessment at an earlier age, functional regulatory mechanisms. The TARDBPITDP-43 gene
would be of value in future studies. An important limitation codes for the TDP-43 protein and is involved in regulating gene
of this study is the low number of ALS cases (n = 42). The expression and RNA splicing (22). Even though mutations in
results ofthis study should be interpreted with caution, and the the TARDBPITDP-43 gene are reported in only about 2%-5%
hypothesis of alopecia and its association with ALS should of ALS cases (23), TDP-43-dominant protein aggregates are
be tested in other populations. Another limitation is that we found in dying motor neurons in about 95% ofALS cases (22,
were unable to study the risk of alopecia and ALS in different 24, 25).

Table 2. Relative Risk of Amyotrophie Lateral Sclerosis by Level of Balding in Men in the Health Professionals Follow-up Study, 1992-2008

No. of Age-Adjusted Multivariate Multivariate


Level of Balding ALS Relative 95%CI Relative 95%CI Relative 95%CI
Cases Risk Risk" Riskb

No alopecia 13 1.00 Referent 1.00 Referent 1.00 Referent


Moderate 18 1.45 0.71, 2.97 1.47 0.72, 2.99 1.44 0.71, 2.95
alopecia
Extensive 11 2.69 1.20, 6.01 2.74 1.23, 6.13 2.75 1.23, 6.15
alopecia
Ptrend 0.020 0.018 0.018

Abbreviations: ALS, amyotrophie lateral sclerosis; Cl, confidence interval.


a
Adjusted for age (in single years) and smoking status (current, previous, or never).
b
Adjusted for age (in single years), smoking status (current, previous, or never), body mass index (weight (kg}/height (m)2) (in categories of
underweight, normal, overweight, and obese), and vitamin E supplement use (yes or no).

Am J Epidemiol. 2013;178(7):1146-1149

301
iKB LECTURE CRITIQUE D'ARTICLE

Alopecia and Amyotrophie Laierai Sclerosis 1149

Neither the cause of ALS nor the cause of alopecia is fully 8. Inui S, ltami S. Molecular basis ofandrogenetic alopecia:
understood. Although the presence of dihydrotestosterone is From androgen to paracrine mediators through dermal papilla.
required for the development of alopecia (8), circulating lev­ J Dermatol Sei. 2011;61(1):l -6.
els ofdihydrotestosterone have not been shown to be associated 9. Li R, Brockschmidt FF, Kiefer AK, et al. Six nove!
susceptibility loci for early-onset androgenetic alopecia and
with alopecia. Rather, it is the sensitivity of androgen recep­
their unexpected association with common diseases. PLoS
tors, pairing with dihydrotestosterone in hair follicles, that is genetics. 2012;8(5):el 002746.
thought to be the cause (8). This process is regulated by several 1O. Rimm EB, Giovannucci EL, Willett WC, et al. Prospective
coactivators and corepressors (8). We speculate that androgen study ofalcohol consumption and risk ofcoronary disease in
receptor sensitivity might play a role in ALS etiology as well, men. Lancet. 1991;338(8765):464-468.
possibly with the involvement ofTDP-43 protein abnormalities. 11. Norwood OT. Male pattern baldness: classification and
In conclusion, we found an association between early-onset incidence. South Med J. 1975;68(11):1359-1365.
alopecia and ALS. The mechanisms underlying this associa­ 12. Brooks OT, Miller RG, Swash M, et al. El Escorial revisited:
tion deserve further investigation. revised criteria for the diagnosis ofamyotrophie lateral
sclerosis. Amyotraph Lateral Scler Other Motor Neuran
Disord. 2000;1(5):293-299.
13. WeisskopfMG, McCullough ML, Calle EE, et al. Prospective
study ofcigarette smoking and amyotrophie lateral sclerosis.
Am J Epidemiol. 2004;160(1):26-33.
ACKNOWLEDGMENTS 14. Wang H, O'Reilly EJ, WeisskopfMG, et al. Smoking and risk
of amyotrophie lateral sclerosis: a pooled analysis of5
Author affiliations: Department ofNutrition, Harvard School prospective cohorts. Arch Neural. 2011;68(2):207-213.
of Public Health, Boston, Massachusetts (Elinor Fondell, 15. Su LH, Chen TH. Association ofandrogenetic alopecia
Kathryn C. Fitzgerald, Éilis J. O'Reilly, Alberto Ascherio); with smoking and its prevalence among Asian men: a
Department ofEpidemiology, Harvard School ofPublic Health, community-based survey. Arch Dermatol. 2007;143(1 l ):
Boston, Massachusetts (Guido J. Falcone, Alberto Ascherio); 1401-1406.
Department of Neurology, Massachusetts General Hospital, 16. O'Reilly EJ, Wang H, WeisskopfMG, et al. Premorbid body
Boston, Massachusetts (Guido J. Falcone); and the Channing mass index and risk ofamyotrophie lateral sclerosis.
Division ofNetworkMedicine, Brigham and Women's Hospi­ Amyotraph Lateral Scler Frantotemporal Degener. 2013;
tal and Harvard Medical School, Boston, Massachusetts (Alberto 14(3):205-211.
17. Wang H, O'Reilly EJ, WeisskopfMG, et al. Vitamin E intake
Ascherio).
and risk ofamyotrophie lateral sclerosis: a pooled analysis of
This work was supported by the National Cancer Institute data from 5 prospective cohort studies. Am J Epidemiol.
(grant POl C A055075). 2011;173(6):595-602.
Conflict of interest: none declared. 18. Blasco H, Guennoc AM, Veyrat-Durebex C, et al.
Amyotrophie lateral sclerosis: a hormonal condition?
Amyotraph Lateral Scler. 2012;13(6):585-588.
19. Vivekananda U, Manjalay ZR, Ganesalingam J, et al. Low
index-to-ring finger length ratio in sporadic ALS supports
REFERENCES prenatally defined motor neuronal vulnerability. J Neural
Neurasurg Psychiatry. 2011;82(6):635-637.
1. del Aguila MA, Longstreth WT Jr, McGuire V, et al. 20. Wicks P. Hypothesis: higher prenatal testosterone predisposes
Prognosis in amyotrophie lateral sclerosis: a population-based ALS patients to improved athletic performance and manual
study. Neuralogy. 2003;60(5):813-819. professions. Amyotraph Lateral Scler. 2012;13(3):251-253.
2. Traynor BJ, Codd MB, Corr B, et al. Incidence and prevalence 21. Johnson AD, Handsaker RE, Pulit SL, et al. SNAP: a
ofALS in Ireland, 1995-1997: a population-based study. web-based tool for identification and annotation ofproxy
Neuralogy. 1999;52(3):504-509. SNPs using HapMap. Bioinformatics. 2008;24(24):
3. Armon C. Sports and trauma in amyotrophie lateral sclerosis 2938-2939.
revisited. J Neural Sei. 2007;262(1-2):45-53. 22. Yokoseki A, Shiga A, Tan CF, et al. TDP-43 mutation in
4. Weiner LP. Possible role of androgen receptors in amyotrophie familial amyotrophie lateral sclerosis. Ann Neural. 2008;
lateral sclerosis. A hypothesis. Arch Neural. 1980;37(3): 63(4):538-542.
129-131. 23. Wijesekera LC, Leigh PN. Amyotrophie lateral sclerosis.
5. La Spada AR, Wilson EM, Lubahn DB, et al. Androgen Orphanet J Rare Dis. 2009;4:3.
receptor gene mutations in X-linked spinal and bulbar 24. Neumann M, Sampathu DM, Kwong LK, et al. Ubiquitinated
muscular atrophy. Nature. 1991;352(6330):77-79. TDP-43 in frontotemporal lobar degeneration and
6. Bruson A, Sambataro F, Querin G, et al. CAG repeat length in amyotrophie lateral sclerosis. Science. 2006;314(5796):
0
androgen receptor gene is not associated with amyotrophie 130-133.
(.9
LJ.J
lateral sclerosis. Eur J Neural. 2012;19(10):1373-1375. 25. Van Deerlin VM, Leverenz JB, Bekris LM, et al. TARDBP
a: 7. Zhuo FL, Xu W, Wang L, et al. Androgen receptor gene mutations in amyotrophie lateral sclerosis with TDP-43
(.9

LJ.J
polymorphisms and risk for androgenetic alopecia: a neuropathology: a genetic and histopathological analysis.
a: meta-analysis. Clin Exp Dermatol. 2012;37(2):104-111. Lane et Neural. 2008;7 (5):409--416.
CO
0

z
a:
LJ.J
>
en
z
0
fC=
0
LJ.J
@ Am J Epidemiol. 2013;178(7):1146-1149

302
ARTICLE 10 - LCA-1 2017

Q M
� J De quel type d'étude s'agit-il?
A- Epidémiologique.
B- Cas-témoin nichée dans une cohorte.
C- Transversale.
D- De cohorte historique.
E- Observationnelle.

QCM
2
JQuel(s) est(sont) le(s) facteur(s) d'exposition d'intérêt?
A - La sclérose latérale amyotrophique.
B - L'alopécie à l'âge de 45 ans.
C - L'âge.
D - Le tabagisme.
E - L'indice de masse corporelle.

QCM
3
J Quel plan d'étude alternatif aurait pu être proposé pour répondre à cette question?
A - Une étude cas-témoin comparant un groupe de patients atteints de sclérose latérale
amyotrophique et un groupe de témoins indemnes de cette pathologie.
B - Une étude évaluant la prévalence de l'alopécie chez les patients atteints de sclérose latérale
amyotrophique.
C - Une étude cas-témoin comparant un groupe de patients atteints d'alopécie et un groupe de
témoins indemnes d'alopécie.
D - Une étude de cohorte prospective en population générale comparant l'incidence de la sclérose
latérale amyotrophique en fonction de la présence ou non d'une alopécie.
E - Une étude rétrospective à partir d'un registre spécifique des patients atteints de sclérose latérale
amyotrophique.

QCM 1Parmi les participants de la Health Professionals Follow-up Study, les personnes
4 incluses, en 1992, dans l'étude rapportée dans cet article, sont :
A - Les cas prévalents de sclérose latérale amyotrophique.
B - Les cas incidents de sclérose latérale amyotrophique.
C - Les sujets de plus de 45 ans ayant répondu au questionnaire sur la calvitie.
D - Les sujets décédés de sclérose latérale amyotrophique.
E - Les sujets ayant un antécédent personnel de sclérose latérale amyotrophique.

Q M
� J L'information sur l'alopécie à l'âge de 45 ans :
A- Etait de nature déclarative.
B- A été évaluée à l'aide de la classification de Norwood.
C- A été recueillie tous les deux ans à partir de 1992.
D- A été recueillie à un âge moyen supérieur à 60 ans.
E- A été recueillie de manière prospective.

L'information sur l'alopécie à l'âge de 45 ans est déclarative et recueillie de manière


QCM
rétrospective en 1992, source potentielle d'erreur de classement. Cette erreur de
6 classification ou de classement :
A- Peut potentiellement biaiser l'estimation du risque relatif de survenue de sclérose latérale
amyotrophique.
B- Diffère selon la survenue d'une sclérose latérale amyotrophique au cours du suivi.
C- Est liée à la mémoire potentiellement défaillante des participants.
D- Tendrait à rapprocher l'estimation du risque relatif de sclérose latérale amyotrophique de la
valeur neutre 1.
E- Est susceptible de concerner davantaqe les participants plus âqés.

303
iKB LECTURE CRITIQUE D'ARTICLE

QCM
7
1
Les cas incidents de sclérose latérale amyotrophique ont été identifiés :
A - Par un enquêteur expérimenté au cours d'un entretien téléphonique.
B - Tous les deux ans.
C - Jusqu'au 31 décembre 2008.
D - Uniquement chez les patients avec une alopécie modérée ou extensive.

1
E - Par signalement systématique du neurologue traitant au comité scientifique de l'étude.

QCM Les modalités d'authentification des cas incidents identifiés de sclérose latérale
8 amyotrophique incluaient :
A - L'interrogatoire d'un membre de l'entourage des participants.
B - La revue rétrospective du dossier médical par un neurologue expérimenté.
C - La présence d'un code de cause de décès de maladie du motoneurone (code 335.2) dans la
base de données du National Death Index.
D - Le diagnostic, probable ou certain, communiqué par le neurologue traitant.
E - L'utilisation de critères diagnostiques standardisés dans le questionnaire destiné au neurologue
traitant à partir de 2004.

QCM
9
1Dans cette étude :
A - La période de suivi s'étendait de la date de retour du questionnaire de 1992 au 31 décembre
2008.
B - Quarante-deux cas incidents de sclérose latérale amyotrophique ont été authentifiés.
C - 40046 participants suivis ont contribué à 565125 personnes années exposées.
D - Cinq cas incidents de sclérose latérale amyotrophique ont été identifiés à partir du National Death
Index.
E - Tous les participants contribuaient au même nombre de personnes-années.

Pourquoi le tabagisme aurait pu constituer un facteur de confusion, expliquant, en


QCM
partie, l'association observée entre l'alopécie et la survenue de sclérose latérale
10
amyotrophique dans cette étude ?
A- Le tabagisme est un facteur de risque potentiel de sclérose latérale amyotrophique rapporté dans
la littérature.
B- Le tabagisme est associé à un risque accru d'alopécie dans la littérature.
C- L'information recueillie sur le tabagisme est de nature déclarative dans cette étude.
D- L'ajustement sur le tabagisme en analyse multivariée modifie peu l'estimation ponctuelle du
risque relatif.
E- La prévalence du tabagisme décroit avec la sévérité de l'alopécie.

Quelle(s) stratégie(s) utilisent les auteurs pour s'affranchir de l'effet de l'utilisation


QCM
de finastéride dans l'analyse de l'association entre l'alopécie et la sclérose latérale
11
amyotrophique ?
A- L'ajustement à l'aide d'un modèle multivarié.
B- La stratification sur la prise ou non de finastéride.
C- L'appariement des cas et des témoins sur l'utilisation de la finastéride.
0
(.9
LJ.J
D- La standardisation sur la prise de finastéride.
a:
(.9 E- La restriction de l'analyse aux non-utilisateurs de finastéride.
LJ.J
a:
CO
0

z
a:
LJ.J
>
en
z
0
fC=

@
0
LJ.J

304
ARTICLE 10 - LCA-1 2017

En analyse multivariée, cette étude objective une relation croissante entre le risque
QCM
de sclérose latérale amyotrophique et l'intensité de l'alopécie. Ce résultat peu
12 potentiellement s'expliquer par :
A- Le risque d'erreur statistique de première espèce du risque alpha.
B- Un défaut de puissance statistique.
C- L'existence de facteurs de confusion résiduels méconnus.
D- Un biais dans le recueil de l'information sur l'alopécie.
E- Le codage de l'alopécie en trois catégories au lieu des cinq catégories de la classification de
Norwood.

QCM 1 L'association entre l'alopécie et le risque de sclérose latérale amyotrophique


13 pourrait s'expliquer par :
A - Des mutations du gène des récepteurs androgéniques.
B - Un polymorphisme nucléotidique à proximité du gène TAR DNA-binding protein 43
(TARDBP/TDP-43).
C - Une sensibilité augmentée des récepteurs androgéniques.
D - Une augmentation des taux circulants de dihydrotestostérone.
E - L'accumulation de la protéine TDP43 dans les follicules du cuir chevelu.

QCM I Le degré de confiance que l'on peut avoir dans les résultats de cette étude est :
14
A - Limité par le faible nombre de cas de sclérose latérale amyotrophique.
B - Limité par les caractéristiques de la population de l'étude.
C - Limité par le fait que les facteurs d'ajustement ne modifient pas les résultats.
D - Renforcé par le caractère non-différentiel du biais de classement sur l'exposition.
E - Renforcé par la plausibilité biologique de l'association.

QCM
1 Les résultats de cette étude incitent à
15
A - Supplémenter en vitamine E les hommes atteints d'alopécie extensive précoce.
B - Réaliser un électroneuromyogramme tous les 2 ans chez les hommes atteints d'alopécie
extensive précoce.
C - Mettre en place un essai randomisé évaluant l'efficacité et la sécurité du finastéride pour réduire
le risque de sclérose latérale amyotrophique chez les hommes atteints d'alopécie précoce.
D - Proposer une consultation de conseil génétique aux hommes atteints d'alopécie précoce.
E - Planifier une étude épidémiologique, en population générale, visant à vérifier l'existence de
l'association objectivée.

305
iKB LECTURE CRITIQUE D'ARTICLE

Grille de correction QCM


(Questions à choix multiples)

A-
B- F .
V Réponse: A
Il s'agit d'une étude épidémiologique, observationnelle, analytique,
.... C- F longitudinale, de type cohorte prospective.
::!!:
(.) D- F NB : ici, l'exposition d'intérêt est certes recueillie de manière rétrospective par
0 questionnaire, mais le suivi des patients est bien prospectif, avec recueil de la survenue
E- F ou non de la maladie d'intérêt (SLA). Dans le cas d'une cohorte historique, l'ensemble de
la cohorte est reconstituée a posteriori, souvent à partir d'une base de données.

N
A-
B-
F
V .
Réponse: B
Le seul facteur d'exposition d'intérêt dans cette étude est l'alopécie à l'âge de 45
::!!: C-
0 D-
(.)
F
F . ans.
Le tabagisme et l'indice de masse corporelle sont eux aussi collectés, mais parce
qu'ils constituent des facteurs de confusion potentiels dans l'étude, à prendre en
E- F compte.
A-
B-
V
F .
Réponse: A
Une étude cas-témoin aurait tout à fait pu être menée ici. Elle aurait d'ailleurs pu
M C- F être justifiée par la prévalence faible de la SLA, maladie d'intérêt dans notre
::!!: D- F
. exemple.

.
(.)
0 Les cas auraient été les patients avec SLA.
E- F
. Les témoins des patients non atteints de SLA.
L'exr::1osition étudiée aurait été l'alopécie à l'âge de 45 ans.
A- F
"'"
::!!: C-
(.)
B-
V .
F Réponse: C
Seuls sont inclus dans cette étude les sujets ayant répondu au questionnaire sur
0 D- F l'alopécie, datant de 1992.
E- F
A-
B- V .
V Réponse: ABD
L'information sur l'alopécie a été recueillie uniquement sur le questionnaire de
C- F 1992. Des schémas explicatifs ont été utilisés, basés sur la classification de
Lt) D- V Norwood. Elle a été recueillie de manière rétrospective chez les participants,
::!!:
. alors âgés de 46 à 80 ans.

.
(.)
0 L'alopécie n'a plus été recueillie dans les questionnaires suivants.
E- F L'âge moyen au moment du recueil sur l'alopécie (donc en 1992) est donné dans
le tableau 1.

A-
B- F .
V Réponse: ACDE
La mesure de l'exposition peut ici entraîner un biais de classement non-
C-
::!!: D-
V
V . différentiel.
La mesure du RR peut donc être biaisée, avec une « dilution » du risque vers la

. valeur neutre 1.
(.)
0
Comme la mesure de l'exposition est rétrospective, elle peut être liée à la mémoire
E- V potentiellement défaillante des participants, cela étant d'autant plus susceptible
0
(.9
LJ.J
d'arriver que les sujets sont âgés.
a:

.
(.9 A- F Réponse: BC
LJ.J
a: ..... B- V La durée de l'étude s'étend de 1992 (date du renvoi du premier questionnaire) au

.
0 ::!!: C- V 31 décembre 2008 (date de fin du suivi).
(.)
z
a: 0 D- F Ce sont les questionnaires qui permettent dans un premier temps d'identifier les
>
LJ.J
E- F cas « potentiels » de SLA.
z
0

LJ.J
@

306
ARTICLE 10 - LCA-1 2017

A-
B- V .
F Réponse: BCDE
Sur la base des réponses apportées par les participants sur les questionnaires
CO C- V libres, le neurologue traitant était contacté (si autorisation était donnée). Al'aide
::!!: D- V d'un questionnaire validé (à partir de 2004), le neurologue traitant confirmait ou
(.) non le diagnostic, et y associait un degré de certitude. Il envoyait le dossier à un
0
E- V . neurologue expert qui le relisait et confirmait (ou non) finalement le diagnostic.
Il n'y avait pas d'interrogatoire de la famille (elle recevait seulement la demande de
prise en contact avec le neurologue traitant si le patient était décédé)
A-
B-
V
V .
Réponse: ABCD
Sur la période de suivi s'étendant de la date de retour du premier questionnaire
C- V (1992) au 31 décembre 2008, 42 cas incidents de SLAont été identifiés, 37 cas à
D- V partir des questionnaires, et 5 cas à partir des certificats de décès (code 335.2 en

. cause principale ou causes ayant contribuées au décès).


a,
::!!: Les personnes-années de suivi sont comptabilisées entre la date d'entrée dans
(.)
0 l'étude (= date de retour du questionnaire de 1992) et soit la date de survenue
E- F d'une SLA, soit la date du décès avec code 335.2, soit la date de fin d'étude
(31/12/2008). Ainsi, les personnes ayant été suivies de 1992 au 31 décembre 2008
sans avoir de diagnostic de SLAsont celles qui ont le plus contribué aux
personnes-années dans cette étude.

.
A- V Réponse: AB
.... B- V
.
0
Un facteur de confusion est lié à la fois à l'exposition et à la maladie.
::!!: C- F Le fait que l'ajustement sur le tabagisme modifie peu la relation est un argument
(.)
0 D- F qui va contre le fait qu'il soit un facteur de confusion : si tel était les cas, la relation
E- F aurait été modifiée.
A- F
........
::!!: C-
(.)
B-
F .
F Réponse: E
Dans la partie résultats, les auteurs évoquent une analyse secondaire qu'ils ont
0 D- F réalisée uniquement sur les non-utilisateurs de finastéride.
E- V
A-
B- F .
V Réponse: ACD
Un défaut de puissance ou un biais de recueil de l'information sur l'alopécie
....
N C- V auraient plutôt conduit à ne pas retrouver de différence de risque entre
::!!: D-
(.)
V
. l'intensité de l'alopécie et la SLA.
La caractère rétrospectif du recueil de l'exposition (alopécie) est une source de

.
0 biais potentiel.
E- F Dans l'article, les auteurs disent qu'ils obtiennent des résultats similaires sur cette
relation, que l'analyse ait été faite avec 3 catégories ou 5 catégories d'alopécie.
A- F
.... B-
.
M
V Réponse: BC
::!!: C- V Les mécanismes biologiques qui pourraient sous-tendre la relation entre alopécie
(.)
0 D- F et SLAsont explicités par les auteurs dans la partie discussion.
E- F
A-
.
V Réponse: AC
B-
C-
F
V . On aborde ici la validité interne de l'étude.
Le schéma d'étude peut ainsi être questionné au regard du faible nombre de cas
D- F
. identifiés de SLA.
Il existe potentiellement des facteurs de confusion résiduels, (résultats peu
"'"....
::!!:
. modifiés avec les facteurs d'ajustement utilisés par les auteurs dans cette étude).
Le caractère non-différentiel du biais de classement est certes préférable à son
(.) caractère différentiel, mais il n'empêche qu'un biais de classement est tout de
0 même présent. Cela affaiblit donc le degré de confiance que l'on peut avoir dans
E-
.
F les résultats de cette étude.

. La population d'étude renvoie à la validité externe.


La plausibilité biologique sera un argument en faveur de la causalité de la relation,
mais ne touche ni la validité interne de l'étude, ni sa validité externe. Elle renvoie
plutôt à la pertinence clinique.

307
iKB LECTURE CRITIQUE D'ARTICLE

A-
B- F .
F Réponse: E
Il faut d'autres études épidémiologiques étudiant l'association entre alopécie et
C-
D-
F
F .SLA.
Le finastéride n'était pas un facteur d'intérêt dans cette étude, de même que la
....
::!!:
(.)
.vitamine E.
Les propositions B et D ne sont pas adaptées, une seule étude a montré une
0 association entre alopécie précoce et SLA. Diverses méthodes de dépistage de la
E- V SLA ne sont donc pas appropriées car trop précoces à ce stade des investigations,
et surtout seraient éthiquement discutables (aucun traitement n'existe actuellement
pour la SLA). Surtout, la validité externe de cette étude est limitée, la population
d'étude étant assez restreinte.

0
(.9
LJ.J
a:
(.9
J,
LJ.J
a:
CO
0


z
a:
LJ.J
>
en
z
0
fC=
0
LJ.J
@

308
Chapitre
44

ARTICLE 11 - LCA 2 / 2017

The NEW ENGLAND JOURNAL of MEDICINE

1_1 __________
o_R _I_G_I_N_ A_L_A_ _R T_1c_L_E__________11

Levosimendan for the Prevention of Acute


Organ Dysfunction in Sepsis
A.C. Gordon, G.D. Perkins, M. Singer, D.F. McAuley, R.M.L. Orme,
S. Santhakumaran, A.J. Mason, M. Cross, F. AI-Beidh,J. Best-Lane, D. Brealey,
C.L. Nutt,j.j. McNamee, H. Reschreiter, A. Breen, K.D. Liu, and D. Ashby

ABSTRACT

BACKGROUND
The authors' full names, academic de­ Levosimendan is a calcium-sensitizing drug with inotropic and other properties that
grees, and affiliations are listed in the may improve outcomes in patients with sepsis.
Appendix. Address reprint requests to Dr.
Gordon at ICU llN, Charing Cross Hospi­ METHODS
tal, Imperia! College London, Fulham Pal­
We conducted a double-blind, randomized clinical trial to investigate whether
ace Rd., London W6 8RF, United Kingdom,
or at anthony.gordon@imperial.ac.uk. levosimendan reduces the severity of organ dysfunction in adults with sepsis.
Patients were randomly assigned to receive a blinded infusion of levosimendan (at a
A complete list of investigators in the dose of 0.05 to 0.2 µg per kilogram of body weight per minute) for 24 hours or
Levosimendan for the Prevention of Acute
Organ Dysfonction in Sepsis (LeoPARDS)
placebo in addition to standard care. The primary outcome was the mean daily
trial is provided in the Supplementary Sequential Organ Failure Assessment (SOFA) score in the intensive care unit up to
Appendix, available at NEJM.org. day 28 (scores for each of five systems range from O to 4, with higher scores indicat­
ing more severe dysfunction; maximum score, 20). Secondary outcomes included
This article was published on October S,
2016, at N EJ M.org. 28-day mortality, time to weaning from mechanical ventilation, and adverse
events.
N Engl J Med 2016;375:1638-48.
DOi: 10.1056/N EJ Moal609409 RESULTS
Copyright © 2016 Massachusetts Medical Society.
The trial recruited 516 patients; 259 were assigned to receive levosimendan and 257
to receive placebo. There was no significant difference in the mean (±SD) SOFA
score between the levosimendan group and the placebo group (6.68±3.96 vs. 6.06
±3.89; mean difference, 0.61; 95% confidence interval [Cl], -0.07 to 1.29; P = 0.053).
Mortality at 28 days was 34.5% in the levosimendan group and 30.9% in the placebo
group (absolute difference, 3.6 percentage points; 95% Cl, -4.5 to 11.7; P = 0.43).
Among patients requiring ventilation at baseline, those in the levo-simendan group
were less likely than those in the placebo group to be success-fully weaned from
mechanical ventilation over the period of 28 days (hazard ratio, 0.77; 95% Cl, 0.60 to
0.97; P = 0.03). More patients in the levosimendan group than in the placebo group
had supraventricular tachyarrhythmia (3.1% vs. 0.4%; absolute difference, 2.7
percentage points; 95% Cl, 0.1 to 5.3; P = 0.04).
CONCLUSIONS
The addition of levosimendan to standard treatment in adults with sepsis was not
associated with less severe organ dysfunction or lower mortality. Levosimendan
was associated with a lower likelihood of successful weaning from mechanical
ventilation and a higher risk of supraventricular tachyarrhythmia. (Funded by the
NIHR Eff icacy and Mechanism Evaluation Programme and others; LeoPARDS
Current Controlled Trials number, ISRCTN12776039.)

1638 N ENGLJ MED375;17 NEJM.ORG OCTOBER27, 2016

309
iKB LECTURE CRITIQUE D'ARTICLE

LEVOSIMENDAN TO PREVENT ORGAN DYSFUNCTION IN SEPSIS

S
EPSIS IS DEFINED AS LIFE-THREATENING London-Harrow Research and Ethics Commit­
organ dysfunction caused by a dysregulated tee approved the protocol.
host response to infection1 and is a leading The trial was funded by the National Institute
cause of death worldwide. Septic shock is the for Health Research and Tenax Therapeutics and
most severe form of the condition and results in sponsored by Imperia! College London. Data
circulatory and metabolic abnormalities.2 Per­ management and analysis were performed by
sisting hypotension despite adequate fluid resus­ the Imperia! Clinical Trials Unit. Orion Pharma
citation is due to a combination of profound provided levosimendan and placebo free of
vasodilatation, vascular hyporeactivity to catechol­ charge. The funders, the sponsor, and Orion
amines, and myocardial depression.3 Although Pharma had no role in designing the trial, gath­
catecholamines are the recommended first-line ering or analyzing the data, writing the manu­
therapy for septic shock,4 high doses of admin­ script, or making the decision to submit the
istered catecholamines and high levels of circu­ manuscript for publication. The first author
lating catecholamines are associated with poor vouches for the data and analyses, as well as for
outcomes and severe side effects, including the fidelity of this report to the trial protocol.
myocardial injury and peripheral ischemia.s-7
Levosimendan is a calcium-sensitizing drug ENROLLMENT CRITERIA AND RANDOMIZATION

with inotropic and vasodilator properties that is Adult patients who had septic shock and had
licensed in numerous countries (not including received vasopressors for at least 4 hours were
the United States) to treat decompensated heart eligible for inclusion. Detailed inclusion and ex­
failure.8 In contrast to catecholamines, levosimen­ clusion criteria are provided in the Supplemen­
dan causes increased myocardial contraction with tary Appendix, available at NEJM.org. Patients
a minimal increase in oxygen demand,9 and dia­ had to be recruited within 24 hours after meet­
stolic relaxation is not impaired. Small studies ing the inclusion criteria. Written informed con­
that have investigated the use of levosimendan sent was obtained from either the patient or, in
in patients with septic shock have shown improve­ the event that the patient lacked capacity, a per­
ments in hemodynamic variables, 10 microcircu­ sona! or professional legal representative before
latory flow, 11 and renal1° and hepatic12 function, enrollment in the trial. Retrospective written
as compared with dobutamine. Other important informed consent was sought from the patient
noninotropic effects have also been shown, includ­ once capacity was regained.
ing antiinflammatory, 13 antioxidative, 14 and anti­ Enrollment, randomization, and data collec­
apoptotic15 effects and possibly protection from tion were performed by means of an online sys­
ischemia and reperfusion injury.16 A recent meta­ tem (InForm, Oracle). Patients were assigned in
analysis supported the use of levosimendan in pa­ a 1:1 ratio to receive levosimendan or placebo,
tients with sepsis, but only 125 patients in total with the use of variable block sizes of four and
had been treated.17 The Levosimendan for the six and computer-generated random numbers
Prevention of Acute Organ Dysfunction in Sepsis and with stratification according to recruitment
(LeoPARDS) trial was designed to test whether center. The randomization sequence was prepared
the addition of levosimendan to standard care by an independent statistician. Trial-specific la­
would reduce the severity of organ dysfunction beling and packaging, to ensure that trial packs
among patients with septic shock and to assess were identical, was undertaken by Victoria Phar­
its safety profile in patients with this condition. maceuticals. Patients and clinical and research
staff remained unaware of the trial-group assign­
ment throughout the trial.
METHODS

TRIAL DESIGN AND PARTICIPANTS CLINICAL TREATM ENT


0
(.9
LJ.J
We conducted this multicenter, randomized, Patients were assigned to receive a blinded in­
a:
(.9 double-blind, placebo-controlled clinical trial fusion of either levosimendan or placebo for
LJ.J
a: in 34 general adult intensive care units (ICUs) in 24 hours in addition to standard care. Fig. S1 in
CO
0 the United Kingdom. The trial protocol, avail- the Supplementary Appendix shows the infusion
z
a:
able with the full text of this article at NEJM.org, algorithm. No bolus loading dose was given.
LJ.J
> was designed by the trial management commit- The administration of levosimendan or placebo
en
z
0 tee and has been published previously.18 The was started at a rate of 0.1 µ,g per kilogram of
fC=
0
LJ.J
N ENGLJ MED 375;17 NEJM.ORG OCTOBER 27, 2016 1639
@

310
ARTICLE 11 - LCA-2 2017

The NEW ENGLAND JOURNAL of MEDICINE

body weight per minute and, in the absence To assess the effect of levosimendan on indi­
of rate-limiting side effects, was increased after vidual organ systems, the individual SOFA com­
2 to 4 hours to 0.2 µ,g per kilogram per minute ponents were analyzed, and several other clinical
for a further 20 to 22 hours. Patients received outcomes were determined a priori for second­
intravenous fluid boluses for any clinically sig­ ary analyses. These outcomes included the num­
nificant drop in blood pressure and, if neces­ ber of catecholamine-free and ventilator-free days,
sary, vasopressors were adjusted to maintain an the time to weaning from mechanical ventila­
adequate blood pressure. If the patient had rate­ tion, the proportion of patients with a major
limiting side effects - either hypotension or acute kidney event22 over a period of 28 days
severe tachycardia (heart rate >130 beats per (defined as death, new requirement for renal­
minute, or an increase of >20% if the heart rate replacement therapy, or sustained renal failure
was already >110 beats per minute) - at the [stage 2 or 3 acute kidney injury23] at day 28),
dose of 0.2 µ,g per kilogram per minute, then and the duration of renal-replacement therapy.
the infusion rate was reduced to 0.1 µ,g per kilo­ Mortality rates at 28 days, at ICU discharge, and
gram per minute. If necessary to avoid hypoten­ at hospital discharge, as well as the length of
sion or severe tachycardia, the rate was reduced stay in the ICU and serious adverse events, were
to 0.05 µ,g per kilogram per minute or even dis­ also recorded.
continued.
Other aspects of clinical care were at the dis­ STATISTICAL ANALYSIS

cretion of the local physician and were based on We calculated that a sample of 500 patients
the Surviving Sepsis Campaign guidelines (see would provide the trial with 90% power to detect
the Supplementary Appendix).4 The trial protocol a difference of 0.5 points in the mean SOFA
recommended a mean arterial pressure of 65 to score, assuming a standard deviation of 1.5 and
70 mm Hg. This pressure could be varied for a significance level of 0.05.19 To allow for a 3%
individual patients, but investigators were en­ rate of withdrawal of consent, the recruitment
couraged to use the lowest dose of vasopressor target was 516 patients.
that maintained tissue perfusion in each patient. The primary analysis was unadjusted in the
Additional inotropic agents could be used as intention-to-treat population, and reported the
clinically indicated (i.e., for ongoing low cardiac difference in mean SOFA scores between the two
output after fluid resuscitation). Dobutamine trial groups. Because the mean SOFA score was
was the recommended inotrope, with lowering not normally distributed, 95% confidence inter­
of the dose and discontinuation once adequate vals of the mean difference were calculated with
oxygen delivery had been achieved. the use of bootstrapping, with the application of
the percentile method with 100,000 samples. We
OUTCOME ME ASURES used a priori defined regression models to inves­
The primary trial outcome was the mean daily tigate whether the main analysis was sensitive to
Sequential Organ Failure Assessment (SOFA) adjustment for trial-center (i.e., ICU) effects, age,
score19 while the patient was in the ICU, as mea­ and severity of illness (according to the Acute Phy­
sured from randomization to a maximum of siology and Chronic Health Evaluation [APACHE]
28 days. The daily SOFA score after baseline was II score) with bootstrapped confidence intervals.
calculated for each patient on the basis of five Because levosimendan is an inotrope with
organ systems: cardiovascular, respiratory, renal, prolonged hemodynamic effects but is not in­
hepatic, and coagulation systems. (Scores for cluded as part of the cardiovascular scoring
each system range from O to 4, with higher scores within the SOFA score, the primary analysis was
indicating more severe organ-system dysfonc­ repeated with the exclusion of the cardiovascular
tion; maximum score, 20.) The neurologie system component as a sensitivity analysis. We prespeci­
was not included, as in some previous trials,20,21 fied the use of Bayesian models of multiple im­
owing to the difficulties of accurately scoring putation for missing data, as described in the
the Glasgow Coma Score daily in the presence Supplementary Appendix; we also performed
of sedation. Daily scores were totaled for each post hoc analyses using imputation to account
patient's ICU stay and divided by the number of for any differential effect of treatment on the
days that they remained in the ICU in order to rates of ICU discharge or death before 28 days.
calculate the mean SOFA score for that patient. Time-to-event data were described with the use

1640 N ENGLJ MED375;17 NEJM.ORG OCTOBER27, 2016

311
iKB LECTURE CRITIQUE D'ARTICLE

LEVOSIMENDAN TO PREVENT ORGAN DYSFUNCTION IN SEPSIS

of Kaplan-Meier plots and Cox regression, with group. The mean arterial pressure was lower in
adjustment for age and APACHE II score, allow­ the patients in the levosimendan group than in
ing for clustering according to ICU. those in the placebo group in the first 24 hours
Four subgroup analyses were planned a pri­ (the duration of the infusion) but was similar
ori on the basis of the baseline measurement of thereafter in the two groups. The rate and dura­
the cardiac index, if measured (lowest third vs. tion of the norepinephrine infusion were higher
middle and highest thirds), the central venous in the levosimendan group than in the placebo
oxygen saturation (low [<70%], normal [70 to group; there was also less frequent use of dobuta­
85%], or high [>85%]), the serum lactate level mine in the levosimendan group. The heart rate
(�2 mmol per liter vs. >2 mmol per liter), and over the first 4 days was significantly higher in
the dose of norepinephrine (below vs. above the patients in the levosimendan group than in those
median infusion rate). The heterogeneity of treat­ in the placebo group. Intravenous-fluid adminis­
ment effect according to subgroup was calcu­ tration, fluid balance, and serum lactate levels
lated with the use of a permutation test, which were similar in the two groups. Details are pro­
permuted both the subgroup and the trial­ vided in Table S3 and Fig. S2 through S6 in the
group assignment.24 All the analyses were per­ Supplementary Appendix.
formed with the use of R software, version
3.2.2 (R Project for Statistical Computing).25 A OUTCOMES

P value of less than 0.05 was considered to in­ The percentage of daily SOFA scores that were
dicate statistical significance, with the use of missing ranged from 2.3% for the cardiovascu­
two-sided tests; no corrections were made for lar component to 12.8% for the liver component.
multiple testing. The primary outcome, the mean (±SD) SOFA
score over the stay in the ICU, was 6.68±3.96 in
the levosimendan group and 6.06±3.89 in the
RESULTS
placebo group (mean difference, 0.61; 95% con­
TRIAL PARTICIPANTS fidence interval [CI], -0.07 to 1.29; P=0.053)
The trial ran from January 2014 through Decem­ (Table 3). After adjustment for ICU, age, and
ber 2015, when the required sample of 516 pa­ APACHE II score in a regression model, the
tients were enrolled. Fig. 1 shows the random­ mean difference in the score was 0.59 (95% CI,
ization and flow of patients in the trial; 259 -0.02 to 1.20; P=0.06). In an analysis that con­
patients were assigned to receive levosimendan sidered each component of the total SOFA score
and 257 to receive placebo. A total of 8 patients independently, the mean daily cardiovascular
(4 patients in each group) did not receive the as­ score was higher in the levosimendan group
signed trial regimen. The family of 1 patient in than in the placebo group (mean difference,
the levosimendan group withdrew consent after 0.25; 95% CI, 0.04 to 0.46; P=0.01). The pre­
randomization but before the drug was admin­ specified and post hoc sensitivity analyses did
istered. This patient was excluded from all the not materially change the result (Table 3, and
analyses. The other 7 patients were included in Table S4 in the Supplementary Appendix). The
the intention-to-treat analysis. total daily SOFA scores and individual compo­
The two groups were well balanced at base­ nent scores are shown in Fig. S7 through S12 in
line (Tables 1 and 2, and Tables Sl and S2 in the Supplementary Appendix.
the Supplementary Appendix). The median time Secondary outcomes are shown in Table 3.
to recruitment was 16 hours after the initiation Mortality at 28 days was 34.5% in the levosimen­
of vasopressors, and the median dose of norepi­ dan group and 30.9% in the placebo group
nephrine was 0.28 µ,g per kilogram per minute (mean difference, 3.6 percentage points; 95% CI,
at the time of starting the infusion. -4.5 to 11.7; P=0.43). The Kaplan-Meier curves
0
(.9
LJ.J
for survival to day 28 are shown in Figure 2.
a:
(.9 CARDIOVASCULAR EFFECTS Among patients requiring mechanical ventila­
LJ.J
a: The infusion was discontinued before the 24-hour tion at baseline, those in the levosimendan
CO
0 time point owing to hemodynamic instability group were less likely than those in the placebo
z
a: (hypotension or tachycardia) in 33 of 244 patients group to be successfully weaned from mechani­
LJ.J
> (13.5%) in the levosimendan group, as compared cal ventilation over the period of 28 days (hazard
en
z with 19 of 248 patients ( 7.7%) in the placebo ratio, 0.7 7; 95% CI, 0.60 to 0.97; P=0.03) (Fig.
0
fC=
0
LJ.J
N ENGLJ MED 375;17 NEJM.ORG OCTOBER 27, 2016 1641
@

312
ARTICLE 11 - LCA-2 2017

The NEW ENGLAND JOURNAL of MEDICINE

2382 Patients were assessed for eligibility 1


1

1866 Were excluded


15 7 Were not in septic shock
12 Were <18 yr of age
41 Did not have an infection
43 Did not meet SIRS criteria
127 Did not meet vasopressor criteria
714 Were outside 24-hr window since
meeting inclusion criteria
82 Had end-stage renal failure
2 Had a history of torsades de pointes
83 Had severe hepatic impairment
61 Had obstructions affecting ventricular
flow
352 Had a decision regarding treatment
limitation
47 Weighed >135 kg
4 Were pregnant
6 Had received levosimendan within
30 days
2 Had hypersensitivity to levosimendan
56 Were enrolled in another trial
43 Were not enrolled, per physician's
decision
90 Did not give consent or have consent
obtained
85 Had problems with staff availability
102 Had other reasons

1 516 Underwent randomization


1
!
259 Were assigned to receive
!
257 Were assigned to receive
levosimendan placebo

!
255 Received levosimendan 253 Received placebo only
4 Did not receive levosimendan 1 Received placebo and open-label
1 Withdrew consent levosimendan
2 Died 3 Did not receive placebo
1 Had a clinical decision 2 Died
to withhold drug owing to 1 Was enrolled during period in which
improvement in condition trial was temporarily halted

!
258 Were included in primary analysis
257 Were included in primary analysis
1 Was excluded owing to withdrawal
of consent

!
255 Were included in as-treated analysis 253 Were included in as-treated analysis

Figure 1. Recruitment and Randomization of the Patients.


Patients couId meet more than one exclusion criterion. Other reasons for nonenrollment included unavailability of
levosimendan or placebo, mental health problems, language barrier, and unspecified reasons (in 78 patients). SIRS
denotes the systemic inflammatory response syndrome.

1642 N ENGLJ MED375;17 NEJM.ORG OCTOBER27, 2016

313
iKB LECTURE CRITIQUE D'ARTICLE

LEVOSIMENDAN TO PREVENT ORGAN DYSFUNCTION IN SEPSIS

Table 1. Baseline Characteristics.'�

Levosimendan Placebo
Characteristic (N=258) (N=257)
Median age (IQR) -yr 67 (58-75) 69 (58-77)
Male sex-no. (%) 145 (56.2) 144 (56.0)
Median weight (IQR) -kg 76 (65-90) 80 (68-91)
Median body-mass index (IQR)t 27 (23-30) 28 (24-32)
Race-no. (%)t
Asian 11 (4.3) 10 (3.9)
Black 4 (1.6) 6 (2.3)
White 240 (93.0) 240 (93.4)
Other 3 (1.2) 1 (0.4)
H istory of recent surgery-no. (%)§ 94 (36.4) 95 (37.0)
Preexisting condition-no. (%)
lschemic heart disease 46 (17.8) 31 (12.1)
Congestive heart failure 1 (0.4) 4 (1.6)
Cardiac failure 23 (8.9) 26 (10.1)
Severe COPD 16 (6.2) 11 (4.3)
Chronic renal failure 19 (7.4) 18 (7.0)
Cirrhosis 4 (1.6) 6 (2.3)
lmmunocompromised condition 23 (8.9) 24 (9.3)
Diabetes 59 (22.9) 51 (19.8)
Beta-blockers normally taken-no. (%) 54 (20.9) 45 (17.5)
Median time from shock ta randomization (IQR) -hr, 16 (10-21) 15 (10-20)
Vasoactive-drug dose at randomization

Norepinephrine

No. of patients 255 253


Median dose (IQR) -pg/kg/min 0.29 (0.16-0.52) 0.27 (0.15-0.44)
Epinephrine

No. of patients 21 21
Median dose (IQR) -pg/kg/min 0.14 (0.07-0.28) 0.13 (0.08-0.38)
Vasopressin

No. of patients 33 37
Median dose (IQR) -units/min 0.03 (0.02-0.04) 0.03 (0.02-0.04)
Dobutamine

No. of patients 18 22
Median dose (IQR) -pg/kg/min 5. 7 (3.5-8.8) 5.0 (4.4-6.2)

;, There were no significant between-group differences in the demographic characteristics at baseline. The rates of missing
values are shown in Table Sl in the Supplementary Appendix. COPD denotes chronic obstructive pulmonary disease,
and IQR interquartile range.
0
(.9 t The body-mass index is the weight in kilograms divided by the square of the height in meters. Data were missing for six
LJ.J
a: patients in the levosimendan group and for three in the placebo group.
(.9

LJ.J
t Race was determined from medical records.
a: § Recent surgery was defined as admission ta the intensive care unit from the operating room.
CO
0 , The onset of shock was defined as the initiation of vasopressors.

z
a:
LJ.J
>
en
z
0
fC=
0
LJ.J
N ENGLJ MED 375;17 NEJM.ORG OCTOBER 27, 2016 1643

314
ARTICLE 11 - LCA-2 2017

The NEW ENGLAND JOURNAL of MEDICINE

Table 2. Acute lllness and Physiological Variables at Baseline.'�

Levosimendan Placebo
Variable (N=258) (N=257)
Median APACHE 11 score(IQR)t 25(21-31) 25(21-30)
Median SOFA score (IQR)t 10(8-12) 10(7-12)
Organ failure- no./total no.(%)§
Respiratory 99/257(38.5) 101/256(39.5)
Renal 77 /258(29.8) 74/256(28.9)
Hepatic 6/252(2.4) 8/252(3.2)
Coagulation 16/256(6.2) 13/255(5.1)
Neurologie 117 /224(52.2) 111/212(52.4)
Source or site of initial infection- no./total no.(%)
Lung 98/257(38.1) 103/257(40.1)
Abdomen 95/257(37.0) 96/257(37.4)
U rinary tract 12/257(4.7) 17 /257(6.6)
Primary bacteremia 7/257(2.7) 3/257(1.2)
Neurologie site 4/257(1.6) 1/257(0.4)
Soft tissue or catheter 16/257(6.2) 10/257(3.9)
Other 25/257(9.7) 27/257(10.5)
Positive microbiologie culture - no./total no. (%), 109/258(42.2) 112/256(43.8)
Mechanical ventilation- no.(%) 207(80.2) 210(81.7)
Renal-replacement therapy- no.(%) 44(17.1) 45(17.5)
Moderate or severe ARDS - no.(%) 72(27.9) 59(23.0)
Heart rhythm- no./total no. (%)
Sinus rhythm 201/258(77.9) 218/255(85.5)
Atrial fibrillation 32/258(12.4) 21/255(8.2)
Paced 3/258(1.2) 2/255(0.8)
Other irregular rhythm 22/258(8.5) 14/255(5.5)
Median values for physiological variables(IQR) Il
Mean arterial pressure- mm Hg 74(68-80) 73(67-79)
Heart rate - beats/min 97 (82-111) 94(80-110)
Central venous pressure - mm Hg 11(9-15) 12(8-16)
Cardiac index- liters/min/m2 2.7 (2.2-3.7) 3.3(2.2-4.0)
Stroke volume - ml 55. 7(40.0-73.5) 67.0(49.4-79.7)
Arterial oxygen saturation- % 97(95-98) 97 (95-98)
Central venous oxygen saturation- % 75(69-81) 76(70-81)
Lactate - mmol/liter 2.2(1.4-3.5) 2.3(1.5-3.9)
Paoi :F102- mm Hg 216(151-294) 215(152-296)
Creatinine- mg/dl 1.6(1.0-2.4) 1.5 (1.1-2.4)
Bilirubin- mg/dl 0.8(0.5-1.5) 0.9(0.5-1.6)
Hemoglobin- g/liter 108(94-123) 108(93-125)
Platelet count per mm 3 212,000(134,000-299,000) 216,000(144,000-308,000)
Glasgow Coma Scale score 9(3-15) 8(3-15)

;, There were no significant between-group differences in the characteristics at baseline, except for stroke volume(P=0.02). ARDS
denotes the acute respiratory distress syndrome, F102 fraction of inspired oxygen, and Pao2 partial pressure of arterial oxygen.
t Scores on the Acute Physiology and Chronic Health Evaluation(APACHE) Il range from Ota 72, with higher scores in­
dicating more severe illness and a higher risk of death.
t Scores on the Sequential Organ Failure Assessment (SOFA) were calculated on the basis of six organ systems at base­
line. Scores range from Ota 24, with higher scores indicating more severe illness.
§ Renal failure was defined as having an acute kidney injury of stage 3(urinary-output criteria omitted because data were
unavailable)23; other organ failures were defined as a SOFA score of 3 or higher. Cardiovascular failure is not listed here
because it was an inclusion criterion.
,The types of organisms that were identified are shown in Table S2 in the Supplementary Appendix.
Il The cardiac index and stroke volume were measured in 84 patients in the levosimendan group and in 73 in the placebo group.
The numbers of missing values for other physiological variables listed here are shown in Table Sl in the Supplementary
Appendix. Ta convert the values for creatinine ta micromoles per liter, multiply by 88.4. Ta convert the values for bilirubin ta
micromoles per liter, multiply by 17.1. Scores on the Glasgow Coma Scale range from 3 ta 15, with lower scores indicating a
greater depression of consciousness.

1644 N ENGLJ MED375;17 NEJM.ORG OCTOBER27, 2016

315
iKB LECTURE CRITIQUE D'ARTICLE

LEVOSIMENDAN TO PREVENT ORGAN DYSFUNCTION IN SEPSIS

Table 3. Clinical Outcomes.'�

Levosimendan Placebo Absolute Difference


Outcome (N=258) (N=257) (95% Cl)"j" PValue
Primary outcome
Mean daily total SOFA score 6.68±3.96 6.06±3.89 0.61(-0.07 ta 1.29) 0.053
Respiratory 1.70±1.18 1.56±1.15 0.14(-0.06 ta 0.34) 0.23
Coagulation 0.75±1.05 0.75±1.02 0.00(-0.18 ta 0.17) 0.55
Hepatic 0.51±0.84 0.45±0.77 0.06(-0.08 ta 0.19) 0.65
Cardiovascular 2.27±1.20 2.02±1.20 0.25(0.04 ta 0.46) 0.01
Renal 1.46±1.49 1.28±1.38 0.18(-0.07 ta 0.42) 0.32
Mean daily SOFA score excluding cardiovascular score 4.41±3.13 4.05±3.07 0.36(-0.17 ta 0.90) 0.12
Mean daily total SOFA score in the sensitivity analysist 7.19±3.72 6.78±3.74 0.41(-0.24 ta 1.06)
Secondary outcomes
Death-no./total no. (%)§
At 28 days 89/258(34.5) 79/256(30.9) 3.6(-4.5 ta 11.7) 0.43
At ICU discharge 83/258(32.2) 76/257(29.6) 2.6(-5.4 ta 10.6) 0.59
At hospital discharge 97/258(37.6) 84/256(32.8) 4.8(-3.5 ta 13.0) 0.30
Median no. of catecholamine-free days(IQR) 22(0 ta 26) 23(0 ta 26) -1.0(-4.5 ta 1.0) 0.09
Median no. of ventilation-free days (IQR) 16(0 ta 25) 19(0 ta 25) -3.0(-9.5 ta 1.0) 0.14
Major acute kidney event over period of 28 days 148/258(57.4) 139/256(54.3) 3.1(-5.5 ta 11.6) 0.54
-no./total no. (%)
Need for new renal-replacement therapy 62/257(24.1) 62/257(24.1) 0.0(-7.4 ta 7.4) >0.99
Sustained renal failure at day 28 or ICU discharge if before 118/258(45.7) 108/257(42.0) 3.7(-4.9 ta 12.3) 0.45
28 days
Median duration of renal-replacement therapy(IQR)-days 3.0(1.0 ta 8.0) 5.0(2.0 ta 9.0) -2.0(-3.0 ta 0.0) 0.24
Median length of ICU stay (IQR)-days
Ali patients 7.3(3.2 ta 14.8) 8.3(3.9 ta 13.5) -1.0(-2.6 ta 0.8) 0.66
Survivors 9.1(5.0 ta 16.1) 9.0(4.9 ta 14.1) 0.2(-2.0 ta 2. 7) 0.31
Nonsurvivors 3.2(1.4 ta 8.9) 5.7(2.2 ta 11.7) -2.6(-5.7 ta -0.8) 0.09
Median length of hospital stay(IQR)-days
Ali patients 19.6(10.1 ta 40.4) 22.7(11.7 ta 42.3) -3.1(-7.0 ta 2.2) 0.24
Survivors 30.1(16.8 ta 48) 27.7(18 ta 52.3) 2.5(-5.9 ta 8.2) 0.81
Nonsurvivors 8.2(3.4 ta 18.6) 11.3(5.1 ta 25. 7) -3.1(-6.5 ta O. 7) 0.25
Safety outcomes
Any serious adverse event-no.(%) 32(12.4) 23(8.9) 3.5(-2.3 ta 9.2) 0.26
Any life-threatening arrhythmia-no.(%) 15(5.8) 6(2.3) 3.5(-0.3 ta 7.3) 0.08
Supraventricular tachyarrhythmia 8(3.1) 1(0.4) 2.7(0.1 ta 5.3) 0.04
Bradycardia 0 2(0.8) -0.8(-2.2 ta O. 7) 0.48
Ventricular fibrillation or tachycardia 7(2.7) 3(1.2) 1.5(-1.2 ta 4.3) 0.34
Myocardial infarction or acute coronary syndrome-no.(%) 3(1.2) 1(0.4) 0.8(-1.1 ta 2.7) 0.62
Other-no.(%), 18(7.0) 17(6.6) 0.4(-4.3 ta 5.1) >0.99

;, Plus-minus values are means ±SD. Absolute differences between percent values are percentage points. Confidence intervals were calculated
with the use of bootstrap methods for all continuous variables. P values for continuous outcomes were calculated with the use of a Mann­
0
(.9 Whitney test and for binary outcomes with the use of a chi-square test. ICU denotes intensive care unit.
LJ.J
a:
(.9
t Values may be different than expected owing ta rounding.
t A prespecified sensitivity analysis that implemented Bayesian models was performed with the use of Markov chain Monte Carlo methods
LJ.J
a: (see the Supplementary Appendix). The absolute difference in this analysis is presented with 95% credible intervals, and P values are not
CO
0 applicable ta this type of analysis.
§ One patient in the placebo group declined follow-up after discharge from the ICU but before day 28 and hospital discharge.
z
a:
LJ.J
, Other events were defined as any serious adverse event that was not a life-threatening arrhythmia and not a myocardial infarction or acute
> coronary syndrome.
en
z
0
fC=
0
LJ.J
N ENGLJ MED 375;17 NEJM.ORG OCTOBER 27, 2016 1645

316
ARTICLE 11 - LCA-2 2017

The NEW ENGLAND JOURNAL of MEDICINE

higher heart rates, had a higher rate of arrhyth­


100
mia, and underwent mechanical ventilation for
� longer than those who received placebo.
Placebo
"C
OJ
75 Levosimendan is an inotropic agent with a
·1: Levosimendan
mechanism of action that differs from that of
50 catecholamines. By sensitizing cardiomyocytes
to existing levels of intracellular calcium, an in­
25
crease in the force of myocardial contraction is
-�
OJ
achieved with a minimal increase in myocardial
oxygen demand, in contrast to catecholamines.9
0
0 14 21 28 As calcium levels fall in diastole, relaxation of
Days the myocardium is not impaired with levosimen­
No. at Risk dan, which may be an additional benefit over
Levosimendan 258 203 183 174 171 catecholamines.26 Although levosimendan has
Placebo 257 216 194 186 182
a half-life of approximately 1 hour, its active
metabolite OR-1896 has a half-life of 80 hours.
Figure 2. Kaplan-Meier Estimates ofthe Probability ofSurvival to Day 28.
Therefore, a single 24-hour infusion should pro­
The adjusted hazard ratio for death in the levosimendan group, as com­
pared with the placebo group, was 1.24 (95% Cl, 0.91 ta 1.67; P=0.17). vide hemodynamic effects over the course of a
week, 27 which is long enough to support the
majority of patients with septic shock until hemo­
dynamic recovery.20
SB in the Supplementary Appendix). The num­ Preclinical and small clinical trials have shown
ber of catecholamine-free days was 22 days in the a potential benefit of levosimendan on renal, 10
levosimendan group and 23 in the placebo group hepatic, 12 and pulmonary28 fonction in patients
(difference, -1.0 day; 95% CI, - 4.5 to 1.0; P=0.09). with sepsis. Therefore, the mean daily SOFA
A total of 32 patients in the levosimendan group score was chosen as the primary outcome in this
had a serious adverse event, as compared with trial to fully assess the clinical efficacy and bio­
23 in the placebo group. Supraventricular tachyar­ logie effect of levosimendan. However, there was
rhythmia was significantly more common in the no evidence of any beneficial effect on the total
levosimendan group than in the placebo group. SOFA score or on any individual component of
There were no significant differences over time the score or on any other clinical outcome. The
between the two groups in the cardiac index, cardiovascular SOFA score was higher in the levo­
stroke volume, central venous oxygen saturations simendan group than in the placebo group,
or pressure, the ratio of the partial pressure of which reflects the higher doses of norepineph­
arterial oxygen to the fraction of inspired oxy­ rine that were required to maintain the mean
gen, and the serum creatinine and bilirubin arterial pressure.
levels (Figs. S14 through S20 in the Supplemen­ Mortality in our trial population was lower
tary Appendix). than in previous studies of levosimendan in pa­
There were no significant between-group dif­ tients with septic shock. This difference is, at
ferences in the mean SOFA score or in 28-day least in part, a consequence of the fact that we
mortality in the prespecified subgroups. There recruited a wide range of patients with sepsis,
was no significant heterogeneity of treatment without requiring a low cardiac output as an
effect in any of the subgroup analyses (Fig. S21 enrollment criterion. Myocardial dysfonction,
in the Supplementary Appendix). although present in more than 5 0% of patients
with sep tic shock, 3 may not always be clinically
evident, even when cardiac-output monitoring is
DISCUSSION
used.29 There were four planned subgroup analy­
In this trial, the addition of levosimendan to ses to examine the effect of levosimendan in
standard care was not associated with less se­ high-risk patients, including those with a low
vere organ dysfonction in adult patients with cardiac output, those with impaired oxygen de­
septic shock. Patients who were treated with levo­ livery to the tissues, and those receiving high­
simendan required more norepinephrine, had dose catecholamines. There was no evidence of a

1646 N ENGLJ MED375;17 NEJM.ORG OCTOBER27, 2016

317
iKB LECTURE CRITIQUE D'ARTICLE

LEVOSIMENDAN TO PREVENT ORGAN DYSFUNCTION IN SEPSIS

beneficial effect of levosimendan in any of these if a low cardiac index is present. The target mean
prespecified subgroups. arterial pressure of 65 to 70 mm Hg, which was
Although levosimendan does not stimulate recommended in the protocol and reiterated
/3-adrenoreceptors, a significantly higher heart at investigator meetings, was frequently exceed­
rate was seen in the levosimendan group than in ed (as in other trials involving patients with
the placebo group, most likely owing to vaso­ shock20• 2 • ), which suggests that the norepi­
3 33

dilatation but possibly related to the higher rate nephrine doses that were administered could
of infusion (i.e., higher dose) of norepinephrine have been reduced in the two trial groups.
in the levosimendan group. 0 Similarly, there was
3
In conclusion, in adult patients with septic
a higher rate of tachyarrhythmia among patients shock, the addition of levosimendan to standard
in the levosimendan group than among those in care was not associated with less severe organ
the placebo group. These observations may have dysfonction or lower mortality. Patients who
contributed to the lack of overall clinical benefit were assigned to receive levosimendan required
and are consistent with recent data that suggest more norepinephrine, were less likely to be suc­
a potential benefit in treating persistent tachy­ cessfully weaned from mechanical ventilation,
cardia in patients with sepsis with the use of and had more tachycardia and a higher rate of
beta-blockers. 1 It is also possible that the higher
3
supraventricular arrhythmia than those assigned
rate of norepinephrine use in the levosimendan to receive placebo.
group than in the placebo group may have con­ The views expressed in this article are those of the authors
and not necessarily those of the Medical Research Council
tributed to further catecholamine-induced myo­ (MRC), the National Health Service (NHS), the National Insti­
cardial dysfonction. tute for Health Research (NIHR), or the Department of Health.
This trial has several limitations. We inves­ Supported by the Efficacy and Mechanism Evaluation Pro­
gramme, an MRC and NIHR partnership, an NIHR Clinician
tigated levosimendan as added to standard care Scientist Award (NIHRJCS/009/007, to Dr. Gordon), and Tenax
rather than a comparison of levosimendan with Therapeutics. The NIHR Comprehensive Biomedical Research
an alternative inotrope, such as dobutamine. Centre (based at Imperia! College Healthcare NHS Trust and
Imperia! College London) and the U.K. Intensive Care Founda­
Less than 10% of the patients in the placebo tion provided general research support.
group received dobutamine, although the rate of Dr. Gordon reports receiving consulting fees from Ferring
use in the placebo group was higher than in the Pharmaceuticals and grant support from HCA International,
both paid to his institution; Dr. Perkins, receiving fees for serv­
levosimendan group and may explain in part why ing on an advisory board from GlaxoSmithKline; Dr. McAuley,
the cardiac index and stroke volume were not receiving consulting fees from Peptinnovate, Sobi, Bayer, Boeh­
higher in the levosimendan group than in the ringer Ingelheim, and GlaxoSmithKline and fees to his institu­
tion from GlaxoSmithKline for participating in a clinical trial,
placebo group. There was no significant differ­ and being named on a patent related to a new treatment for the
ence in outcome seen in the prespecified sub­ acute respiratory distress syndrome (Canada, U.S., Australia,
group analysis involving patients with a low car­ and European Union patent no., WO 2011073685, issued to
Queen's University Belfast); and Dr. Liu, receiving consulting
diac index; however, the number of patients with fees from Achaogen, ChemoCentryx, and Durect and fees for
a measured low cardiac index was small (52 pa­ giving a presentation from Genentech, participating on an ad­
tients). Similarly, no echocardiographic analyses visory board for ZS Pharma, and holding stock in Amgen. No
other potential conflict of interest relevant to this article was
were performed to provide additional detailed reported.
information about changes in myocardial fonc­ Disclosure forms provided by the authors are available with
tion with levosimendan treatment. Therefore, this the full text of this article at NEJM.org.
We thank the staff of the NIHR Critical Care Clinical Re­
trial cannot provide guidance as to which ino­ search Network and the Northern Ireland Clinical Research Net­
trope is best to use in the management of sepsis work for help with recruitment of patients and data acquisition.

APPENDIX

The authors' full names and academic degrees are as follows: Anthony C. Gordon, M.D., Gavin D. Perkins, M.D., Mervyn Singer, M.D.,
Daniel F. McAuley, M.D., Robert M.L. Orme, M.B., Ch.B., Shalini Santhakumaran, M.Sc., Alexina J. Mason, Ph.D., Mary Cross, B.A.,
0
(.9 Farah Al-Beidh, Ph.D., Janis Best-Lane, M.Sc., David Brealey, M.D., Christopher L. Nutt, M.B., B.Ch., James J. McNamee, M.B., Henrik
LJ.J
a: Reschreiter, M.D., Andrew Breen, M.B., Ch.B., Kathleen D. Liu, M.D., Ph.D., and Deborah Ashby, Ph.D.
(.9
The authors' affiliations are as follows: the Section of Anaesthetics, Pain Medicine and Intensive Care Medicine, the Departtnent of
LJ.J
a: Surgery and Cancer, Imperia! College London and Imperia! College Healthcare NHS Trust (A.C.G., F.A.-B., J.B.-L.), Bloomsbury Insti­
CO
0 tute of Intensive Care Medicine, the Division of Medicine, University College London (M.S.), Imperia! Clinical Trials Unit Imperia!
College London (S.S., M.C., F.A.-B., J.B.-L., D.A.), the Departtnent of Health Services Research and Policy, London School of Hygiene
z and Tropical Medicine (A.J.M.), and the Division of Critical Care, University College London Hospitals (D.B.), London, Warwick Clini­
a:
LJ.J
> cal Trials Unit, University of Warwick and Heart of England NHS Foundation Trust, Coventty (G.D.P.), the Centte for Experimental
en
z
0
fC=
0
LJ.J
N ENGLJ MED 375;17 NEJM.ORG OCTOBER 27, 2016 1647
@

318
ARTICLE 11 - LCA-2 2017

LEV OSIMENDAN T O PREVENT ORGAN DYSFUNCTION IN SEPSIS

Medicine, Queen's University of Belfast (D.F.M., J.J.M.), and the Regional Intensive Care Unit, the Royal Hospitals (D.F.M., J.J.M.),
Belfast, the Department of Critical Care, Gloucestershire Hospitals NHS Foundation Trust, Cheltenham (R.M.L.O.), Intensive Care Unit,
Antrim Area Hospital, Antrim (C.L.N.), Intensive Care Unit, Poole Hospital NHS Foundation Trust, Poole (H.R.), and Intensive Care
Unit, Leeds Teaching Hospitals NHS Trust, Leeds (A.B.) - ail in the United Kingdom; and the Department of Medicine, University of
California at San Francisco, San Francisco (K.D.L.).

REFERENCES

1. Singer M, Deutschman CS, Seymour of levosimendan vs dobutamine added to MD, et al. Design of clinical trials in acute
CW, et al. The Third International Con­ dopamine on liver fonctions assessed with kidney injury: report from an NIDDK
sensus Definitions for Sepsis and Septic noninvasive liver fonction monitoring in workshop on trial methodology. Clin J
Shock (Sepsis-3). JAMA 2016;315:801-10. patients with septic shock. J Crit Care Am Soc Nephrol 2012;7:844-50.
2. Shankar-Hari M, Phillips GS, Levy ML, 2012;27(3):318.el-6. 23. Mehta RL, Kellum JA, Shah SV, et al.
et al. Developing a new definition and 13. Wang Q, Yokoo H, Takashina M, et al. Acute Kidney Injury Network: report of an
assessing new clinical criteria for septic Anti-inflammatory profile of levosimen­ initiative to improve outcomes in acute
shock: for the Third International Con­ dan in cecal ligation-induced septic mice kidney injury. Crit Care 2007;11:R31.
sensus Definitions for Sepsis and Septic and in lipopolysaccharide-stimulated mac­ 24. Anderson MJ, Ter Braak CJF. Permuta­
Shock (Sepsis-3). JAMA 2016;315:775-87. rophages. Crit Care Med 2015;43(11): tion tests for multi-factorial analysis of
3. Vieillard-Baron A, Caille V, Charron C, e508-e520. variance. J Stat Comput Simul 2003;73:85-
Belliard G, Page B, Jardin F. Actual inci­ 14. Has slacher J, Bijuklic K, Bertocchi C, 113.
dence of global left ventricular hypokine­ et al. Levosimendan inhibits release of re­ 25. R Core Team. R: a language and envi­
sia in adult septic shock. Crit Care Med active oxygen species in polymorphonu­ ronment for statistical computing. Vienna:
2008;36:1701-6. clear leukocytes in vitro and in patients R Foundation for Statistical Computing,
4. Dellinger RP, Levy MM, Rhodes A, et al. with acute heart failure and septic shock: 2015.
Surviving Sepsis Campaign: international a prospective observational study. Crit 26. Ji:irgensen K, Bech-Hanssen 0, Houltz
guidelines for management of severe sep­ Care 2011;15:R166. E, Ricksten SE. Effects of levosimendan
sis and septic shock: 2012. Crit Care Med 15. Parissis JT, Adamopoulos S, Anto­ on left ventricular relaxation and early
2013;41:580-637. niades C, et al. Effects of levosimendan filling at maintained preload and after­
5. Dünser MW, Ruokonen E, Pettila V, et on circulating pro-inflammatory cyto­ load conditions after aortic valve replace­
al. Association of arterial blood pressure kines and soluble apoptosis mediators in ment for aortic stenosis. Circulation 2008;
and vasopressor Joad with septic shock patients with decompensated advanced 117:1075-81.
mortality: a post hoc analysis of a multi­ heart failure. Am J Cardial 2004;93:1309- 27. Kivikko M, Antila S, Eha J, Lehtonen L,
center trial. Crit Care 2009;13:Rl81. 12. Pentikainen PJ. Pharmacokinetics of levo­
6. Boldt J, Menges T, Kuhn D, Diridis C, 16. du Toit EF, Genis A, Opie LH, Polle­ simendan and its metabolites during and
Hempelmann G. Alterations in circulat­ sello P, Lochner A. A role for the RISK after a 24-hour continuons infusion in pa­
ing vasoactive substances in the critically pathway and K(ATP) channels in pre- and tients with severe heart failure. !nt J Clin
ill - a comparison between survivors and post-conditioning induced by levosimen­ Pharmacol Ther 2002;40:465-71.
non-survivors. Intensive Care Med 1995; dan in the isolated guinea pig heart. Br J 28. Morelli A, Teboul J-L, Maggiore SM,
21:218-25. Pharmacol 2008;154:41-50. et al. Effects oflevosimendan on right ven­
7. Schmittinger CA, Torgersen C, Luck­ 17. Zangrillo A, Putzu A, Monaco F, et al. tricular afterload in patients with acute
ner G, Schri:ider DC, Lorenz !, Dünser Levosimendan reduces mortality in pa­ respiratory distress syndrome: a pilot
MW. Adverse cardiac events during cate­ tients with severe sepsis and septic shock: study. Crit Care Med 2006;34:2287-93.
cholamine vasopressor therapy: a prospec­ a meta-analysis of randomized trials. 29. Shahul S, Gulati G, Haclœr MR, et al.
tive observational study. Intensive Care J Crit Care 2015;30:908-13. Detection of myocardial dysfonction in
Med 2012;38:950-8. 18. Orme RM, Perkins GD, McAuley DF, septic shock: a speckle-tracking echocar­
8. Nieminen MS, Fruhwald S, Heunks et al. An efficacy and mechanism evalua­ diography study. Anesth Analg 2015;121:
LM, et al. Levosimendan: current data, tion study of Levosimendan for the Pre­ 1547-54.
clinical use and future development. vention of Acute oRgan Dysfonction in 30. Gordon AC, Wang N, Walley KR, Ash­
Heart Lung Vesse! 2013;5:227-45. Sepsis (LeoPARDS): protocol for a ran­ by D, Russell JA. The cardiopulmonary ef­
9. Ukkonen H, Saraste M, Akkila J, et al. domized controlled trial. Trials 2014;15: fects of vasopressin compared with nor­
Myocardial efficiency during calcium sen­ 199. epinephrine in septic shock. Chest 2012;
sitization with levosimendan: a noninva­ 19. Ferreira FL, Bota DP, Bross A, Mélot 142:593-605.
sive study with positron emis sion tomog­ C, Vincent JL. Serial evaluation of the 31. Morelli A, Ertmer C, Westphal M, et al.
raphy and echocardiography in healthy SOFA score to predict outcome in criti­ Effect of heart rate contrai with esmolol
volunteers. Clin Pharmacol Ther 1997;61: cally ill patients. JAMA 2001;286:1754-8. on hemodynamic and clinical outcomes
596-607. 20. Gordon AC, Mason AJ, Thirunavuk­ in patients with septic shock: a random­
10. Morelli A, De Castro S, Tebou!J-L, et al. karasu N, et al. Effect of early vasopressin ized clinical trial. JAMA 2013;310:1683-
Effects of levosimendan on systemic and vs norepinephrine on kidney failure in 91.
regional hemodynamics in septic myocar­ patients with septic shock: the VANISH 32. Russell JA, Walley KR, Singer J, et al.
dial depression. Intensive Care Med 2005; randomized clinical trial. JAMA 2016;316: Vasopressin versus norepinephrine infu­
31:638-44. 509-18. sion in patients with septic shock. N Engl
11. Morelli A, Donati A, Ertmer C, et al. 21. Gordon AC, Mason AJ, Perkins GD, et J Med 2008;358:877-87.
Levosimendan for resuscitating the micro­ al. The interaction of vasopressin and cor­ 33. Asfar P, Meziani F, Hamel J-F, et al.
circulation in patients with septic shock: ticosteroids in septic shock: a pilot ran­ High versus low blood-pressure target in
a randomized controlled study. Crit Care domized controlled trial. Crit Care Med patients with septic shock. N Engl J Med
2010;14:R232. 2014;42:1325-33. 2014;370:1583-93.
12. Memi� D, !na! MT, Sut N. The effects 22. Palevsky PM, Molitoris BA, Okusa Copyright© 2016 Massachusetts Medical Society.

1648 N ENGLJ MED375;17 NEJM.ORG OCTOBER27,2016

319
iKB LECTURE CRITIQUE D'ARTICLE

QCM
1
1Quels sont les éléments rapportés ou suggérés par les auteurs pour justifier la
réalisation de cette étude ?
A - Le sepsis est une cause fréquente de décès.
B - Le Levosimendan est déjà enregistré dans l'indication du sepsis grave.
C - Le Levosimendan a déjà montré une amélioration des paramètres hémodynamiques dans le
choc septique.
D - L'existence d'une méta-analyse positive déjà publiée, basée sur seulement 125 patients.

1
E - Les éléments de preuve existant dans la littérature restaient insuffisants.

QCM
Concernant la sélection des patients dans l'essai :
2
A - L'inclusion devait avoir débuté au maximum dans les 28 heures suivant le début du choc
septique.
B - Les patients n'ayant reçu que deux heures de traitement vasopresseur n'étaient pas éligibles.
C - Les critères d'exclusion de cette étude sont précisés dans l'appendix en supplément.
D - Seuls les patients admis en réanimation étaient éligibles.
E - Une procédure de consentement par un proche était possible dans cette étude.

Q M
� I A propos de la randomisation des patients:
A- Elle avait pour but d'assurer l'équilibre de répartition des patients entre les deux groupes.
B- Elle était centralisée.
C- La randomisation a été menée par blocs de quatre ou de six selon le centre.
D- La stratification sur le centre permet de limiter un éventuel « effet centre ».

1
E- La différence entre les effectifs de chaque groupe suggère un échec de la randomisation.

QCM Concernant les aspects éthiques ou réglementaires, quelle(s) est(sont) la(les)


4 proposition(s) exacte(s) ?
A - La signature d'un consentement aux patients garantit l'éthique du protocole.
B - En France, une telle étude multicentrique aurait seulement requis l'autorisation d'un comité de
protection des personnes (CPP).
C - Le promoteur de l'étude était la firme Orion.
D - Le premier auteur ne déclarait pas de lien d'intérêt avec Orion.
E - Le principe d'ambivalence a été respecté.

QCM
5
1Concernant les procédures d'aveugle :
A - Les auteurs ont utilisé un double-placebo pour assurer l'aveugle de cette étude.
B - Elles sont justifiées par l'effet placebo potentiel du Levosimendan.
C - Le personnel soignant était en aveugle du traitement.
D - Elles permettent de limiter le biais d'exposition au Levosimendan.
E - Des éléments cliniques en cours d'administration pourraient rompre l'insu.

QCM
6
1 Le critère de jugement principal:
A - Est traité comme une variable qualitative.
0
(.9
B - Est basé sur un score SOFA modifié.
LJ.J
a:
(.9
C - Est le score SOFA mesuré à J28.
LJ.J
D - Est un critère combiné.
a:
CO
0
E - A été évalué à l'aveuqle de la connaissance du qroupe de traitement.
z
a:
LJ.J
>

@
en
z
0
fC=
0
LJ.J

320
ARTICLE 11 - LCA-2 2017

QCM
7
1 Concernant le calcul d'effectif :
A - Il a été déterminé sans préjuger du sens de la différence entre Levosimendan et placebo.
B - Il a été déterminé en tenant compte de l'écart type du score SOFA.
C - Il a été déterminé pour un risque bêta de 10%.
D - La différence attendue du critère de jugement principal, entre les deux groupes, était d'au moins
0,5 points.
E - Le calcul d'effectif a considéré un taux de perdu de vue de 3%.

QCM 1 Selon le diagramme de flux, dans cet essai :


8
A - Les patients du groupe Levosimendan n'ayant pas reçu de Levosimendan ont été exclus de
l'analyse principale.
B - Sur les 259 patients randomisés dans le bras Levosimendan, un patient a retiré son
consentement et a été exclus de l'analyse principale.
C - Deux patients sont décédés avant de recevoir le Levosimendan.
D - La population « as-treated » comprend l'ensemble des patients ayant effectivement reçu le
traitement assigné par randomisation.
E - Un patient du groupe placebo a reçu du Levosimendan.

QCM
9
1 Que peut-on dire des tableaux 1 et 2 ?
A - 25% des patients du groupe Levosimendan avaient un index de masse corporelle supérieur à 30.
B - Le délai médian entre le choc et la randomisation était comparable entre les deux groupes.
C - Le score SOFA à la randomisation était compris entre 8 et 12 dans le groupe Levosimendan.
D - Les caractéristiques étaient globalement comparables entre les deux groupes.
E - Compte tenu du nombre de tests réalisés, la différence significative sur le débit systolique (stroke
volume) pourrait s'expliquer par l'inflation du risque alpha.

QCM
10
1 Le résultat principal de cette étude :
A - Montre une différence de score moyen SOFA à 28 jours entre les groupes de 0,61.
B - Montre une tendance vers un meilleur score SOFA dans le groupe Levosimendan.
C - Montre une absence de différence statistiquement significative sur le critère de jugement
principal, l'intervalle de confiance à 95% incluant la valeur O.
D - Est confirmé dans une analyse de sensibilité ajustée sur le centre, l'âge et le score APACHE Il.
E - Porte sur le score moven cardiovasculaire du SOFA.

QCM
11
1 Concernant la mortalité :
A - 34,5% des patients du groupe Levosimendan étaient décédés à 28 jours.
B - La différence absolue de mortalité à 28 jours entre les deux groupes était de 3,6%.
C - La mortalité à 28 jours n'était pas significativement différente entre les groupes, l'IC à 95% de la
différence incluant la valeur O.
D - Elle a été évaluée comme critère binaire à 28 jours et comme critère censuré (délai jusqu'au
décès dans les 28 jours).
E - Il n'y avait pas de différence significative dans la durée de survie, dans les 28 jours, entre les
groupes (hazard ratio ajusté de 1,24 (0,91-1,67)).

321
iKB LECTURE CRITIQUE D'ARTICLE

QCM
12
1 Les analyses concernant les critères secondaires tels que présentés dans le tableau
3 et le paragraphe « secondary outcomes »
A - Ne retrouvaient aucune différence statistiquement significative entre les groupes.
B - Ne comportaient pas de correction pour la multiplicité des tests.
C - Montraient un sevrage de ventilation plus précoce dans le groupe placebo chez les patients
nécessitant une ventilation mécanique à la randomisation.
D - Ne permettaient pas de conclure à un quelconque bénéfice du Levosimendan.

1
E - Ont utilisé un test de permutation.

QCM
Quels sont les éléments en faveur d'une bonne validité interne de cette étude ?
13
A - La déclaration de la source de financement et des liens d'intérêt.
B - Le fait que le protocole soit disponible.
C - L'administration du traitement en aveugle.
D - L'analyse en intention de traiter.

1
E - La description de la méthode de randomisation.

QCM Quels sont les éléments en faveur d'une bonne généralisabilité des résultats de
14 cette étude ?
A - Le recrutement multicentrique.
B - L'absence d'effet centre attestée par la stratification de la randomisation.
C - L'attrition (cf. flow chart).
D - Une prise en charge pour les traitements associés proche de la vraie vie dans cette étude.
E - Le taux de mortalité plus faible que dans d'autres études sur le Levosimendan.

QCM
15
1Que peut-on conclure de cette étude ?
A - Elle donne des indications sur le médicament inotrope +, à utiliser dans la prise en charge du
sepsis, quand l'index cardiaque est faible.
B - La divergence avec le résultat de la méta-analyse citée peut s'expliquer par un biais de
publication.
C - L'ajout du Levosimendan ne semble apporter aucun bénéfice par rapport à la prise en charge
habituelle dans le choc septique.
D - Le Levosimendan améliore la défaillance cardiovasculaire.
E - La méta-analyse, antérieurement publiée, supportait déjà l'utilisation du Levosimendan dans le
sepsis, cette étude, non conclusive, ne remet pas en cause ce résultat.

0
(.9
LJ.J
a:
(.9

LJ.J
a:
CO
0

z
a:
LJ.J
>

@
en
z
0
fC=
0
LJ.J

322
ARTICLE 11 - LCA-2 2017

Grille de correction QCM


(Questions à choix multiples)

A-
.
V Réponse: ACDE

....
::!!: C-
B- F
V . Les informations se trouvent dans l'introduction de l'article.
Le Levosimendan est indiqué dans le traitement de l'arrêt cardiaque, pas du choc

.
(.) D- V septique.
0
Cependant, quelques études ont déjà été réalisées (donc manque de preuve dans
E- V
la littérature), dont une méta-analyse, mais qui ne comportait que 125 patients.
A- V
.
Réponse: ABCDE

N
B-
C-
V
V . Ces informations se trouvent dans la partie « méthodes» de l'article.
Etaient éligibles les patients adultes avec un choc septique, traités pendant au
::!!: D- V moins 4 heures par vasopresseurs. Ils devaient ensuite être inclus dans les 24
(.) heures suivant la présence des critères d'inclusion (donc 28 heures après le début
0
E- V . du choc).
Par ailleurs, l'essai clinique ne se déroule que dans des unités de réanimation,
donc il est sous-entendu que seuls ces patients seront éligibles à l'étude.
A-
B-
V
V .
Réponse: ABD
La randomisation se fait de manière centralisée (système « en ligne»), avec
C- F génération de nombres au hasard par ordinateur. Les listes ont été établies par

M
::!!:
D- V
. un statisticien indépendant.
La randomisation est restreinte, par blocs de 4 ou 6, mais ces blocs sont
(.)
indépendants du centre de randomisation. En réalité, comme il y a stratification sur
0 le centre, il y a une liste de randomisation par centre, chacune étant elle-même
E- F
. réalisée selon des blocs de 4 et 6 patients.
Comme la randomisation est restreinte par blocs, il peut exister un déséquilibre
entre les groupes au cours du suivi, si les blocs ne sont pas complets, ce qui est
normal!
A-
B-
F
F .
Réponse: DE
La signature d'un consentement (libre et éclairé) aux patients participe au respect
C- F des aspects éthiques du protocole, mais n'est pas suffisant. C'est l'accord du
D- V comité d'étique indépendant (au regard des informations fournies par les
investigateurs, notamment le protocole qui sera donné aux patients pour signature)
""
::!!: . qui garantit que le protocole est éthique.
En France, une étude interventionnelle de ce type (avec usage de médicaments)

.
(.)
0 aurait nécessité au moins en plus une autorisation de l'ANSM.
E- V Orion Pharma a seulement fourni les molécules (Levosimendan et placebo), le

. promoteur est l'lmperial College London.


Le principe d'ambivalence est respecté car chaque patient inclus dans l'étude peut
recevoir indépendamment le placebo ou le Levosimendan, et les patients ne
pouvant recevoir le Levosimendan ont été exclus (cf. flow-chart).
A-
.
F Réponse: CDE
Lt) B- F L'aveugle permet le maintien de la comparabilité entre les groupes au cours de

.
::!!: C- V l'étude.
(.)
0 D- V Ici, c'est un triple aveugle : les patients, le personnel soignant et le personnel de
E- V recherche ne connaissaient pas le traitement administré aux patients.

323
iKB LECTURE CRITIQUE D'ARTICLE

A-
B- V .
F Réponse: BE
Le critère de jugement principal est le score SOFA moyen quotidien, calculé sur
C- F l'ensemble des jours où le patient est resté en unité de soins intensifs, divisé
ID
D- F
.
par le nombre de journées passées en unité de soins intensifs.

.
::!!: C'est un score modifié car il ne tient pas compte de l'évaluation neurologique.
(.)
0 Le critère de jugement principal est évalué par les cliniciens lors du suivi quotidien
E- V du patient. Or, ceux-ci sont en aveugle du traitement administré, donc l'évaluation
du critère de jugement principal se fait elle aussi en aveugle de la connaissance du
groupe de traitement.
A-
B- F .
V Réponse: ACD
Il s'agit d'une formulation bilatérale, on ne sait pas dans quel sens se fait la
..... C-
::!!: D-
V
V .
différence entre les deux traitements.
Il tient compte de l'écart-type de la différence sur le score SOFA moyen entre les
(.)
0 .
deux groupes.
E- F .
Puissance = 1-bêta = > bêta = 1-puissance = 1-90% = 10%
Les 3% correspondent à des retraits de consentement de patients, et non des
perdus de vue.

.
A- F Réponse: BCDE
CO B- V Le diagramme de flux est une figure clé dans les essais cliniques randomisés. Il

.
::!!: C- V doit normalement y figurer systématiquement (recommandations CONSORT).
(.)
0 D- V On y trouve des informations sur le recrutement, l'allocation des traitements, le
E- V suivi des patients et l'analyse des résultats.
A-
B- V .
V Réponse: ABDE
Le Q3 de l'IMC pour le groupe Levosimendan est à 30, donc 75% des patients ont
C- F
.
un IMC ::5 30, et 25% ont un IMC > 30.
a,
::!!: D- V La différence significative sur le débit systolique pourrait effectivement s'expliquer
(.)
0 par une inflation du risque alpha du fait du nombre important d'analyses
E- V réalisées, étant donné que les auteurs n'ont pas réalisé de corrections sur les tests
multiples.
A-
B- F .
F Réponse: CD
Le résultat sur le score SOFA n'est pas évalué à 28 jours, mais sur l'ensemble
C- V des journées passées en unité de soins intensifs, sur un maximum de 28 jours
....
.
(la durée peut donc être inférieure à 28 jours).
0
D- V
::!!: Un score SOFA élevé est en faveur d'une plus grande/grave dysfonction

.
(.)
0 d'organe.
E- F Dans le cas d'une différence, la valeur neutre est O. Ici, pour le critère de
jugement principal, on trouve une différence absolue de 0,61 , avec un IC95% = - [
0.07 ; 1 .29], p= 0.053.
A- V
........ B- V .
Réponse: ABCDE
::!!: C-
(.)
0 D-
V
V
. Cf. tableau 3 et figure 2 dans l'article.
Attention, ce sont des données reposant sur des analyses secondaires, on ne
pourra donc pas conclure dessus : elles sont réalisées à visée exploratoires.
E- V
A- F
....
N

::!!: C-
B- V
V
.
Réponse: BCDE
Il existait une différence significative sur le sevrage de la ventilation entre les
(.) deux groupes (plus précoce dans le placebo que dans le groupe Levosimendan,
0
(.9
0 D- V
chez les patients avec ventilation mécanique à la randomisation).
LJ.J
a:
(.9
E- V
A- F
....
LJ.J
a:

.
B- F Réponse: CD
CO M
0

z ::!!: C- V La validité interne de l'étude correspond à sa qualité méthodologique et


a: (.)
scientifique, évaluée a posteriori.
LJ.J
> 0 D- V
en
z
0
E- F
fC=
0
LJ.J
@

324
ARTICLE 11 - LCA-2 2017

A-
.
V Réponse: AD

....
B-
C-
F
F . On aborde ici la validité externe de l'étude, sa généralisabilité.
L'attrition et l'absence d'effet centre sont en lien avec la validité interne de
::!!: D-
(.)
0
V
. l'étude, sa« force».
La cohérence externe est limitée, car le taux de mortalité retrouvé est plus faible
E- F que dans d'autres études sur le Levosimendan. Il peut par ailleurs s'agir également
d'un problème de recrutement des patients.
A-
B-
F
V .
Réponse: B
On ne peut conclure que sur le critère de jugement principal (la sévérité de la
....
Lt)
C- F
. dysfonction d'organes chez les patients atteints de choc septique).
::!!: D- F Biais de publication : seules les études positives ont été publiées, pas les études

.
(.)
0 négatives.
E- F Il faudra mener d'autres études pour répondre aux autres questions évoquées
parmi les propositions.

325

Vous aimerez peut-être aussi