Vous êtes sur la page 1sur 133

Cours dpidmiologie pour urgentiste #1 version sept 2008

Cours dpidmio #1
Mesures de la frquence des maladies et associations Objectifs du cours : - Dfinir et savoir calculer : incidence, prvalence, taux - Savoir calculer et connatre les avantages et inconvnients des ratio de cote, risque relatif, risque attribuable. lire: Barbara W. Trautner, MDa,bet al., Prospective Evaluation of the Risk of Serious Bacterial Infection in Children Who Present to the Emergency Department With Hyperpyrexia (Temperature of 106F or Higher) PEDIATRICS Vol. 118 No. 1 July 2006, pp. 34-40. http://pediatrics.aappublications.org/cgi/reprint/118/1/34 Exercices pratiques faire avant le cours. Il sagit dexercices qui serviront de point de dpart pour les discussions. Question #1 Selon vous laquelle des 2 entits suivantes a la prvalence la plus leve : le pulled elbow ou la fracture du fmur ? Pourquoi ? Question #2 Faites la dmonstration mathmatique que OR=RR si la maladie est rare.

Question #3 Dans un petit village de 20 000 personnes, il y avait 100 personnes sous traitement pour cancer du testicule et 1000 sous traitement pour cancer de la prostate en 1998. Au cours des 5 annes subsquentes, le mdecin du village a diagnostiqu 18 nouveau cas de cancer du testicule et 20 cancer de la prostate. Laquelle des 2 maladies a lincidence la plus leve dans ce village et pourquoi?

Question #4 Si on sait que la prvalence dune maladie X est de 10 cas / 1 000 personnes et on sait que son incidence est de 5 nouveaux cas / 1 000 personnes risque par anne, peut-on estimer la dure moyenne de la maladie ?

page1

Cours dpidmiologie pour urgentiste #1 version sept 2008 Question #5 Voici des tables donnant les taux de mortalit selon les ges pour 2 pays trs diffrents. Age 0-1 ans 1-5 ans 5-10 ans 10-18 ans Pays A Taux mortalit / 100 000 pers 100 20 10 5 population 10 000 30 000 30 000 30 000 Pays B Taux mortalit / 100 000 pers 200 40 20 10 population 3 000 7 000 30 000 60 000

total

20.5

100 000

20.8

100 000

Comment expliquer que les taux de mortalit totaux sont similaires pour des populations de tailles similaires malgr le fait que pour chaque catgorie dge, le taux de mortalit est 2 fois plus lev dans le pays B que le pays A ? Question #6 Voici un tableau construit partir dune tude prospective Maladie + Maladie Facteur de risque + 20 80 Facteur de risque 10 90 Total 30 170

Total 100 100 200

Quel est le risque relatif de dvelopper la maladie chez les gens expos ? Quelle est la diffrence de risque ? Quest-ce que a veut dire ? Quelles en sont les implications ? Quel est le odds ratio ? Voici le mme tableau construit sur le mme sujet partir dune tude cas-tmoin. Facteur de risque + Facteur de risque Total Maladie + 20 80 100 Maladie 10 90 100 Total 30 170 200

Quel est le risque relatif de dvelopper la maladie chez les gens expos ? Quel est le odds ratio ? Quelle est lexplication ?

page2

Cours dpidmiologie pour urgentiste #1 version sept 2008 Question #7 Supposons que les cancers A et B sont tout aussi mchant et mortels. Si vous savez que la prise destrogne par les femmes mnopauses diminue le risque du cancer A de 25% mais il augmente le risque du cancer B de 75%, quelle autre donne concernant les cancers A et B vous sera ncessaire avant de faire des recommandations face lutilisation destrogne ? Question #8 Quels sont les avantages du risque relatif ? Quels sont les avantages du odds ratio ? Question #9 Un mdecin a dvelopp un nouveau mdicament qui permet aux gens atteint de cancer des os de vivre 9 mois de plus avec une bonne qualit de vie. Avant cette nouvelle mdication, lesprance de vie au moment du diagnostic tait de 18 mois. Malheureusement, cette nouvelle mdication est associe une hausse de la prvalence de la maladie de 50%. Est-ce que vous utiliseriez ce mdicament dans votre pratique ? Expliquez.

Question # 10 Dans larticle de Trautner : Doit-on dire lincidence ou la prvalence dhyperthermie (hperpyrexia)? Quelle est lincidence/prvalence dhyperthermie dans leur population ? Quelle est la prvalence de bactrimie parmi leurs patients avec hyperpyrexie ? Les auteurs disent que tous les patients avec hyperthermie furent inclus dans ltude. Estce une bonne affaire et pourquoi ? Quelle est lutilit de la FSC dans leur tude ?

page3

Cours dpidmiologie pour urgentiste #1 version sept 2008

Cours # 1 Mesures de la frquence des maladies et associations


Lpidmiologie consiste en la description et ltude de la distribution des maladies et de leurs facteurs associs. Pour ce faire la premire tape consiste dterminer la frquence de la maladie. 1.1 Mesures de frquence Quantifier le nombre de personnes atteintes dune pathologie est utile pour valuer les ressources ncessaires. Si lon veut comparer loccurrence de la maladie dans diverses populations ou situations, il faut par contre avoir une ide de la taille de la population risque (dnominateur). Il existe 3 types de paramtre mathmatique permettant de dcrire la relation entre le numrateur et le dnominateur : - Une cote (odds) est obtenue en divisant le nombre de cas de la maladie ou condition X par le nombre de cas nayant pas la maladie ou la condition X. Il sagit donc dun ratio de 2 probabilits. On dira par exemple que dans les cas dun traumatisme de la cheville on retrouve 2 patients avec fracture pour 8 patients avec une lsion des tissus mous dont une cote de 2:8 ou 1:4. Ce paramtre est plus difficile conceptualiser mais il est utile au point de vue statistique pour des raisons mathmatiques. Il est donc utilis frquemment mme sil nest pas instinctif de parler en terme de cote. - Une proportion ressemble un ratio mais le dnominateur contient tous les cas et les non-cas (donc tous les participants). On peut aussi parler de risque. On dira par exemple 2 patients avec fractures sur les 10 patients avec traumatisme de la cheville donc 20% des patients avec un traumatisme de la cheville ont une fracture. - Un taux est une mesure dassociation o le dnominateur contient aussi une dimension temporelle. On dira par exemple que le taux dIVRS est en moyenne de 2 rhumes par enfant par anne. On peut toujours transformer une cote en risque et vice-versa. Pour ce faire, on utilise la formule : Cote = risque / (1-risque) et risque = Cote / (1+ cote) La prvalence dune maladie est dfinie par le nombre de patients atteints de la maladie divis par la population totale un moment prcis. On peut la voir comme une photographie fixe dans le temps pour dcrire une situation. Elle nous donne la probabilit quun participant soit atteint de la maladie un moment prcis. La prvalence est leve pour les maladies frquentes et pour celles qui durent longtemps. Ainsi, une maladie qui tue rapidement comme un cancer agressif aura une prvalence plus faible quune autre qui tue lentement. On peut aussi parler de la prvalence dune maladie pour un moment non fixe dans le temps mais fixe dans une vie. Par exemple, on parlera de la prvalence danomalie congnitale la naissance, du taux dune maladie lautopsie ou de la prvalence denfants non vaccins lentre lcole. Prvalence = Nombre de personne avec la maladie ou la condition X Nombre de personne risque de la maladie ou la condition X

page4

Cours dpidmiologie pour urgentiste #1 version sept 2008 Lincidence de la maladie permet dajouter la dimension temporelle au calcul du ratio entre les cas et la population risque. Il sagit du nombre de patients ayant dvelopps la maladie pendant une priode donne divis par le nombre de participants risque de dvelopper la maladie. Le dnominateur contient tout ET seulement les gens risque; il exclut donc les participants ayant dj la maladie au dbut de la priode de surveillance ou ceux qui ne pourrons jamais avoir la maladie. Incidence : Nombre de nouveaux cas de la maladie ou condition X Nombre de personnes risque * priode de temps Linclusion de patients qui nont aucun risque davoir la maladie dans le dnominateur diminuera le taux mesur de la maladie. Par exemple, lincidence de balanite paratra faussement basse dans les rgions ou une majorit de garons sont circoncis car ceux ci nont aucune chance de faire une balanite. Lincidence nest pas influence par la dure de la maladie parce quon mesure le taux de nouvelle maladie. Si le risque de dvelopper la maladie est constant dans le temps, les participants ne doivent pas ncessairement tre tous valus pendant toute la dure de ltude. Par exemple, voici une tude sur le risque de pneumonie chez 6 enfants avec FKP : Patients Patient 1 Patient 2 Patient 3 Patient 4 Patient 5 Patient 6 Dbut 3 mois 6 mois 9 mois 12 mois -----------------------------------------------------------------Pneumonie -----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------pneumonie ----------------------------------------------------

Priode dobservation patient 1 : 9 mois Priode dobservation patient 2 : 3 mois Priode dobservation patient 3 : 6 mois Priode dobservation patient 4 : 12 mois Priode dobservation patient 5 : 6 mois Priode dobservation patient 6 : 6 mois Donc total de priodes dobservation : 42 mois Il y a 2 pneumonies pour 6 patients qui totalisent 42 mois dobservation. Il y a donc 2 / (6*4 ans (ou 42 mois) Incidence : 1 pneumonie / 21 patients-mois On peut exprimer la relation entre lincidence et la prvalence par la formule : Prvalence = incidence * dure de la maladie. On peut donc calculer la dure moyenne dune maladie si on en connat la prvalence ainsi que lincidence. Dans le cas de maladie chronique, la prvalence (cas avec la maladie) est grande mais lincidence (nouveaux cas) est petite donc la dure de la maladie est longue.

page5

Cours dpidmiologie pour urgentiste #1 version sept 2008 Dans le cas de maladies aigues frquente mais non ltales, i.e. : un rhume, lincidence (nouveaux cas) sera grande mais tant donn que la dure est courte la prvalence est petite moins davoir une pidmie. Cette relation est importante car on a souvent dans les donnes publies la prvalence dune maladie mais si on veut faire une tude prospective de prvention ou de traitement de cette maladie, cest plus intressant de savoir lincidence de la maladie (nouveaux cas). Si on connat la prvalence et quon estime la dure de la maladie selon nos connaissance on peut driver lincidence. Il est parfois difficile de comparer les prvalence et incidence dune maladie pour 2 populations trs diffrentes parce quil peut y avoir plusieurs facteurs influenant ces donnes. Ainsi les taux de mortalit de nos jours sont difficiles comparer ceux des annes 30 parce que notre population est beaucoup plus vielle de nos jours Une faon de remdier ce problme est de calculer des taux spcifiques pour chaque catgorie (ge, sexe, race) de la population. On appelle cela la standardisation. La standardisation directe consiste utiliser une distribution standard et a y appliquer les taux de la maladie spcifiques chaque catgorie. Par exemple, si lon veut comparer les taux de mortalit de 1930 et de 2000, on peut utiliser la population de lan 1980 stratifie en groupe dge (0-10 ans, 10-20 ans, etc.) et on applique les taux de mortalit pour les diffrentes strates dges pour les 2 populations. Les taux de mortalit obtenus seront donc plus comparables parce que non influencs par la population totale qui diffre entre 1930 et 2000. Cependant, plusieurs maladies ou conditions sont intimement lies lge. On obtient donc des rsultats qui ne reprsentent pas la ralit si on modifie la distribution dge. Pour contourner ce problme, on peut comparer le taux de mortalit obtenu dans une population celui que lon sattendrait avoir normalement. Cette technique sappelle le taux de standardisation indirect. Elle consiste appliquer les taux de maladie dune population standard la population tudie. On obtient ainsi un nombre de maladie prvu (expected outcome). On divise le nombre de maladie observ par le nombre prvu pour obtenir un ratio de maladie standardis. Ce ratio permet dvaluer le taux de maladie par rapport une population standard. Voici un exemple pour des gens travaillant dans les mines damiante. Le taux de mortalit contrle est celle de la population gnrale dhomme blanc: Groupe dge # participant # dcs taux de mortalit # dcs prvu pop gnrale (taux mort * #particip) (/100 000) 15-24 1250 2 5 0.1 25-34 3423 3 7 0.2 35-44 3275 5 9 0.3 Total 7948 10 7 0.6 Taux de mortalit 1,25 par 1000 chez les participants (10 cas/7948 participants) vs un nombre de dcs prvu de 0.07 par 1000 hommes (7 par 100 000 contrles) Taux de mortalit standardis : taux de maladie observ / taux de maladie prvu=

page6

Cours dpidmiologie pour urgentiste #1 version sept 2008 1.2/0.07= 17.1 1.2 Mesures dassociation 1.2.1 Risque relatif Les mesures dassociation permettent dvaluer lampleur dune association entre une exposition (mdicaments, toxine etc.) et une maladie ou une condition X. Pour valuer les associations, il faut tre familier avec les tables 2x2. Ces tables prsentent dans un axe (habituellement en vertical) une variable indpendante (le facteur de risque ou lexposition ou le mdicament) et dans lautre axe une variable dpendante (le outcome : maladie ou condition X). Chacune des cellules se nomme a, b, c, d. Pour crer cette table, il est important davoir des variables dichotomiques (mort-vivant, maladie/pas de maladie, etc.). Lorsquil sagit dune variable continue ( ex chiffre de tension artrielle, niveau dhmoglobine) cette dernire doit tre transforme en variable dichotomique en choisissant un point de brisure (cut-off). On pourrait, par exemple, dcrter quune tension artrielle < que le 5me percentile est une hypotension (outcome+) et que tout ce qui est au-dessus est une absence dhypotension. Expos Non expos Outcome + A C Outcome B D

Le risque (R) consiste en la probabilit davoir loutcome choisi pour un groupe. Par exemple, on dira que pour les gens expos lamiante, le risque de dvelopper un cancer du poumon est de 1 pour 10 000 patients. Le risque relatif (RR) estime lampleur dune association entre une exposition et une maladie et indique la probabilit de dvelopper la maladie dans un groupe expos versus un groupe non expos. Dfinition: Ratio de lincidence de maladie dans le groupe expos divis par lincidence de la mme maladie dans un groupe non expos. RR : Incidence dans le groupe expos Incidence dans le groupe non expos Cest une mesure dassociation pouvant tre utilise pour les tudes prospectives comme les tudes de cohorte ou les essais cliniques randomiss. Pour ce faire on compare lincidence dune maladie dans le groupe expos divise par celle du groupe contrle. Dans la table e, on calculerait le risque relatif par la formule : RR = A / (A+B) C / (C+D) Un risque relatif de 1 indique que le risque de maladie est le mme dans les 2 groupes. Si RR est > 1, lexposition est un facteur de risque de la maladie tandis que si le RR est

page7

Cours dpidmiologie pour urgentiste #1 version sept 2008 entre 0 et 1, lexposition protge de la maladie. On ne peut pas avoir de valeur ngative. Lavantage principal du risque relatif est quil est facile concevoir lesprit. Un RR de 3 signifie que le risque de dvelopper la maladie est trois fois plus lev pour le groupe expos. Il ne nous donne aucune information sur lincidence de la maladie dans les 2 groupes. Le principal inconvnient du risque relatif est dordre statistique : il ne peut pas tre utilis dans les tudes o le ratio de cas et de contrles sont dtermins au pralable. Ainsi il ne peut pas tre utilis dans les tudes cas-tmoin. Il existe plusieurs faons de comparer les risques de diffrentes populations. La diffrence de risque (risk difference RD) ou risque attribuable est une mesure dassociation donnant de linformation sur leffet absolu davoir la maladie si on est expos ou non. Elle est dfinie comme la diffrence entre lincidence de la maladie entre les patients exposs et les non exposs. La diffrence entre le RR et risque attribuable peut tre illustr par cet exemple. Une longue tude sur leffet dune diminution du cholestrol avec la mdication X sur la mortalit dmontre une baisse de la mortalit de 30 %. Lorsque lon calcule le nombre de dcs vits par la diminution du cholestrol, la faible incidence de mortalit dans les 2 groupes (traits ou non) mne une baisse de seulement 4 cas sur 1000 patients. La diffrence de risque est une mesure brute de la diffrence entre les 2 groupes. Ainsi, une maladie qui est trs rares pourra avoir un risque relatif lev mais elle aura une faible diffrence de risque. En contrepartie, une exposition avec un effet minime aura un impact important sur la diffrence de risque dune maladie frquente. RD : A/A+B - C/C+D RD = Ie - Io O Ie = risque chez le groupe expos et Io= risque chez le groupe non expos Interprtation des RD : RD=0, pas dassociation RD>0: association causale positive entre lexposition et la maladie, indique le nombre de cas de maladie attribuable lexposition RD<0: association causale ngative entre lexposition et la maladie indique le nombre de cas protgs par lexposition Number needed to treat (NNT): La diffrence de risque (RD) est une bonne faon dvaluer lampleur de lamlioration due un traitement ou une intervention compar une autre intervention ou au processus de gurison naturelle. Cependant, elle est difficile conceptualiser lorsquon dcide du traitement. Le NNT nous dit combien de patients auraient besoin dtre traits pour prvenir un cas de maladie.

page8

Cours dpidmiologie pour urgentiste #1 version sept 2008 Il est calcul comme suit : 1/RD La rduction du risque relatif est une mesure du changement de risque (amlioration) de maladie si le patient est trait ou expos en relation au niveau de base de la maladie. Il existe 2 faons de le calculer : RRR= 1-RR RRR = (Ie - Io) / Io Le risque attribuable de la population (population AR) est une mesure de lincidence dune maladie dans la population gnrale moins lincidence de la maladie chez les patients non exposs. Cette mesure permet dvaluer 2 aspects dune exposition : Son effet sur la maladie et sa prvalence. Par exemple, lamiante augmente de beaucoup le risque de cancer chez les gens expos mais son exposition est rare et leffet de lamiante est faible sur la population gnrale. Dautre part, lobsit augmente un peu le risque de cancer mais elle tellement prsente que leffet sur la population est important. PAR = Ipop Io 1.2.2 Les ratio de cote (Odds ratio) La cote (odds) est une expression mathmatique souvent utilise dans les jeux de hasard (ou les paris sportifs). Dans des tudes de type cas-tmoins, les participants sont slectionns selon quils ont ou pas le rsultat ou la maladie. Cest souvent impossible de calculer le taux de dveloppement de la maladie selon la prsence dexposition ou pas. Dans ces cas, on ne peut calculer un RR mais il peut tre estim par le rapport de cotes (odds ratio) en calculant la probabilit dexposition chez les malades vs les contrles. Le OR est une approximation du RR dans la plupart des conditions rencontres dans les tudes cas-tmoins: il ny pas de maladie tudie dans le groupe contrle et les cas et les tmoins nont pas t slectionns selon leur exposition. Lorsque la prvalence de la maladie tudie est faible, les deux ratios sont trs prs lun de lautre. Contrairement au risque, le dnominateur dune cote ne contient pas tous les sujets risque mais seulement ceux qui sont non-exposs. Ainsi si un cheval a 3 chances sur 5 de gagner une course, on dit quil a une cote de 3 pour 2. Il a donc 3 chances de gagner pour 2 chances de perdre. Le ratio de cote (odds ratio) permet de comparer 2 cotes dans toutes sortes de situations. On obtient un ratio de cote en divisant le ratio dexposition du groupe malade par le ratio dexposition du groupe contrle. En utilisant la table ci haut on obtiendrait : OR : Probabilit dexposition chez les cas =A/C Probabilit dexposition chez les tmoins =B/D OR = A/C / B/D = A*D / B*C

page9

Cours dpidmiologie pour urgentiste #1 version sept 2008

Interprtation des rapports de cotes OR=1: pas dassociation entre lexposition et la maladie. OR<1: association ngative. tre expos protge de la maladie. OR>1: association positive. tre expos augmente la chance de la maladie. Les rsultats obtenus sont plus difficiles expliquer car il ne sagit de pas de la comparaison de 2 risques. Ainsi un OR de 3 ne signifie pas ncessairement que le risque de maladie est trois fois plus lev. a signifie que le ratio expos/non-expos est 3 fois plus lev chez les patients atteints de la maladie. Malgr cette complexit, les ratio de cote possdent dimportants avantages expliquant leur grande popularit dans la littrature mdicale. Premirement, on peut les utiliser dans tous les types dtudes (prospective, rtrospective, essaie clinique, etc.) car ils sont statistiquement robustes. De plus, les calculs mathmatiques complexes effectus par des ordinateurs rapportent habituellement des valeurs apparentes aux ratios de cote. Cest le cas particulier des rgressions linaires et des mta-analyses. Enfin une proprit des ratios de cote est que lorsque lincidence de la maladie est rare, le ratio de cote et le risque relatif sont semblables. 1.3 La valeur de p et les Intervalles de confiance : La valeur p mesure la force de lassociation et la taille de lchantillon. La valeur p reprsente la probabilit davoir une valeur aussi ou plus extrme que celle obtenue dans le cas ou il ny aurait pas de diffrence entre les traitements. Cette valeur na pas de signification si les deux traitements sont diffrents dans la ralit. Par exemple, une valeur p de 0.02 signifie que si deux traitements sont identiques, les risques davoir un rsultat aussi extrme que celui mesur est de 2 %. Ceci ne signifie pas que la probabilit davoir une diffrence est de 2%. La convention est quune valeur infrieure 0.05 est significative. Donc une petite diffrence peut tre statistiquement significative si la taille de lchantillon est grande et inversement une grosse diffrence peut ne pas tre statistiquement significative si la taille de lchantillon est trop petite. La valeur p devrait tre considre comme un guide plus que comme une conclusion ferme sur la valeur de lassociation. Pour pallier aux difficults dinterprtation de la valeur p on fait appelle aux intervalles de confiance Les intervalles de confiance (CI) reprsentent une fourchette de valeurs lintrieur de laquelle se retrouve la vraie mesure de leffet avec un certain degr dassurance. Ex: ARR est 11.9% ( 2.6%-21.2%): indique que la vraie ARR se situe avec 95% de confiance entre 2.6 et 21.2. Si les valeurs inclus dans lintervalle inclus 0, la valeur de p sera > 0.05 Si la valeur de 0 nest pas inclue comme dans lexemple, la valeur p est < 0.05 (p=0.02) La largeur de lintervalle de confiance indique la somme de variabilit inhrente lestimation donc leffet de la taille de lchantillon. Plus lintervalle de confiance

page10

Cours dpidmiologie pour urgentiste #1 version sept 2008 est large plus la variabilit de lestimation est grande et la taille de lchantillon est petite. Cest particulirement important dans linterprtation de rsultats dtudes qui ne sont pas statiquement significatifs. Ex: si lintervalle de confiance est troit, cela supporte limpression quil ny a pas daugmentation relle du risque. Si lintervalle est large, cest compatible avec une augmentation ou diminution relle du risque mais la taille de lchantillon ne permet pas davoir la puissance ncessaire pour exclure que la chance seule ait pu donner ces rsultats. Les notions de valeur p et dintervalle de confiance seront reprises de faon extensive au cours # 10.

page11

Cours dpidmiologie en urgence pdiatrique # 2 version sept 2007

Cours dpidmio #2 Tests diagnostics et scores de svrit


Objectifs du cours : - Savoir calculer et interprter les sensibilit, spcificit et valeurs prdictives - Savoir interprter les rapports de vraisemblance - Comprendre et savoir interprter une courbe ROC - Savoir comment crer et valuer un score de svrit - Notions de base sur lvaluation de la fiabilit dune mesure dichotomique - Comprendre la mesure de Bland-Altman pour les mesures continues Lecture faire en concordance avec le cours - Thayyil Set al., Is procalcitonin useful in early diagnosis of serious bacterial infections in children? Acta Paediatrica 2005; 94: 155-8. - Kharmada et al , A clinical decision rule to identify children at low risk for appendicitis. Pediatrics 2005 ; 116 : 709-16. http://pediatrics.aappublications.org/cgi/content/abstract/116/3/709 Exercices pratiques faire avant le cours. Il sagit dexercices qui serviront de point de dpart pour les discussions. Question #1 Pourquoi est-ce que la majorit des articles sur les tests diagnostics rapportent les valeur de sensibilit et spcificit au lieu des valeurs prdictives positive et ngative? Question #2 Sachant que le risque de bactrimie est de 2% pour un nourrisson fbrile et que le dcompte leucocytaire a une sensibilit de 80% et une spcificit de 60% ; quel est le risque de bactrimie chez un enfant fbrile avec des leucocytes levs ? Il existe au moins 2 faons de le calculer. Question #3 Dans larticle de Thayyil, la figure 1 montre la distribution des patients selon leur niveau de CRP ou procalcitonine et leur statut (SBI vs infection viral possible vs infection bactrienne possible). Si on dit que le seuil pour la procalcitonie est de 2 ng/l, pouvez vous remplir le tableau de la distribution des patients en utilisant la figure 1 : Infection srieuse (SBI) PCT > 2.0 (Test +) PCT < 2.0 (test -) total 3a Quelle est la valeur prdictive positive calcule? Quelle est votre analyse de ce tableau ? Question #4 Dans larticle de Thayyil Tous les autres total

Page 1

Cours dpidmiologie en urgence pdiatrique # 2 version sept 2007

Quel est le risque pr-test dinfection bactrienne srieuse ? Quel est le risque dinfection post-test si : - la CRP est leve (et que lon na mesur que la CRP)? Faites-les calculsCar lun des participants viendra les faire au tableau. - Les globules blancs sont levs (et quon na fait quune FSC) ? Faites les calculs, car lun des participants viendra les faire au tableau. Question #5 Dans larticle de Thayyil Quelles sont les sensibilits et spcificits pour les 2 valeurs de procalcitonine values ? valeur sensibilit spcificit 1-spcificit

Dessinez une courbe ROC pour valuer lhabilet de la procalcitonine prdire le risque dinfection bactrienne srieuse.

Question #6 6a Appliquer la grille du QUADAS larticle de Thayil


Item Yes Was the spectrum of patients representative of the patients who will () receive the test in practice? Were selection criteria clearly described? Is the reference standard likely to correctly classify the target condition? () () No Unclear

1. 2. 3. 4. 5. 6.

() () () () () ()

() () () () () ()

Is the time period between reference standard and index test short enough to be reasonably sure that the target condition did not change ( ) between the two tests? Did the whole sample or a random selection of the sample, receive verification using a reference standard of diagnosis? Did patients receive the same reference standard regardless of the index test result? () ()

Page 2

Cours dpidmiologie en urgence pdiatrique # 2 version sept 2007

7. 8. 9. 10. 11. 12. 13. 14.

Was the reference standard independent of the index test (i.e. the index test did not form part of the reference standard)? Was the execution of the index test described in sufficient detail to permit replication of the test? Was the execution of the reference standard described in sufficient detail to permit its replication? Were the index test results interpreted without knowledge of the results of the reference standard? Were the reference standard results interpreted without knowledge of the results of the index test? Were the same clinical data available when test results were interpreted as would be available when the test is used in practice? Were uninterpretable/ intermediate test results reported? Were withdrawals from the study explained?

() () () () () () () ()

() () () () () () () ()

() () () () () () () ()

6b Appliquer la grille du QUADAS larticle de Kharbanda


Item Yes Was the spectrum of patients representative of the patients who will () receive the test in practice? Were selection criteria clearly described? Is the reference standard likely to correctly classify the target condition? () () No Unclear

1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14.

() () () () () () () () () () () () () ()

() () () () () () () () () () () () () ()

Is the time period between reference standard and index test short enough to be reasonably sure that the target condition did not change ( ) between the two tests? Did the whole sample or a random selection of the sample, receive verification using a reference standard of diagnosis? Did patients receive the same reference standard regardless of the index test result? Was the reference standard independent of the index test (i.e. the index test did not form part of the reference standard)? Was the execution of the index test described in sufficient detail to permit replication of the test? Was the execution of the reference standard described in sufficient detail to permit its replication? Were the index test results interpreted without knowledge of the results of the reference standard? Were the reference standard results interpreted without knowledge of the results of the index test? Were the same clinical data available when test results were interpreted as would be available when the test is used in practice? Were uninterpretable/ intermediate test results reported? Were withdrawals from the study explained? () () () () () () () () () ()

Page 3

Cours dpidmiologie en urgence pdiatrique # 2 version sept 2007

Question #7 Dans une tude, on value lutilit dune FSC chez les patients suspects dappendicite. 100 patients furent tests et 20 avaient une appendicite. Au total, 30 patients ont eu une FSC perturbe. De plus, des 20 patients avec appendicite, 15 avaient une FSC perturbe. Pour une FSC perturbe, calculez : La VPP La VPN La sensibilit La spcificit Le risque de vraisemblance + Le risque de vraisemblance La prvalence de la maladie Question # 8 Pour ltude de Kharbanda Quel tait le but de ltude ? Quelle est la conclusion de ltude ? Quels sont le pourcentage et le nombre de patient ayant un CT scan au total ? Peut-on savoir le pourcentage ayant un ct-scan dans la priode de validation ? Si on considre que tous les patients avec critre positif selon la rgle base sur la rgression logistique devaient avoir un ct-scan (tel que recommand), quel serait le taux de CT-scan ? Et pour la rgle avec un arbre dcisionnel ? A votre avis, quel est le pourcentage de scan pour suspicion dappendicite au CHU SainteJustine (3 choix : 10 %, 50 %, 90%)? Quelles sont vos conclusions sur lutilit de cette rgle en pratique au CHU Sainte-Justine? Question # 9 On vous demande de crer une rgle de svrit afin de prdire le risque dpilepsie chez les patients se prsentant avec une convulsion fbrile. Donnez les tapes suivre allant de la conception la diffusion de cette rgle.

Question # 10

Page 4

Cours dpidmiologie en urgence pdiatrique # 2 version sept 2007

Quels sont les taux de corrlation simple (pourcentage des fois o les 2 observateurs sont en accord) ainsi que le score kappa pour les tudes suivantes : tude 1 Pour un test de dpistage pour une maladie prvalente chez 10% de la population Observateur 1 dit + Observateur 1 dit Total Observateur 2 dit + 2 18 20 Observateur 2 dit 18 162 180 Total 20 180 200 Corrlation : Kappa :

tude 2 Pour un test de dpistage pour une maladie prvalente chez 10% de la population Observateur 1 dit + Observateur 1 dit Total Observateur 2 dit + 12 8 20 Observateur 2 dit 8 172 180 Total 20 180 200 Corrlation : Kappa :

tude 3 Pour un test de dpistage pour une maladie prvalente chez 50% de la population Observateur 1 dit + Observateur 1 dit Total Observateur 2 dit + 50 50 100 Observateur 2 dit 50 50 100 Total 100 100 200 Corrlation : Kappa :

tude 4 Pour un test de dpistage pour une maladie prvalente chez 50% de la population Observateur 1 dit + Observateur 1 dit Total Observateur 2 dit + 80 20 100 Observateur 2 dit 20 80 100 Total 100 100 200 Corrlation : Kappa :

Page 5

Cours dpidmiologie en urgence pdiatrique # 2 version sept 2007

Tests diagnostics et scores de svrit


Le raisonnement clinique est bas sur une approche probabiliste o le mdecin tente de dterminer le diagnostic de son patient en liminant diverses pathologies laide de donnes de lanamnse, de lexamen o de rsultats de tests para-cliniques. Avant de raliser un test diagnostique, le contexte clinique permet dtablir une probabilit dexistence de la maladie, la probabilit pr-test. Gnralement, un test positif augmente la probabilit dexistence de la maladie, un test ngatif la diminue. La probabilit post-test reprsente la situation aprs le test. Chaque test diagnostic possde des caractristiques intrinsques dterminant sa validit. 2.1.1 Critres de validit pour une variable dintention primaire dichotomique. Les sensibilit et spcificit sont des mesures de validit bien connues. Elles sont utilises pour dcrire les tests donnant des rsultats dichotomiques (oui/non). On dit quelles sont robustes la population value car il sagit de proprits intrinsques au test : ainsi quelle que soit la prvalence de la maladie dans la population tudie, les valeurs de sensibilit et spcificits seront les mmes. On peut donc les valuer chez des populations ayant une prvalence leve de la maladie et les appliquer chez des populations o la maladie est plus rare. On utilise habituellement une table 2x2 pour rapporter les rsultats dune valuation dun test diagnostic (table 2.1). Dans un axe, on inscrit les rsultats du test diagnostic tandis que dans lautre axe, on rapporte ce quon croit tre la vraie valeur base sur un talon de rfrence (gold standard). Pour bien classer les sujets parmi les malades et les non-malades, il faut disposer dun talon de rfrence de qualit. Il existe des talons de rfrence de toutes sortes avec des niveaux de fiabilit variables: - Les rsultats de pathologie sont habituellement fiables mais difficiles appliquer - Il existe parfois des tests diagnostics fiables (CT-scan, tests sanguins complexe), pouvant servir dans un contexte dtude mais ne pouvant tre utilis dans une situation clinique pour des raisons deffets secondaires, de cots ou autre. - Lpreuve du temps est souvent utilise pour les tests valuant la svrit dune situation. On peut ainsi comparer le test avec le devenir du patient (dcs, greffe, etc) - On value parfois la svrit du patient en utilisant le consensus dun groupe dexpert pour chaque situation (adjudicating process, mthode de Delphi). - Enfin, certains construisent des talons de rfrence partir de la combinaison de plusieurs tests. Par exemple, il nexiste aucun talon de rfrence pour valuer un outil de triage pour lurgence parce quil nexiste aucune mesure fiable de lurgence dune situation. Pour remdier ce problme, les tudes valuants les outils de triage utilisent des marqueurs de svrit tel que ladmission, lutilisation des ressources, le temps pass lurgence ou ladmission aux soins intensifs. Pour viter les biais, il faut suivre certaines rgles : 1) ltalon de rfrence doit tre valu chez tous les sujets ; 2) ltalon de rfrence et le test tudi doivent tre valus de faon aveugle ; 3) si lon veut comparer 2 tests, les 2 doivent tre compar au mme talon de rfrence plutt que de les comparer entre eux ; 4) la validation dun test doit toujours tre faite avec le meilleur talon de rfrence disponibleun test ne peut pas savrer meilleur que ltalon de rfrence qui sert le valider. Table 2.1 Exemple de table pour valuer un test Maladie + Maladie Test + A (vrai positif) B (faux positif) Test C (faux ngatif) D (vrai ngatif) Total A+B C+D

Page 6

Cours dpidmiologie en urgence pdiatrique # 2 version sept 2007

Total

A+C

B+D

A+B+C+D

La sensibilit est dfinie comme le pourcentage des patients ayant la variable dintrt primaire (maladie) qui ont un rsultat positif au test. Il sagit donc du pourcentage de malade diagnostiqu par le test. Plus la sensibilit est leve, meilleure sont les chances de dpister la maladie avec le test. Dans le tableau 2.1, la sensibilit se calcule par la formule : A / (A+C). Ainsi, un test a la sensibilit leve manquera peu de cas. La spcificit est dfinie comme le pourcentage des patients nayant pas la variable dintrt (sains) qui ont un rsultat ngatif au test. Il sagit donc de lhabilet du test trouver les patients exempts de la maladie. Une spcificit leve signifie que le test na pas tendance sur diagnostiquer la maladie chez les patients non atteints. Dans la table 2.1, la spcificit se calcule par la formule : D / (B+D). Bien quelles dcrivent la fiabilit des tests, les sensibilit et spcificit ont le dsavantage de ne pas rpondre la question qui intresse le clinicien face au patient : quelle est la probabilit que mon patient ait la maladie ? Pour rpondre cette question, 2 mesures furent rapportes : Les valeur prdictive positive et valeur prdictive ngative. La valeur prdictive positive (VPP) est la probabilit davoir la variable dintrt primaire (maladie) pour les patients qui ont un test positif. Autrement dit : quel est la probabilit que le patient est la maladie si le test est positif. Dans le tableau 2.1, la VPP se calcule par la formule : A / (A+B). La valeur prdictive ngative (VPN) est la probabilit de ne pas avoir la variable dintrt primaire (sain) pour les patients ayant un test ngatif. Dans le tableau 2.1, la VPN se calcule par la formule : D / (C+D). Ces 2 mesures dpendent des sensibilit, spcificit et prvalence de la maladie. Plus la prvalence de la maladie est leve dans la population, plus leve sera la VPP et plus basse sera la VPN. Plus la prvalence est basse, plus la VPP sera basse et la VPN sera haute. Plus le test est sensible, meilleure est la valeur prdictive ngative Plus le test est spcifique, meilleure est la valeur prdictive positive. Bien que les VPP et VPN semblent plus utiles pour le clinicien parce que mieux applicables la clinique, ces mesures sont rarement utilises en pratique car, souvent, on ne connat pas la prvalence de la maladie dans la population de base. La valeur globale ou efficience dun test est un autre indice employ et dsigne la proportion des rsultats qui sont vrais : Valeur globale = (vrais positifs + vrais ngatifs) / (vrais positifs + faux ngatifs + faux positifs + vrais ngatifs) On peut calculer un intervalle de confiance (IC 95%) pour chacune de ces valeurs mais ces calculs seront discuts dans les modules 9 et 10. 2.2 Les rapports de vraisemblance(1)

Page 7

Cours dpidmiologie en urgence pdiatrique # 2 version sept 2007

Le rapport de vraisemblance (likelihood ratio LR) est un terme de plus en plus utilis dans la littrature mdicale pour dcrire la validit dun test diagnostic. Il sagit dune faon de synthtiser les valeurs de sensibilit et spcificit en une seule mesure afin dvaluer la probabilit de maladie post-test. Les rapports de vraisemblance se basent sur les thories des cotes (odds). Les cotes (odds) Le rapport du nombre de malades au nombre de non-malades est appel cote (odd). Il sagit dune faon diffrente dexprimer une proportion : au lieu de dire que la prvalence dappendicite est de 20 %, on dira quil y 20 appendicites pour 80 non-appendicites (20/80 ou 0.25). Toute proportion peut tre transforme en cote et vice versa. On utilise les cotes parce quelles ont certains avantages au niveau des calculs statistiques. Odds = risque / (1- risque) ET risque = Odds / (1+odds) Ainsi : Cote pr-test = probabilit pr-test / (1-probabilit pr-test) Cote post-test = probabilit post-test / (1-probabilit pos-test) Risque (probabilit) = Cote / (1+cote) Le rapport de vraisemblance positif (positive likelihood ratio, LR+) est calcul selon la formule : sensibilit/ (1-spcificit). Le rapport obtenu est le facteur par lequel on peut multiplier la cote pr-test pour obtenir la cote post-test chez les patients ayant eu un test positif. Il rsume ce que lexamen diagnostique nous apprend sur le patient. Il est propre cet examen diagnostique. On dit que le LR est robuste car il ne change pas dun contexte clinique lautre. Le LR+ a habituellement de valeur >1.0. Plus il est lev, plus le risque que le patient ait la maladie est lev. On considre quun LR+ est utile lorsque sa valeur dpasse 34. Le rapport de vraisemblance ngatif (negative likelihood ratio, LR-) est calcul selon la formule : (1-sensibilit) / spcificit. Le rapport obtenu est le facteur par lequel on peut multiplier la cote pr-test pour obtenir la cote post-test chez les patients ayant eu un test ngatif. Il est propre cet examen diagnostique. On le dit robuste car il ne change pas dun contexte clinique lautre. Le LR- a une valeur < 1.0. La formule qui lie le rapport de vraisemblance, le pr-test (probabilit a priori) et le post-test (probabilit a posteriori) est la suivante : Cote pr-test x rapport de vraisemblance = cote post-test Les rapports de vraisemblance sont utiles car ils sont robustes (peu influencs par la prvalence de la maladie) en plus de pouvoir tre utilis par les cliniciens en pratique. Il existe encore des articles o lon ne rapporte pas les valeurs de LR mais il est facile de les calculer en connaissant les sensibilit et spcificit. Voici un exemple de rapport de vraisemblance afin dillustrer le concept : Disons que le risque dappendicite aigu pour un enfant qui se prsente lurgence est de 20%. Un chirurgien dcide de faire une radiographie abdominale afin daider au diagnostic. Il sait que la sensibilit dun appendicolithe la radiographie est de 10% mais que la spcificit est de 99%. Il calcule les rapports de vraisemblances ainsi que la cote pr-test : LR+ : 0,10 /(0,01) = 10.0 LR- : 0,90 / 0,99 = 0.91

Page 8

Cours dpidmiologie en urgence pdiatrique # 2 version sept 2007

Cote pr-test : 0.2 /0.8 =

0.25

Si le patient une radiographie positive (prsence dappendicolithe), sa cote post-test sera de 0.25 * 10.0 = 2.5 Selon la formule donne dans lencadr plus haut : Probabilit post test = Cote post test / ( 1 + cote post test) Probabilit post test = 2.5 (1+2.5) = 0.71 ceci donne une probabilit dappendicite 71%. Si le patient une radiographie ngative, sa cote post-test sera de 0.25 * 0.91 = 0.23 ceci donne une probabilit dappendicite 18,6%. On voit donc que la prsence dappendicolithe augmente de beaucoup la probabilit dappendicite tandis que son absence na que peu deffet. Pour ceux qui naime faire les calculs, on peut toujours utiliser le nomogram suivant afin destimer la probabilit post test. Lavantage du nomogram est sa simplicit dutilisation au dtriment de la prcision.

http://xnet.kp.org/permanentejournal/fall97pj/gifs/testsfig4.gif

2.3 Les courbes ROC (receiver operating characteristic) Dans les cas discuts plus haut, il tait considr que les tests donnaient un rsultat dichotomique. Dans la ralit, la majorit des tests para-cliniques ont des valeurs continues ou multiples. Puisque la variable dintrt primaire est dichotomique, il faut donc dterminer un point de rupture (cut-off) qui sparera les rsultats dits positifs de ceux qui sont ngatifs. La variation de ce point de rupture influencera les spcificit et sensibilit. Ainsi, un changement qui augmente la sensibilit aura pour effet de diminuer la spcificit et vice-versa. La courbe ROC (de langlais Receiver Operator Characteristic curve) est un moyen dexprimer la relation entre la sensibilit et la spcificit dun test diagnostique. On la

Page 9

Cours dpidmiologie en urgence pdiatrique # 2 version sept 2007

construit en utilisant les valeurs de sensibilit et spcificit pour diffrents points de rupture. Les caractristiques de base de la courbe sont : - En ordonne (Y) on met la sensibilit tandis quen abscisse(x) on met la valeur de 1spcificit correspondante. - La courbe commence toujours du point (0,0) parce que lorsque la sensibilit est de 0%, la spcificit devrait tre de 100%. - La courbe termine toujours au point (1,1) parce que lorsque la sensibilit est de 100%, la spcificit devrait tre de 0%. - La courbe est toujours au-dessus de la diagonale des points (0,0) et (1,1) - Pour un test dont le rsultat sexprime sur une chelle numrique (par exemple, des dosages biologiques), on pourrait avoir une multitude de points, constituant une courbe. Dans la majorits des cas, par contre, on aura quelques points reprsentant les diffrentes valeurs dune chelle. - Plus la courbe ROC sloigne de la diagonale pour rejoindre langle suprieur gauche, plus le test diagnostique est globalement " puissant ". Voici un exemple : Un chercheur veut tester la validit de la numration leucocytaire pour dpister le risque dappendicite chez les patients avec douleur abdominale. Il obtient les rsultats suivant pour 3 points de rupture : Point Valeur Sensibilit Spcificit 1-spcificit A >15.0 40% 95% 5% B >10.0 80% 50% 50% C >5.0 90% 40% 60% Ceci signifie que si le chercheur voulait utiliser la valeur de >5.0 comme point de rupture pour dire que le patient a une appendicite, la sensibilit de son test serait de 90% mais sa spcificit serait de 40%. En utilisant les points de sensibilit et 1-spcificit, on construit la courbe :

On compare habituellement les diffrents tests diagnostic laide de laire sous la courbe ROC (AUC). Plus la courbe est dplace vers le haut et la gauche, plus laire sera grande et plus performant est le test. Laire est toujours plus grande que 0,5. Par exprience, les tests trs performants ont des valeur daire sous la courbe de >0.8.

Page 10

Cours dpidmiologie en urgence pdiatrique # 2 version sept 2007

On utilise parfois la courbe ROC pour dterminer le point de rupture dun test. Le point le plus proche du coin suprieur gauche est le plus performant. Ce point de rupture nest par contre pas ncessairement celui que lon voudra utiliser pour toutes les situations. Ainsi dans lexemple suivant les courbes C et D sont les courbes ROC schmatiques de deux tests. C est prfr si on veut privilgier la sensibilit au prix dune perte de spcificit. D est prfr si cest la spcificit qui prime mme au prix dun plus grand nombre de faux ngatifs.

2.4 Les scores de svrit Un score de svrit consiste en une mesure de la svrit de la condition dun patient base sur la somme de plusieurs critres clinique ou para-cliniques. Les scores de svrit sont de plus en plus populaire en mdecine. Il semble exister un score de svrit pour presque toutes les pathologie courantes..Ces scores de svrits ont plusieurs utilits : Dans les tudes cliniques, ils permettent de comparer des population semblables parce quon peut sassurer de la similarit des groupes avant ltude. Par exemple dans une tude sur la bronchiolite, on peut stratifier les groupes de randomisation selon le score RDAI. Ils permettent de suivre lvolution dune pathologie dans le temps chez une population. On peut ainsi dterminer que les patients admis aux soins intensifs ont des scores de svrit PRISM de plus en plus levs. Ils permettent de prvoir le devenir des patients ainsi que les soins de sant requis. Par exemple, le Pediatric Trauma Score aide dterminer si un patient doit aller dans un centre de traumatologie tertiaire lors de sa prise en charge par lambulancier.

Comment crer un score de svrit en 6 tapes Premirement, on dfini la question de recherche. Par la suite, on runit des experts sur un sujet afin de sortir tous les facteurs pouvant potentiellement tre corrls avec la svrit ou le devenir du patient. On utilise souvent une approche nomme mthode de Delphi(2). Cette mthode ne fait pas partie du cadre de ce cours mais il est bon de savoir quil sagit dune mthode o lon sonde

Page 11

Cours dpidmiologie en urgence pdiatrique # 2 version sept 2007

des experts sur un sujet en effectuant de multiples rondes de questionnairePar la suite, on dtermine quelle est la variable dintrt primaire la plus adquate. Cette dernire, doit bien reprsenter ce quon cherche valuer et tre le plus objectif possible. On value, dans une tude prospective ou rtrospective, lassociation entre chacun des facteurs de risque possible et la variable dintention primaire (analyse univarie). Par la suite, on fait une analyse multi-varie pour dterminer les facteurs statistiquement associs la variable dintrt primaire. La reproductibilit de la mesure des composantes du score doit tre effectue cette tape. Cette analyse permet de crer la rgle. Ltape suivante consiste valuer prospectivement la rgle dans une autre population. Enfin, le score devra idalement tre valid dans une tude multi-centrique prospective. Un exemple de dveloppement de score de svrit est donn en rfrence(3;4).

2.5 valuer un test diagnostic ou un score de svrit Il existe plusieurs paramtres valuer afin de dterminer de lutilit dun test diagnostic ou dun score clinique. La premire tape consiste sassurer de la reproductibilit de la mesure. Sil sagit dune mesure effectue par une machine ou dun test enzymologique, les auteurs devront dmontrer que les rsultats du test sont constant lorsque mesurs par 2 personnes diffrentes. Sil sagit dun score clinique, les auteurs devraient dmontrer, pour chaque constituant du score, que diffrents observateurs obtiennent le mme rsultat. Ceci est dmontr par le coefficient de corrlation Kappa pour les variables dichotomiques. Pour les variables continues, on utilise des courbes de corrlation et des coefficients de corrlation intra-classe. Ces coefficients seront discuts plus loin Une fois quil est dmontr que le test ou score est reproductible, il faut valuer sa validit interne. Cette dernire est la proprit dun test dire la vrit. Il existe plusieurs faons dtudier la validit dun test. La plus frquente est dvaluer lhabilet du test prdire une variable dintention primaire (outcome) vrifie avec une mthode sure (gold standard). Tel que discut plus haut, cet talon de rfrence peut tre un autre instrument de mesure, un rapport de pathologie, lvolution du temps (pour prdire la mort ou lhospitalisation par exemple) ou autre Il existe, par contre, certaines situations o il ny a pas de mesure parfaite. Dans ces cas les chercheurs peuvent dvelopper des stratgies pour infrer la vrit. La validit de construit consiste comparer les rsultats dun test ou score avec une hypothse thorique fonde par les chercheurs. Par exemple, pour une chelle de triage de la svrit des patients se prsentant lurgence, on pourrait supposer que le niveau de triage devrait corrler avec les taux dadmission lhpital et aux soins intensifs ainsi quau taux de dcs. La validit de contenu consiste sassurer que le test/score incorpore tous les aspects du domaine quil value. Par exemple, un score sur la qualit de vie devrait avoir des items touchant la sant mais aussi la vie sociale et familiale du patient. La validit par critre consiste vrifier que le test/ score est en corrlation avec dautres variables dintention primaires parallles au phnomne tudi.

Page 12

Cours dpidmiologie en urgence pdiatrique # 2 version sept 2007

La dernire tape consiste vrifier la validit externe du test/score. Ceci est lapplication des rsultats obtenus dans la population tudie une plus vaste population. Il est important de vrifier les critres dinclusion et dexclusion de la population tudie afin de savoir si la population tudie ressemble celle laquelle on veut appliquer le test. Il existe souvent beaucoup de restrictions linclusion dans une tude qui diminuent la porte des rsultats obtenus. Dautres qualits vrifier afin de sassurer de lutilit dun test sont la facilit dutilisation, la facilit dinterprtation, lapplicabilit clinique, le rapport cot-bnfice et la disponibilit et la pertinence. Au cours des dernires annes, un outil a t dvelopp pour standardiser lvaluation des tudes traitant de tests diagnostic. Il fut cr suite de multiple rencontre dexpert sur le sujet. Cet outil permet lvaluation qualitative des tudes sur des tests diagnostics avant des inclure dans une mta-analyse par exemple. Les auteurs ont nomm loutil QUADAS pour Quality Assessment of Diagnostic Accuracy Studies(5). Il sagit dun nonc de 14 items qui doivent tre valus par les rviseurs de larticle. Chacun des items se rpond par oui, non ou inconnu. Les auteurs nont pas voulu que le QUADAS soit utilis comme un score de qualit mais plutt comme un outil dvaluation qualitative standardise. Loutil QUADAS est dcrit la fin du prsent texte. 2.6 Mesurer la corrlation entre plusieurs observations (fiabilit ou reliability anglais) Que ce soit pour une mesure objective effectue laide dun appareil ou pour une mesure clinique, il est important dvaluer la reproductivit inter-observateur. On appelle fiabilit (reliability) la mesure de cette reproductibilit. 2.6.1 Variables catgoriques (score Kappa) Pour les variables catgoriques, loutil de mesure de fiabilit utilis est souvent le score Kappa(6;7). Cette mesure permet dvaluer la corrlation entre plusieurs observateurs qui nest pas d au hasard. On dit que la valeur du Kappa va de 0 (aucune corrlation non-due au hasard) 1 (corrlation parfaite) mais il est aussi possible davoir des kappa ngatifs si les observateurs sont en dsaccord plus souvent que ne le serait le hasard (corrlation pire que le hasard !). On peut calculer un score Kappa pour un nombre dobservateurs allant de 2 un nombre trs lev. La formule pour le calcul dun score kappa est la suivante : = (Po-Pe) / (1-Pe) o Po = La proportion des mesures concordantes observes Pe = La proportion des mesures concordantes prdites par le hasard Voici un tableau utilis pour faire la nomenclature des formules utiliser Observateur 2 + Observateur 2 Total Observateur 1 + A C (C1) Observateur 1 B D (C2) Total (R1) (R2) (N)

Page 13

Cours dpidmiologie en urgence pdiatrique # 2 version sept 2007

Voici un exemple de calcul pour une table montrant les rsultats dune tude sur lefficacit dun test X dterminer la prsence dune maladie Y. Table des rsultats de ltude : Observateur 2 + Observateur 2 Total Observateur 1 + 80 (A) 20 (C) 100 (C1) Observateur 1 10 (B) 90 (D) 100 (C2) Total 90 (R1) 110 (R2) 200 (N)

Po = La proportion des mesures concordantes observes = (80+90) / 200 = 85% Dans ce tableau, on voit que lobservateur 1 a un test + pour 50 % des rsultats tandis que lobservateur 2 a un test + pour 45% (90/200) des rsultats. Si la distribution se faisait au hasard, il y aurait donc la distribution suivante (formule entre les parenthses) : Observateur 2 + Observateur 2 Total Observateur 1 + 45 (R1* C1/ N) 55 (R2* C1/ N) 100 Observateur 1 45 (R1* C2/ N) 55 (R2* C2/ N) 100 Total 90 110 200

Pe = La proportion des mesures concordantes prdites par le hasard = (45+55) / 200 Le score Kappa est donc de : (170/200 - 100/200) / 1- 100/200 = 0.35 / 0.5 = 0.7

Une autre faon de calculer les probabilits observe et celle prdite par le hasard est dutiliser les formules : Po = La proportion des mesures concordantes observes (a + d) / N Pe = La proportion des mesures concordantes prdites par le hasard (r1c1 + r2c2)/ N2 Linterprtation des scores Kappa ne se fait pas de faon intuitive. Des chercheurs (Landis et Koch)(8) ont propos les barmes suivant pour la corrlation en fonction des scores Kappa : - < 0.40 faible corrlation - 0.40-0.60 modre - 0.60-0.80 bonne - >0.80 presque parfaite. Limitations : Score peu fiable lorsque la concordance ou la discordance sont totales parce quil ne peut plus diffrencier la concordance relie la chance de la concordance observe

Page 14

Cours dpidmiologie en urgence pdiatrique # 2 version sept 2007

Score kappa varie en fonction de la prvalence des cas dans les diffrentes cellules du tableau de contingence indice de concordance lev et un score k bas selon la disposition des nombres dans les cellules (une disposition trs asymtrique va donner un score k plus bas) On ne peut pas calculer le score si le nombre de colonne est diffrent du nombre de rang et lorsquil y a un 0 dans une cellule. 2.6.2 Variables continues (corrlation) En mdecine, il existe plusieurs situations o lon veut mesurer la reproductibilit dune mesure continue. Pour ce faire, on utilise la corrlation linaire. Le graphique suivant est une illustration de la corrlation entre les observations de 2 valuateurs pour une mesure quelconque. Chaque point reprsente un spcimen valu par 2 observateurs. Sur laxe des x se trouve la valeur mesure par lvaluateur A tandis que sur laxe des Y sont les mesure de lvaluateur B. Dans une situation idale, tous les points seraient aligns parfaitement. La corrlation R est une valeur mesure tmoignant de la distance entre les points et la ligne idale. La valeur R va de -1 (pour une corrlation inverse parfaite +1 pour une corrlation parfaite). Une valeur de 0 signifie quil ny a pas de corrlation.
100 90 80 70 60 50 40 30 20 10 0 0 20 40 60 80 100 Observateur A

Une corrlation leve signifie que les 2 mesures varient de faon proportionnelle mais a ne veut pas dire que les deux mesures sont pareilles. Dans la figure ci-haut, un changement dans lchelle des x ne changera en rien la corrlation mais on ne pourra plus dire que les observateurs disent la mme choseLa figure suivante dmontre un bel exemple de situation o la corrlation R est leve mais les 2 mesures ne sont pas pareilles.
100 90 80 70 60 50 40 30 20 10 0 0 10 20 30 Observateur A

Page 15

Observateur B

Observateur B

Cours dpidmiologie en urgence pdiatrique # 2 version sept 2007

2.7 La mesure de Bland-Altman(9) Lutilisation de la corrlation R peut savrer adquate dans la mesure de la corrlation entre 2 individus utilisant le mme outil de mesure mais lorsque lon veut comparer un nouvel instrument de mesure un ancien, il ne faut pas utiliser la corrlation. En 1983, Douglas Altman et Martin Bland ont propos une nouvelle faon dvaluer la corrlation entre deux instruments de mesures dans la revue Statistician (Altman DG, Bland JM. (1983). Measurement in medicine: the analysis of method comparison studies. The Statistician 32, 307-317). Personne nen a parl dans le monde mdical jusquau jour o ils ont publi un article similaire dans le Lancet en 1986 (Bland JM, Altman DG. (1986). Statistical methods for assessing agreement between two methods of clinical measurement. Lancet, 1986, 307310). Cet article expliquait une faon dvaluer la corrlation entre 2 mesures continues maintenant connue sous le nom de mthode de Bland-Altman. La mesure de Bland-Altman est complexe. On pourrait la rsumer ainsi : lvaluation de la frquence o la diffrence entre les 2 mthodes est plus grande quune valeur juge cliniquement significative. Nous expliquerons la mthode laide dun exemple rcemment publi par le groupe durgentiste. Il sagit dune tude o lon valuait linterchangeabilit des diffrentes chelles de douleur pour les enfants avec douleur abdominale. Ltude fut mene auprs de 90 enfants souffrants de douleur abdominale. Dans cette tude, la mesure du VAS (Visual Analog Scale) tait considre comme le Gold standard. Le VAS est compos dune ligne droite de 100 mm et lenfant doit faire un trait lendroit reprsentant le mieux sa douleur allant de pas de douleur la pire douleur quil est dj eue. Dans ltude, on lui comparait 3 autres chelles de douleur pdiatriques. La premire tape faire est de dterminer quelle diffrence entre loutil test et loutil de rfrence est cliniquement significative. Ceci se fait souvent avec lopinion dexpert dans le domaine. Il faut idalement le faire au moment dcrire le protocole de recherche. Pour ltude de la douleur, il existe des tudes suggrant quune diffrence de 20 mm dans le VAS devrait tre considr cliniquement significatif. Ce fut donc la limite choisie La deuxime tape est de faire un graphique o lon crit les diffrences entres les deux mesures en fonction de la valeur moyenne des 2 mesures. Voici le graphique gnr par la comparaison des valeurs de VAS et dune autre chelle de douleur (CAS). Les 2 lignes en gras qui dpassent reprsentent les limites cliniquement significatives:

Page 16

Cours dpidmiologie en urgence pdiatrique # 2 version sept 2007

50 40 30 20 10 0 -10 -20 -30 0 20 40 60 80 100 120 AVERAGE of VAS and CAS -1.96 SD -18.6

VAS - CAS

+1.96 SD 14.4 Mean -2.1

La troisime tape est de comparer lintervalle de confiance de la diffrence (qui se dfini comme la diffrence moyenne 1.96 dviation standard) avec les limites cliniquement significatives. Dans lexemple ci-haut, on voit que lintervalle de confiance va de -18,6 +14,4). On peut donc conclure que les diffrences entre les 2 mesures ne sont pas cliniquement significatives. Les outils de mesure sont donc interchangeables. En rsum, voici les termes utilis dans la mthode de Bland-Altman ; Limit of acceptability : ce sont les diffrences maximales qui seraient cliniquement acceptables (dans lexemple 20 mm) Limit of agreement : Ce sont les limites de lintervalle de confiance 95% des diffrences (dans lexemple -18,6 +14.4) On conclut que 2 mthodes sont interchangeables si les limit of agreement sont plus petites que les limit of acceptability Avantages de la mthode de Bland Altman: Ce test permet de : - mesurer la diffrence entre les 2 tests (moyenne des diffrences entre les tests DS) - vrifier si la diffrence entre les 2 tests est cliniquement significative - vrifier si la concordance demeure bonne tout au long de ltendue des rsultats du test - vrifier sil existe une relation entre la diffrence entre les test et le rsultat du test (corrlation significative entre le rsultat moyen des deux tests et la diffrence entre les tests)
Page 17

Cours dpidmiologie en urgence pdiatrique # 2 version sept 2007

Item

Voici une copie de loutil QUADAS Yes No Unclear

1. 2. 3.

Was the spectrum of patients representative of the patients who will receive the test in practice? Were selection criteria clearly described? Is the reference standard likely to correctly classify the target condition? Is the time period between reference standard and index test short enough to be reasonably sure that the target condition did not change between the two tests?

() () ()

() () ()

() () ()

4.

()

()

()

5. 6. 7.

Did the whole sample or a random selection of the sample, receive verification using a () reference standard of diagnosis? Did patients receive the same reference standard regardless of the index test result? Was the reference standard independent of the index test (i.e. the index test did not form part of the reference standard)? () ()

() () ()

() () ()

8.

Was the execution of the index test described in sufficient detail to permit replication of the () test? Was the execution of the reference standard described in sufficient detail to permit its replication? Were the index test results interpreted without knowledge of the results of the reference standard? ()

()

()

9.

()

()

10.

()

()

()

11.

Were the reference standard results interpreted without knowledge of the results of the index ( ) test? Were the same clinical data available when test results were interpreted as would be available ( ) when the test is used in practice? Were uninterpretable/ intermediate test results reported? Were withdrawals from the study explained? () ()

()

()

12. 13. 14.

() () ()

() () ()

BMC Med Res Methodol. 2003; 3: 25. Published online 2003 November 10. doi: 10.1186/1471-2288-3-25. Copyright 2003 Whiting et al; licensee BioMed Central Ltd. This is an Open Access article: verbatim copying and redistribution of this article are permitted in all media for any purpose, provided this notice is preserved along with the article's original URL.

Page 18

Cours dpidmiologie en urgence pdiatrique # 2 version sept 2007

Reference List (1) Halkin A, Reichman J, Schwaber M et al. Likelihood ratios: getting diagnostic testing into perspective. QJM. 1998;91(4):247-258.

(2) Jones J, Hunter D. Consensus methods for medical and health services research. BMJ. 1995;311(7001):376-380.

(3) Leclerc F, Leteurtre S, Duhamel A et al. Cumulative influence of organ dysfunctions and septic state on mortality of critically ill children. Am J Respir Crit Care Med. 2005;171(4):348-353.

(4) Leteurtre S, Martinot A, Duhamel A et al. Development of a pediatric multiple organ dysfunction score: use of two strategies. Med Decis Making. 1999;19(4):399-410.

(5) Whiting P, Rutjes AW, Reitsma JB et al. The development of QUADAS: a tool for the quality assessment of studies of diagnostic accuracy included in systematic reviews. BMC Med Res Methodol. 2003;3:25.

(6) Cohen J. A coefficient of agreement for nominal scales. Educ Psychol Meas. 1960;20:27-46.

(7) McGinn T, Wyer PC, Newman TB et al. Tips for learners of evidence-based medicine: 3. Measures of observer variability (kappa statistic). CMAJ. 2004;171(11):1369-1373.

(8) Landis JR, Koch GG. The measurement of observer agreement for categorical data. Biometrics. 1977;33(1):159-174.

Page 19

Cours dpidmiologie en urgence pdiatrique # 2 version sept 2007

(9) Bland JM, Altman DG. Statistical methods for assessing agreement between two methods of clinical measurement. Lancet. 1986;1(8476):307-310.

Page 20

Cours dpidmio #3 pour fellow de lurgence version dc 2006

Cours dpidmio #3 Les tudes descriptives et analytiques


Objectifs du cours: - Connatre les caractristiques inhrentes aux tudes descriptives - Connatre les caractristiques inhrentes aux tudes cas-tmoin - Connatre les caractristiques inhrentes aux tudes de cohorte Lecture : - Martens et al., Predictiors of Hospital Readmission of Manitoba Newborn Within Sixweeks Postbirth Discharge : A population-Based Study. Pediatrics 2005; 114(3):708-713. http://pediatrics.aappublications.org/cgi/content/abstract/114/3/708 - Goldman et al.,Patients who leave the pediatric emergency department without being seen: a case-control study. CMAJ 2005; 172(1): 39-43. http://www.cmaj.ca/cgi/content/abstract/172/1/39 - Valent et al., A case-crossover study of sleep and childhood injury. Pediatrics 2001; 107 (2); e23. http://pediatrics.aappublications.org/cgi/content/abstract/107/2/e23 Question #1 Laquelle des figures suivantes a la corrlation la plus leve ?
Table 1 a

9 8 7 6 5 4 3 2 1 0 0 2 4 6 8 10

Table 1 a

Table 1 b 10 9 8 7 6 5 4 3 2 1 0 0 1 2 3

Table 1 b

Page 1

Cours dpidmio #3 pour fellow de lurgence version dc 2006

Question #2 Dessinez une tude cas-tmoin sur un sujet durgence pdiatrique. Quelle est la question ? Comment allez-vous identifier les cas ? Quelle est la population de base ? Quel sera le groupe contrle ? Comment allez-vous valuer lexposition ? Question #3 (concernant larticle de Goldman et al dans CMAJ) Quels sont les cas ? Quels sont les contrles ? Quelle est la population de base ? Selon la table 1, y a-t-il des facteurs associs avec le fait de partir avant davoir t vu ? Quelle est votre interprtation de ces rsultats ? Goldman et ses collgues disent quils ont fait une tude cas-tmoin. tes-vous daccord ? Comment pourrait-on aussi appeler ce type dtude et pourquoi ? Question #4 Une tude de cohorte value si il y a une association entre porter une tuque pour aller lcole et le risque davoir la grippe chez les enfants dge scolaire. Suite un sondage men auprs des mres des enfants, on dcide de suivre pendant un hiver complet 200 enfants porteur de tuque vs 200 enfants dont les parents ne demande pas de porter la tuque. Voici le tableau des rsultats : Enfant porteur de tuque Enfant Cool Total Grippe 60 90 150 Pas de grippe 140 110 250 total 200 200 400

Quel est le risque relatif davoir une grippe si un enfant porte une tuque ? Si tous les enfants cool (pas de tuque) portait une tuque, de combien leur taux de grippe baisserait-il ? Quelle est lincidence de grippe ? -Chez les porteurs de tuque ? - Dans la population de lcole ? Question # 5 Pour larticle de Valent et coll (Ped 2001) au sujet du risque daccident en relation avec le taux de fatigue, quel est lavantage dutiliser ce type de design vs une tude cas-tmoin traditionnelle ? Les auteurs rapportent le risque relatif dans une tude cas-tmoin !!!! Comment peuvent-ils le justifier ? quel type de biais sont sujet les tudes case-crossover ? Y a-t-il des rsultats de la table 1 qui nous font penser que ce type de biais peut tre prsent ? Certains chercheurs ont suggrer que la priode contrle (24 48h pr accident) peut-tre associ la priode cas. Par exemple, pendant une priode de fte, un enfant dormira peu

Page 2

Cours dpidmio #3 pour fellow de lurgence version dc 2006

pendant quelques jours conscutifs. Selon ces chercheurs, il aurait fallu choisir une autre priode. Quels serait leffet sur le odds-ratio si les 2 priodes taient effectivement associes ? Comment remdier ce problme ? Question #6 Pour larticle de Martens et al quels sont les 2 types dtude rapportes dans larticle ? Quelle est votre interprtation de la figure 3 ? Quelle est votre interprtation de la figure 4 ?

Page 3

Cours dpidmio #3 pour fellow de lurgence version dc 2006

3.1. Les tudes descriptives.


Les tudes descriptives dcrivent la distribution des maladies en relation avec certaines variables telles que le temps ou les endroits. Ces tudes dcrivent lincidence ou la prvalence dune maladie pour une population donne. Elles utilisent linformation provenant de diverses sources (souvent gouvernementales) comme les registres de cancer, les donnes provenant darchive mdicale ou les sondages et recensements. Linstitut statistique Canada est un bon fournisseur de donnes pour ce genre dtude. Puisquelles utilisent des donnes dj collectes, les tudes descriptives sont souvent plus rapides et moins dispendieuses. Elles peuvent rarement, par contre, tester des hypothses et servent surtout en gnrer ou soulever des questions. On peut parfois se servir des rsultats dtudes descriptives titre dtude prliminaire. Il existe 3 types dtudes descriptives - tudes de corrlations - Srie de cas - tudes transverses (cross-sectionnal) Les tudes de corrlation Les tudes de corrlation utilisent les donnes concernant des populations. Dans ces tudes, pour les diverses populations, on met le taux dune maladie X en relation avec une variable Y. Pour ce faire on utilise habituellement les rsultats de 2 tudes : lune value lincidence ou la prvalence dune maladie X en fonction des populations tandis que lautre value la prvalence du facteur Y en fonction des populations. Par exemple, larticle de Martens et coll. (Peds 2005 ; 114/3/708-713) rapporte une tude de corrlation pour valuer si le taux de rhospitalisation des nouveau-ns est associ au niveau socio-conomique ou au taux de mortalit infantile (fig 3 et 4). Pour ce faire, ils ont tudi les taux de r-hospitalisation dans les 6 premires semaines de vie pour les nourrissons provenant de 11 rgions rurales du Manitoba et de 12 rgions de Winnipeg. Ils ont aussi valu le taux de mortalit des prmaturs et le niveau socio-conomique des gens pour chacune de ces rgions. Ils ont finalement fait la corrlation entre les taux de r-hospitalisation et le taux de mortalit des prmaturs ou le niveau socio-conomique. Dans la figure 3 et 4, chaque point reprsente 1 rgion. Les rsultats de ces tudes sont habituellement rapports en terme de CORR LATION R. Le coefficient de corrlation r (allant de -1 +1) est une mesure de la dispersion des points. Plus il est loin de 0, plus la corrlation est forte. Lorsque les points sont aligns et forment une ligne droite parfaite, on obtient une corrlation parfaite de +1 (relation proportionnelle) ou 1(relation inversement proportionnelle). La pente de la courbe nest pas une indication de la corrlation car on peut changer la pente de la courbe en modifiant lchelle du graphique. Lavantage principal des tudes de corrlation est son faible cot et la vitesse dexcution. Pour les mener, il suffit habituellement dutiliser des bases de donnes dj existantes (provenant de statistique Canada ou de la RAMQ par exemple). Une limite importante des tudes de corrlation est labsence de lien causal direct entre le maladie X et la variable Y sur une base individuelle. On peut, par exemple, montrer par une tude de corrlation que le taux de cancer de la prostate est corrl avec le nombre de

Page 4

Cours dpidmio #3 pour fellow de lurgence version dc 2006

tlviseur par maison en comparant les taux de cancer de la prostate et le nombre moyen de tlviseur par maison de diffrents pays.Labsence de lien temporel entrane que lon ne peut pas toujours dterminer lequel des 2 vnements tudi est prcurseur de lautre (quel est lagent causal et quelle est la consquence). Une autre limite revient au fait que lon compare habituellement de valeur moyennes (pour la variable Y) qui peuvent ne pas montrer les subtilits de la relation (par exemple une population peut avoir une consommation moyenne dalcool leve mais avoir peu dindividu faisant des excs tandis quune autre population peut avoir plusieurs individus faisant des excs les mettant risques mais avoir une moyenne de population plus basse). Enfin, la forte possibilit de facteur confondant peut limiter la validit de ces tudes. Les sries de cas ou rapport de cas Cest probablement du type de publication mdicale le plus frquent. Il sagit habituellement dun mdecin lesprit veill qui rapporte une situation nouvelle ou inhabituelle concernant un ou une srie de patients. Ce type de publication constitue une zone charnire entre la clinique et la recherche pidmiologique. Ces rapports servent souvent gnrer des questions qui pourront ultrieurement tre values. Un des exemples les plus connus de ce type de publication est le rapport de 5 hommes homosexuels ayant prsents une pneumonie Pneumocytis Carinii entre octobre 1980 et avril 1981 Los Angeles (MMWR, 1981).Suite la rvlation de ces cas, une surveillance plus accrue fut instaure par le CDC Amricain. Cette surveillance permit de dvoiler que les patients avaient acquis un type dimmunosuppression secondaire une maladie transmissible par le sang. Ceci mena finalement la dfinition du SIDA puis la dcouverte du VIH. Une limite importante des sries de cas est quil ny a pas de groupe contrle afin de sassurer que le phnomne rapport nest pas quune concidence. De plus les sries de cas ne se basent habituellement que sur lexprience dun ou de quelques mdecins et ceci en limite la sensibilit. Aussi, on ne rapporte que le nombre de cas sans avoir une ide du dnominateur afin de pouvoir calculer lincidence ou la prvalence. tudes transverses (cross-sectionnal) Il faut voir les tudes transverses comme une photo prise un moment prcis dans le temps. Il sagit dtude o la maladie et lexposition sont values au mme instant dans une population prcise. Cette photo donne une ide de la prvalence dune maladie dans la population ainsi que des facteurs de risque. Larticle de Martens et coll. (Peds 2005 ; 114/3/708-713) dcrit aussi une tude transverse. Pour cette partie, les auteurs ont valu sur une base individuelle la relation entre le risque dtre admis dans les 6 premires semaines et plusieurs facteurs dmographiques et mdicaux. La table 2 donne les Odds Ratio pour divers facteurs. Le fait que certains facteurs mesurs ne puissent tre modifis avec le temps rend cette tude un peu plus analytiques que la moyenne des tudes descriptives observationnelles. Il sagit presque dune tude cas-tmoin On rapporte habituellement les rsultats des tudes transverses de 2 faons : Premirement, elles permettent de donner la prvalence dune maladie. Deuximement, on peut donner les odds ratio pour lassociation entre la maladie et les facteurs de risque. Un avantage important de ce type dtude est que lon value les participants sur une base individuelle. La corrlation entre les variables indpendantes et la maladie est donc plus

Page 5

Cours dpidmio #3 pour fellow de lurgence version dc 2006

prcise. De plus, il sagit dune tude qui se mne rapidement car on na pas suivre les patients. La relation temporelle entre les 2 variables nest par contre pas value et ceci peut tre une source de biais important. Par exemple une tude transverse pourrait montrer une certaine corrlation entre les enfants non asthmatiques et le tabagisme chez les parents puisque les parents denfant asthmatiques auront tendance cesser de fumer aprs que leur enfant fut diagnostiqu dasthme. Une autre limite est le fait que lon ne mesure que la prvalence. Ainsi une variable, qui augmenterait la survie des patients pourrait semble associe la maladie. Il existe 2 types de fentres de temps pour ces tudes : La premire consiste valuer tous les patients pendant la priode de temps selon le calendrier (exemple : jan avril 2005). La deuxime consiste valuer les patients une priode prcise de leur vie (exemple : la naissance, lentr lcole, etc.). 3.2. Les tudes cas-tmoin. Les tudes cas-tmoin sont des tudes observationnelles analytiques o les participants sont choisis en fonction quils aient (cas) o quils naient pas (tmoin) une maladie particulire. Par la suite, on compare les taux dexposition une ou plusieurs variables indpendantes. Ces tudes sont habituellement rtrospectives. Elles ont plusieurs avantages : - Permet dtudier les maladies dont les expositions on eu lieu longtemps avant la maladie - Plus rapide et moins chre complter d leur nature rtrospective - Permet dtudier des maladies rares parce quon fixe dans la mthode le nombre de cas et de tmoin - Permet dvaluer plusieurs variables dexposition simultanment. Elles ont, par contre, quelques dsavantages : - Risques plus lev davoir un biais de slection parce que lexposition et la maladie ont dj eu lieu lors de linclusion dans ltude. o La connaissance de lexposition peut influencer le diagnostic : par exemple, un mdecin voyant une patiente en choc septique posera plus facilement un diagnostic de syndrome du choc toxique si il sait que la patiente portait un tampon vaginal dans les derniers jours. o Les patients auront une tendance consulter plus rapidement sil croit avoir t expos un facteur de risque. Par exemple, le taux de consultation pour douleur rtro sternal augmentera chez les patients ayant pris du vioxx depuis lannonce de son risque associ aux infarctus. o De plus, certaines expositions peuvent donner des effets qui mneront consulter un mdecin. Ceci augmentera le nombre de test fait chez les patients et augmentera le risque de trouver une maladie. Cest ce que les gens suggraient lors des premires tudes sur leffet de lstrogne sur le risque de cancer de lutrus. Lstrogne augmentait les saignements vaginaux et ceci augmentait le taux de consultation par les femmes sous hormonothrapie. Plusieurs de ces femmes furent investigues et le taux de cancer de lutrus sest avr plus leve que dans la population gnrale. Il est possible que

Page 6

Cours dpidmio #3 pour fellow de lurgence version dc 2006

plusieurs de ces femmes nauraient pas consult aussi prcocement si elles navaient pas pris dhormonothrapie. Risque de biais dobservation. o Les patients avec une maladie auront peut-tre tendance se rappeler diffremment de leur exposition une fois quon leur diagnostic une maladie.

La facilit dexcution ainsi que le cot modr des tudes cas-tmoin en fait des tudes idales pour faire une premire valuation dune question (hypothesis testing). Ce type dtude bien mene permet dvaluer une hypothse de faon adquate et de rpondre une question prcise. Le risque de biais plus lev fera par contre douter certains chercheurs quand la validit des rsultats rapports. Il faut donc souvent confirmer les rsultats dune tude cas-tmoin par une autre tude prospective. On peut dfinir 8 tapes ncessaires pour dessiner une tude cas-tmoin : 1. Dterminer la question de recherche laquelle on veut rpondre. 2. tablir des critres diagnostics prcis et objectifs afin davoir les groupes les plus homognes possibles 3. Identifier la population de base do viennent les cas. Il peut sagir de tous les patients venant une urgence ou de tous les membres dune population (cole, ville, etc.). Le risque de biais de slection est moindre avec les populations compltes. 4. Choisir les tmoins constitue habituellement la partie la plus complique de ltude. Il faut des participants qui nont pas la maladie mais qui auraient probablement t inclus dans ltude si lavait eue. Les possibilits de recrutement sont diverses et aucune nest parfaite. On peut prendre un chantillon ou tous les patients visitant lurgence pour un autre problme. On peut prendre un chantillon de la population gnrale (avec le recensement, ou des registres). Une autre option souvent pratique est de prendre un membre de la classe du patient ou un ami. On peut aussi choisir des tmoins qui seront pairs (match) avec les cas selon certaines caractristiques (sexe, age, etc). Les avantages du pairage sont multiples parce quils permettent de diminuer les risques de biais connus et inconnus secondaires aux diffrences dans les caractristiques de base. Il faut faire attention ne pas faire dovermatching : Si les caractristiques des cas et des tmoins sont trop semblables, il est possible que lon induise dans ltude une trop grande ressemblance au point de vue des facteurs de risques entres les 2 groupes. 5. Dcider du ratio cas : tmoin. Un ratio idal serait de 1 :1 mais il est parfois difficile dobtenir beaucoup de cas dune maladie rare. En augmentant le nombre de tmoin, on augmente la puissance de ltude. Ceci est vrai jusqu un ratio de 1:4. Aprs cela, il ny a pas davantage. 6. Dterminer la mthode dvaluation de lexposition des cas et des tmoins. Idalement, le mode dvaluation devrait tre le mme pour les 2 groupes. Il peut sagir de questionnaire aux parents ou dune revue de dossier ou de registre. 7. Lanalyse des rsultats se fait en rapportant les odds ratio parce que le nombre de cas et de tmoin et fix par le protocole dtude. Deux situations sont possibles : a. Les tmoins ne sont pas pairs. Dans ce cas on fait un tableau 2x2 traditionnel et on calcul le odds ratio. b. Les tmoins sont pairs (match). Dans ce cas, chaque cellule du tableau ne reprsente pas le nombre de patient mais le nombre de paire de patient. On peut donc calculer le odds ratio en omettant dutiliser les paires concordantes (celles o les cas et tmoin sont exposs et celles o les cas et tmoins ne sont

Page 7

Cours dpidmio #3 pour fellow de lurgence version dc 2006

pas exposs). Ces paires concordantes ne sont quand mme pas inutiles car elles serviront pour le calcul de lintervalle de confiance. Exemple de tableau dune tude NON-paire expos Cas 30 Tmoin 10 Le odds ratio sera de 40*30 /(20*10) = 6.0 Exemple de tableau dune tude paire Tmoin expos Cas expos 24 Cas non-expos 13 Le odds ratio sera de 26/13 = 2.0 Les tudes case-crossover Ltude case-crossover est une nouvelle variante de ltude cas-tmoin qui fut dveloppe au cours des annes 1990. Les premires tudes rapportes touchaient lvaluation du risque dinfarctus chez les patients faisant une activit physique intense (Willich SN NEJM 1993 et Mittleman MA NEJM 93). Ces tudes servent dterminer si une exposition transitoire peut augmenter momentanment le risque davoir une maladie (par exemple, exercice et infarctus, ou pollution dans lasthme). Un avantage important est quon ne recrute que des cas pour faire les tudes case-crossover. La logique derrire ces tudes est que le meilleur contrle pour un cas est le cas lui-mme un autre moment avant ou aprs avoir t malade. La question de base est : Quest-ce que le patient faisait au moment de dclencher son problme de sant quil naurait pas fait normalement ? Voici le schma dune tude case-crossover : On mesure lexposition un facteur X pendant une priode CAS situe juste avant que le patient ne devienne un cas (exposition juste avant le dclenchement de la maladie). Puis on mesure lexposition ce facteur X lors dautre priodes dites CONTRLES. Enfin, on compare les taux dexposition entre les priodes cas et les priodes contrles. non expos 20 40

Tmoin non-expos 26 14

Maladie

Priode contrle 2

Priode contrle 1

Priode cas

Page 8

Cours dpidmio #3 pour fellow de lurgence version dc 2006

Voici un des premiers exemples dtude case-crossover : Des chercheurs ont valu lassociation entre faire un infarctus et pelleter son entre de garage. Pour ce faire, ils ont demand tous les cas dinfarctus sils ont pellet dans les dernires 24h (priode cas) et compar ce rsultat avec une ou plusieurs autres priodes de 24h prdtermine (priodes tmoins). Le problme le plus important de ces tudes est de dterminer quels sont les priodes que lon considre risque et celles que lon devrait estimer tre dans le groupe contrle. Par exemple, si on tudie le risque de thrombophlbite chez les patients prenant lavion, quelle sera la priode risque ? le jour mme, la dernire semaine ou le dernier mois ? En utilisant une priode cas trop grande, on diluera leffet de lassociation tandis quen prenant une priode trop troite, on risque de aussi de diluer lassociation. Pour remdier ce problme, la majorit des tudes utilisent maintenant plusieurs priodes de contrle. Ainsi, si toutes les priodes contrles ont une incidence de maladie semblable et que la priode cas en est trs diffrente, on peut conclure que le patient est risque diffrent pendant la priode cas. Une limite importante de ces tudes est le biais qui peut tre engendr par le fait que la majorit des patients vont devoir dcrire leur exposition juste aprs avoir eu leur diagnostic pour la priode cas et quils devront se souvenir dune autre priode loigne dans le temps pour lexposition contrle. Cest pour cela que dans certaines situations, les chercheurs vont rejoindre le cas une priode alatoire ultrieure afin de connatre son niveau exposition. Malheureusement, cette approche ne convient pas toutes les situations parce quil arrive que la maladie modifie le style de vie du patient (par exemple, les patients niront pas pelleter en post-infarctus). On analyse les donnes de ces tudes comme pour les tudes cas-tmoin appaires (match case-control). On peut donc faire un tableau 2X2 pour les facteurs dichotomiques ou comparer les moyennes pour les facteurs sous forme de variables continues.

3.3. Les tudes de cohorte.


Les tudes de cohorte sont des tudes observationnelles analytiques o les participants sont choisis en fonction quils soient exposs ou non une variable dintrt. Par la suite, on compare lincidence dune pathologie chez les divers groupes. Bien quelle soient habituellement prospectives, il est possible de les mener rtrospectivement en rvisant les informations contenues dans les dossiers. Elles ont plusieurs avantages : - Meilleure dfinition de la relation temporelle entre le facteur de risque et la maladie - Permet dvaluer les expositions rares - Permet de voir plusieurs effets dune exposition - Permet destimer lincidence de la maladie dans la population value - Puisque les patients nont pas encore eu la maladie lorsquon les slectionne pour participer ltude, les biais de slections sont minimiss. Les dsavantages principaux des tudes de cohorte sont : - Parce quelles sont prospectives, il faut suivre les patients et attendre lavnement des maladies. Ceci est plus coteux et plus long faire que pour les autres tudes observationnelles

Page 9

Cours dpidmio #3 pour fellow de lurgence version dc 2006

Les erreurs de classification (expos vs non-expos) auront gnralement pour effet de diluer leffet de lassociation entre le facteur de risque et la maladie. Ces tudes peuvent tre biaises par les patients perdus au suivi. Les patients perdus au suivi ont souvent un risque de maladie diffrent de ceux qui restent dans ltude. Si le taux de patients perdu au suivi est diffrent entre les deux groupes, ceci peut entraner un biais. Le nombre de patients qui refuse de participer ltude peut nuire la gnralisibilit des rsultats mais il ne devrait pas nuire la validit de la relation entre le facteur de risque et la maladie. On pourra ainsi conclure quil y a une association entre le facteur de risque et la maladie mais on ne pourra pas commenter lincidence de la maladie dans la population gnrale.

Types dtude de cohorte Pour toutes les tudes de cohorte, on classe toujours initialement les patients selon leur exposition avant de dterminer sils ont eu la maladie. Par contre, on dfini quune tude de cohorte est prospective ou rtrospective selon la relation entre le moment o ltude dbute et la prsence de la maladie chez le participant. Les tudes de cohorte rtrospectives sont menes laide de rvision de dossier. Elles sont plus rapides et moins fastidieuses mais elles comportent des risques de biais de slection plus levs que pour les tudes prospectives. Il existe une situation particulire o lon peut faire une tude cas-tmoin partir dun sousgroupe de patients dune tude de cohorte. On appelle ces tudes nested case-conntrol study . Ces tudes sont idalement prvues au dbut de ltude de cohorte mais on peu les imaginer tout moment de la progression de ltude cohorte. Voici un exemple : Imaginons une tude de cohorte o lon value le risque de mort subite chez 10 000 enfants de 0 12 mois. Pour tous les patients ligibles, on fait une prise de sang et on passe un questionnaire exhaustif la naissance. Par la suite, on suit les patients pour 12 mois pour mesurer le taux de mort subite en relation avec les divers facteurs valus. Imaginons quun chercheur veut valuer un test sanguin nouveau quil croit excellent pour prdire les enfants risque de mort subite et que ce test est trs cher (parce quil ne se fait quen mode exprimental). Sachant que le taux de mort subite est denviron 3/1000, il faudrait faire le test aux 10 000 patients pour avoir 30 patients avec la maladie dans une tude de cohorte Loption nested casecontrol serait de garder un chantillon de sang congel chez tous les patients et de faire le test sur les spcimens des 30 patients avec mort subite et sur les spcimens dun chantillon de 30 patients tmoins. Un autre exemple serait dutiliser ce type dtude pour valuer le risque de bactrimie en relation avec le taux de procalcitonine chez les enfants fbriles. Analyse On analyse habituellement les rsultats dune tude de cohorte en rapportant le risque relatif. Cette valeur est plus facile conceptualiser. On peut aussi donner la diffrence de risque. Enfin, on peut trs bien calculer les odds ratio. Rexpos = # malade expos / # participant expos Rnon-expos = # malade non-expos / # participant non-expos Risque relatif = Rexpos / Rnon-expos

Page 10

Cours dpidmio #3 pour fellow de lurgence version dc 2006

Diffrence de risque = Rexpos - Rnon-expos

Page 11

Cours dpidmio #4 pour fellow de lurgence version Jan 2008

Cours dpidmio #4 Biais et facteurs confondants


Objectifs du cours: - Connatre les types derreurs voques lors dtudes pidmiologiques - Savoir dfinir et reconnatre un biais - Savoir dfinir et reconnatre un facteur confondant - Savoir dfinir une modification deffet - Connatre les stratgies visant minimiser les biais et facteurs confondants Lecture : - Sunday Clark, MPH, Thomas Costantino, MD, Gail Rudnitsky, MD and Carlos A. Camargo, jr., MD, DrPH. Observational Study of Intravenous versus Oral Corticosteroids for Acute Asthma: An Example of Confounding by Severity. Acad Emerg Med 2005; 12: 439-445. http://www.aemj.org/cgi/content/full/12/5/439 Question #1 De plus en plus, on suggre dutiliser des programmes informatiques de base de donne o lon doit entrer les donnes en double (par 2 transcripteurs). Pourquoi fait-on cela ? Si vous nutilisez pas cette technique, quels sont les risques potentiels pour votre tude ? Question #2 votre avis, quest-ce qui est pire une erreur systmatique ou des erreurs alatoires ? Et pourquoi ? Question #3 Voici 3 tableaux rsumant une tude de cohorte avec des hommes et des femmes. Exposition + Exposition Cas 70 50 Tmoin 50 70 Odds ratio : Voici une sous-analyse de cette tude pour les hommes Exposition + Cas 60 Tmoin 20 Odds ratio : Voici la sous-analyse pour les femmes Exposition + Cas 10 Tmoin 30 Odds ratio : Quelle est votre analyse de la situation ? Exposition 30 10

Exposition 20 60

Page 1

Cours dpidmio #4 pour fellow de lurgence version Jan 2008

Question #4 Voici 3 tableaux rsumant une autre tude. Exposition + Cas 50 Tmoin 40 Odds ratio : Sous analyse pour les hommes Cas Tmoin Odds ratio : Sous analyse pour les femmes Cas Tmoin Odds ratio : Quelle est votre analyse de la situation ? Exposition + 40 20 Exposition + 10 20

Exposition 30 50

Exposition 20 40

Exposition 10 10

Question # 5 a) Comment value-t-on le risque de biais lorsquon lit un article scientifique ? Que faut-il rechercher ? b) Les tudes randomises sont-elles plus risque de biais de slection ou de biais dinformation ? Question #6 Dites de quel type de biais serait susceptible les tudes suivantes : - Une tude cas-tmoin sur lassociation entre lorigine ethnique et la maladie de kawasaki. - Une tude randomise entre une approche chirurgicale vs mdicale sur la qualit de vie chez les patients avec insuffisance cardiaque. Le tout value par un questionnaire men par un psychologue. - Une tude randomise clinique sur le traitement du pied dathlte. Recrutement par une annonce dans les journaux. Question #7 Nommez les 5 faons de contrler pour les facteurs confondants.

Question # 8 Les infirmires de lurgence sont invites participer une tude comparant la variabilit inter-observateur dans le triage des patients en utilisant 2 techniques. La premire est lutilisation de lancien systme de triage (version papier) tandis que la deuxime est lutilisation dune version informatise (statdev). Elles nont pas toutes accepte de participer Page 2

Cours dpidmio #4 pour fellow de lurgence version Jan 2008

ltude. Lexposition est (triage informatis vs standard) et le outcome est la variabilit entre les observations (score kappa). Les auteurs tentent de dmontrer que lutilisation de lordinateur va diminuer la variabilit dans le triage. Quels sont les biais possible dans cette tude ? Comment minimiser ces biais ? Quels sont les facteurs confondant possible dans cette tude ? Question # 9 Dans larticle de Clark sur leffet confondant de la svrit dans lasthme. Faites les tableaux suivants Pour la population totale Cortico IV Admission + observ Cong Odds ratio : Cortico IV Symptmes svres Pas svre Odds ratio : Quelle table manque-t-il pour prouver que la svrit est un facteur confondant ? Cortico PO Cortico PO

Page 3

Cours dpidmio #4 pour fellow de lurgence version Jan 2008

4 Les erreurs lors dtudes pidmiologiques


Toutes les tudes pidmiologiques sont susceptibles d'inclure des erreurs car elles sont bases sur des mesures qui ne sont jamais parfaites. Il existe 2 types derreurs pouvant affecter les conclusions dune tude pidmiologique: Les erreurs alatoires et les erreurs systmatiques. Ces 2 types derreurs ont des consquences diffrentes sur les conclusions dune tude. Voici un schma rsumant les types derreur : - Erreurs alatoires - Erreurs systmatiques Biais de slection Biais dchantillonnage Biais de recrutement Biais dautoslection Biais dindication Biais par survie slective Biais dinformation ou dobservation Biais de rappel Leffet Hawthorne Biais dvaluation Biais par perte de suivi

4.1 Les erreurs alatoires


Les erreurs alatoires sont des erreurs dont la distribution est exclusivement attribuables au hasard. Elles ont tendance diminuer la prcision des rsultats parce que les valeurs mesures sont plus loignes de la valeur relle. Ainsi la valeur moyenne obtenue devrait normalement ressembler la VRAIE valeur de la moyenne mais lintervalle de confiance augmentera avec limprcision. La prcision d'une estimation est proportionnellement relie la taille (n) de l'chantillon et inversement relie la variabilit (X) du paramtre tudi. Les erreurs alatoires font que les divers groupes ont tendance se ressembler. Ceci biaise les rsultats vers lhypothse nulle quil ny a pas de diffrence entre les 2 groupes. Lutilisation dune mthode de mesure plus prcise permet de diminuer les erreurs alatoires et, par consquent, la variabilit des rsultats. Dautre part, un observateur nonchalant ou quelquun qui fait des erreurs en transcrivant les rsultats dans la base de donne augmente le taux derreurs alatoires amenant une baisse de la prcision (intervalle de confiance plus large). Plus lintervalle de confiance est troit, meilleure est la prcision dune mesure. Voici quelques causes derreur alatoire : - Un instrument de mesure mal calibr ou dfectueux - Une grande variabilit temporelle de la mesure - Des participants qui ne rpondent pas correctement un questionnaire - Des erreurs de transcription dans la base de donne Toutes ces erreurs diminuent la prcision de ltude et augmente lintervalle de confiance des rsultats. Ceci pour effet de minimiser les chances de trouver une diffrence entre 2 groupes ou de noter une relation entre un facteur de risque et un vnement.

Page 4

Cours dpidmio #4 pour fellow de lurgence version Jan 2008

Voici une reprsentation graphique de deux tudes. La courbe reprsente la distribution des rsultats obtenus pour une mesure. La premire tude contient peu derreurs alatoires tandis que la deuxime en contient beaucoup. On voit donc une courbe de distribution plus tendue pour la deuxime tude. Vraie valeur Vraie valeur

Peu derreurs

Beaucoup derreurs

4.2 Les erreurs systmatiques


Les erreurs systmatiques sont des erreurs qui se produisent lorsque la probabilit de commettre une erreur est diffrente pour les 2 groupes valuer. Il sagit donc derreurs qui se font toujours dans un sens (systmatique). Ceci cr un dsquilibre menant une conclusion biaise. On dfini le biais par la prsence derreurs systmatiques dans une tude menant une valuation errone de la relation entre lexposition et la maladie. La prsence de biais nuit la validit des rsultats. Contrairement au hasard, il est trs difficile de quantifier un biais. Il faut donc tout faire pour minimiser les risques de biais dans llaboration de la mthodologie des tudes. Il existe peu de liens entre la prcision (relie aux erreurs alatoires) et les biais (reli aux erreurs systmatiques) ; Une tude peut avoir des rsultats trs prcis (reproductibles) mais qui ne refltent pas la ralit (biais) et vice-versa. Voici une reprsentation graphique de deux tudes ayant peu derreurs alatoires. La premire ne contient pas derreur systmatique tandis que la deuxime en contient. Vraie valeur Vraie valeur

Pas derreur

Erreur systmatique

Les types de biais On diffrencie trois grands types de biais : - Le biais de slection qui est reli au mode de recrutement des patients dans ltude - Le biais dobservation est reli lvaluation du patient une fois quil est recrut

Page 5

Cours dpidmio #4 pour fellow de lurgence version Jan 2008

Le biais danalyse qui se caractrise par la prsence dun autre facteur confondant relie lexposition et au devenir du patient. Ce type de biais sera discut plus loin

4.2.1 Les biais de slection Les biais de slections se produisent au moment dinclure un participant dans une tude. Il peut sagir de linclusion de patients qui ne reprsentent pas la population gnrale quils doivent reprsenter (lors dtude descriptives) ou du recrutement diffrentiel de patients selon leur exposition (lors dtude analytiques). Il y a gnralement un biais de slection lorsque lidentification des participants selon leur statut dexposition (dans une tude de cohorte) ou de maladie (dans une tude cas-tmoin) est aussi influence par un autre aspect impliqu dans de la relation exposition-outcome. Les types dtude les plus risque de biais de slection sont les tudes rtrospectives (comme les tudes cas-tmoin). Dans ces tudes, la maladie et lexposition ont dj eu lieu et ceci peut influencer le recrutement des participants. Dautre part, les tudes prospectives ont un faible risque de biais de slection parce que la maladie na pas encore eu lieu au moment du recrutement. Voici diffrents types de biais de slection : Les biais dchantillonnage se produisent lorsque les participants recruts ne sont pas reprsentatifs de la population gnrale quils doivent reprsenter. Ces participants possdent certaines caractristiques diffrentes de la population gnrale. On retrouve ce type de biais dans les tudes descriptives (pour mesurer la prvalence, incidence, etc.). Par exemple, dans une tude sur la prvalence de lasthme chez lenfant, un chercheur effectuant le recrutement des participants dans certaines coles francophones de Montral pourrait avoir des taux biaiss parce quil nvalue pas les populations de nouveaux arrivant ne parlant pas le franais. Un autre exemple serait de recruter les participants lurgence pour valuer la prvalence dasthme chez les enfants. Les biais de recrutement se produisent lorsque le systme (ou la personne responsable) de recrutement fait en sorte que les participants choisis possdent certaines caractristique relies la maladie dintrt. On retrouve ce type de biais dans les tudes analytiques (Exemple castmoin). Voici un exemple : - tude cas-tmoin sur lassociation possible entre les accidents sportifs et le fait de participer un tournoi. Une personne charge de recruter des patients pourrait inconsciemment tre tent de recruter de faon plus agressive les patients blesss lors de tournoi sportif. Ceci aurait pour effet daugmenter faussement le Odds ratio en faveur dune association entre les 2 vnements. Les biais d'autoslection se produisent lorsque les participants doivent sinscrire eux-mmes pour participer ltude (volontaire). Les volontaires ne reprsentent habituellement pas la population gnrale. Voici un exemple : - Un sondage men auprs des mdecins pour connatre leurs besoins en support informatique obtient un taux de rponse est trs bas (25%). Il est trs probable que cet chantillon ne soit pas reprsentatif de la population gnrale des mdecins. On peut mme supposer que les rpondants seront des mdecins intresss par le sujet. Ils ont probablement des connaissances et des besoins diffrents de la population totale des mdecins. Les biais d'indication se produisent lorsque le facteur dexposition tudi fait parti des critres de diagnostic utiliss par les mdecins ou augmente la possibilit de dtecter la maladie. Voici un exemple : - Une tude cas-tmoin sur les risques dembolie pulmonaire associs la prise de contraceptif oraux a montr une association. Par contre, il fut dmontr que pour la mme

Page 6

Cours dpidmio #4 pour fellow de lurgence version Jan 2008

patiente avec des rsultats de scintigraphie quivoque, un mdecin pouvait changer son diagnostic selon que la patiente prenait ou non des contraceptifs. Ce type de biais tend augmenter les associations entre le facteur dexposition et la maladie. Enfin les biais par survie slective se produisent lorsque le dcs prcoce de certains patients les empche de participer ltude. 4.2.2 Les biais dinformation ou dobservation Les biais dobservation rsultent derreurs systmatiques dans la collecte de linformation au sujet de lexposition ou du devenir aprs que le participant fut recrut. On retrouve ces biais dans tous les types dtudes parce quils concernent lvaluation du participant aprs quil fut recrut ou mme randomis. Le risque de biais est plus lev lorsque lvaluateur en charge de dterminer le statut du patient (cas/tmoin ou expos/non-expos) connat dj lautre statut de laxe exposition-outcome. Voici diffrents types de biais dobservation : Les biais de rappel se produisent dans les tudes rtrospectives lorsque les participants ont des souvenirs diffrents de leur exposition selon leur groupe. La diffrence de rappel peut tre secondaire aux connaissances et ides pr-conues du patient ou de lvaluateur. Voici un exemple : - Une tude cas-tmoin value lassociation entre le risque de thrombophlbite et le fait de voyager en avion. Il est possible que les patients atteints de thrombophlbite se rappellent mieux davoir voyag en avion car on leur a demand souvent lors de lanamnse (par lexterne, le rsident, le mdecin et le chercheur) en comparaison avec un groupe contrle de patients avec une autre condition mdicale. Ce biais augmentera le OR dune association voyage-thrombophlbite. Leffet Hawthorne est un autre type de biais reli au comportement des participants une tude prospective. La rationnelle de cet effet est que les gens agissent diffremment lorsquils se savent observs. Ainsi, ils adopteront habituellement des comportements plus sains ou socialement plus acceptables. Il est possible que cette amlioration modifie les diffrences entre divers groupes tudis. Les biais dvaluation secondaires aux valuateurs sont frquents. La connaissance pralable des facteurs d'exposition suspects (biais par suspicion d'exposition) ou des pathologies concernes (biais par suspicion diagnostique) peut entraner un "excs de zle" de l'valuateur, l'amenant rechercher prfrentiellement les facteurs d'exposition voqus ou approfondir l'enqute auprs des seuls sujets malades, cela afin de trouver "quelque chose". Les biais par perte de suivi (lost to follow-up) peuvent se produire lors de toutes les tudes prospectives et ils constituent lun des rares biais possibles lors dtude clinique randomise. Il est bien connu que les patients perdus au suivi ont gnralement un moins bon devenir que ceux qui restent dans ltude. Le risque de biais est lev si les taux de perte au suivi sont diffrents dans les 2 groupes tudis. Les erreurs de classification des participants pourra avoir des effets divers selon quelles soient diffrentielles ou non : Les erreurs de classification non-diffrentielles sont des erreurs qui se produisent avec des taux semblables dans des directions semblables pour les divers groupes tudis. Ces erreurs biaiseront toujours les tudes vers lhypothse nulle car il

Page 7

Cours dpidmio #4 pour fellow de lurgence version Jan 2008

sagit derreur distribue au hasard qui font que les diffrents groupes se ressembleront de plus en plus. Les erreurs de classification diffrentielles sont des erreurs qui se produisent diffremment pour les 2 groupes. Par exemple, un valuateur survaluera le taux dexposition dans le groupe cas et sous-valuera lexposition chez les contrles. Ce type derreur peu biaiser les conclusions dans nimporte quelle direction. Voici des exemples derreur de classification diffrentielle et non-diffrentielle : tude cas-tmoin sur le risque de mort subite du nourrisson et le fait de dormir sur le ventre. Voici les VRAIES valeurs : Exposition + Exposition Cas 20 80 Tmoin 10 90 Odds ratio : (20/80) / (10/90) = 2.25 Voici la mme tude o les chercheur se sont tromps dans lassignation de lexposition chez 10 patients dans chaque groupes au hasard : Erreur non diffrentielle Exposition + Exposition Cas 20-2 +8 = 26 80-8+2 = 74 Tmoin 10-1+9 = 18 90-9+1 = 82 Odds ratio : (26/74) / (18/82) = 1.67 Voici la mme tude o les chercheur se sont tromps dans lassignation de lexposition chez 5 patients dans chaque groupes : ils ont surestim lexposition des cas et sous estim lexposition des tmoins : Erreur diffrentielle Exposition + Exposition Cas 25 75 Tmoin 5 95 Odds ratio : (25/75) / (5/95) = 6.33 4.2.3 Comment prvenir les biais Il fut mentionn plus haut quil est trs difficile de quantifier les biais au niveau statistique. La raison majeure de ce fait est quon nest habituellement pas au courant de ces erreurs provenant du systme, des valuateurs ou des participants. Labsence de quantification nuit considrablement lvaluation critique des rsultats dune tude. Le seul remde aux biais est de les prvenir avant quils ne se produisent. Il faut donc prvoir dans le dessin dune tude quels seront les moyens utiliss pour prvenir les biais. En gnral, on minimise le risque de biais en augmentant la rigueur et lobjectivit de la slection et de la collecte dinformation et en gardant les patients et valuateurs le plus ignorant possible face au but de ltude. Ces moyens seront habituellement dcrits dans la section procdure de la mthode des articles scientifiques. Voici plusieurs moyens utiliss pour minimiser les biais : Biais de slection : - Avoir plusieurs groupes contrle diffrents - Standardiser les procdures de recrutement - Ne pas dvoiler aux participants l'hypothse de l'tude, - Ne pas dvoiler aux valuateurs l'hypothse de l'tude - Utiliser la randomisation dans une population pour le choix des participants Page 8

Cours dpidmio #4 pour fellow de lurgence version Jan 2008

Utiliser la randomisation dans lassignation des traitements

Biais dinformation : - Assurer un suivi comparable aux divers groupes - Avoir une valuation standardise - Ne pas dvoiler aux participants l'hypothse de l'tude, - Ne pas dvoiler aux valuateurs l'hypothse de l'tude - Utiliser la randomisation dans lassignation des traitements - Garder les valuateurs laveugle face lexposition 4.3 Les facteurs confondants Un facteur confondant est un facteur qui biaise les rsultats de ltude parce que son association avec lexposition et la maladie fait faussement croire que lexposition est associe la maladie. Contrairement aux types de biais prcdemment dcrits, les facteurs confondants sont des facteurs conduisant des rsultats errons que lon peut quantifier. On peut aussi en tenir compte dans lanalyse afin den liminer leffet. On dfinit un facteur confondant par la prsence obligatoire de 3 critres : - Le facteur confondant est associ lexposition - Le facteur confondant est associ au devenir (outcome) - Cette association se fait de faon indpendante de lexposition : Le facteur confondant nintervient pas directement dans la relation exposition-outcome. Facteur confondant

Exposition

Devenir

Voici un exemple : Dans une tude sur le taux daccident de voiture et lutilisation de tlphone cellulaire on constate une forte association. Voici le tableau des rsultats : Cellulaire + Cellulaire Cas (accident) 35 90 Tmoin (pas daccident) 15 70 OR : (35/90) / (15/70) = 1.8 Un chercheur voit ces rsultats et suggre quil pourrait y avoir un important facteur confondant : lge. Les jeunes de moins de 25 ans ont beaucoup plus daccident de voiture et ils sont beaucoup plus frquents possder un tlphone cellulaire. Voici 2 tableaux de la mme tude selon que les participants aient < 25 ans ou > 25 ans. Pour les moins de 25 ans Cellulaire + Cas 30 Tmoin 5 OR : ( 30/60) / (5/10) = 1.0 (pas dassociation) Page 9 Cellulaire 60 10

Cours dpidmio #4 pour fellow de lurgence version Jan 2008

Pour les plus de 25 ans Cellulaire + Cas 5 Tmoin 10 OR : (5/30) / (10/60)= 1.0 (pas dassociation) Cellulaire 30 60

On voit donc que lutilisation nest pas un facteur de risque daccident pour les gens de moins de 25 ans ni pour ceux de plus de 25 ans !!!! Par contre, lorsquon les regroupe sans considrer lge, on obtient une association. Ceci est une belle dmonstration dun facteur confondant. On voit que lge est associ avec lexposition (les plus jeunes ont plus de tlphones) et avec le outcome (les jeunes ont plus daccident). De plus, lge nintervient pas directement dans la relation cellulaire-accident. Dautres exemples seraient : - Relation calvitie- consommation de bire. Un facteur confondant pourrait tre le sexe - Relation # de tlviseur la maison-cancer de la prostate. Lge ou le niveau socio conomique pourraient tre des facteurs confondants.

Il existe 2 faons de dmontrer la prsence dun facteur confondant: 1. On value lassociation entre lexposition et le devenir de faon spare pour les diverses strates du prsum facteur confondant. Si les OR sont tous semblables la valeur du OR total, il ny a pas de facteur confondant. Si les OR sont semblables pour les diverses strates mais diffrentes du rsultat total, il faut suspecter un facteur confondant. Ceci fut dmontr dans les tableaux prcdents 2. On peut aussi montrer quil existe une association entre le facteur confondant et lexposition et une association entre le facteur confondant et le devenir (outcome). Voici les tableaux pour lexemple prcdent. Tableau de lassociation age et cellulaire : Cellulaire + Cellulaire ge < 25 ans 35 70 ge > 25 ans 15 90 OR : (35/70) / (15/90) = 3.0 Tableau de lassociation age et accident : Accident ge < 25 ans 90 ge > 25 ans 35 OR : (90/15) / (35/70) = 12.0 Tmoin 15 70

On voit donc une association entre lge et lexposition (OR 3) et entre lge et le devenir (OR12). Lge est donc un facteur confondant puisquil nest pas impliqu directement dans la relation cellulaire-accident. 4.3.1 Management des facteurs confondants On peut prvenir les facteurs confondant la phase de llaboration dune tude ou en tenir compte lors de son analyse. Page 10

Cours dpidmio #4 pour fellow de lurgence version Jan 2008

Voici 3 mthodes de contrle lors de llaboration: - La restriction : Pour confondre, un facteur doit tre prsent en frquence variable dans les divers groupes (expos vs non). Une faon de contrecarrer cette variabilit est de restreindre la participation ltude qu certains individus selon leur statut face au facteur confondant. On peut, par exemple, restreindre ltude quaux hommes, quaux enfants dun certain ge ou membre dune seule communaut ethnique. La restriction est simple appliquer mais elle diminue souvent de beaucoup le nombre de participants potentiels et elle ne permet pas de conclure pour les patients qui ntaient pas dans les strates values. On limite donc la gnralabilit des rsultats - Lappariement : Dans ce type de procd, les participants sont recruts afin davoir une distribution quitable des facteurs confondants parmi les divers groupes. Cette technique permet dvaluer toutes les strates du facteur confondant. Pour chaque participant recrut, il y aura un autre participant ayant une valeur semblable du facteur confondant recrut dans lautre groupe. Les dsavantages principaux de lappariement sont que cest difficile faire, que lon perd beaucoup de participants et que lanalyse est plus complexe. - La randomisation : Cette technique est la procdure de choix pour liminer les facteurs confondants. Un avantage indniable par rapport aux autres mthodes, est que cette technique permet de minimiser les facteurs confondants inconnus. Malheureusement, elle ne sapplique que pour les tudes o il y a une intervention. Elle est inapplicable pour les tudes de cohorte ou cas-tmoin. Voici deux mthodes de contrle appliques la phase danalyse pour le contrle des facteurs confondants : - Lanalyse stratifie : Il sagit dune technique o lon value la relation expositionoutcome pour diverses strates du facteur confondant (voir lexemple plus haut). On peut ainsi rapporter le ratio de cote pour chaque strate. Ceci se rapporte bien lorsquil ny a que deux strates (homme-femme, jeune-vieux) mais il est beaucoup plus laborieux lorsquil y a plusieurs strates (multiple groupes dge, ethnie, etc.). Il serait, par exemple, beaucoup plus fastidieux de lire un article qui rapporterait les ratios de cotes pour toutes les strates dune tude o lon a divis lge des participants en 6 groupes. Une valeur sommaire peut tre calcule en accordant un poids relatif chaque strate. Plusieurs techniques ont t dcrites mais la plus populaire est celle qui fut dcrite par Mantel et Haenszel. Pour cette technique, on accorde un poids relatif chaque strate. Ce poids est inversement proportionnel la variance de la strate. Ainsi les strates contenant plusieurs participants ou ayant une faible variabilit auront une faible variance et auront un poids plus important dans le calcul. Dautre part, les strates avec peu de participants et, par consquent, des variances larges auront peu dinfluence sur le rsultat global. Une drivation mathmatique complexe (au-dessus du niveau de ce cours) a permis den arriver aux formules suivantes : o Pour une tude cas-tmoin : ORMH = ad/T) / bc/T) o Pour une tude de cohorte : RRMH = a*(c+d) / T) / c*(a+b)/T) o Pour le tableau suivant : o o Cas o Control o o Expos o .a o b o a+b o Non expos o .c o d o c+d o o .a+c o b+d o T Ces analyses sont frquentes et facilement accomplies par un ordinateur. Elles permettent de rapporter une valeur unique, non-biaise par les facteurs confondants. On peut Page 11

Cours dpidmio #4 pour fellow de lurgence version Jan 2008

calculer la magnitude deffet confondant en comparant les valeurs obtenues en utilisant tout les rsultats (Ratio de cote cru) et les valeurs ajustes (Mantel haenszel). Plus la diffrence est grande, plus il y a un effet confondant. Lanalyse multivarie est la technique de choix de nos jours. Le perfectionnement des ordinateurs a permis de gnraliser lutilisation de lanalyse multivarie. Lavantage principal de cette technique est quelle permet dvaluer une multitude de facteurs en mme temps. On peut donc faire lanalyse de plusieurs facteurs ainsi que voir les interactions quil y entre eux. Cette analyse se fait gnralement par lutilisation du modle mathmatique de la rgression linaire multiple. Un dsavantage est quil faut connatre le facteur confondant pour recueillir les informations son sujet.

Comment faire une rgression linaire ? La rgression linaire multiple est une extension de la rgression linaire simple, que lon a tous apprit au secondaire lorsque lon voulait dcrire une ligne droite simple partir de points (y=mx +b o m est la pente, b est lordonne, y est la variable dpendante et x est la variable indpendante). Lorsque lon met les donnes dans lordinateur (une variable dpendante et une indpendante), celui-ci calcule la valeur de la pente et la valeur de lordonne qui vont minimiser la distance entre les points et la ligne droite. On dit que Y= a +bX. Ou a est lordonne et b est la pente. Les ordinateurs ont la possibilit de refaire ces analyses en utilisant plusieurs dimensions permettant dvaluer plusieurs facteurs de risques en mme temps. On obtient alors la formule : Y = a + b1X1 +b2X2 +bnXn ou a est lordonne b1-n est le coefficient pour les divers facteur de risque 1 n. Tout ceci sera discut plus loin au cours 9 et 10. 4.4 La modification deffet (effect modification) Nous avons dj vu que - si les ratios de cotes pour les diverses strates sont tous semblables au rsultat global il ny a pas de facteur confondant - si les ratios de cotes pour les diverses strates sont tous semblables entre eux mais diffrents du rsultat global il y a un facteur confondant Que faire si les ratios de cotes pour les diverses strates sont diffrents ? Ceci signifie que la relation entre lexposition et le devenir est diffrente pour les diverses strates. Ainsi, on pourrait dire que leffet de la fluoration de leau diminue le taux de carie dentaire chez les enfants faible niveau socio-conomique mais que cet effet nest pas remarqu chez les plus riches. Voici 3 tableaux qui rsument cet exemple : Tableau carie dentaire vs fluoration dans une tude cas-tmoin (population totale) : Fluoration Pas de fluoration Carie 40 80 Tmoin 60 60 OR : (40/80) / (60/60) = 0.5 la fluoration protge

Page 12

Cours dpidmio #4 pour fellow de lurgence version Jan 2008

Tableau carie dentaire vs fluoration dans une tude cas-tmoin (population riche) : Fluoration Pas de fluoration Carie 20 40 Tmoin 20 40 OR : (20/40) / (20/40) = 1.0 pas deffet chez les riches Tableau carie dentaire vs fluoration dans une tude cas-tmoin (population pauvre) : Fluoration Pas de fluoration Carie 20 40 Tmoin 40 20 OR : (20/40) / (40/20) = 0.25 donc fluoration protge chez les pauvres Lorsquil y a modification deffet, la valeur globale se retrouve toujours entre les valeurs les plus extrmes des diverses strates. Si la valeur globale se retrouve en dehors des valeurs extrmes des strates, il y a aussi un facteur confondant. Une modification deffet se dfinit donc comme un facteur qui a un effet diffrent sur le outcome selon les diverses strates dune population.

Page 13

Cours dpidmio #5 pour rsidents version Dcembre 2007

Cours dpidmio #5 Essais clinique randomis


Objectifs du cours : - Savoir dfinir la question de base (connatre la diffrence entre des tudes voulant montrer la supriorit vs lgalit de 2 traitements). - Connatre les avantages et dsavantages de la randomisation. - Connatre, les motivations, avantages et inconvnients menant ltude laveugle - Connatre les diffrentes structures d essais cliniques (factorielle, cross-over, parallle et randomisation de groupe) - Connatre lnonc de CONSORT - Connatre les paramtres savoir pour estimer la taille dchantillon - Connatre les avantages et inconvnients lanalyse par intention-de-traitement, per protocole ou per traitement. - Connatre la marche suivre face aux donnes manquantes et au suivi de la compliance - Discuter des aspects thiques face aux essais cliniques randomiss (comit dthique, consentement clair) lire : - Lnonc de CONSORT - Article de Jan de Van sur la dexamthasone dans la mningite
56.)

(N Engl J Med 2002;347:1549-

- Article de Lacroix sur TRIPICU (N Engl J Med 2007;356:1609-19.)

Exercices pratiques faire avant le cours. Il sagit dexercices qui serviront de point de dpart pour les discussions. Question # 1 En 1988, Dr Lebel a publi un article important montrant leffet protecteur des strodes dans la mningite. (Lebel MH et al. Dexamethasone therapy for bacterial meningitis: results of two double-blind, placebo-controlled trials. N Engl J Med 1988;319:964-971.). Larticle de Jan de Gans du New England de 2002 au sujet de la dexamthasone dans le traitement des mningites est un nouveau classique qui a raviv le dbat. Dans cette tude : - Quelle est la question de base ? - Quel type de randomisation a-t-on utilis ? - Quels rsultats nous permet de croire que la randomisation a effectivement distribu les patients au hasard? - Comment les investigateurs ce sont-ils assurs que lon puisse savoir quel traitement le participant tait randomis en cas durgence ? - Sagit-il dune tude laveugle et pourquoi/pour qui ? - Quelle est la conclusion de cette tude ?

page1

Cours dpidmio #5 pour rsidents version Dcembre 2007

Question # 2 Voici un extrait dabstract : Deltamethrin-impregnated dog collars reduce sandfly bite rates on dogs, and are effective in killing sandflies that attempt to feed. Because domestic dogs are the principal reservoir hosts of zoonotic visceral leishmaniasis, we tested whether application of dog collars could protect children against infection with Leishmania infantum, the parasite that causes the disease. Quelle structure dessais clinique utiliseriez-vous pour mener cette tude (factorielle, parallle, etc..) ? Question # 3 Un chercheur veut faire un essai clinique randomise sur leffet dun mdicament X sur la perte de poids chez des adolescents obses. Quelles sont les informations ncessaires pour calculer la taille dchantillon sil veut comparer les pertes de poids moyennes des 2 traitements? Question # 4 Une tude randomise clinique vise valuer leffet de lutilisation de paramedics sur le taux de survie des patients avec arrt cardiaque. Le primary outcome est la survie lurgence (mort ou vivant). Quelles sont les informations ncessaires pour calculer la taille dchantillon ? Question # 5 Une tude value le taux deffet secondaires dun mdicament vs. un placebo. la fin de ltude, 20% des patients nont pas t compliants. Lors dune runion du comit de recherche, certains disent que lon devrait valuer les patients par intention-de-traitement tandis que dautres suggrent danalyser seulement les patients ayant t fidle au protocole. Quelle est la meilleure analyses afin dvaluer le risque deffet secondaire du mdicament ? Question # 6 Pour chacune des 3 vignettes suivantes au sujet de lanalgsie pour la rduction dun paraphimosis, de quel type danalyse sagit-il : a) Une tude ou lon randomise les patients avant la procdure et on les analyse selon le traitement quils ont effectivement reu. b) Une tude ou lon randomise les patients avant la procdure et on analyse seulement ceux qui ont reu le traitement prvu. c) Une tude ou lon randomise les patients avant la procdure et on analyse selon la randomisation quel que soit le traitement reu.

page2

Cours dpidmio #5 pour rsidents version Dcembre 2007

Question #7 On estime que le taux de survie un arrt cardiaque hors de lhpital est de prs de 5%. Un rsident projette de faire une tude sur une approche qui permettrait damliorer le taux de survie des patients. Sachant quil utilisera une erreur de type 1 de 0.05 et quil voudrait avoir une puissance de 90%, calculez la taille dchantillon ncessaire si les experts estime quun taux de survie chez le groupe trait de 7% serait cliniquement significatif. Et si ce taux tait de 10%. Comment pourrait-on baisser sa taille dchantillon ? Question # 8 Un mdecin-chercheur propose une nouvelle tude au comit dthique de son institution. Lorsque questionn, le mdecin affirme quil nenrlerait pas son enfant dans cette tude car il est certain que le traitement propos fonctionne et quil voudrait le donner a son enfant. Le comit dthique devrait-il approuver ce projet. Quelles sont vos rflexions sur ce cas ?

page3

Cours dpidmio #5 pour rsidents version Dcembre 2007

Les essais cliniques randomiss (randomized controlled trials)


Les essais cliniques randomiss sont perus au sommet de lchelle des dessins dtudes cliniques mdicales parce quil sagit de lapproche qui ressemble le plus aux tudes exprimentales des sciences de base. Le nombre dessais cliniques randomiss est encore en expansion. Une recherche via Medline en fv 2005 permettait de rapatrier plus de 11 000 publications dessai clinique en 2000 en comparaison avec 2000 publications en 1980. Les lignes qui suivent traiteront des divers aspects relatifs au bon droulement dune tude randomis contrle. 5.1 La question ltude Chaque essai clinique randomis sert rpondre une question bien spcifique. La dtermination lavance dune question claire et prcise est le premier pas vers une tude bien dessine. Idalement, les tudes devraient avoir une seule question primaire rsoudre. Une tude devrait tenter de rpondre la question la plus intressante pour le chercheur. Ainsi, il sera parfois plus important de sintresser leffet biologique qu leffet clinique dun mdicament et vice-versa. Par exemple, pour rpondre la question : Quel est le taux de survie pour un patient sil prend le mdicament X? , il faudra exclure de ltude les patients non-compliants au traitement. On parlera alors dune tude defficacit (efficacy). Une tude defficacit value donc leffet biologique rel du traitement. Pour rpondre la question : Quel sera le taux de survie de mes patients si je leur prescrit le traitement X ? , on devra valuer tous les patients et on parlera dune tude defficience (effectiveness). Une tude defficience mesure leffet dun traitement lorsquil est appliqu dans un contexte clinique (c--d dans la vraie vie). On peut donc voir quune petite subtilit dans la formulation de la question de base peut avoir dimportantes rpercussions sur la structure de ltude. Il en dcoule quil faut bien prendre son temps afin de dterminer une question claire. Chaque paramtre du traitement devrait tre modul en fonction de lobjectif principal de ltude. Par exemple, une tude valuant le taux de gurison suivant lutilisation dun mdicament devrait utiliser une posologie standard, tandis quune tude visant valuer la scurit dun mdicament devra utiliser le mdicament aux dosages maximaux afin dobtenir des conclusions conservatrices. Un autre aspect important consiste dterminer si lon vise dmontrer une diffrence entre 2 ou plusieurs traitements ou lquivalence (absence de diffrence). On dtermine laide de la valeur (habituellement de 0.05) la probabilit de dterminer faussement que 2 traitements sont diffrents. On dfini lerreur comme tant la probabilit de dire que deux traitements sont similaires alors quils ne le sont pas. La puissance (gale 1-) est la probabilit de dterminer que 2 traitements sont diffrents si ils le sont vraiment. Il faut beaucoup plus de patients pour dmontrer une quivalence car il faut avoir une puissance leve (0.90 et plus) et la puissance demande un nombre de patients beaucoup plus grand.

page4

Cours dpidmio #5 pour rsidents version Dcembre 2007

5.2 La randomisation Laspect le plus important des essais cliniques randomiss est la randomisation! La randomisation consiste en lallocation alatoire du traitement pour les participants ltude. Chaque participant devrait avoir un risque identique de recevoir le traitement au moment de linclusion dans ltude. Les buts de la randomisation sont multiples: - Premirement, la randomisation contrle pour les biais de slection pouvant tre engendr lorsque le mdecin sait davance quel traitement sera allou au participant avant de linscrire ltude. Certains mdecins pourraient ne pas inclure un patient dans une tude en croyant que ce dernier est trop, ou pas assez malade pour se permettre que son traitement soit laiss au hasard. - Deuximement, elle permet de distribuer quitablement les facteurs de risque parmi les diffrents groupes de traitement. Ceci permet de diminuer les biais engendrs par des facteurs de risques connus mais aussi pour les facteurs de risques inconnus. - De faon indirecte, elle permet de maintenir les traitements laveugle parce que les mdecins ne savent pas quoi sera randomis le participant. Ceci permet de minimiser le risque de biais dvaluation pouvant tre introduit aprs lassignation dun traitement. Finalement, la randomisation sert de base linfrence statistique. 5.2.1 Les stratgies de randomisation utilises : Il existe plusieurs faons de distribuer alatoirement les patients. Chacune de ces mthodes possde des avantages et inconvnients. Les randomisations fixes. Pour ces stratgies, la squence alatoire est initialement dtermine et la probabilit dallocation nest pas modifie en cours dtude. Il sagit des mthodes les plus frquemment utilises Simple : Il sagit de la forme de randomisation la plus lmentaire. On dtermine une squence de traitement et chaque participant est assign au prochain traitement dtermin selon la squence. Cest une mthode facile utiliser mais il peut parfois y avoir des dsquilibres entre les groupes surtout si la taille dchantillon est petite. Exemple : AABABAABBA. En bloc : Pour ce faire, on utilise habituellement des blocs de 4, 6 ou 8 participants. On dtermine par la suite des squences alatoires pour chaque bloc permettant davoir le mme nombre de participants randomiss chaque groupe de traitement. Il sagit dune forme de randomisation trs populaire car elle est simple et permet davoir des groupes de traitement de tailles semblables. Les chercheurs utilisent souvent des blocs de tailles diffrentes afin doptimiser le blinding car si les mdecins savent quel est la taille des blocs et connaissent lallocation de traitement des premiers participants, ils peuvent deviner le traitement du prochain patient et introduire un biais de slection. Une limite du blocage est quil faut en tenir compte lors de lanalyse et ceci rend le travail un peu plus ardu. Exemple AABB ABBABA BAAB.

page5

Cours dpidmio #5 pour rsidents version Dcembre 2007

Stratifi : La stratification consiste en sparer les participants selon la prsence de certains facteurs de risque avant la randomisation. Ainsi tous les participants avec le facteur de risque X seront randomiss ensembles et tous ceux nayant pas le facteur de risque seront randomiss dans un autre groupe. Pour faire ce type de procdure, il faut connatre le facteur de risque avant la randomisation. Il peut sagir de variable simple (sexe, age) ou plus compliques (valeur lECG, taux de cholestrol). La stratification permet dquilibrer les facteurs de risques pour les tudes si petites que la randomisation simple ne permettrait pas de le faire. Il faut, par contre, savoir modrer ses envies de stratification car le nombre de groupes augmente de faon multiplicative avec chaque facteur. Ainsi, une tude o lon veut stratifier pour le sexe (f/m), le tabagisme (oui/non) et un groupe dge (<35 ans, 35-55 ans >55 ans) aura 2*2*3= 12 strates. La randomisation adaptative de base. Pour cette stratgie, la squence de randomisation est dtermine par la squence antrieure. Le but de lalgorithme est de randomiser les participants dans les divers groupes de faon quivalente. Si un dsquilibre se prsente, la probabilit dallocation du traitement en plus petit nombre sera augmente afin de rtablir lquilibre. Un avantage de cette mthode face la randomisation en bloc est que les mdecins ne peuvent pas deviner le prochain traitement. Il sagit dune mthode peu utilise actuellement. Lanalyse statistique en est plus complexe. La randomisation adaptative la rponse. Ces procdures utilisent la rponse des participants aux interventions prcdentes pour dterminer la prochaine allocation. Un modle classique est celui nomm play the winner . Dans cette approche, on dcide de lallocation du premier traitement au hasard. La rponse du patient au traitement dicte lallocation du prochain participant : si le patient volue bien, on garde le mme traitement pour le prochain participant (play the winner!!!) tandis que si le patient volue mal, on change de traitement. Un pr requis important pour cette approche est de pouvoir avoir la rponse dichotomique (bien / mal) assez rapidement pour tre prt a allouer le traitement du prochain patient. Un aspect intressant de cette approche est quil permet de maximiser le nombre de patients bnficiant du meilleur traitement. Lanalyse est par contre souvent complique et bien peu dtude utilise les randomisations adaptatives la rponse. Exemple de play de winner :
1er pt Tx A---volue bien---2me pt TxA---volue mal---3me pt Tx B---volue mal 4 me pt TxA

5.2.2 Faire la randomisation Pour tablir une randomisation adquate, il est recommand que le dveloppement de la squence alatoire soit effectue par un groupe indpendant de celui qui recrutera ou prendra en charge les patients. Il est aussi recommand dutiliser une squence alatoire pouvant tre vrifiable postriori. On utilise pour cela des tables de randomisations (eh oui, il existe des livres de tables de randomisation.) ou des programmes informatiques.
page6

Cours dpidmio #5 pour rsidents version Dcembre 2007

Si on utilise une mthode adaptative, il est important de faire la randomisation aprs stre assure de lligibilit du participant. Enfin, il est important de maintenir lallocation inconnue jusquau moment o le participant recevra son traitement afin de minimiser les biais. Il y a au moins 4 tudes qui montrent que les tudes dont laveuglement de lallocation est douteuse ont tendance avoir des rsultats montrant un meilleur effet du traitement. Les mthodes les plus reconnues pour garder la squence dallocation anonyme sont lutilisation denveloppes opaques, de bouteilles avec numros de srie ou dune randomisation centrale au tlphone. Une faon souvent utilise pour dmontrer que lallocation fut vraiment alatoire est de dmontrer que les 2 groupes ltude avaient des caractristiques de bases semblables au moment de la randomisation. Ceci se fait habituellement dans la table 1 du manuscrit. On ne met habituellement pas de p-value dans ces tables? 5.3.1 Le traitement laveugle (blinding) Idalement, on devrait toujours maintenir le traitement allou laveugle pour le patient, le personnel soignant ainsi que pour lvaluateur de la variable dintention primaire. On parle alors de triple blind . On parle souvent de double blind lorsque la variable dintention primaire est mesure par le personnel soignant et quil sagit dune valeur objective. Il nest malheureusement pas toujours possible de garder les traitements laveugle pour le patient ou pour le soignant. Dans ces cas, il faudra avoir une variable dintention primaire la plus objective possible afin de minimiser les biais dvaluation. La faon la plus souvent utilise pour maintenir le traitement laveugle est lutilisation dun placebo. Si il sagit dun mdicament, il devrait tre trs difficile de diffrencier le mdicament du placebo en se basant sur la vue, le got ou lodorat. Voici dautres exemples dapproche utilise afin de maintenir le traitement tudi laveugle : - Chambre hyperbare (traitement avec 3 atmosphres et placebo 1.1 atmosphres afin que les patients ressente une petite pression dans loreille) - tude sur leffet dune discussion entre le mdecin et des adolescentes sur lincidence de grossesse. Groupe traitement : discussion au sujet des risques de relations sexuelles non protges, Groupe contrle : discussion sur les risque de la consommation dalcool. - Garder un pansement sur une rparation de plaie afin de cacher au patient le traitement utilis (colle vs suture). - Utilisation dpinephrine racmique vs salin en nbulisation. Le meilleur placebo, sera identique en apparence au traitement mais il naura aucun effet (positif ou ngatif) sur le patient et sera thiquement acceptable. 5.3.2 Avantages du traitement laveugle Le fait de maintenir le personnel soignant ignorant du traitement permet de limiter certains biais qui pourraient tre engendr par une diffrence de traitement entre les 2 groupes. Par exemple, un mdecin persuad quun traitement ltude est plus efficace quun placebo pourrait avoir tendance fournir plus de soins adjuvants aux patients ayant

page7

Cours dpidmio #5 pour rsidents version Dcembre 2007

reus le placebo afin de les protger. Ceci pourrait optimiser le devenir des patients du groupe placebo en comparaison avec le groupe traitement et minimiser leffet rel du traitement. Maintenir le patient laveugle permet de minimiser leffet placebo . Il a t dmontr que les patients participants une tude ont habituellement un meilleur devenir que les patients qui ny participent pas. Ceci pourrait tre d en partie parce que le patient pense quil recevra un traitement actif. Le fait de savoir quil ne reoit pas le traitement actif peut influencer ngativement le participant et nuire son outcome. De plus, sil sait quil ne reoit pas le traitement actif dans ltude, le participant pourra tenter dautres traitements. Finalement, maintenir lvaluateur laveugle permet de minimiser les biais dvaluation. Ceci est particulirement vrai pour les variables dintrt primaire subjectives (par exemple : qualit de vie, esthtisme dune plaie, douleur, etc.). 5.3.3 Inconvnients du traitement laveugle Les principales barrires au traitement laveugle sont dordre thique. Il est parfois impossible de donner un placebo un patient sil existe dj un traitement gnralement accept par la communaut mdicale (avec vidence ou non). Dans ces situations, le traitement ltude sera compar au groupe contrle form de patients ayant reu le traitement standard. Aussi, il existe certaines situations o il serait non thique davoir un placebo. Par exemple, on ne peut pas endormir un patient et lui faire une cicatrice sur le ventre pour feindre une laparotomie. Un autre problme se prsente pour les patients dont lvolution est dfavorable. Par exemple, le mdecin voudra savoir quoi fut randomis le patient si ce dernier fait une raction dallure allergique svre. En dautres occasions, le mdecin voudra savoir si un patient qui se dtriore a reu le placebo afin de lui donner le traitement ltude en dsespoir de cause. Pour toutes les tudes utilisant un traitement laveugle, il doit tre possible en tout temps de briser le code et de savoir ce que le patient a reu si le besoin se fait sentir. 6.4 Les diffrentes structures dessais cliniques randomiss 6.4.1 tudes parallles La majorit des essais cliniques randomiss utilisent une approche parallle o lon value lefficacit de 2 ou plusieurs traitements. Pour ces tudes, chaque participant est randomis un traitement parmi 2 choix ou plus. Un exemple est une tude sur lotite avec 3 branches de traitement possibles : placebo, amoxil standard ou amoxil haute dose. Il sagit dtudes au dessin facile dont lanalyse statistique est simple. 5.4.2 tude chass-croise (crossover) Il sagit dtude o le participant est initialement randomis un traitement puis il change pour lautre traitement aprs une priode de temps prdtermine. On compare donc,

page8

Cours dpidmio #5 pour rsidents version Dcembre 2007

pour chaque patient, la rponse du patient lorsquil tait sous le traitement A la rponse lorsquil tait sous le traitement B. Cette approche permet de minimiser les variations naturelles entre les participants puisque chaque participant est son propre contrle. Ceci permet de diminuer la taille dchantillon requise. On peut difficilement utiliser cette approche pour les traitements curatifs car il ne faut pas que le traitement de la premire priode ait encore un effet pendant le second traitement. On utilise donc gnralement cette approche pour les maladies chroniques. Un exemple de question pouvant mener ce type dtude serait leffet des sels dor vs. un AINS sur la douleur articulaire chez des enfants atteints darthrite rhumatode. On peut parfois utiliser les tudes crossover pour les maladies o lefficacit du traitement peut tre valu rapidement. Dans ce dernier cas, les patients avec succs de traitement au premier traitement sont librs tandis que ceux qui nont pas rpondu au premier traitement sont transfrs au second traitement. Une tude de Macias et coll (peds 1998) sur le traitement des pulled elbow en est un bon exemple. Dans cette tude, les patients avec un pulled elbow taient initialement randomiss une technique de rduction manuelle (hyperpronation ou flexion/supination). Si la manuvre chouait, linvestigateur tentait lautre mthode. La perte dun participant pour ce type dtude aura des effets plus important que pour une tude parallle parce quon perd lquivalent dun traitement et dun contrle. De plus, lanalyse statistique sera un peu plus complexe mais elle sera plus puissante. Un pr requis important pour ce type dtude est que la maladie soit stable au cours de la priode dtude afin de sassurer que chaque traitement fait face la mme maladie. On utilise aussi habituellement un ordre de traitement alatoire afin de sassurer que chaque traitement une chance gale dtre administr en premier. 5.4.3 tudes factorielles (factorial) Une tude ayant un dessin factoriel permet dtudier plusieurs thrapies concomitantes. Ltude CanBEST sur la bronchiolite en est un bon exemple. Dans cette tude, on value sparment lefficacit de 2 thrapies (lpinphrine et la dexamthasone) sur le risque dhospitalisation dans les bronchiolites. Il sagit du plus simple exemple de dessin factoriel puisque les groupes sont forms par une table 2x2. pinphrine Placebo Dexamthasone Groupe A Groupe B Placebo Groupe C Groupe D Le nombre de groupe augmente de faon exponentielle pour chaque nouveau traitement tudi. Ainsi une tude valuant 3 traitements devra avoir 2x2x2 = 8 groupes diffrents. Lavantage principal des tudes factorielles, est que lon peut mener lquivalent de 2 ou plusieurs tudes en mme temps avec un nombre plus restreint de participants : on demande moins de patients que si on menait les 2 tudes sparment. Lautre avantage est que lon peut comparer les diffrents traitements entre eux ainsi que linfluence que les diffrents traitements ont les uns sur les autres. Ainsi on pourrait dmontrer que le traitement A est aussi efficace que le traitement B mais que les 2 traitements concomitants sont 4 fois plus efficaces que les placebos.

page9

Cours dpidmio #5 pour rsidents version Dcembre 2007

Lanalyse statistique de ces tudes est un peu plus complexe car elle demande que lon tienne compte des diverses interactions. Ainsi pour analyser leffet de lpinphrine ainsi que de la dexamthasone sur la probabilit dadmission, on calculera : - Effet total de lpinphrine : P (groupe A et C) / P (groupe B et D) - Effet total de la dexamthasone : P (groupe A et B) / P (groupe C et D) - Interaction de la dexa sur leffet de lpinphrine P C / P D - P A / P B Dans ce dernier modle, si le risque relatif (pour pinphrine) est le mme pour les 2 groupes ayant reus de la dxa (A et B) que pour les 2 groupes placebos (C et D), alors, il ny a pas dinteraction. 5.4.4 Randomisation de groupe (cluster randomisation) La randomisation de groupes au lieu dindividu est parfois utilise pour certaines tudes pour des raisons pratiques. Pour ces tudes les participants seront randomiss un traitement selon quils appartiennent un groupe donn. Ces groupes peuvent tre les habitant dun village, tous les patients dun mdecin, dune clinique ou dun hpital ou tout autre groupe naturel. On peut aussi grouper les patients dans le temps. Par exemple, traitement A les jours pairs et traitement B les jours impairs. Les raisons motivant lutilisation dune randomisation de groupe sont multiples. - Elle permet dviter la contamination entre les patients lors dtudes comportementales. Pour plusieurs de ces tudes, il serait difficile de dlivrer des politiques ou certaines interventions (campagne de publicit par exemple) sur une base individuelle. - Cest une faon de minimiser les cots pour lachat dquipement dispendieux en ne procurant lquipement dispendieux ltude que dans la moiti des centres. - Il existe certaine situations o la mesure ne peut se faire quau niveau de la population car les taux dvnement recherch est bas (Intoxication au mercure par exemple). Il existe certaines subtilits prserver dans les tudes de groupes. On peut, entre autre, mesurer la variable dintention primaire au niveau individuelle ou de groupe. Il est prfrable, par contre de comparer les groupes entre eux et non les individus lorsque vient le temps de lanalyse. Il est important de maintenir la randomisation des groupes afin de minimiser les biais. Enfin, il faut considrer le fait que les participants furent groups lorsque vient le temps de lanalyse parce que les participants dun mme groupe auront une tendance naturelle se ressembler. 5.5 Les types danalyse Il existe 3 approches analytiques possibles pour les essais cliniques randomiss : a) Analyse per protocole : On analyse seulement les patients qui ont suivi le protocole (ont reu le traitement, ont t compliants et sont revenus pour le suivi final) dans le groupe auxquels ils furent randomiss. Cette approche permet dvaluer leffet biologique du traitement sur la

page10

Cours dpidmio #5 pour rsidents version Dcembre 2007

b)

c)

maladie ou la condition. Cette approche ne pourra jamais sous-estimer leffet dun traitement car on nanalyse que les patients compliants. Elle permettra, par contre, de maximiser les diffrences entre 2 traitements. Il sagit donc dune approche analytique conservatrice lors dtudes voulant dmontrer que 2 traitements sont quivalents. Cest aussi lapproche utilise pour valuer lefficacit dune thrapie. Analyse per traitement : On analyse les patients selon le traitement quils ont reu indpendamment de la randomisation. Cette approche est peu recommande car elle bafoue les avantages initiaux de la randomisation. Analyse par intention de traitement (Intention-to-treat) : On analyse tous les patients dans le groupe o ils furent randomiss quel que soit le traitement quils aient reu. Il y a 2 aspects cette analyse : Premirement, les patients sont analyss dans le groupe o ils furent randomiss (contrairement une approche per traitement). Deuximement, TOUS les patients sont analyss quelle que soient leur compliance (contrairement une approche per protocole). Lapproche par intention de traitement, plus conservatrice, permettra de minimiser les biais lis la compliance des patients. Cest lapproche analytique de choix pour les tudes visant dmontrer une diffrence entre 2 traitements. Cest aussi lapproche pour valuer lefficience dune thrapie

5.6 La taille dchantillon Le calcul de la taille dchantillon est le cauchemar pour une majorit de mdecin dsirant se lancer dans une tude clinique. Cest aussi lendroit o lon aime bien quizzer le rsident qui prsente son projet de recherche..Il sagit, par contre, dune tape cruciale pour la planification dune tude : Une taille dchantillon sous-value pourra limiter la possibilit darriver une conclusion fiable ou augmentera le risque de manquer une diffrence qui existe vraiment (erreur ). Ceci peut mener lexclusion dun traitement potentiellement bnfique. Dautre part, une surestimation engendrera des cot et effort supplmentaires en plus de soumettre un nombre excessif de patient un traitement potentiellement infrieur. Il existe de multiples faons destimer la taille dchantillon. On peut trouver des livres entiers qui traitent du sujet, des sites internet pouvant les calculer ou nous donner des formules utiles et enfin de multiples revues de littrature sur le sujet dans les journaux de biostatistique. Trois concepts statistiques de base sont essentiels la comprhension du calcul de la taille dchantillon. - Tester une hypothse : Avant de dbuter une tude, on doit premirement dfinir une hypothse de travail (HA) et une hypothse nulle (H0). Par exemple, dans un article sur le risque de cphales engendr en mangeant de la crme glace (Kackzoroswki 2002), lhypothse de travail est que la proportion de cphales

page11

Cours dpidmio #5 pour rsidents version Dcembre 2007

sera plus leve dans le groupe denfant mangeant rapidement leur crme glace que dans le groupe lent tandis que lhypothse nulle est que le 2 groupes auront des taux de cphale semblables. HA : P cphale rapide > P cphale lent H0 : P cphale rapide = P cphale lent ou P rapide -P lent = 0 Le but de ltude sera de rejeter lhypothse nulle afin de conclure que lhypothse de travail est vraie. La valeur p de signifiance : Mme si les donnes obtenues lors de ltude semblent dmontrer une diffrence entre les 2 traitements, il est toujours possible que cette diffrence soit due au hasard. On dit alors quil sagit dune erreur de type 1 ou . On peut quantifier le risque davoir une erreur de type 1 grce la valeur p. Il sagit dun terme trs utilis dans les publications mdicales dont il existe encore beaucoup dincomprhension au niveau de sa provenance. On dfinit la valeur P comme la probabilit davoir une diffrence aussi grande que celle observe lors de ltude si lhypothse nulle tait vraie (Ou probabilit de trouver une diffrence alors que lhypothse nulle est vraie). En dautres mots, une valeur p de 0.05 signifie que si les 2 traitements sont identiques, il y a 5% des chances de conclure quils sont diffrents. On accepte gnralement une erreur de 0.05. La puissance : Les rsultats dune tude pourraient accepter lhypothse nulle mme si elle est fausse. On appelle ce type derreur erreur ou de type 2. On dfinit habituellement la puissance dune tude par 1-. Il sagit de la probabilit de trouver une diffrence entre 2 traitements si il y a effectivement une diffrence. On recherche habituellement une puissance de 80% 90%. Si on veut montrer quil ny a pas de diffrence entre 2 traitements, il faut avoir une puissance plus leve (90% habituellement) afin dtre crdible.

La mthode utilise pour estimer la taille dchantillon dpend du type de variables et, par consquent, du type danalyse qui sera effectue. Il sagit toujours dune estimation base sur des prsomptions qui peuvent savrer trs diffrentes en cours dtude. 5.6.1 Variables catgoriques Les variables catgoriques (dichotomiques ou plusieurs catgories) sont habituellement analyses en comparant des proportions. Par exemple, on comparera souvent le taux de survie ou le taux de gurison de diffrents traitements. Pour des raisons statistiques, il faut habituellement plus de patients dans une tude comparant des proportions que dans une tude comparant des variables continues. On compare gnralement des proportions en calculant la valeur Z et en utilisant la formule (une explication plus approfondie de la valeur z sera faite au cours #8) : Z = (P control P Tx) / ( Rac carre de ( Pmoyen (1-Pmoyen) ( 1/Ncontrol + 1/NTx )) Cette formule peut tre ramnage pour isoler N N = ( Z * Rac carre (2*Pmoy *(1-Pmoy)) (P Tx (1 P Tx ))2 / (P control -P Tx)2 + Z* rac carre (P control (1- P control ) +

page12

Cours dpidmio #5 pour rsidents version Dcembre 2007

O N est le nombre de patients par branche (on arrondi vers le haut) Z et Z sont des constantes Valeur des constantes pour les tests (2 sided) Erreur Z 0.01 2.576 0.05 1.960 0.10 1.645 Puissance 80% 90% 95% Z 0.84 1.282 1.645

On ne connat pas la proportion de patients du groupe traitement qui auront la variable dintrt primaire. On peut, par contre dfinir ce qui serait cliniquement significatif en demandant aux cliniciens. Par exemple, un peut leur demander : si on vous proposait un nouveau mdicament avec peu deffets secondaire et un prix raisonnable, sachant que le taux dadmission dans les cas de gastro-entrite est de 20%, partir de quelle taux dadmission (pour le groupe trait) diriez-vous que ce mdicament vaut la peine dtre donn ? La rponse cette question permet de dterminer la proportion cliniquement significative pour P Tx ou la diffrence de proportion cliniquement significative . Pour le calcul dune taille dchantillon pour une variable catgorique, il faut donc connatre les valeurs des constantes Z et Z, la proportion prvue dans le groupe contrle ainsi que la diffrence de proportion cliniquement significative. Puisque les 2 proportions sont souvent semblables et que les constantes sont connues, on peut simplifier rapidement pour calculer une taille dchantillon avec =0.05 et puissance de 90%. N = 21*(Pmoy *(1-Pmoy)) / (P control -P Tx)2 O N= # de patient par branche Ceci est un raccourci statistique qui est moins prcis mais qui donne une bonne approximation. utiliser lorsquon assiste une confrence ou pour discuter mais ce nest pas assez prcis pour des calculs importants. 5.6.2 Les variables continues Les variables continues offrent certains avantages. Lavantage principal est que ces variables suivent souvent une distribution normale. Ceci permet des analyses statistiques plus faciles en plus de ncessiter un plus petit nombre de patients. On calcule habituellement la taille dchantillon avec la formule : N = 2 2 ( Z + Z )2 / (1 2)2 =2* ( Z + Z )2 * 2 / (1 2)2 O 2 est la variance moyenne = cart-type au carr 1 est la moyenne du groupe1 2 est la moyenne du groupe 2 N est le nombre de patients par branche

page13

Cours dpidmio #5 pour rsidents version Dcembre 2007

Pour calculer une taille dchantillon avec des variables continues on doit donc savoir ( partir dtudes antrieures) la moyenne prvue pour le groupe placebo ainsi que la variance (on la considre quivalente pour les 2 groupes). Comme pour les variables dichotomiques, il faut obtenir de la part dexperts, la diffrence de moyenne qui serait cliniquement significative. Parce que la taille de lchantillon augmentera avec la variabilit entre les mesures, il faut toujours avoir des mesures fiables et constantes. Plus la diffrence recherche est petite, plus il faudra de patients. Inversement, plus le nombre de patient est grand, plus on peut dtecter de minimes diffrences qui ne sont pas toujours cliniquement significatives. Les grandes tudes de cardiologie enrlent souvent plus de 50 000 patients. Ceci permet davoir une valeur p significative mais leffet pour le patient peut tre discutable. Encore une fois, il existe une petite formule statistique permettant destimer rapidement la taille dchantillon : N = 21 *Variance / (Diffrence recherche)2 O N est le nombre de patient par branche Ceci est un raccourci statistique qui est moins prcis mais qui donne une bonne approximation. utiliser lorsquon assiste une confrence ou pour discuter mais ce nest pas assez prcis pour des calculs importants 5.6.3 Les variables base sur le temps (survie) Pour plusieurs tudes, on compare leffet de divers traitement afin de repousser ou acclrer larriv dun vnement. On appelle cela tude de survie. La distribution des patients suit habituellement une courbe exponentielle. S(t) = e-t Ou est appel le taux de survie Et t est le temps Dans ces tudes, on compare donc les diffrents taux de survie (. Une formule simple propose pour calculer la taille dchantillon est : N = 2*(Z + Z )2 / (ln control/Tx)2 Cette formule suppose que les patients seront suivis jusqu' lavnement de la variable dintrt. Ceci nest pas souvent le cas. Il existe des formules plus complexes pour les situations ou les patients ne seront pas suivis jusqu cet pisode. De plus il faut avoir une ide du taux de survie du groupe placebo et identifier ce qui serait un taux de survie cliniquement significatif. Ce dernier point est souvent difficile conceptualiser. 5.6.4 Situations particulires Il existe certains cas particuliers ncessitant une modification des approches dcrites plus haut. Par exemple, lorsque le nombre de patients est asymtrique entre les 2 bras de ltude, il faudra plus de patients au total.

page14

Cours dpidmio #5 pour rsidents version Dcembre 2007

Si on fait de multiples analyses divers temps, il prfrable dutiliser une valeur p plus petite car en multipliant les analyses, on augmente le risque davoir une erreur due au hasard. Pour ce faire, on divise par le nombre danalyse prvue. Par exemple, si on prvoit faire 5 mesures, il faudrait utiliser une valeur de 0.05/5 = 0.01 afin de dire que le rsultat est statistiquement significatif. En calculant une taille dchantillon, il faut aussi se rappeler que cet chantillon reprsente le nombre de patients devant tre analyss et non seulement randomiss Il faut donc prvoir une taille dchantillon plus leve afin de compenser la perte de patient et la non compliance. En calculant le nombre de patients possiblement recrutable, il faut considrer que plusieurs patients ne remplieront pas les critres dinclusion/exclusion et que plusieurs refuseront de participer a ltude. 5.7 Donnes manquantes (missing data) Les donnes manquantes reprsentent un important problme des essais cliniques randomiss parce quil ny a pas encore de bonne solution. Plusieurs statisticiens ont proposes des approches statistiques au problme mais elles apportent toutes un risque de biais non ngligeable. Voici quelques approches : Pour tout type de variables: - Last observation carried forward : Pour les patients ayant eu plusieurs mesures, on garde la dernire mesure prsente au dossier et on considre que le patient a la mme mesure a la fin de ltude. - Exclusion des patients : Il sagit de la mthode la plus frquente mais elle comporte des risques car les patients perdus au suivi ont habituellement un devenir diffrent des patients qui restent dans ltude. Pour les variables continues : - Remplacement par la moyenne de son groupe - Remplacement par la moyenne de lautre groupe : Cette approche est plus conservatrice mais le risque derreur de type 2 est lev. - Rgression multiple : On estime la valeur de la mesure manquante en comparant toutes les autres variables du patient avec celles des autres patients qui nont pas de donnes manquante. Il sagit dune approche fastidieuse avec un risque de biais encore prsent. Pour les variables catgoriques : Best case/worst case scenario : On fait lanalyse en disant que tous les patients avec donnes manquantes du groupe contrle ont un bon devenir et que tous ceux du groupe traitement ont eu un mauvais devenir (worst case scenario). On fait lanalyse en disant que tous les patients avec donnes manquantes du groupe contrle ont un mauvais devenir et que tous ceux du groupe traitement ont eu un bon devenir (best case scenario). Cette approche nous donne le spectre des

page15

Cours dpidmio #5 pour rsidents version Dcembre 2007

rsultats possibles mais sil y a beaucoup de donnes manquantes, il est difficile de conclure car les possibilits de rsultats sont trop larges. En rsum, aucune mthode dimputation nest adquate. La meilleure solution est de ne pas avoir de donnes manquantes. 5.8 Compliance Lvaluation par intention-de-traitement est gnralement reconnue comme lapproche de choix pour les tudes visant dmontrer la supriorit dun traitement. Lvaluation de la compliance peut savre utile pour expliquer linefficacit de certains traitements. Il existe plusieurs faons de la mesurer : Par questionnaire, en comptant les comprims dans la bouteille, en instaurant une puce lectronique qui calcule la frquence dutilisation des pompes de ventolin, par mesure sanguine ou urinaire, etc. 5.9 Aspects thiques Au cours des 50 dernires annes, plusieurs textes ont t dposs afin de guider les chercheurs dans le dveloppement et la conduite dtudes cliniques. Plusieurs de ces textes furent dvelopps en rponse un vnement spcifique. Voici un rsum de quelques uns de ces textes : - Code de Nuremberg : Ce texte fut dpos en 1947 la suite dune dcision judiciaire suivant les atrocits commises par les mdecins nazis durant la deuxime guerre mondiale. Il concerne surtout la ncessit davoir un consentement clair de la part des participants et le besoin davoir un rapport risque/bnfice adquat pour les patients. - Dclaration de Helsinki : Dpos en 1964 et maintes fois rvis, ce texte fut dvelopp par lassociation mdicale mondiale pour pallier certains manques du texte prcdent. Il discute surtout du risque/bnfice et des rvisons des projets de recherche par des comits de pairs. - Le rapport Belmont fut instaur aux Etats-Unis en 1979 afin de dfinir les rgles dthique appliquer aux Etats-Unis suite a certains scandales amricains (affaire Tuskegee entre autre). - Enfin lnonc de politique des trois Conseils (http://www.pre.ethics.gc.ca/francais/policystatement/policystatement.cfm) prsente la position commune du Conseil de recherches mdicales du Canada (CRM), du Conseil de recherches en sciences naturelles et en gnie du Canada (CRSNG) et du Conseil de recherches en sciences humaines du Canada (CRSHC). Il sert de balise pour tout projet de recherche clinique au Canada. Il rgie le fonctionnement des comits dthique de la recherche des diverses institutions. Il se base sur 8 principes directeurs : o Le respect de la dignit humaine.
o o

o Le respect des personnes vulnrables. o Le respect de la vie prive et des renseignements personnels. o L'quilibre des avantages et des inconvnients. o La rduction des inconvnients. o L'optimalisation des avantages.
Le respect de la justice et de l'intgration

Le respect du consentement libre et clair

page16

Cours dpidmio #5 pour rsidents version Dcembre 2007

On peut dfinir 7 dterminants si une tude est thiquement acceptable : - Une tude doit avoir une valeur scientifique et sociale. Elle doit tre base sur des hypothses acceptables et scientifiques. Le gain escompt doit amliorer la sant des patients, tre reproductible et fiable. - La mthodologie propose doit tre valide. Une tude doit utiliser une mthodologie rigoureuse afin de sassurer que les patients impliqus seront protgs et quil y aura un bnfice scientifique la fin de ltude. - La slection des sujets doit tre quitable. Il faut sassurer que tous les groupes sociaux et dmographiques sont bien reprsents. Il faut aussi sassurer que les groupes plus vulnrables soient protgs. - Le ratio risque/bnfice doit tre acceptable pour la socit et pour le participant. - Ltude doit faire lobjet dune rvision indpendante. Cest le rle des comits dthique et scientifique qui doivent se tenir dans chaque institution. Ces comits ont le pouvoir de refuser ou dinterrompre une tude. - Les participants doivent pouvoir produire un consentement clair. Ils doivent tre inform des but, risques potentiels, bnfices et autre possibilit de traitement en cas de refus de participer. - Les chercheurs doivent respecter les participants potentiels. Pour ce faire, ils doivent permettre aux patients de quitter ltude, garder les donnes confidentielles, informer les patients de tout changement face au consentement et protger les patients.

page17

Cours # 6 sondage

Cours dpidmiologie # 7 Les mta-analyses version mars 2008

Cours dpidmio #7 Les mta-analyses


Objectifs du cours: - Savoir effectuer une revue de littrature standardise - Savoir analyser une mta-analyse - Connatre les stratgies visant valuer lhomognit des tudes dans une mta-analyse Lectures: - Moher D, Cook DJ, Eastwood S et al. Improving the quality of reports of meta-analyses of randomised. Lancet 1999; 354: 1896-1900. http://www.sciencedirect.com/science?_ob=ArticleURL&_udi=B6T1B-3YVKXHPX&_user=789746&_rdoc=1&_fmt=&_orig=search&_sort=d&view=c&_acct=C0000433 57&_version=1&_urlVersion=0&_userid=789746&md5=394d5a13998bf5f253b63ccf078 e1ea5 - Desphande G, rao S et Patole S. Probiotics for prevention of necrotising enterocolitis in preterm neonates with very low birthweight: a systematic review of randomised controlled trials. Lancet 2007; 369: 1614-1620. - http://www.sciencedirect.com/science?_ob=ArticleURL&_udi=B6T1B-4NPC1M014&_user=789746&_coverDate=05%2F18%2F2007&_rdoc=1&_fmt=full&_orig=brows e&_cdi=4886&_sort=d&_docanchor=&view=c&_ct=1&_acct=C000043357&_version=1 &_urlVersion=0&_userid=789746&md5=74bf745f6a318c206bc517eb448264df Site internet de rfrence - Site Cochrane sur les mta-analyses http://www.cochrane.dk/cochrane/handbook/hbook.htm#appendices/appendix_8a._consid erations_and_recommendations_for_figures_in_cochrane_reviews__graphs_of_statistical _data.htm - Livre lectronique sur les mta-analyse d luiversit de Lyon : http://www.spc.univlyon1.fr/livreMA/frame.htm Question #1 Lire larticle de Desphande et remplir la grille dvaluation QUOROM. Question #2 Quelle est la diffrence entre une revue de littrature, une revue systmatique de littrature et une mta-analyse ? Question #3 Dans une mta-analyse, comment savoir que tous les articles pertinents furent identifis ?

Cours dpidmiologie # 7 Les mta-analyses version mars 2008

Question #4 Doit-on avoir laccord du comit dthique avant de faire une mta-analyse? Question #5 Quelle est votre conclusion face cette figure ?

Cours dpidmiologie # 7 Les mta-analyses version mars 2008

7 Les mta-analyses
Les mdecins sont constamment confronts une quantit grandissante dinformation mdicale. Malheureusement, il est souvent difficile de synthtiser cette quantit dinformation parfois contradictoire. Les mta-analyses ont, depuis quelques annes, envahi la littrature mdicale afin de rpondre la quantit grandissante dtude. Elles consistent combiner les rsultats de plusieurs tudes selon une mthodologie claire et prcise afin de minimiser les biais de slection et dinterprtation. Ce type dtude a t cr pour pallier certains problmes lis la puissance limite (trop petit nombre de patients/tude) des tudes randomises contrles. Lobjectif principal des mta-analyses est de rpondre une question laquelle plusieurs tudes nont pas russi rpondre (trop petit nombre ou rsultats contradictoires dune tude lautre). Le prsent cours dpidmiologie consiste rsumer les grands principes sous-jacents aux mtaanalyses. Une description plus complte des diverses tapes suivre pour llaboration dune revue systmatique ou une mta-analyse se trouve sur le site web du groupe Cochrane au http://www.cochrane.org/resources/handbook/index.htm. La Collaboration Cochrane est une organisation internationale but non lucratif ddie procurer une information prcise et de qualit sur les effets des soins prodigus dans le monde. Ce groupe produit et dissmine les revues systmatiques (mta-analyses) sur des interventions de sant et encourage la recherche dvidence de qualit sous la forme dtudes dinterventions randomises. Rgle dor de la mta-analyse: la mta-analyse ne peut tre meilleure que la meilleure des tudes utilises pour la faire. Garbage in = garbage out.

7.1 Comment faire une mta-analyse


7.1.1 Choisir une question La premire tape de llaboration dune mta-analyse est de dterminer une question de recherche qui na pas dj t rsolue. Si lvidence est forte quun traitement est suprieur un autre et quil ny a pas de controverse, il est peu utile de faire une mta-analyse, de mme que si plusieurs mta-analyses ont t faites sur le mme sujet et la mme question De plus, sil ny a que 1 ou 2 essais cliniques randomiss sur le sujet on ne pourra pas faire de mta-analyse. On peut se rfrer aux outils de recherche suivant pour rviser la littrature et savoir si une question dj t tudie: Pudmed, lEmbase (base de donnes europenne) et la librairie Cochrane, (http://www.cochrane.org). Ces bases de donnes seront dcrites plus loin. En plus de sa pertinence, il est important davoir une question de recherche claire qui contient 4 lments essentiels que nous avons dj dcrit dans dautres cours. On se rappelle de ces 4 lments par lacronyme PICO. P Participants. qui sadresse cette tude. Il est important davoir des critres clairs dfinissant la maladie ET les patients inclus dans ltude. Comme pour les essais cliniques randomiss, une restriction augmentera la validit interne de la mta-analyse mais limitera la gnralisibilit.

Cours dpidmiologie # 7 Les mta-analyses version mars 2008

C O

Intervention. Quel est le traitement valu? quelle dose? La plupart des interventions varient dune tude lautre surtout si lintervention est un mdicament (variation de la posologie, technique dadministration diffrente, traitement donn par des infirmires, des mdecins, des sur-spcialistes, etc). Cela peut tre intressant de voir lefficacit dun traitement mme si lintervention nest pas identique entre les diffrentes tudes sur ce sujet. Il faut, par contre, faire attention de ne pas inclure dtudes o la dose serait trop forte ou trop petite pour ne pas induire un biais dans la mta-analyse. Contrle. Quel est le traitement standard utilis ? Outcome. Quelle est la variable dintrt primaire? Il faut tre trs prcis sur la comparaison que lon utilisera. La dfinition de la variable dpendante est-elle identique ou au moins similaire dun article lautre. Par exemple, il peut tre difficile davoir une dfinition claire et reproductible dadnite cervicale pour que lon puisse comparer les rsultats de plusieurs tudes. Un autre exemple nous vient de la littrature sur la gastroentrite; pendant que certaines tudes utilisent un outcome primaire de dure des symptmes (en heure), dautres valuent la quantit de selles au jour 2 tandis que dautre valuent la prsence de diarrhe (oui/non) selon les parents au jour 3. Il est donc difficile damalgamer toutes ces tudes en un seul outcome primaire.

Enfin il est important de dterminer quel type dtude sera valu dans la mta-analyse. La majorit du temps, on value des essais cliniques randomiss 7.1.2 Slectionner les tudes Cette tape comporte deux volets. Le premier consiste lidentification tous les essais cliniques randomiss touchant au sujet. Cette tape est critique et lutilisation dune approche systmatique permet de diffrencier les revues de littrature traditionnelles dune mta-analyse. Des tudes ont dj rapport que lutilisation de Medline uniquement avait une sensibilit variant de 30 80 % pour identifier tous les RCTs publis touchant un sujet. Il faut donc utiliser dautres mthodes afin didentifier tous les RCTs pertinents. Voici dautres mthodes utiles afin didentifier les tudes pertinentes : - Recherche de la base de donne lectronique EMBASE. Il sagit dun quivalent Europen de Pubmed regroupant des revues diffrentes de Pubmed. - Recherche de la base de donne du groupe Cochrane (CENTRAL). Cette base de donne consiste en un regroupement de plus de 350 000 RCT rpertoris par les membres du groupe Cochrane. Il sagit de la plus large banque de donnes concernant les RCTs. - Recherche manuelle en scrutant les rfrences des articles choisis pour ltude. - Recherche manuelle en valuant les rsums de congrs scientifique. - Recherche des tudes non publies en communicant avec les auteurs. Le deuxime volet consiste dcrire les critres dinclusion et dexclusion utiliss pour dfinir les tudes pertinentes. Cette tape consiste valuer toutes les tudes identifies afin de ne retenir que celles qui remplissent certains critres de pertinence. Ainsi, cest cette tape que lon rejettera les tudes dont le outcome primaire est diffrent et non interchangeable avec celui que lon a choisi pour la mta-analyse. Idalement, ce processus doit tre effectu par plus dun

Cours dpidmiologie # 7 Les mta-analyses version mars 2008

valuateur qui rvisent chaque abstracts choisis. Le protocole de la mta-analyse doit bien dcrire comment se fera lvaluation des tudes. Il faut dfinir : - Qui valuera les abstracts (MD, tudiants, infirmire de recherche, archiviste, etc) - Combien dvaluateur par abstract (idalement 2) - Comment seront valus les conflits - Quelle est la population recherche - Quel est le outcome primaire - Quelle est lexposition 7.1.3 valuation de la qualit des tudes. Lvaluation de la qualit des tudes est primordiale afin de limiter les biais relatifs aux mtaanalyses. Certaines mta-analyses rejetteront les tudes dont on suspect une moins bonne validit tandis que dautre se serviront des valuations de la validit afin dexplpiquer les rsultats. Dune faon ou dune autre cette valaution est importante. Il existe plusieurs faon dvaluer la qualit des essais cliniques randomiss. En 1995, Moher et al ont rpertori plus de 25 chelles et 9 checklist utilises afin dvaluer la validit des essais cliniques randomiss. Parce quil nexiste pas de gold standard pour la validit dune tude, il nexiste pas dvaluation de ces chelles. Il nexiste pas de mthode universellement reconnue pour valuer la validit des tudes. Les investigateurs peuvent donc utiliser la mthode de leur choix. Il est, par contre important de spcifier dans la mthodologie de la mta-analyses : - Qui a valu la validit des tudes - Quelle est la corrlation inter-observateur pour lvaluation des tudes - Combien de personnes ont valu chaque tude et comment furent rsolus les conflits - Est-ce fait laveugle des auteurs et des rsultats - Quel outil fut utilis pour valuer la validit. 7.1.4 La collecte des donnes. La collecte des donnes se fait laide dun formulaire standardis. Ce formulaire doit avoir t test sur quelques tudes avant dtre utilis. On doit mesurer la corrlation inter-observateur pour lutilisation du formulaire a-priori. Les composantes essentielles au formulaire de collecte sont : - Un identifiant pour chaque tudes - Les auteurs - La rfrence pour chaque tude - Une vrification de lligibilit - Les caractristiques des tudes (randomisation, blinding, validit, etc) - Le nombre de participant - Lintervention exacte - Le groupe contrle - La variable dintrt primaire - Les rsultats Idalement, la collecte des donnes initiale devrait se faire laveugle des rsultats au moment dvaluer la validit dune tude.

Cours dpidmiologie # 7 Les mta-analyses version mars 2008

7.1.5 Lanalyse Aprs avoir fait la revue systmatique ainsi que la collecte des donnes, il faut en faire lanalyse. Lanalyse consiste regrouper les rsultats des diffrentes tudes pour en obtenir un rsultat combin. Les buts de faire une mta-analyse sont : - pour augmenter la puissance de ltude - Pour augmenter la prcision - Pour rpondre une question que les tudes individuelles ne russissent pas rpondre Lanalyse des mta-analyses se fait habituellement en 2 tapes. La premire consiste rapporter une valeur statistique (OR, RR ou autre) pour chaque tude incluse dans lanalyse. Par la suite, on rapporte une valeur sommaire comprenant les rsultats de toutes les tudes rassembles (pooled statistics). Le sommaire est form par lensemble des rsultats des tudes individuelles. Plusieurs mthodes existent pour combiner les rsultas de plusieurs tudes dans une mtaanalyses. La mthode la plus utilise est celle de pondrer les rsultats des diffrentes tudes slectionnes en se basant sur 2 hypothses : leffet fixe (fixed effect model) ou leffet alatoire (random effect model). Modle fixe Dans le modle fixe, on prsume que leffet de lintervention est identique entre les diffrentes tudes et que ces tudes sont donc semblables et que les variations de leffet dune tude lautre sont secondaires aux diffrences dues aux patients ou lintervention qui est un peu diffrente entre les tudes. Plusieurs faons de combiner les rsultats de leffet de lintervention ont t dcrites dont le Mantel-hanzel, DerSimonian-Laird, la mthode de Peto ou lapproche baysienne. La mthode de Peto serait plus souvent utilise. Un des inconvnients de la mthode fixe est quon ne peut expliquer lhtrognit entre les tudes car on assume que leffet est considr fixe entre les tudes. Cependant, la plupart des mta-analyses incluent des tudes tant assez homognes tant qu la population, lintervention et la variable dpendante donc le model fixe est le modle de choix. Modle alatoire Lautre modle est le modle alatoire ou ( random effect model). Dans ce modle, on assume que leffet rel ( la variation des rsultats) est variable dune tude lautre et non la diffrence des patients ou de lintervention tudie, contrairement au modle fixe. Ces diffrences se distribuent normalement et reprsente lhtrognit. Lanalyse peut se faire avec le Mantelhanzel, DerSimonian-Laird mais ne peut se faire avec la mthode de Peto. Il ne semble pas avoir de mthode suprieure mais lorsque les rsultats des tudes ou les populations sont diffrentes ont prfre le modle alatoire et si les rsultats des tudes ou les populations sont semblables, la mthode fixe est adquate. Il existe maintenant des programmes informatiques permettant de calculer les rsultats sommaires pour les mta-analyses. Le programme REVMAN est distribu gratuitement par le groupe Cochrane et permet de tels calculs. On peut y accder via : http://www.cc-ims.net/RevMan La reprsentation des rsultats

Cours dpidmiologie # 7 Les mta-analyses version mars 2008

Il existe au moins 3 tables/figure prsenter dans une mta-analyse. La premire figure consiste en un organigramme dcrivant lidentification et la slection des articles pertinents. La figure suivante montre un exemple dune telle figure :

http://www.nature.com/ijo/journal/v27/n5/images/0802258f1.gif

Cours dpidmiologie # 7 Les mta-analyses version mars 2008

La premire table consiste habituellement en une table dcrivant sommairement toutes les tudes incluses dans la mta-analyse. Cette description peut varie dune mta-analyse lautre mais ressemble la table suivante :

Cours dpidmiologie # 7 Les mta-analyses version mars 2008

La figure suivante (nomme forest plot) montre comment on reprsente les rsultats individuels et le sommaire. Chaque ligne reprsente une tude. Les extrmits indique lintervalle de confiance et le carr central est la statistique sommaire. Plus le carr est large plus ltude est importante (poids plus lev) dans la mta-analyse finale. Le diamant reprsente le rsultat final sommaire. Le centre du diamant est le RR final est les extrmits nous donnent les limites de lintervalle de confiance 95% pour les rsultats.

Une information importante retracer dans une mta-analyse est lvaluation de lhtrognt. On dfini lhtrognt par la variabilit entre les rsultats pour diffrentes tudes. Cette variabilit provient de 2 sources : 1. La variabilit clinique (diffrence entre les populations, interventions et outcomes tudis) et 2. La variabilit mthodologique (diffrence dans le dessin de ltude tel laveuglement, la randomisation, etc). Il est important dvaluer jusqu quel point les rsultats des tudes incluses sont divergents. On peut avoir une ide de cette htrognt en regardant si les intervalles de confiance se superposent. Il existe aussi des mthodes statistiques permettant dvaluer lhtrognt mais leur calcul ne fait pas partie de ce cours. Il faut juste savoir que quune valeur de p< 0.05 signifie quil y a de lhtrognt. Mesure de leffet (effect size) Dans les tudes individuelles, on rapporte souvent le risque relatif ou le rapport de cotes qui donne une estimation du risque de la maladie ou la condition tudie suite une intervention ou une exposition. Ces estimations ne nous donne pas par contre la mesure de leffet, lampleur de leffet de lintervention (le nombre de cas de la maladie tudie si on la traite ou pas). La mtaanalyses permet ce type de mesure. Elle permet de calculer le nombre de patients quil faudrait pour pouvoir viter une maladie (Number needed to treat) Analyses de sensibilit On retrouve frquemment des analyses de sensitivit dans les mta-analyses. Elles consistent enlever les tudes soient trs positive ou trs ngative ou les tudes avec population diffrentes et voir si le rsultat de la mta-analyse est encore dans la mme direction. 9

Cours dpidmiologie # 7 Les mta-analyses version mars 2008

7.2 Comment valuer la qualit dune mta-analyse?


Il existe une liste de critres qui permettent de distinguer une bonne mta-analyse dune mauvaise. La grille valuative QUORUM [2] La grille valuative Quorum consiste en une description de la mthodologie suggre dun abrg et dun papier sur une mta-analyse. Elle consiste en 21 items et sous items concernant : la recherche et la slection, lvaluation de la validit des tudes slectionnes, la synthse des donnes, la description des caractristiques des tudes slectionnes, la synthse des donnes quantitatives, la validit interne (qualit des tudes) la gnralisabilit des rsultats.

7.2.1 Quoi rechercher dans la section mthodologie?


1) Est-ce que la question adresse par la mta-analyse est claire et explicite? 2) Recherche des articles: Est-il probable que dimportants articles soient oublis? Description des sources (banques de donnes, registres, filire personnelle, informateurs experts, agences, et restriction ( annes, statut de publication, langue de publication (anglais uniquement ou autres), MEDLINE ( 1966-2002) EMBASE (1988-2002) Cochrane Renal Group Specialized Register, text words used, RCTs 3) Slection des articles: critres dinclusion et dexclusion des articles On doit retrouver les dfinitions des populations, interventions, rsultat thrapeutique principal et devis de ltude. Il faut que les populations se ressemblent, lintervention soit comparable et que la dfinition de la variable dpendante (la consquence de lintervention) ne diffre pas trop dune tude lautre. On devrait retrouver la figure dcrivant lidentification et la slection 4) Est-ce que la validit des tudes slectionnes a t estime? Les critres et le processus (conditions masques, valuation de la qualit et leurs trouvailles) Description des mthodes de randomisation et dissimulation (est-ce que la randomisation permet de prvenir que linvestigateur influence lallocation des patients?) aveuglement des participants et investigateurs aprs la randomisation, analyse du projet thrapeutique

10

Cours dpidmiologie # 7 Les mta-analyses version mars 2008

(intention-to-treat), taux de suivi. Lorsque des donnes taient manquantes, les investigateurs des tudes taient contacts. 5) Est-ce que lvaluation des tudes est reproductible? Description du processus utilis pour valuer les tudes. Plusieurs mthodes dvaluation sont propos dont celle de Moher [3] qui est le plus souvent utilis ou le CONSORT statement [4] ou la mthode plus ancienne de Chalmers qui est encore souvent utilise[5]. Il faut savoir si lvaluation de la qualit des articles sest faite indpendamment ou si elle a t duplique. On devrait aussi savoir comment la mthode de rsolution en cas de divergence entre les valuateurs 6) Caractristiques des tudes : Est-ce que les rsultats taient semblables dune tude lautre? Le type dtude i.e. : devis, caractristiques des patients, dtail de lintervention, dfinition du rsultat thrapeutique (outcome) et est-ce que lhtrognit des tudes a t value? Une mta-analyse implique que les rsultats de plusieurs tudes ont t compils et implique que les tudes sont assez semblables entre elles (homognes) . Il existe une mthode de vrifier si tel est le cas : un test dhtrognit. Le test d dhtrognit est calcul laide de Chi carr. On rapporte aussi les rapports de cote et lintervalle de confiance de 95% de chaque tude 7) Synthse des donnes quantitatives On devrait retrouver la mesure principale de leffet (risque relatif) et la mthode de combiner les rsultats des diverses tudes, avec intervalle de confiance. On devrait aussi dfinir la mthodologie de traitement des donnes manquantes, des statistiques du test dhtrognit. La rationnelle pour les analyses de sensitivit et les analyses de sousgroupes et lvaluation des biais de publication devraient tre dcrits.

7.2.2 Quoi rechercher dans la section rsultats ?


1) Rsum des caractristiques de chaque tude. Table 1 dcrivant les tudes incluses. 2) Un rsum simple des rsultats (pour chaque groupe de traitement, pour chaque rsultat). Il peut y avoir un calcul de lampleur de leffet, des intervalles de confiances dans les analyses du projet thrapeutique. Cest l que lon utilise la forest plot 3) Quels sont les rsultats et la prcision des rsultats? Dtail sur le nombre absolu de cas, les rsultats de lanalyse intention to treat. Combien de patients devront tre trait pour viter un cas de maladie ou complication, etc?

7.2.3 Quoi rechercher dans la section Discussion ?


On devrait retrouver dans la section discussion le rsum des faits importants, une discussion sur la validit interne et externe. On retrouvera aussi une interprtation des rsultats selon la

11

Cours dpidmiologie # 7 Les mta-analyses version mars 2008

littrature actuelle dcrivant les biais potentiels de la mthodologie et suggrant des voies de recherche future.

7.3 Biais des tudes mta-analyses


Le biais de publication est un problme important pour les mta-analyses. Pour le solutionner, plusieurs options ont t voques : 1. Inclure toutes les tudes. Ceci est difficile car on inclura des tudes de pitres qualits et a ne rglera pas le problme du biais de publication 2. Mthode de Rosenthal : Cette mthode consiste dterminer mathmatiquement combien dtudes ngatives devraient tre incluses pour renverser les tudes positives 3. Graphique en entonnoir : Cette mthode est la plus souvent utilise pour valuer la prsence dun biais de publication (voir la figure suivante). Elle consiste faire un graphique o chaque point reprsente une tude. En abscisse(x) on dsigne le OR ou RR tandis quen ordonn(y) on place la prcision de ltude. Ce graphique devrait avoir une forme de pyramide centre sur la vraie valeur du OR (ou RR) parce que les tudes les plus prcises devraient tendrent vers la VRAIE valeur de OR tandis que les tudes les plus loin de la vrit devraient tre celles avec le moins de prcision. En absence de biais de publication, on devrait avoir une distribution symtrique des points formant ainsi un entonnoir invers (une pyramide). Certains logiciels ont t crs pour faire ceci. De plus il existe une mesure (Beggs test) permettant dvaluer le biais de slection. Cette mthode value la relation entre la variabilit et la taille de leffet.

12

Cours dpidmiologie # 7 Les mta-analyses version mars 2008

La figure suivante montre 3 graphiques en entonnoir des distributions thorique des publication sur un sujet donn. On peut voir que dans le graphique a la distribution est symtrique de part et dautre du RR tandis quil y a moins de publications situes la droite de la ligne du RR dans le graphique c . Ces articles non publis dans le graphique c reprsentent un biais de publication

Les forces de la mta-analyse : Forces : utile pour rsumer les rsultats de plusieurs tudes augmente la puissance statistique globale cot moindre quun essai clinique randomis de taille quivalente Les faiblesses : biais de publication qualit des tudes utilises ou le principe du garbage in = garbage out comparabilit des tudes slection des tudes Il est important de spcifier quune tude randomise contrle (ERC) de bonne puissance devrait tre meilleure pour rpondre une question quune mta-analyse. LeLorier sest intress au sujet et a compar 12 RCTs et 19 mta-analyses sur le mme sujet. Il a trouv un accord modr entre les 2 types dtude (score Kappa de 0.35), VPP: 68% VPN: 67%. Il existait une diffrence de lestimation de leffet dune tude lautre dans 80% du temps mais la direction de leffet tait la mme (ex. le mdicament efficace vs non efficace). On notait par contre, une diffrence significative entre les ERCs et les mta-analyses dans 12 % des cas. Il conclu en disant que si aucune ERC navait t faite suivant le rsultat dune mta-analyse, on aurait adopt un traitement inefficace dans 32% du temps ou rejet un traitement efficace dans 33 % du temps. Donc il existe un DANGER de conclure faussement si on se fit uniquement aux mta-analyses [1] En rsum, il existe une mthodologie propre aux mta-analyses qui doit tre respecte pour en assurer sa qualit et sa validit.

13

Cours dpidmiologie # 7 Les mta-analyses version mars 2008

1. 2. 3. 4. 5. 6.

LeLorier, J., et al., Discrepancies between meta-analyses and subsequent large randomized, controlled trials. N Engl J Med, 1997. 337(8): p. 536-42. Moher, D., et al., Improving the quality of reports of meta-analyses of randomised controlled trials: the QUOROM statement. Quality of Reporting of Meta-analyses. Lancet, 1999. 354(9193): p. 1896-900. Moher, D., et al., Assessing the quality of randomized controlled trials: an annotated bibliography of scales and checklists. Control Clin Trials, 1995. 16(1): p. 62-73. Hopewell, S., et al., CONSORT for reporting randomised trials in journal and conference abstracts. Lancet, 2008. Chalmers, T.C., et al., A method for assessing the quality of a randomized control trial. Control Clin Trials, 1981. 2(1): p. 31-49. Flanc, R.S., et al., Treatment of diffuse proliferative lupus nephritis: a meta-analysis of randomized controlled trials. Am J Kidney Dis, 2004. 43(2): p. 197-208.

Higgins JPT, Green S, editors. Cochrane Handbook for Systematic Reviews of Interventions 4.2.5 [updated May 2005]. In: The Cochrane Library, Issue 3, 2005. Chichester, UK: John Wiley & Sons, Ltd

14

Cours dpidmio #8 pour rsidents version jan 2008

Cours dpidmio #8 Prparer un protocole de recherche


Objectifs du cours : - Savoir dfinir la question de recherche. - Connatre les grandes tapes de la rdaction dun protocole de recherche. - Savoir ce quil faut connatre pour calculer une taille dchantillon. - Connatre les tapes inhrentes la ralisation dun projet de recherche. - Savoir prparer une base de donne. faire : - Prparer les grandes lignes dun projet de recherche : Question de recherche prcise. Avoir une ide de la mthode Exercices pratiques faire avant le cours. Il ny a pas de question pour ce module. Vous devez prparer un projet de recherche. Vous devez laborer un protocole visant valuer un proverbe, une expression ou une croyance populaire. Mme si le sujet ne semble pas srieux, le protocole devra tre rigoureux. Voici des exemples de sujet tudier : - Aprs la pluie le beau temps - Dans les petits pots les meilleurs onguents - Les enfants qui ne portent pas de tuque sont risque davoir une pneumonie - etc Quelle est votre expression ou croyance tudier? Quelle est la question de base ? Faites lintroduction en 3 phrases (pas besoin de faire de revue de littrature) Quel est le dessin (devis?) de ltude (1 phrase)? O se fera- t-elle (1 phrase)? Qui seront les participants (1 phrase)? Quelle sera la variable dintrt primaire et comment la mesurera-t-on ? (2 phrases) Combien de participants faut-il selon vous ? (estimation grossire) Lensemble des participants au cours votera pour le meilleur projet au niveau de loriginalit et de la rigueur du protocole.

Page 1

Cours dpidmio #8 pour rsidents version jan 2008

La prparation dun protocole de recherche


Pour plusieurs, le fait de mettre une ide de recherche par crit sous forme de protocole semble une montagne insurmontable. Ceci ne devrait pas tre le cas puisque que llaboration dun protocole de recherche se fait en suivant certaines tapes simples qui seront discutes plus loin dans le prsent chapitre. Avant de sembarquer fond dans un projet, tout chercheur devrait sassurer que le projet remplit 5 critres (RUINE): R alisable : Il faut sassurer quil y a assez de patients pour complter ltude dans un temps adquat. U tile : Si vous voulez tre publi un jour... I ntressant : Vous passerez BEAUCOUP de temps travailler sur votre projet. Lintrt est le critre de russite numro un. N ouveau : afin dintresser les gens thique 8.1 Les buts dun protocole Llaboration dun protocole de recherche se fait pour 4 grandes raisons: 1. Le chercheur doit crire prospectivement ce quil veut tudier ainsi que justifier les raisons le poussant effectuer ltude. Ainsi, les rsultats rapports seront crdibles et non le fruit dune dcouverte fortuite due au hasard. Il est beaucoup plus crdible davoir un chercheur qui dit quil valuera une possible association entre un facteur et une maladie et qui la dmontre que davoir un chercheur qui est all la pche en valuant 50 facteurs pour rapporter 1 association avec une maladie. Ce deuxime chercheur court un risque lev de rapporter une association due au hasard. 2. Les tudes impliquant des humains ou des animaux doivent tre approuves par un comit dthique de la recherche (CER, ou Institutionnal review board IRB) de linstitution o aura lieu ltude avant de dbuter. Le protocole permettra de bien dcrire ltude aux membres de CER. 3. Les organismes subventionnaires se basent sur le protocole afin de dterminer loctroi dargent. 4. Llaboration du protocole permet souvent de mettre en lumire certains problmes potentiels. Il permet aussi de sassurer que tous les chercheurs de lquipe disent la mme chose. 8.2 tape 1 dterminer la question de recherche La dtermination de la question de recherche est ltape la plus importante et une des plus difficiles effectuer. Il sagit de la base sur laquelle sera construit le protocole. Il faut bien prendre son temps pour bien la dfinir parce quil est difficile de la changer en cours de route. Une subtilit dans la formulation peut entraner des impacts majeurs. Voici un exemple thorique qui illustre bien ce point : Au 18me sicle, 2 embaumeurs voulaient tre certain que tous ceux quils mettaient en terre taient bel et bien mort avant de les enterrer et non simplement dans un sommeil profond. Ils allrent voir le sorcier du village pour lui demander conseil. Le premier dit au sorcier : Comment massurer que je nenterre que des morts? tandis que le second demanda Comment massurer que je ne tue pas une personne endormie en faisant mon

Page 2

Cours dpidmio #8 pour rsidents version jan 2008

travail dembaumeur? Le sorcier rpondit au premier de planter un clou de 50 cm au niveau du cur de chaque client avant de lenterrer afin dtre certain quil soit mort. Au second, il lui suggra de mordre le gros orteil du client afin de voir sil se rveille avant de lenterrer. Les questions de recherche peuvent provenir de plusieurs sources. Il peut sagir dune question que lon se pose aprs avoir vu un patient, suite un club de lecture ou une revue de littrature. Un bon endroit provient aussi des limites inhrentes aux tudes publies. On peut ainsi refaire ltude en amliorant la qualit du dessin (devis?) afin den minimiser les limites. On peut aussi transposer une tude mene dans un autre milieu son milieu. En dterminant la question, il est important didentifier si on veut valuer un effet biologique ou une situation clinique. Par exemple, voici 2 questions dcrivant une situation similaire mais ncessitant une analyse diffrente : Quelle est la proportion de persistance dotite aprs 48 heures de traitement chez une population ayant pris de lamoxyl? Quelle est la proportion de persistance dotite aprs 48 heures de traitement chez une population qui on a prescrit de lamoxyl? La premire question value leffet biologique du mdicament et permet den mesurer lefficacit (efficay study) tandis que la deuxime question permet de dterminer leffet de ce mme mdicament lorsquil est utilis en pratique. On parle alors deffficience (effectiveness study). Une bonne question de recherche devrait contenir 4 items dans la question que lon dcrit avec lanagramme PICO: P articipant : On doit dire qui sapplique la question et qui seront les sujets de ltude I ntervention : on doit dfinir ce que sera lintervention ou lexposition (lors dtude observationnelle) C ontrole : On dfinit quel sera le groupe contrle Oucome : On dfinit ce qui sera la variable dintrt primaire (souvent la maladie ou un aspect de morbidit) 8.3 tapes 2 et 3 la revue de littrature et la faisabilit La revue de littrature Une question de recherche perd de son importance si elle a dj t rpondue adquatement par le pass. De plus, il ne serait pas thique de priver un participant dun traitement reconnu suprieur pour des fins de recherche. Le mot adquatement est soulign parce quil existe beaucoup dempirisme en mdecine et certains dogmes bnficient parfois dtre valus. Par exemple, les chirurgiens ont longtemps proscrit lutilisation danalgsie chez les patients avec suspicion dappendicite de peur de masquer la douleur et les signes cliniques dappendicite. Ceci tait bas sur des livres de rfrences se basant sur lexprience de chirurgiens experts. Il existe maintenant plusieurs tudes dmontrant la scurit de la prescription danalgsie chez ces patients.

Page 3

Cours dpidmio #8 pour rsidents version jan 2008

Un chercheur intress par un sujet a habituellement une ide de la littrature concernant ce sujet avant didentifier une question de recherche. Une fois la question choisie, il est impratif de faire une revue de littrature extensive afin didentifier ce qui a t fait sur le sujet. Cest un travail fastidieux mais trs important parce quil servira prouver la pertinence du projet aux comits dthique, scientifique et subventionnaires. La majorit des sujets de recherche ont dj t tudis par le pass mais la majorit des tudes ne russissent pas clore le dbat pour lune des raisons suivantes : - La population tudie est diffrente de la vtre : groupe dge diffrent, diffrence gntique, diffrence de milieu, diffrence dans le temps, etc - La taille dchantillon tait trop petite pour conclure - Il y a des rsultats discordants entre les tudes - La question de recherche est un peu diffrente (efficience vs efficacit par exemple) - 1 seule tude sur le sujet existe et elle est difficilement gnralisable Ainsi, il existe un effet balancier que lon voit frquemment en mdecine : 1. Quelquun rapporte un cas ou une courte srie de cas de patients avec la maladie X traits avec succs avec le traitement A 2. Quelquun rapporte une petite tude montrant lefficacit du traitement A dans la maladie X 3. Plusieurs tudes de taille moyenne montrent lefficacit du traitement A dans la maladie X 4. Une mta-analyse ou une grande tude multi-centrique dmontre lefficacit du traitement A dans la maladie X 5. Quelquun rapporte des situations spciales o le traitement A nest pas efficace pour la maladie X ou il y a dimportants effets secondaires Il est important pour un chercheur de savoir o se situe son tude dans le cycle de la recherche et de bien positionner ltude propose par rapport ce qui est connu sur le sujet. Il est aussi trs utile de demander aux experts leur opinion face la question de recherche ainsi que de sinformer sur les vidences sous-jacentes cette opinion. valuer grossirement le protocole. Une fois la question de recherche choisie et aprs stre assur quelle nait pas dj t rpondue, il faut commencer construire une bauche de protocole afin de sassurer de sa faisabilit. Pour ce faire, il faut avoir une ide du nombre de patients que lon peut recruter, du temps dont on dispose et du nombre de patient que lon doit recruter. Par exemple, un rsident voulant faire une tude prospective sur le purpura fulminans ne pourra jamais terminer son tude avant la fin de sa rsidence. Il est important de sattarder ce problme avant de passer de longues heures rdiger le protocole. Nous discuterons plus loin de la faon destimer une taille dchantillon. 8.4 tape 4 crire le protocole de recherche Le protocole de recherche sera lu par des gens beaucoup moins intresss et connaisseurs par le sujet de recherche que les chercheurs eux-mmes. Il faut donc tre clair et concis. Un protocole ne devrait habituellement pas dpasser 10 pages + rfrences et annexes.

Page 4

Cours dpidmio #8 pour rsidents version jan 2008

Les rviseurs prfrent lire un protocole court mais complet avec possibilit de se rfrer aux annexes au besoin. Certains chercheurs recommandent dcrire le protocole en anglais ds le dbut mme pour les gens dont ce nest pas la langue dusage. Cest plus long et ardu au dbut mais ceci sauve beaucoup de temps lors de la soumission certains organismes subventionnaires et lors de la rdaction du manuscrit. 8.4.1 La page titre Elle doit contenir le titre complet du projet. Ce titre doit bien dfinir lobjectif de ltude ainsi que la population tudie. Le nom des collaborateurs doit par la suite tre inscrit. La collaboration peut tre associe des conflits quand vient le temps de dterminer lordre des auteurs. Il est donc important de clarifier cet ordre ds le dbut du projet. Le premier auteur est en charge de mener le projet. Il rdige habituellement la premire version des protocoles et manuscrit en plus davoir le dernier mot lors des dcisions controverses. Cest lui qui prend le premier crdit de ltude mais cest lui qui travaille le plus fort. Le premier auteur nest pas ncessairement le responsable du projet auprs des institutions. Il est frquent davoir un rsident en tant que premier auteur tandis que cest un patron du CHU Sainte-Justine qui est le principal investigateur auprs du centre de recherche. Il existe un peu de confusion quand la place que doit avoir un patron qui supervise un rsident. Certain suggrent quil soit le deuxime auteur en plus dtre le corresponding author tandis que dautre suggrent quil soit le dernier auteur.. Finalement, la page titre contient ladresse de correspondance. Les formulaires de soumission demandent habituellement la signature de tous les collaborateurs. Il est utile de recueillir cette signature au plus vite car on perd beaucoup de temps les rechercher la dernire minute. 8.4.2. Le rsum (abstract) page Mme sil se trouve au dbut du protocole, il est suggr de faire le rsum la fin, lorsque les donnes sont analyses et que les conclusions sont tires. On peut ainsi copier et coller des parties du protocole afin dtre cohrent. Un rsum doit contenir entre 200 et 300 mots diviss en 4 sections Introduction (Bacground) : 1 3 phrases pour exposer la nature du problme Objectif (objective) : 1 phrase o lon exprime clairement lobjectif principal de type PICO Mthodes (methods) : 4-6 phrases o lon dcrit le devis dtude (design), le lieu (setting), les participants (inclusion/exclusion criteria), la variable dintrt primaire (primary outcome), la procdure (procedure) et lanalyse (analysis) dont le calcul de la taille dchantillon (sample size) Rsultats escompts (expected results) : 2 phrases Conclusions On utilisera un rsum semblable lorsque lon voudra soumettre les rsultats un congrs en minimisant lintroduction et en bonifiant les rsultats et ajoutant une section conclusion o lon rpond lobjectif de base.

Page 5

Cours dpidmio #8 pour rsidents version jan 2008

Labstract est trs important et doit bien reflter les rsultats du projet car la plupart des lecteurs de journaux ne liront que labstract et interprteront ces rsultats. 8.4.3 Lintroduction (background) 3 5 pages maximum Lintroduction est la section o lon explique la pertinence de ltude. Certains auteurs divisent lintroduction en 2 sections (introduction et revue de littrature) tandis que dautres ne font quun seul bloc. Il sagit dun choix ditorial personnel. Quelle que soit la mthode utilise lintroduction se divise habituellement en 4 grandes sections : - Exposer limportance de la maladie (situation) ltude - Exposer la nature du problme tudier - Dire ce qui a dj t fait sur le sujet et quels sont les arguments pour faire ltude - Dire quel est lobjectif de ltude Il existe plusieurs faons dcrire une introduction mais voici une faon simple et facile respecter. Chaque projet tant diffrent, il y aura une touche individuelle propre chaque projet. On commence habituellement lintroduction par tenter de convaincre le lecteur de limportance du sujet tudier. Un sujet peut tre important pour plusieurs raisons dont voici une liste non complte : - Elle touche beaucoup de gens (ex : obsit) - Elle a un taux de mortalit important (ex :cancer) - Elle entrane une grande morbidit (ex : accident de moto) - Elle est associe des cots sociaux importants (ex : erreurs mdicales) - Elle est rare mais elle touche une population prcise et si les chercheurs ne ltudient pas personne ne le fera (ex : ataxie de Charlevoix) Il est important davoir des donnes probantes afin de convaincre le lecteur de limportance dtudier le sujet et du srieux de lquipe de recherche. Ces donnes proviennent habituellement darticles de revue, dtudes pilotes ou dorganismes gouvernementaux (Ex : statistique Canada). La deuxime partie consiste en lexposition du problme. On y dcrit quelles sont les situations clinques ayant menes au problme. Il est important que cette partie soit trs claire et simplifie pour un non-expert; ce qui parat clair pour un chercheur ne lest pas ncessairement pour le rviseur. Cest dans cette partie que lon utilisera lopinion des experts et que lon fera le lien entre le problme clinique et le but de la recherche. En lisant le protocole, il faut que le lecteur conclut quil faut absolument rpondre au problme expos dans cette section. Voici quelques exemples : - tude A objectif : valuer si le fait de regrouper les heures dactivit sportive augmente le risque de blessure sportive chez les enfants. 1. Le surentranement est une notion reconnue dfinie par un dsquilibre entre le niveau dactivit et le repos qui commence ds le premier jour dactivit 2. Les activits sportives pour les enfants sont souvent regroupes en une fin de semaine pour des raisons logistiques. Ceci pourrait augmenter le risque de blessure chez les enfant lorsquils ont beaucoup dactivits en peu de temps (effet tournois)

Page 6

Cours dpidmio #8 pour rsidents version jan 2008

tude B objectif : valuer lefficacit du gravol pour diminuer les vomissements chez les enfants avec gastro-entrite 1. Les vomissements peuvent mener la dshydratation 2. Il nexiste aucun mdicament reconnu pour diminuer les vomissement lors de G-E.

La troisime partie est de taille variable. Elle dcrit quelles sont les solutions potentielles au problme. Ces solutions peuvent tre thoriques ou bases sur des tudes antrieures. Si aucune tude na tent de rpondre la question de recherche, il est important de justifier les solutions proposes en exposant les arguments physiologiques ou thoriques sous-jacents la solution propose ou en faisant ressortir des exemples similaires o la solution fut propose. Voici quelques exemples : - tude A objectif : valuer si le fait de regrouper les heures dactivits sportives augmente le risque de blessure sportive chez les enfants. 1. Il existe 3 tudes dmontrant une association entre la concentration dactivits et le risque de blessures, effectues chez des populations adultes de professionnels de rugby, de marathoniens et de joueuses de basket collgiales. - tude B objectif : valuer lefficacit du gravol pour diminuer les vomissements chez les enfants avec gastro-entrite 1. Explication thorique de leffet du gravol sur le centre central de vomissement 2. Effet du gravol en post-opratoire Il arrive aussi que dautres auteurs aient rapport des bauches de solution au problme. Il faut donc rapporter, dans cette troisime partie dintroduction, quelles furent les autres tudes effectues concernant le problme. Cest la revue de littrature. Le but de lexercice nest pas de fournir un rsum de toutes les tudes concernant le sujet mais plutt den faire une analyse objective. la fin de cette analyse, il faut comprendre pourquoi une nouvelle tude est indispensable dans le contexte. Il est donc important de ressortir les limites des tudes prcdentes. Si il y a beaucoup dtudes, on peut fournir une table rsumant les tudes en annexe. Lintroduction se termine habituellement par le dvoilement prcis de lobjectif principal de ltude. Il est aussi grandement utile de fournir lhypothse de rsultat escompt. Cette hypothse permet souvent au lecteur de mieux comprendre le but de ltude. Voici un exemple : Lobjectif de cette tude est dvaluer si lutilisation de gravol chez les enfants de 1 18 ans avec diagnostic de gastro-entrite diminuera le nombre dchec de traitement per os. Lhypothse de base est que le taux dchec de traitement (dfini par la ncessit dinstallation de voie intra-veineuse ou dhospitalisation) sera plus bas de 10% chez le groupe Gravol par rapport au groupe placebo. 8.4.4 La section mthodes (environ 4 pages)

Page 7

Cours dpidmio #8 pour rsidents version jan 2008

Il ny a pas de recette universelle pour la section mthode parce quil y a beaucoup de variations en fonction du devis de ltude. Il existe, par contre, certaines bases gnrales : Devis (study design) : On dbute habituellement la section mthode en dfinissant le type dtude utilise. Il est important de dire sil sagit dune tude prospective ou rtrospective. Il faut se rappeler que lon qualifie dtude rtrospective toutes les tudes o la collecte des donnes fut effectue avant llaboration du protocole. Lieu (setting) : On dfinit le lieu physique o les patients recruts pour ltude ont consult. Il ne sagit pas simplement de nommer lendroit; il faut en donner les caractristiques tel que statut (universitaire ou non), rural ou non, # de lit ou de visite ou daccouchement selon le cas, personnel soignant (pdiatre, spcialistes, etc). Une bonne description de lieux permet aux lecteurs dvaluer la gnralisibilit des rsultats. Il est aussi important de dfinir la priode o les patients furent valus. Sil sagit dune tude rtrospective, il faut dire quand furent mesures les donnes. Participants (participants) : Cest dans cette section que lon dcrit la population de base o sont recruts les participants. Il est important de dcrire explicitement les critres dinclusions et dexclusions et de les justifier. On enlvera cette justification dans le manuscrit final. Il faut savoir quilibrer les critres de participation : des critres restrictifs augmentent lhomognit des participants et la validit interne de ltude mais en diminuent la validit externe (gnralisibilt) ainsi que le nombre de participants ligibles. Procdure (procedure) : Cette section sert dcrire comment va se faire ltude. Normalement, la lecture de cette section devrait permettre quelquun de reproduire exactement la mme tude. Si ltude value un outil clinque ou un test biologique, il devra tre suffisamment dcrit pour tre reproduit dans un autre milieu. Cest aussi dans cette section que lon dcrit comment furent forms les gens responsables de recueillir les donnes ainsi que les gens appliquant le test ou la rgle de dcision. Dans les essais cliniques randomiss, on doit dcrire comment on sest assur de maintenir les gens laveugle. Analyse : Il sagit de la partie faible pour beaucoup de projets mens par quelquun dinexpriment. Pour savoir quoi crire ici, il faut savoir ce que lon cherche dmontrer. Ceci nous ramne la question de recherche de base. Avant dcrire cette section, le chercheur doit dterminer quel genre de donnes il obtiendra (une proportion ou une mesure continue). Il pourra par la suite dfinir ce que sont ses hypothses nulle (ex : il ny a pas de diffrence dans les taux dchec de traitement entre les patients ayant reu du gravol et le placebo) et alternative (il y a une diffrence). Un bon moyen pour saider conceptualiser ces valeurs est de se demander comment on imagine le rsultat final (une table comparant des moyennes, ou des proportions, etc). Voici des phrases que lon retrouve souvent dans cette section : - Les donnes seront recueillies dans une base de donne YYY (souvent Excell ou Access)

Page 8

Cours dpidmio #8 pour rsidents version jan 2008

Les donnes seront analyses en utilisant le programme de statistique ZZZ (stata, SAS, SPSS, etc) - Lintervalle de confiance de 95% sera calcul pour chaque valeur. Par la suite, il faut dfinir quels tests seront utiliss pour rejeter lhypothse nulle. On dit habituellement une phrase du genre : la (moyenne ou mdiane ou proportion ) des 2 groupes sera compare en utilisant un test de (student, wilcoxon rank sum, chi-carr). Voici quelques notions de base qui seront reprises dans un cours statistique plus tard : - Les moyennes normalement distribues de 2 groupes se comparent avec un test t de student (student t-test) - Les moyennes de 2 groupes non distribus normalement se comparent avec un test de wilcoxon rank sum - Les moyennes de plus de 2 groupes se comparent en utilisant lANOVA - Les proportions se comportent comme lapproximation normale si lchantillon est grand. - Les proportions se comparent avec des chi-carr pour les plus petits chantillons ou lorsquil y a plus de 2 catgories de patients mais il doit y avoir au moins 5 sujets dans chaque case de la table de distribution. On peut aussi utiliser le test de Fishers exact test qui permet davoir de petits chantillons. Taille dchantillon : cet item doit tre rapport la fin de la section analyse. Il nest pas donn tous les chercheurs de savoir calculer une taille dchantillon mais tous devraient savoir quelles sont les informations ncessaires son calcul. Voici les 5 informations savoir pour le calcul de la taille dchantillon allant de la plus facile obtenir la plus difficile : - Le type de donnes (catgorique ou continue). Il est important de savoir que pour des raisons statistiques, les donnes continues ncessitent habituellement beaucoup moins de participants que lvaluation de donnes catgoriques. - Dfinir le niveau derreur que lon accepte. Il sagit habituellement de 0.05 - Dfinir le niveau de puissance (1-) que lon dsire. On utilise habituellement 0.8 pour les petites tudes visant dmontrer une diffrence et 0.9 pour les tudes plus srieuses et celles visant montrer une ressemblance entre 2 traitements. Il faut savoir quune augmentation de la puissance entrane une hausse de la taille dchantillon - Dfinir quest-ce qui serait une diffrence cliniquement significative. Plus la diffrence cliniquement significative est petite, plus la taille dchantillon sera grande (il est plus difficile de dmontrer une petite diffrence quune diffrence importante). La diffrence cliniquement significative est dtermine par lopinion dexperts du milieu. On peut par exemple, demander par sondage aux mdecins : Sachant que le gravol a peu deffets secondaires, de combien le taux dadmission devrait-il baisser pour les gastro-entrites pour que vous commenciez lutiliser. partir de quel pourcentage de diminution dhospitalisation seriez-vous satisfait de lutiliser? - Enfin il faut connatre la variabilit des rsultats escompts. Cest ce quon appelle la variance. Cette dernire se calcule de diffrente faon selon que lon value une donne continue ou catgorique.

Page 9

Cours dpidmio #8 pour rsidents version jan 2008

1. Pour les variables continues : Il faut estimer la dviation standard de la mesure dans la population tudie. On obtient cette valeur laide dtudes antrieures ou suite une tude pilote. Une formule rapide pour estimer une taille dchantillon avec une puissance 90% et un de 0.05 est de 42*(dviation standard de la moyenne)2 / (moy) 2 o moy est la diffrence de moyenne cliniquement significative 2. Pour les proportions (variable catgorique), la variance se calcule en fonction de la proportion. Il faut donc avoir une ide de la proportion escompte. Plus la proportion est proche de 0.5, plus grande sera la variance. Une formule rapide pour estimer une taille dchantillon avec une puissance 90% et un de 0.05 est de 42*P*(1-P) / (P) 2 o P est la proportion moyenne prvue et P est la diffrence cliniquement significative thique : Il faut enfin dire que le projet sera valu par un comit dthique de la recherche (CER) ou (IRB en anglais). Il faut prparer un formulaire de consentement clair pour les patients dans les langues utilises par les patients. Sil sagit dune revue de dossiers, il faut envoyer une lettre au DSP afin davoir son accord pour consulter les dossiers. 8.4.5 La section rsultats escompts (1/2 page) La section des rsultats escompts permet dmettre les hypothses sur les rsultats venir. Cest aussi lendroit o lon discute des impacts relatifs aux divers rsultats. On peut parfois y montrer des tables ou figures avec des rsultats fictifs afin de faciliter la comprhension du projet. On peut aussi y dcrire ce quon prvoit tre lchancier de ltude en terme de prparation du projet et de recrutement des patients

Page 10

Cours dpidmio #8 pour rsidents version jan 2008

8.4.6 Le budget La majorit des budgets de projets de recherche sont sous-valus. Gnralement, il est plus efficace de faire une demande de financement adquat afin davoir un assistant de recherche pour faire le travail sur le terrain. Ceci permettra au chercheur davoir plus de temps pour produire dautres protocoles de recherche. Il faut savoir faire une demande de financement raliste; une demande trop leve sera rejete parce quil est est non justifi dutiliser tous ces argents publics tandis quune demande trop basse peut tmoigner du manque dexprience du chercheur. Voici un exemple de budget tir du formulaire de soumission de projet pour le CHU sainte-Justine: Honoraires verss l'investigateur(trice): Dpenses de salaires: Technicien(ne): entre de donnes Infirmier(ire): 14 patients/ 8 h * 500 patients * 50$/h Autres salaires : coordination Total des salaires: Autres dpenses: Analyses de lab: Nb_____ x prix_____/Un._____ Mdicaments : Examens diagnostics : Fournitures : quipements : Compensation pour les participants : Autres frais: (Prcisez: congrs) Total des autres dpenses: SOUS-TOTAL DES D PENSES BUDG T ES*: Pour le financement provenant de lindustrie, AJOUTER LES FRAIS INDIRECTS (30% du sous-total des dpenses budgtes*) : Frais d'valuation du Comit d'thique : SOUS-TOTAL incluant les frais indirects GRAND TOTAL: $ $ 1000.00 $ 14285.00 $ 3000.00 $ 18285.00 $ $ $ $ 500.00 $ $ $ 1200.00 $ 1700.00 $ 19985.00 $ $ $ $ 19985.00

Page 11

Cours dpidmio #8 pour rsidents version jan 2008

8.5 Prparer une base de donne La prparation dune base de donnes au mme moment que lon crit le protocole permet parfois didentifier et de corriger dventuels problmes. Un outil facile pour llaboration dune base de donne est le programme Excell mais il existe plusieurs autres outils bien plus fonctionnels. On doit habituellement prparer 3 documents pour la collecte des donnes : 1. Une feuille de collecte de donnes standardise (case report form). Cest la feuille o lon inscrit les rponses aux questionnaires ou examen. Les rponses doivent tre objectives et idalement codifies sous forme numrique. Pour ce faire, il existe certaines rgles de base : a. 1= oui et 0= non b. Il faut viter les cellules vides. Il faut penser avoir une rponse de type : autre= xxx ou inconnu= xxx c. Il faut garder une nomenclature constante entre les diverses questions. Par exemple, si les choix de rponses sont 1= chat, 2 =chien et 3= lion pour la premire question, il faudrait garder la mme nomenclature pour les autres questions ayant des choix de rponse similaires d. Ordre de question du questionnaire= celui de la base de donne 2. Un document Excell pour entrer les donnes. Habituellement, chaque colonne est une variable tandis que chaque ligne reprsente un participant. Chaque question du case report form constitue une colonne. Il ne peut pas y avoir de mots dans les cellules car ceci nest pas analysable. 3. Un document crit o lon inscrit toutes les rponses possibles (codification et dfinition) pour la feuille de collecte de donne. Ce document est la cl dfinissant chaque rponse de la feuille de collecte de donne standardise et permettant de dfinir chaque colonne du document Excell. Normalement, un assistant de recherche devrait pouvoir reproduire ltude en ne lisant que ce document de description de la collecte de donnes. Il sagira du document de rfrence losrquun assistant de recherche rencontrera un cas ambigu. De plus, il arrive souvent que lon ait une ide nouvelle ou des demandes de la part des rviseurs lors de la soumission du manuscrit. Lutilisation dun document clair expliquant chaque variable permet souvent de simplifier les recherches.

Page 12

Cours dpidmio #8 pour rsidents version jan 2008

Conclusion Il ny a pas de recette infaillible pour crire un bon protocole de recherche. Voici 10 conseils afin den faciliter llaboration : 1. Avoir un protocole court mais complet pouvant tre compris par quelquun qui nest pas de la mme spcialit 2. Dfinir clairement lobjectif de ltude en mots simples. Lutilisation dune hypothse est souvent utile 3. tudier la question ayant le plus dimportance au niveau clinique 4. Prserver la squence mise lors des objectifs tout au long du texte. Par exemple sil y a 2 objectifs (a et b), dcrire la variable dintrt primaire de a puis de b et lanalyse de a puis de b et ainsi de suite dans la section rsultats. 5. viter les abrviations et minimiser lutilisation de termes techniques 6. Une fois le protocole termin, le laisser reposer pour quelques jours avant de le relire. 7. Faire lire le protocole par quelquun qui nest pas impliqu dans le projet 8. Utiliser un programme de bibliographie (End notes ou Reference manager) ds le dbut de llaboration du protocole 9. Si on fait une demande de subvention, respecter la lettre les instructions de soumission. 10. Le facteur de russite le plus important pour un projet de recherche est la motivation du chercheur principal. Il faut donc choisir un sujet qui vous passionne

Page 13

Cours dpidmio #9 pour rsidents version avril 2008

Cours dpidmiologie #9
Probabilit #1 (prsentation, distribution des donnes, base des probabilits) Objectifs du cours : - Connatre les avantages et inconvnients des divers modes de prsentation de donnes (graphique, boxplot, etc) - Savoir calculer les mdiane, moyenne, cart-type et variance - Connatre les proprits de la distribution normale. - Connatre les lois de base dune probabilit (additivit, multiplicit) - Connatre les lois de base dun chantillonage lire : Turner et al. Selective Publication of Antidepressant

Trials and Its Influence on Apparent Efficacy. NEJM 2008. http://content.nejm.org/cgi/reprint/358/3/252.pdf


Exercices pratiques faire avant le cours. Il sagit dexercices qui serviront de point de dpart pour les discussions. Question #1 Quelles sont les 5 informations que lon retrouve dans une boxplot ? Question #2 Dans une base de donnes, quel est leffet dune valeur vraiment diffrente des autres (outlyer) sur : - la mdiane - la moyenne - lcart-type ou la variance Question #3 Vous prvoyez faire une tude sur leffet de la morphine (vs placebo) sur le temps que prendra le chirurgien pour prendre sa dcision face au diagnostic final chez des patients avec suspicion dappendicite. Devrait-on comparer les temps mdians ou les temps moyens pour prendre la dcision ? et pourquoi ?

Page 1

Cours dpidmio #9 pour rsidents version avril 2008 Question #4 Sur le graphique suivant trac les lignes pour montrer votre estimation de la moyenne et de la mdiane

Question #5 Calculez lcart-type pour la population suivante : 1.2, 1.3, 1.5, 0.9, 0.8, 1.4, 1.5, 1.3 en utilisant le tableau suivant pour vous aider. Moyenne : Valeurs 1.2 1.3 1.5 0.9 0.8 1.4 1.5 1.3 0.9 TOTAL Valeur - moyenne Au carr

Question #6 Est-ce quune population ayant une distribution normale peut avoir une grande diffrence entre sa moyenne et sa mdiane ? Pourquoi ?

Question #7 Dans un groupe, la taille moyenne des hommes est de 1,75 m et lcart-type est de 0.25m. Quel pourcentage des hommes de ce groupe sera plus petit que 1.26m ?

Page 2

Cours dpidmio #9 pour rsidents version avril 2008 Quel pourcentage de ces hommes sera plus grand que 2,24 m ? Question #8 Sachant que la taille moyenne dune population de singe est de 121 cm et que lcart-type est de 6cm. Dans quel intervalle de confiance se retrouvent 95% de la population? Et 75% de la population ? Question #9 a)Dans larticle de Turner, le dernier paragraphe de la page 254 est dcrit par la figure 1. Quelles sont les diffrences entre la figure et le texte ? b) Aurait-on pu mettre la figure 2 en texte ? Questions sur les lois de la probabilit (optionnelles) Question #10 La probabilit davoir une mningococcmie pour un enfant avec fivre et ptchie est estime 5%. Le taux de dcs dans les cas de mningococcmie est estim 40%. Quel est donc le risque de dcs pour un enfant se prsentant avec fivre et ptchie ? Question #11 Si 20% des enfants sont allergiques la pnicilline et 30% des enfants font de lasthme, Sachant que les 2 conditions ne sont pas associes quelle est la probabilit quun enfant ne soit ni allergique la pnicilline ni asthmatique ? Si les taux de patient ni allergique ni asthmatique taient de 68%, que pourrait-on conclure sur la relation entre les 2 entits ? Et si ce taux tait de 50% ? Question #12 La probabilit de mourir dune mningococcmie est de 40% avec le traitement standard. Quelle est la probabilit que seulement 1 enfant dcde dans une tude non contrle avec 10 patients si le traitement tudi nest pas meilleur que le traitement standard. Question # 13 On value lefficacit dune crme anesthsiante (type EMLA) dans une tude laveugle o le patient a une crme placebo sur un bras et une crme X sur lautre bras. la fin de ltude, 8 patients sur 10 ont dit avoir ressenti une meilleure anesthsie sur le bras X et 2/10 ont prfr le bras placebo. Quelle est la probabilit que ce rsultat soit exclusivement d au hasard ?

Page 3

Cours dpidmio #9 pour rsidents version avril 2008

9.1 Prsentation des donnes


La prsentation des donnes est une tape primordiale dans lanalyse des donnes recueillies pour deux raisons : Premirement, une analyse sommaire de la distribution des donnes permet de svaluer la qualit gnrale des rsultats. Ainsi, lvaluation de la distribution graphique permet davoir une vue densemble afin de sassurer de la validit des rsultats. Elle permet aussi de faire un nettoyage des donnes en rvaluant les valeurs trs atypiques. La deuxime importance de la prsentation des donnes se manifeste lors de la publication des rsultats. Une image vaut mille maux et un graphique bien construit permet au lecteur une comprhension rapide des rsultats. Il existe plusieurs faons de prsenter les rsultats. On peut les diviser en mthodes graphiques (graphiques en barre, courbe, boxplot, etc) ou numrique (moyenne, carttype, distribution, etc). Le choix du mode de prsentation varie selon que la variable soit quantitative ou catgorique, le nombre dindividus valus, la distribution et lauditoire vis. 9.1.1 Dfinitions des types de variables Quantitatives : Variables qui se mesurent. Il y a plusieurs avantages utiliser une variable dintrt primaire quantitative. Cette dernire permet de faire des calculs de moyenne, cart-type ou autre statistique complexe. De plus, pour des raisons statistiques, il faut gnralement moins de participants pour dmontrer une diffrence avec une variable quantitative par rapport aux variables catgoriques Continues Variables qui font lobjet dune mesure prcise et divisible en fraction (en kg, en mMol/L, etc). Discrtes Variable qui se mesure en nombre entier (# de mois, # denfants, etc).

Catgorique : Variable qui ne peut se calculer ou se quantifier. Dichotomique Variable qui se divise en 2 catgories (oui/non, +/-, etc). Multiple ordinale Variable o il y a une hirarchisation des catgories mais qui nest pas mesurable parce que la diffrence entre les diverses strates nest pas identique (petit/moyen/ grand, +/++/+++, etc). Multiple nominale Variable avec de multiples possibilits dfinies par un nom et dont on ne peut pas faire de hirarchisation (bleu/rouge/jaune, indien/caucasien/africain, etc).

9.1.2 Prsentations graphiques Lorsque lon a une banque de donnes, on commence habituellement par regarder les donnes de faon individuelle puis on les met ensemble afin dtablir la relation qui les unies. Cest cette tape que lon construit des reprsentations graphiques. Bien que les

Page 4

Cours dpidmio #9 pour rsidents version avril 2008 tableaux soient utiles pour lanalyse des donnes, il serait souvent laborieux de rapporter tous les rsultats sous forme de tableaux. On illustre donc les rsultats en utilisant des reprsentations graphiques. Un graphique doit pouvoir tre interprt isolment, sans laide du texte. Le titre doit donc apporter toutes les informations ncessaires la comprhension du tableau ou du graphe et toutes les abrviations utilises doivent tre dfinies, mme si elles sont dj dfinies dans le texte. Le titre dun graphique doit mentionner :

les variables utilises, les caractristiques de temps, les caractristiques de lieu, et les caractristiques de personnes.

Les notes en bas du tableau ou du graphe permettent :


de dfinir les abrviations utilises (sigles, acronymes), ventuellement la source des donnes.

Pour les variables catgoriques : La distribution des variables catgoriques se rapporte soit en nombre ou en pourcentage de participant dans chaque catgorie. Les diagrammes en barre permettent de comparer facilement le nombre dindividu dans chacune des catgories. Un avantage important est quil nest pas ncessaire de rapporter les rsultats de tous les participants. On peut aussi utiliser ces diagrammes pour comparer diverses populations sur le mme graphique. Voici un exemple de diagramme en barre: Marqueurs de svrit en fonction du niveau de triage pour 58 569 enfants valus dans un centre pdiatrique tertiaire
Hospitalization 0,7 0,6 0,5 0,4 0,3 0,2 0,1 0 level 1 727 pt level 2 3956 pt level 3 18459 pt level 4 27461 pt level 5 7926 pt PICU LWBS

Voici quelques conseils suivre afin doptimiser la qualit de vos graphique en barre :

Page 5

Cours dpidmio #9 pour rsidents version avril 2008 Ne pas utiliser de graphiques en trois dimensions. Il ne sert rien de rajouter un nouveau paramtre un graphique si a ne donne pas plus dinformation. De plus, il est souvent difficile de reprer o se situe lextrmit des barres dans un graphique 3D. Utiliser le quadrillage avec modration. Il ne faut pas que le quadrillage soit plus important que les barres. Optimiser la quantit dinformation par surface. Pour ce faire, il est bien de donner le nombre dindividu en haut ou bas des barres. On peut aussi parfois ajouter les dviations standard. Utiliser des titres et lgendes clairs et complets. Utiliser des couleurs diffrentes pour les barres. Ces couleurs doivent tre agences la lgende. Disposer les barres en ordre logique (Ceci peut tre chronologique ou non) Ne pas tronquer les chelles et garder les chelles constantes

Les graphiques en tarte donnent une reprsentation visuelle intressante de la distribution de chaque catgorie. Labsence dchelle est habituellement compense par lajout des pourcentages de distribution ct de chaque pointe. Les principaux inconvnients de ces graphiques sont que lon doit rapporter tous les individus pour obtenir un pourcentage de 100%, on ne peut comparer les nombres brut dindividu et on ne peut comparer plusieurs groupes sur 1 seul graphique. Le ratio information / surface est par contre faible. Voici un exemple de graphique en tarte :

http://gfx.download-by.net/screen/0/182-2d3d-pie-chart-amp-graph-software.jpg

Pour les variables quantitatives: La distribution des variables quantitatives se rapporte soit en mesure prcise ou en nombre. Les histogrammes permettent de comparer le nombre de participants prsent dans chaque intervalle de rsultats. Ces graphiques ressemblent donc beaucoup aux diagrammes en barre sauf que chaque barre reprsente un intervalle de valeur possible. Chaque intervalle doit tre de taille identique. On peut voir ces intervalles comme des catgories distinctes ayant une hirarchisation. Lavantage des histogrammes est quils permettent davoir une bonne vision globale de la distribution des participants en un rapide coup dil. Voici un exemple dhistogramme :

Page 6

Cours dpidmio #9 pour rsidents version avril 2008

http://sol.ensam.inra.fr/Produits/EPI/Images/Lexique/Histogramme.png

Comme vous pouvez le voir, cet exemple dmontre bien les imperfections associes lutilisation dun graphique en 3 dimensions. Il y est difficile de dterminer la valeur associe chaque barre. Un type de reprsentation graphique souvent utilise est celui du graphique points. Pour ce faire, on utilise la variable indpendante (continue ou non) en abscisse (x) et la variable dpendante (continue ou non) en ordonne (y). Chaque point reprsente une mesure ou un individu. On dessine souvent la courbe dcrivant la fonction engendre par les points sur le graphique. Ces graphiques permettent dvaluer la dispersion et la corrlation des points autour de la ligne dcrivant la fonction. Voici un exemple de graphique points :

http://www.omnisis.co.uk/correlation%20graph%202.gif

Lorsque labscisse est une variable temporelle, on peut dgager une tendance (orientation de la courbe vers le haut ou vers le bas) ou des variations saisonnires (prsence de vagues dans la courbe). Voici un exemple de graphique. Il sagit de lincidence annuelle de maladie invasive cause par le pneumocoque.

Page 7

Cours dpidmio #9 pour rsidents version avril 2008

http://content.nejm.org/cgi/content/full/354/14/1455/F1

La courbe de densit est un mode de prsentation frquente de rsultats. Elle est particulirement utile lorsquil y a beaucoup dindividu dans lchantillon tudi On peut imaginer cette courbe comme un extension dun histogramme o il y aurait une quantit infinie de catgories chacune de largeur minuscules. Cest un modle mathmatique idalis de la distribution. Laire sous la courbe est toujours gale 1. Il est beaucoup plus facile de faire des analyses statistiques sur des courbes (modle mathmatique) que sur des histogrammes. Voici un exemple de courbe de densit :

http://www-users.york.ac.uk/~mb55/intro/trighs.gif

Il y a 4 choses regarder pour faire lvaluation dune courbe de distribution: 1. Laspect gnral de la distribution (1 seul pic, plusieurs pics ou distribution gale). On appelle ces pics des modes. Une distribution peut tre uni ou multimodale. Le mode est la catgorie o il y a le plus dindividus 2. Quels sont le centre et le spectre de la distribution des donnes. 3. La courbe est-elle symtrique ou tire dun ct (skewed) ? Lorsque la courbe est tire sur un ct, la moyenne aura tendance tre dvie vers le ct allong de la courbe. 4. Y a-t-il des valeurs excessives (outlyers) ? Celles-ci auront tendance influencer la moyenne.

9.2.1 Description arithmtique des distributions


Page 8

Cours dpidmio #9 pour rsidents version avril 2008

Bien que lutilisation de graphiques permette dobserver la distribution des individus, il est souvent prfrable de pouvoir quantifier les distributions. Ces statistiques de distribution permettent de comparer les diverses distributions entre elles. On utilise pour cela diverses mesures ayant chacune leur forces et leur faiblesses. Mesures centrales : La moyenne est la mesure la plus frquemment rapporte. Il sagit habituellement dune bonne estimation de la valeur centrale de la distribution. On lobtient en additionnant la valeur de chaque individus et en divisant cette somme par le nombre dindividu. Il est important de connatre les limites de la moyenne afin de reconnatre les situations o son utilisation est inapproprie : La moyenne est fortement influence par les valeurs extrmes. Ainsi, les courbes allonges dun ct (skewed) auront des moyennes influences par le ct allong. Cette situation se produit souvent lorsque la variable dpendante est une mesure de temps car il peut toujours y avoir quelques individus avec des rsultats beaucoup plus long que les autres. Ceci aura pour effet daugmenter le temps moyen. Voici la formule mathmatique pour calculer la moyenne :

Lutilisation de la mdiane est souvent approprie dans les mesures de temps. La mdiane se dfinit par la valeur reprsentant le point central de la distribution. Ainsi 50% des valeurs lui sont suprieures et 50% lui sont infrieures. Sil y a un nombre pair dindividu, la mdiane est calcule en faisant la moyenne des deux valeurs centrales. On dit quelle est robuste car elle nest pas influence par les extrmes (outlyers). Un inconvnient majeur de la mdiane est quil est plus complexe de la dterminer. Pour la calculer, il faut ordonner tous les individus et dterminer le point central. La majorit des programmes de calcul (comme excel) peuvent maintenant le faire. Les autres calculs statistiques (taille dchantillon, cart-type, etc) sont aussi plus complexes mais ralisables par un statisticien. Paramtres de dispersion de la distribution : La mesure du centre de la distribution peut mener des conclusions errones. Il est souvent important de connatre la largeur du spectre de rsultat. On sait par exemple que la taille moyenne des hommes est de 1,77 m et que celle des femmes est de 1,68m. La large tendue des tailles mesures sur une base individuelles fait que lon ne peut pas deviner le sexe dun individu si on ne connat que sa taille. Plusieurs mesures de dispersion ont t dfinies. Le spectre dtendue (range) est dfinie par les rsultats aux 2 extrmits du spectre de distribution. Par exemple, dans une tude sur la glycmie jeun denfants prenant une cortico-thrapie aigu, on pourrait mesurer une valeur de 3,5 mmol/L chez lenfant avec le taux le plus bas allant jusqu 13,7 mmol/L pour la valeur la plus leve. Le spectre est

Page 9

Cours dpidmio #9 pour rsidents version avril 2008 donc de 3,5-13,7 mmol/L. Un dsavantage majeur du spectre dtendue est quil est dfini par les valeurs extrmes. Ainsi une valeur anormalement extrme (outlyer) qui ne reflte pas la distribution adquatement dictera le spectre de distribution. Les quartiles donnent une meilleure ide de la distribution. Pour les calculer, on ordonne tous les individus selon leur valeur. Par la suite on dtermine lindividu situ 25% de la distribution (premier quartile). Le deuxime quartile (50%) est quivalent la mdiane, le troisime quartile est quivalent au 75% percentile. On rapporte habituellement les 1er et 3me quartiles. Un avantage important de cette valeur est quelle est robuste au outlyers. Il sagit dune valeur frquemment rapporte lorsque lon utilise la mdiane. Boxplot La boxplot est une mthode graphique pour exprimer la valeur centrale ainsi que le spectre de distribution dune tude. Elle permet davoir les avantages des diverses mesures de distribution tout en en minimisant les limites. On doit utiliser 5 valeurs pour lexprimer : Les valeurs minimale et maximale, les premier et troisime quartiles et la mdiane. Voici un exemple de boxplot : La ligne centrale reprsente la mdiane, la boite nous donne les 1er et 3me quartile et les extrmits nous donnes le spectre.

http://www.crle.uoguelph.ca/malawi/Images/Boxplot.jpg

La dviation standard ou cart-type dune distribution consiste en la moyenne des dviations entre les valeurs et la moyenne pour chaque observation. Son calcul se fait en 4 tapes : 1. On calcule la moyenne de la distribution 2. Pour chaque mesure, on calcule la diffrence entre la moyenne et la mesure obtenue. On met le rsultats au carr (afin de toujours avoir des nombres +) 3. On fait la moyenne de tous ces rsultats obtenus (en divisant par n-1 pour des raisons statistiques). Si on arrte le calcul ici, on parle de Variance.

Page 10

Cours dpidmio #9 pour rsidents version avril 2008 4. On fait la racine carre de la moyenne pour obtenir lcart-type (dviation standard). La dviation standard est une bonne mesure de ltendue de la distribution. Elle est facile calculer et trs utile pour les analyses statistiques. Elle ne devrait tre utilise que lorsque la moyenne est la valeur centrale de rfrence. Une limite importante provient du fait quelle nest pas rsistante au outlyers. Voici la formule mathmatique pour la variance :

Notez que les units de variance sont le carr des units de la variable tudie. Comme il est souvent difficile de se reprsenter les variances, on utilise plus souvent la racinecarre de la variance, on lui donne le nom dECART-TYPE (ou dviation standard, cette appellation provenant du terme anglais) et on le note s. s = racine carre de s Les dviations standard ont les mmes units que les observations initiales. Il est aussi important de noter que la variance ainsi que la dviation standard sont trs sensibles aux valeurs extrmes. La moyenne et la dviation standard sont des notions importantes afin de bien dcrire une distribution. Ceci est particulirement vrai avec des donnes ayant une distribution respectant la loi normale.

9.3.1 La loi normale


La distribution normale est un modle mathmatique de la densit de distribution dune variable ayant une forme de cloche. On utilise cette distribution pour des raisons pratiques (elle suit certaine lois statistiques intressantes) et beaucoup de phnomnes naturelles ont un distribution normale. Voici ses caractristiques utiles pour les tudes statistiques : La courbe est symtrique au niveau horizontal autour de la moyenne. On considre que lair sous la courbe complte reprsente 100% des probabilits (1.0) On peut estimer la proportion des observations ayant une valeur > ou < quun point donn en mesurant lair sous la courbe et en utilisant des ordinateurs ou des tables. Il est possible de connatre la distribution en connaissant la variance et la moyenne car 68% des variables se retrouvent autour de la moyenne dans un spectre gale 1 cart-type, 95 % des variables 2 cart-types et 99,7 % des variables 3 cart-types.

Page 11

Cours dpidmio #9 pour rsidents version avril 2008

http://www.abbottdiagnostics.com/Your_Health/Thyroid/images/p12.gif

Plusieurs distributions suivent une distribution normale dans la nature (mesures rptes, populations biologiques, etc) Il sagit dune bonne approximation des vnements dus au hasard. Plusieurs infrences statistiques qui fonctionnent bien pour la loi normale fonctionnent aussi pour dautres distributions symtriques.

On dcrit habituellement une courbe normale laide de 2 paramtres (,) : pour la moyenne et pour lcart-type. En connaissant ces 2 paramtres, on peut estimer la distribution des sujets dfinis par la courbe. Une modification de la moyenne correspond un dplacement latral de la courbe. Une modification de lcart type correspond un talement diffrent de cette courbe (plus lcart-type est grand, plus la courbe sera tale). La connaissance dun seul paramtre de la courbe ne permet pas de la dessiner. On peut estimer lcart-type en regardant une courbe normale : le point o la courbe change de direction en partant du centre est situ Voici le graphe de N(3,1) Moyenne= 3 et cart-type = 1 Pour N(1, 4) Moyenne = 1 et cart-type = 4

La distribution normale est importante pour 3 raisons : 1. Il sagit dune description adquate de multiples distributions naturelles (mesures rptes dune mme exprience, distribution biologiques, etc)

Page 12

Cours dpidmio #9 pour rsidents version avril 2008 2. Il sagit dune description adquate pour dcrire les vnements dus au hasard 3. Il est facile de faire des infrences statistiques avec la courbe normale pour plusieurs distributions symtriques. Les valeurs de p sont calcules partir de la courbe de distribution normale. 9.3.2 La distribution normale standardise En voyant que plusieurs phnomnes ont une distribution normale, des statisticiens ont suggr dutiliser une version standardise pour dcrire les distributions. La standardisation dune distribution permet dutiliser des tables prdfinies pour la dcrire. En rsum, on standardise une distribution en modifiant la moyenne pour quelle gale 0 et lcart-type pour quil gale 1. La distribution normale rduite est une version standardise de la loi normale. Son maximum et sa moyenne se trouvent au centre (u=0) et elle possde une variance gale 1. Pour standardiser une valeur, il faut lui soustraire la moyenne et diviser par lcart-type Voici le graphe de sa densit de probabilit:

.On peut transformer toute variable X en une valeur standardise en employant la formule : Z= (X-/ On nomme habituellement cette variable standardise z. Cette valeur z nous indique combien de dviation standard la variable se trouve de la moyenne. Les observations plus grandes que la moyenne ont une valeur z positive tandis que les valeurs plus petites ont une valeur z ngative. La standardisation permet de comparer des observations ayant des chelles diffrentes. Des tables de distributions et de proportions ont t labores pour la loi normale. Ces tables donnent laire sous la courbe la gauche de la valeur z. Ceci permet destimer rapidement la proportion de la population plus petite ou plus grande quune valeur standardise z. Voici quelques exemples pour illustrer le concept :
Page 13

Cours dpidmio #9 pour rsidents version avril 2008 Exemple 1 : Les tailles releves dans une grande population d'hommes suivent une loi normale de moyenne 172.5 cm et d'cart-type 6.25 cm. Un homme de 185cm aura un score z de : (185-172.5)/6.25 = 2.0

On peut donc dire quil se situe 2 cart-type de la moyenne. En regardant dans une table de distribution z la proportion des valeurs ayant un score z infrieur 2.0 est de 0.9772 (voir la table z la fin de ce texte). On peut donc conclure que prs de 98% des hommes seront plus petit que notre individu et par consquent, 2% seront plus grands. Un homme de 170cm aura un score z de : (170-172.5)/6.25 = -0.4

Il se situe donc 0.4 cart-type de la moyenne. En regardant dans une table de distribution la proportion des valeurs ayant un score z infrieur -0.4 est de 0.3446. On peut donc conclure que prs de 35% des hommes seront plus petit que notre individu et par consquent, 65% seront plus grands. Exemple 2. En moyenne, un enfant atteint de varicelle aura 200 lsions cutanes avec un cart-type de 50 lsions. Si on considre que la distribution est normale, on peut estimer que 95% des enfants auront entre 102 et 298 lsions. Explication : En regardant dans une table z, on note que les scores z correspondants aux valeurs 2,5% et 97,5% sont de -1,96 et +1,96 (presque 2 cart-type). On peut donc conclure que 95% des patients auront entre 200 1.96*50 et 200 + 1,96*50 lsions. Il arrive quune valeur z se retrouve hors des tables pace quelle est trop extrme. Dans ce cas, la proportion qui lui est accorde peut tre calcule par un ordinateur ou estime < 0.0002 (exemple pour z=-4.0) On peut aussi calculer la proportion des observations situes entre 2 valeurs (exemple; le nombre dhomme entre 170cm et 185cm) en soustrayant la valeur la plus petite de la plus grande.

9.4 Les lois de base en probabilit (Cette partie nest pas obligatoire pour le cours dpidmiologie. faire pour les amateurs de statistique. Au pire a amliorera vos chances de gagner au poker)
Depuis toujours, les mathmaticiens ont connu des difficults dfinir prcisment le concept de " probabilit dun vnement ". La dfinition contemporaine utilise une approche intuitive qui considre la probabilit comme la valeur " idale " ou " modle " de la frquence relative dun vnement. Cette dfinition se base sur le concept dpreuves rptes et indpendantes au cours desquelles on peut observer loccurrence ou non dun vnement. La probabilit doccurrence se situe entre 0 et 100% (ou 1.0). La valeur numrique de ce nombre sera obtenue par la limite de la frquence relative de
Page 14

Cours dpidmio #9 pour rsidents version avril 2008 lvnement dans la rptition " infinie " de lpreuve considre. Il existe des situations o lon peut infrer une probabilit thorique avant de lestimer. Par exemple, on peut supposer thoriquement que la probabilit davoir le chiffre 2 en lanant un d 6 cts est de 1/6. On peut aussi lancer un d plusieurs reprises et mesurer le nombre de fois que lon obtient le chiffre 2. Aprs plusieurs lancers, la probabilit devrait tendre vers 1/6. La majorit des situations touchant les vivants ne peuvent malheureusement pas tre prdites thoriquement. Il faut donc mesurer de multiples pisodes afin destimer le point vers lequel tend le rsultat. La loi des grands nombres de Bernoulli (1654 1705) stipule que si lon rpte une mesure de multiples reprises, la valeur obtenue devrait tendre vers la valeur moyenne. Ceci suppose quon est capable de reproduire indfiniment lpreuve qui donne naissance lvnement dans des conditions identiques et de faon ce que son rsultat ne soit pas influenc par les rsultats prcdents. Par exemple, certains chercheurs ont ainsi mesur sur de larges populations que le taux de natalit tait de 105 garons pour 100 filles. 9.4.1 Dfinitions de base en probabilit Un ensemble, not , est dfini par lensemble de toutes les ventualits possibles rsultant dune observation ou dune exprience. Chaque ventualit possible est un vnement lmentaire. Pour lexemple du d, lensemble comprend : 1, 2, 3, 4, 5, 6. Un vnement E est tout sous-ensemble de il peut sagir dvnement lmentaire ( 1 seul lment) ou multiple (par exemple, avoir 2 ds pareils en effectuant 2 lancers). La probabilit davoir un vnement E se situe entre 0 et 1. On utilise la lettre P pour symboliser la probabilit dun vnement. Cet vnement peut tre unique (Exemple : avoir un 2) ou multiple (Exemple : avoir 3 coups pairs successifs). Il existe 7 grandes rgles de base pour le calcul des probabilits. 0 < P(E) < 1 La probabilit dun vnement se trouve toujours entre 0 et 100% P(total) = 1 Lvnement est certain: il se produit en effet coup sr une des ventualits possibles de . P (=1 (ou 100%) P(Ec) = 1 P(E) On appelle complmentaire la probabilit quun vnement ne se produise pas P(Ec).La probabilit quun vnement ne se produise pas est de (100% - la probabilit quil se produise). Par exemple, en lanant un d, la probabilit de ne pas avoir de 2 est de 1 - 1/6 = 5/6. P(E ou F) = P(E) +P(F) si E et F sont mutuellement exclusifs

Page 15

Cours dpidmio #9 pour rsidents version avril 2008 Si 2 vnements ne peuvent pas se produire en mme temps (par exemple obtenir un 2 et un 4 en lanant 1 seul d), la probabilit dobtenir lun ou lautre est gale la somme des 2 probabilits (1/6 +1/6 = 2/6). P(E ou F) = P(E) +P(F) P(E et F) en toute circonstances La probabilit dobtenir lun ou lautre de 2 vnements est gale la somme des probabilits dobtenir chacun de ses vnements moins la probabilit dobtenir les 2 vnements en mme temps. P(E et F) = P(E) x P(F) si E et F sont indpendants La probabilit dobtenir 2 vnements est gale la multiplication des probabilits dobtenir chacun de ses vnements si les 2 vnements sont indpendants. Ainsi la probabilit davoir 2 quatre en lanant 2 ds est de 1/6 * 1/6 = 1/36. P(E et F) = P(F | E) x P(E) La probabilit davoir 2 vnements est gale la multiplication de la probabilit davoir le premier vnement (P(E) ) par la probabilit davoir le deuxime vnement lorsque lon a eu le premier (P(F | E)). Cette formule statistique permet souvent disoler la probabilit conditionnelle (F | E) qui est la probabilit davoir un vnement F en fonction de lvnement E. Cette valeur est utile lorsque les vnements ne sont pas indpendants (par exemple, dans un jeu de carte, la probabilit de piger un as est modifi aprs quun premier joueur eut pig un as. La probabilit passe de 4/52 3/51. 9.4.2 Comment obtenir une probabilit ? Comme il fut mentionn plus haut, il existe peu de situations biologiques o lon puisse calculer thoriquement la probabilit dun vnement. Il faut donc se baser sur la thorie des grands nombres et utiliser une approche probabiliste o lon rpte une exprience de multiples reprises afin de tendre vers LA probabilit la plus fiable. Pour ce faire, il faut tre certain que les expriences sont indpendantes. La probabilit de A : P(A) = Nombre dvnements A / Nombre total dvnement possible( Plus on rpte la mesure (augmentation du nombre dvnements indpendants), meilleure sera la fiabilit du rsultats. Ceci sera expliqu dans le cours # 10 lorsque lon parlera dintervalle de confiance. Ainsi, il sera gnralement plus fiable daffirmer que la probabilit dappendicite pour les enfants avec douleur la fosse iliaque droite est de 10% avec une tude valuant 1000 enfants quavec une tude sur 20 enfants. 9.4.3 Les variables alatoires Une variable alatoire est une description numrique de la frquence doccurrence dun vnement d au hasard. En dautres termes, il sagit du nombre de fois quun vnement se produit cause du hasard. Pour chaque situation, il existe un nombre fini de possibilit dvnements. On peut calculer la probabilit doccurrence de chacune des variables

Page 16

Cours dpidmio #9 pour rsidents version avril 2008 alatoires afin dobtenir une distribution de probabilit. Par exemple, le tableau suivant donne les probabilits des diverses variables alatoires pour 4 tirages pile ou face : Nombre de pile 0/4 2/4 4/4 Probabilit 0.0625 0.25 0.375 0.25 0.0625

Les statistiques nous permettent de dterminer la probabilit doccurrence dune variable alatoire en utilisant la formule pour les probabilits binomiales suivante : Probabilit de la variable alatoire = x Pk x (1-P)n-k . n! (n-k)!k!

n= le nombre de tirage k= le nombre de fois o lvnement fut tir P= probabilit doccurrence de lvnement

Comme vous vous rappelez peut-tre, ! veut dire que lon multiplie par tous les chiffres plus petits. Ainsi, 5!= 5*4*3*2*1 Voici un exemple : Probabilit davoir 3 rsultats pile en 4 tirages : = 4! / (1!*3!) * *0.53 * (0.5)1 = ( (4*3*2*1) / (1)(3*2*1) ) *0.53 * (0.5)1

= 0.25 donc 1 chance sur 4


Les probabilits binomiales sont facilement calcules par les ordinateurs et mmes les calculatrices scientifiques. Lorsque le nombre dvnements est petits, on peut utiliser des tables de distributions qui nous donnent les valeurs exactes ou la formule mathmatique dcrite plus haut. Probabilit pour les grands nombre de participants Lorsque le nombre dvnement est grand, on peut utiliser lapproximation normale parce que la distribution de la probabilit ressemblera la distribution normale avec :
Page 17

Cours dpidmio #9 pour rsidents version avril 2008 une moyenne = P (la probabilit obtenue) un cart-type = racine carre de P(1-P) / n La formule prcdente permet de conclure quil y a 2 facteurs qui diminuent lcart-type : Augmenter le nombre de mesures (ou de participants). Car ceci augmentera la valeur de n. Une valeur de P qui sloigne de 0.5 car la valeur de P*(1-P) sera plus petite. La valeur P*(1-P) sera son maximum pour 0.5 * 0.5= 0.25

Voici un exemple de lutilisation de la loi normale dans un contexte de probabilit. Chercheur value lassociation entre le lupus et le sexe. Dans une tude rtrospective, il note que sur un total de 100 patients, 750 sont des femmes. Sachant que les femmes reprsentent 50% de la population gnrale, il se demande quelle est la probabilit quune si grande proportion (75%) de patients atteint de lupus soient des femmes dans son tude. Pour ce calcul : = P = 0.75 S = Rac Carre de P*(1-P) / n =rac carre de (0.75*0.25) / 1 00 = 0.0433

La proportion (0.75) se trouve 0.25 de la valeur attendue (0.50). On peut normaliser cette distance en divisant la distance par lcart-type : 0.25/ 0.0433 = 5.8 La distance est donc quivalente 5.8 cart-type de la proportion attendue. En regardant dans la table des valeur z, on note que la probabilit davoir une valeur z plus leve est de moins de 0.01. Donc franchement improbable.

Page 18

Cours dpidmio #9 pour rsidents version avril 2008

Score Table
Z 3.4 3.3 3.2 3.1 3.0 2.9 2.8 2.7 2.6 2.5 2.4 2.3 2.2 2.1 2.0 1.9 1.8 1.7 1.6 1.5 1.4 1.3 1.2 1.1 1.0 0.9 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0.0 0.09 0.0002 0.0003 0.0005 0.0007 0.0010 0.0014 0.0019 0.0026 0.0036 0.0048 0.0064 0.0084 0.0110 0.0143 0.0183 0.0233 0.0294 0.0367 0.0455 0.0559 0.0681 0.0823 0.0985 0.1170 0.1379 0.1611 0.1867 0.2148 0.2451 0.2776 0.3121 0.3483 0.3859 0.4247 0.4641 0.08 0.0003 0.0004 0.0005 0.0007 0.0010 0.0014 0.0020 0.0027 0.0037 0.0049 0.0066 0.0087 0.0113 0.0146 0.0188 0.0239 0.0301 0.0375 0.0465 0.0571 0.0694 0.0838 0.1003 0.1190 0.1401 0.1635 0.1894 0.2177 0.2483 0.2810 0.3156 0.3520 0.3897 0.4286 0.4681 0.07 0.0003 0.0004 0.0005 0.0008 0.0011 0.0015 0.0021 0.0028 0.0038 0.0051 0.0068 0.0089 0.0116 0.0150 0.0192 0.0244 0.0307 0.0384 0.0475 0.0582 0.0708 0.0853 0.1020 0.1210 0.1423 0.1660 0.1922 0.2206 0.2514 0.2843 0.3192 0.3557 0.3936 0.4325 0.4721 0.06 0.0003 0.0004 0.0006 0.0008 0.0011 0.0015 0.0021 0.0029 0.0039 0.0052 0.0069 0.0091 0.0119 0.0154 0.0197 0.0250 0.0314 0.0392 0.0485 0.0594 0.0721 0.0869 0.1038 0.1230 0.1446 0.1685 0.1949 0.2236 0.2546 0.2877 0.3228 0.3594 0.3974 0.4364 0.4761 0.05 0.0003 0.0004 0.0006 0.0008 0.0011 0.0016 0.0022 0.0030 0.0040 0.0054 0.0071 0.0094 0.0122 0.0158 0.0202 0.0256 0.0322 0.0401 0.0495 0.0606 0.0735 0.0885 0.1056 0.1251 0.1469 0.1711 0.1977 0.2266 0.2578 0.2912 0.3264 0.3632 0.4013 0.4404 0.4801 0.04 0.0003 0.0004 0.0006 0.0008 0.0012 0.0016 0.0023 0.0031 0.0041 0.0055 0.0073 0.0096 0.0125 0.0162 0.0207 0.0262 0.0329 0.0409 0.0505 0.0618 0.0749 0.0901 0.1075 0.1271 0.1492 0.1736 0.2005 0.2296 0.2611 0.2946 0.3300 0.3669 0.4052 0.4443 0.4840 0.03 0.0003 0.0004 0.0006 0.0009 0.0012 0.0017 0.0023 0.0032 0.0043 0.0057 0.0075 0.0099 0.0129 0.0166 0.0212 0.0268 0.0336 0.0418 0.0516 0.0630 0.0764 0.0918 0.1093 0.1292 0.1515 0.1762 0.2033 0.2327 0.2643 0.2981 0.3336 0.3707 0.4090 0.4483 0.4880 0.02 0.0003 0.0005 0.0006 0.0009 0.0013 0.0018 0.0024 0.0033 0.0044 0.0059 0.0078 0.0102 0.0132 0.0170 0.0217 0.0274 0.0344 0.0427 0.0526 0.0643 0.0778 0.0934 0.1112 0.1314 0.1539 0.1788 0.2061 0.2358 0.2676 0.3015 0.3372 0.3745 0.4129 0.4522 0.4920 0.01 0.0003 0.0005 0.0007 0.0009 0.0013 0.0018 0.0025 0.0034 0.0045 0.0060 0.0080 0.0104 0.0136 0.0174 0.0222 0.0281 0.0351 0.0436 0.0537 0.0655 0.0793 0.0951 0.1131 0.1335 0.1562 0.1814 0.2090 0.2389 0.2709 0.3050 0.3409 0.3783 0.4168 0.4562 0.4960 0.00 0.0003 0.0005 0.0007 0.0010 0.0013 0.0019 0.0026 0.0035 0.0047 0.0062 0.0082 0.0107 0.0139 0.0179 0.0228 0.0287 0.0359 0.0446 0.0548 0.0668 0.0808 0.0968 0.1151 0.1357 0.1587 0.1841 0.2119 0.2420 0.2743 0.3085 0.3446 0.3821 0.4207 0.4602 0.5000

Page 19

Cours dpidmio #9 pour rsidents version avril 2008

z 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0 1.1 1.2 1.3 1.4 1.5 1.6 1.7 1.8 1.9 2.0 2.1 2.2 2.3 2.4 2.5 2.6 2.7 2.8 2.9 3.0 3.1 3.2 3.3 3.4

0.00 0.5000 0.5398 0.5793 0.6179 0.6554 0.6915 0.7257 0.7580 0.7881 0.8159 0.8413 0.8643 0.8849 0.9032 0.9192 0.9332 0.9452 0.9554 0.9641 0.9713 0.9772 0.9821 0.9861 0.9893 0.9918 0.9938 0.9953 0.9965 0.9974 0.9981 0.9987 0.9990 0.9993 0.9995 0.9997

0.01 0.5040 0.5438 0.5832 0.6217 0.6591 0.6950 0.7291 0.7611 0.7910 0.8186 0.8438 0.8665 0.8869 0.9049 0.9207 0.9345 0.9463 0.9564 0.9649 0.9719 0.9778 0.9826 0.9864 0.9896 0.9920 0.9940 0.9955 0.9966 0.9975 0.9982 0.9987 0.9991 0.9993 0.9995 0.9997

0.02 0.5080 0.5478 0.5871 0.6255 0.6628 0.6985 0.7324 0.7642 0.7939 0.8212 0.8461 0.8686 0.8888 0.9066 0.9222 0.9357 0.9474 0.9573 0.9656 0.9726 0.9783 0.9830 0.9868 0.9898 0.9922 0.9941 0.9956 0.9967 0.9976 0.9982 0.9987 0.9991 0.9994 0.9995 0.9997

0.03 0.5120 0.5517 0.5910 0.6293 0.6664 0.7019 0.7357 0.7673 0.7967 0.8238 0.8485 0.8708 0.8907 0.9082 0.9236 0.9370 0.9484 0.9582 0.9664 0.9732 0.9788 0.9834 0.9871 0.9901 0.9925 0.9943 0.9957 0.9968 0.9977 0.9983 0.9988 0.9991 0.9994 0.9996 0.9997

0.04 0.5160 0.5557 0.5948 0.6331 0.6700 0.7054 0.7389 0.7704 0.7995 0.8264 0.8508 0.8729 0.8925 0.9099 0.9251 0.9382 0.9495 0.9591 0.9671 0.9738 0.9793 0.9838 0.9875 0.9904 0.9927 0.9945 0.9959 0.9969 0.9977 0.9984 0.9988 0.9992 0.9994 0.9996 0.9997

0.05 0.5199 0.5596 0.5987 0.6368 0.6736 0.7088 0.7422 0.7734 0.8023 0.8289 0.8531 0.8749 0.8944 0.9115 0.9265 0.9394 0.9505 0.9599 0.9678 0.9744 0.9798 0.9842 0.9878 0.9906 0.9929 0.9946 0.9960 0.9970 0.9978 0.9984 0.9989 0.9992 0.9994 0.9996 0.9997

0.06 0.5239 0.5636 0.6026 0.6406 0.6772 0.7123 0.7454 0.7764 0.8051 0.8315 0.8554 0.8770 0.8962 0.9131 0.9279 0.9406 0.9515 0.9608 0.9686 0.9750 0.9803 0.9846 0.9881 0.9909 0.9931 0.9948 0.9961 0.9971 0.9979 0.9985 0.9989 0.9992 0.9994 0.9996 0.9997

0.07 0.5279 0.5675 0.6064 0.6443 0.6808 0.7157 0.7486 0.7794 0.8078 0.8340 0.8577 0.8790 0.8980 0.9147 0.9292 0.9418 0.9525 0.9616 0.9693 0.9756 0.9808 0.9850 0.9884 0.9911 0.9932 0.9949 0.9962 0.9972 0.9979 0.9985 0.9989 0.9992 0.9995 0.9996 0.9997

0.08 0.5319 0.5714 0.6103 0.6480 0.6844 0.7190 0.7517 0.7823 0.8106 0.8365 0.8599 0.8810 0.8997 0.9162 0.9306 0.9429 0.9535 0.9625 0.9699 0.9761 0.9812 0.9854 0.9887 0.9913 0.9934 0.9951 0.9963 0.9973 0.9980 0.9986 0.9990 0.9993 0.9995 0.9996 0.9997

0.09 0.5359 0.5753 0.6141 0.6517 0.6879 0.7224 0.7549 0.7852 0.8133 0.8389 0.8621 0.8830 0.9015 0.9177 0.9319 0.9441 0.9545 0.9633 0.9706 0.9767 0.9817 0.9857 0.9890 0.9916 0.9936 0.9952 0.9964 0.9974 0.9981 0.9986 0.9990 0.9993 0.9995 0.9997 0.9998

Page 20

Cours dpidmio #10 pour rsidents version mai 2008

Cours dpidmio #10 Probabilit #2 (infrence statistique)


Objectifs du cours : - Savoir calculer les intervalles de confiance et en connatre la signification - Connatre la signification de la valeur p - Comprendre les diffrents tests statistiques et la gnration des hypothses statistiques Lecture faire Article de Sparrow et Geelhoed sur la dexa vs prednisolone pour le traitement de la laryngite, Arch Dis Child. Published Online First: 19 April 2006 http://adc.bmjjournals.com/cgi/content/abstract/adc.2005.089516v1 Exercices pratiques faire avant le cours. Il sagit dexercices qui serviront de point de dpart pour les discussions. Question #1 Un manuscrit rapporte les rsultats dune tude randomise contrle comparant lefficacit de 2 traitements de la gale. Les auteurs rapportent une valeur p de 0.037. Quest-ce que a signifie ? Question #2 Lorsquon planifie une tude et que lon prvoit avoir un faible avantage dun traitement par rapport lautre, quelle est la meilleure faon de minimiser lintervalle de confiance ? Question #3 Une tude tente de dmontrer que 2 traitements sont defficacit identique. Les auteurs concluent que les traitements sont semblables car le p est de 0.21. - Quest-ce quil manque pour faire une telle affirmation ? - Quest-ce que 0.21 signifie ? Question #4 3 petits cochons font une tude sur la prvalence de la migraine. Le premier interroge 10 cochons et conclu que la migraine est prsente chez 30% des cochons. Le deuxime, plus vaillant, interroge 100 cochons et il en vient la mme conclusion. Le troisime travaille darrache pied pour obtenir du financement et fait un sondage tlphonique permettant de rejoindre 1000 cochons. Dans son tude, le taux de migraineux est de 30%. Quels sont les intervalles de confiance de ces 3 rsultats ? Question #5 Dans une tude prospective, un chercheur conclu que le taux de malformation de larbre urinaire est de 0% chez les patients ayant prsent une pididymite. Il se base sur un rsultat de 0 malformation chez 10 patients. - Quel est lintervalle de confiance de ce rsultat ? - Et si ctait 0/50. Quelle serait une estimation conservatrice ?

Page1

Cours dpidmio #10 pour rsidents version mai 2008

Question #6 Un chercheur veut valuer si le tabagisme est un facteur de risque pour la mort subite du nourrisson. - Quelles devraient tre lhypothse nulle et lhypothse de base ? - Donner un exemple du test mener. Question #7 Quels sont les avantages et inconvnients relatifs de lintervalle de confiance vs la valeur p ? Question #8 Vous voulez mener une tude de cohorte pour savoir si le risque daccident de vlo est diffrent selon que lon soit la semaine ou la fin de semaine. Soyez cratifs. Quelles seront vos hypothses de base et quel sera votre test statistique ?

Question #9 Voici les schmas de 5 situations possibles concernant lintervalle de confiance. Dans le but de publier des rsultats un jour, quelles sont les pires situations et quelles ont les meilleures ? 1
Zone dquivalence

0
Zone dquivalence

Question #10 Pour beaucoup dtudes rapportes dans la littrature mdicale, les auteurs rapportent avoir utilis un student t-test pour valuer leur hypothse. Pourquoi ne pas avoir utilis la loi normale ? Selon vous partir de quand peut-on considrer que la distribution de student ressemble loi normale ? Question # 11 Dans larticle de Sparrow : - Quelle tait lhypothse nulle ? - Pourquoi donne-t-on surtout lintervalle de confiance et non la valeur p ?

Page2

Cours dpidmio #10 pour rsidents version mai 2008

Probabilit # 2 (infrence statistique)


10.1 Intervalle de confiance
La majorit des mesures que nous faisons se font sur des chantillons de population et non sur des populations entires. Il en dcoule que les valeurs de moyenne ou de proportion ne sont que des estimations de la valeur relle. Plus la taille dchantillon est grande, meilleures sont les chances que la valeur obtenue ressemble la vraie valeur. La notion dintervalle de confiance permet de parer lincertitude associe lutilisation dun chantillon. On peut calculer un intervalle de confiance pour toute sortes de mesures (moyenne, odds ratio, probabilit, mdiane, etc). Prenons lexemple dune population de 1000 individus avec une moyenne pour la taille inconnue . On pourrait prendre un chantillon de 10 individus et obtenir la taille moyenne x. Cette valeur x pourrait staler sur un spectre allant de la moyenne de la taille de 10 plus petits individus celle des 10 plus grands. Si on rpte cette mesure de multiples reprises, on devrait obtenir une distribution des multiples x obtenues ressemblant une distribution normale. De plus, la moyenne de cette distribution devrait ressembler la valeur de . Plus on rpte une mesure avec un chantillon plus la moyenne des valeurs ressemblera la VRAIE valeur. On peut aussi infrer que plus la taille dchantillon est grande, plus la valeur mesure ressemblera la VRAIE valeur. Cest ce quon appelle la thorie de la limite centrale. Il y a trois aspects cette thorie : - La moyenne des moyennes des chantillons devrait ressembler . - La dviation standard de la moyenne des moyennes est appele lerreur standard. Elle est gale : dviationstandard de la mesure (/ racine carr de n o O n est le nombre de mesures - La courbe de distribution des moyennes des chantillons sera dallure normale si n est grand mme si la distribution des individus nest pas normale. On peut donc noter que 2 variables influences la prcision dune mesure ainsi que son intervalle de confiance : - La variabilit des mesures : Elle est module par la variabilit inter-individuelle entre les individus ainsi que par la prcision de loutil de mesure. Ainsi, plus une mesure a une dviation standard importante, plus grande sera la variabilit des rsultats moyens obtenus. - La taille dchantillon : Plus elle est grande, plus la moyenne obtenue ressemblera la VRAIE valeur et plus troit sera lintervalle de confiance. On peut exprimer la distribution des valeurs moyennes obtenues lors dchantillonnage avec la moyenne , la dviation standard des mesures et le nombre dindividus n par chantillon : Distribution (, / rac carre de n) Puisque la distribution normale suit toujours la mme forme, on peut conclure que 95% des valeurs x seront inclues dans 1.96 *erreur standard (calcule par / rac carre de n). Dans la majorit des cas, on ne connat pas et on tente de lestimer en mesurant x. Heureusement, on peut aussi estimer que se trouve 95% du temps dans lintervalle x 1.96 *erreur standard ( / rac carre de n). Cet intervalle (estimation marge derreur) se nomme
Page3

Cours dpidmio #10 pour rsidents version mai 2008 lintervalle de confiance. On utilise habituellement lintervalle de confiance de 95% mais il arrive quon utilise un intervalle plus troit ayant un niveau de confiance plus faible (lintervalle de confiance de 90% aura un spectre plus troit et une plus faible probabilit de contenir la valeur de .). La distribution t de Student Comme on ne connat pas la VRAIE valeur de , on doit utiliser une estimation de cette valeur (s). Le fait dutiliser une estimation de augmente lincertitude face aux rsultats. La mthode statistique utilise pour parer cette incertitude est dutiliser un intervalle de confiance encore plus large. Pour ce faire, on utilise la table t de Student au lieu de la table z de la loi normale. La table de Student est une table semblable la table de z mais elle tient compte du nombre de participants valus pour mesurer la dviation standard. Plus le nombre de patient est grand, plus la table t ressemble la table z. Le nombre de participant permet de dfinir ce quon appelle le degr de libert (Degree of freedom DF en anglais). Il est gale au nombre de participants - 1 (n-1). En connaissant le degr de libert on peut utiliser la distribution approprie. On peut donc rsumer quil existe une table t spcifique pour chaque nombre de participants. Cette table dcrit une distribution plus plate que la distribution normale (table Z) mais plus le nombre de participant est grand, plus la table t ressemble la table z. Voici des exemples de distribution de t de Student selon le degr de libert (df). Comme on peut le voir, les 4 distributions ont toutes la mme moyenne mais la distribution est plus large pour les plus petites tailles dchantillon.

La table de t permet de dterminer les valeurs de t pour calculer lintervalle de confiance. Ainsi sil y a : 10 participants, la valeur de t pour avoir une 95%CI est de 2.23 20 participants, la valeur de t pour avoir une 95%CI est de 2.09 100 participants, la valeur de t pour avoir une 95%CI est de 1.98 On utilise la valeur approprie au lieu du fameux 1,96 selon le nombre de participants. Certains sites permettent de calculer les valeurs de t en fonction du nombre de participants et de lintervalle de confiance dsir ou la valeur de p en fonction du nombre de participant et de la valeur t obtenue. En voici un exemple :
Page4

Cours dpidmio #10 pour rsidents version mai 2008 http://www.stat.sc.edu/~west/applets/tdemo.html Comment interprter un intervalle de confiance Pour lintervalle de confiance de 95% (95%CI) on dit qua long terme, si on rpte les mesures la valeur devrait se retrouver lintrieur de lintervalle de confiance 95% du temps. Lorsquon interprte un intervalle de confiance pour une valeur, il y a 5 possibilits. Supposons que lon veuille calculer lintervalle de confiance pour la diffrence defficacit entre 2 traitements. Lorsque x= 0, il ny a pas de diffrence et lorsque x est situ entre certaines valeurs (0= +ou- quelques chose), il ny a pas de diffrence cliniquement significative. Voici les 5 possibilits : 1. LIC contient 0 et reste dans la zone de non signification clinique. Conclusion : pas de diffrence entre les 2 traitements 2. LIC contient 0 mais une de ses limites dpasse la zone de non signification clinique. Conclusion : on ne peut conclure car il est possible davoir une diffrence cliniquement significative mais il est aussi possible quil ny ait pas de diffrence. 3. LIC est compltement lextrieur de la zone de non signification clinique. Conclusion : Diffrence cliniquement significative 4. LIC ne touche pas 0 mais est compltement situe dans la zone de non-signification clinique. Conclusion : Effet statistiquement significatif mais sans rpercussion clinique 5. LIC ne touche pas 0 mais touche les zones non-significative et significative cliniquement. Conclusion : ne peut pas conclure parce que mme si on note une diffrence statistique, il se peut que cette diffrence ait peu deffet clinique. 1
Zone dquivalence

0
Zone dquivalence

Calcul de lintervalle de confiance Les statisticiens ont appris calculer lintervalle de confiance pour toutes sortes de mesures. - Moyenne, mdiane - Odds ratio, risque relatif - Proportion - Hazard ratio Lintervalle se calcule souvent avec une formule de base simple : Intervalle = valeur de la variable niveau de confiance* erreur standard O le niveau de confiance est la valeur de z ou de t selon la situation Sil y a plus de 100 patients, t et z sont semblables

Page5

Cours dpidmio #10 pour rsidents version mai 2008 z = 1.96 pour le 95%CI et 1.645 pour le 90%CI lorsque lon utilise la distribution normale (table z). Pour calculer lintervalle de confiance de 95%, on peut utiliser les formules suivantes : O n est le nombre de participant dans lchantillon 1. Pour une moyenne : x 1.96 * cart-type / racine carre de n On peut utiliser cette formule pour les distributions normales et lorsque n est suffisamment grand. Si la distribution nest pas normale, la moyenne sera influence par les valeurs extrmes ainsi que lintervalle de confiance. On peut souvent, par contre, considrer que la distribution agira comme une distribution normale si n est > 15. Pour une taille dchantillon plus petit que 100, il est prfrable dutiliser la table de t de Student. Voici un exemple de calcul pour une tude o lon rapporte la taille moyenne dun chantillon de 400 enfants de 2 ans. La taille moyenne mesure est de 0.90 m avec un cart-type de 0.10 m. On peut donc conclure que la taille moyenne de lensemble des enfants telle quextrapole avec cette tude devrait tre de X = 0.90m 1.96 *(0.10/ rac carre de 400) X = 0.90 0.010m *** si cette tude navait valu que 25 patients, on aurait utilis la table t de la loi de student et on aurait conclu que x = 0.90 2.06* (0.10/ rac carre de 25) x = 0.90 0.041m On voit donc que le fait davoir moins de participant augmente lintervalle de confiance 2. Pour la diffrence entre 2 moyennes : diffrence = X X2 1.96* racine carre de ( s21 / n1 + s22 /n2) La prsence de 2 variables inconnues (X X2) augmente le niveau dincertitude associ au calcul. Cest pour cette raison que lintervalle de confiance sera plus grand parce quon additionne les 2 variances. Encore une fois pour un nombre de participants plus petit que 100, il est prfrable dutiliser la table t de Student. Voici un autre exemple de calcul pour une tude o lon compare la taille moyenne de 2 chantillons de 25 enfants de 2 ans. La taille moyenne mesure pour la population a est de 0.90 m avec un cart-type de 0.10 m. tandis que la taille moyenne mesure pour la population b est 0.95 m avec un cart-type de 0.15m Diffrence = (Xa-Xb) 2.06 * rac carre (0.102/25 +0.152/25) Diffrence = - 0.05 0.074

Page6

Cours dpidmio #10 pour rsidents version mai 2008 On voit donc que le fait davoir deux groupes avec des variances inconnues augmente beaucoup lintervalle de confiance 3. Pour une proportion : On peut utiliser lapproximation normale pour les valeurs de n leve P 1.96 * Racine carre de (P*(1-P)) / racine carr de n La thorie de la limite centrale stipule que lorsque le nombre de participant est suffisant, une proportion se comporte selon une distribution normale. Dans ce cas le calcul de lcart-type se calcule toujours avec la mme formule : racine carr de P*(1-P). Dans ce cas, plus la valeur de P se rapproche de 0.5, plus la variance sera leve et plus large sera lintervalle de confiance. Ainsi, pour des proportions plus extrmes, lintervalle de confiance sera plus petit. Voici lexemple dune tude qui mesure la sensibilit dun test. Les mesures de sensibilit se rapportent en terme de proportion. Supposons que ltude rapporte que sur 400 patients avec la maladie, le test en dtecte 360. On peut donc conclure que la sensibilit du test est de 360/400 (90%). On peut aussi calculer un intervalle de confiance pour cette valeur : P= 0.90 1.96 * Rac carre (0.90 * 0.10) / 20 P = 0.90 0.0015 4. Pour la diffrence entre 2 proportions : Diffrence= (P1-P2 ) / rac carre de [P(1-P) (1/ n1 + 1/n2) ] Lorsque n est petit, la thorie de la limite centrale ne sapplique plus et la distribution normale est inadquate. Il existe des tables qui donnent les valeurs exactes des limites de lintervalle de confiance. Voici un exemple de ces tables : N total x 95% Exact CI 99% exact CI 5 0 0-0.45 0-0.6 5 1 0.05-0.71 0-0.81 5 2 0.06-0.83 0-0.91 5 3 0.17-0.94 0.09-1 5 4 0.55-1 0.4-1 10 0 0-0.26 0-0.36 10 1 0-0.44 0-0.54 10 2 0.03-0.56 0.01-0.64 10 3 0.07-0.65 0.04-0.74 10 4 0.12-0.74 0.08-0.81 10 5 0.19-0.81 0.13-0.87 10 65 0.26-0.88 0.19-0.92 En se basant sur cette table on peut dire que si 3 patients sur dix ont la condition recherche, lintervalle de confiance de 95% est de 7 a 65%.

Page7

Cours dpidmio #10 pour rsidents version mai 2008 Certains sites internet, permettent aussi de calculer les intervales de confiance pour les petits chantillons http://statpages.org/confint.html ou pour tous les types de statistiques http://statpages.org/#Confidence. Il est parfois difficile dtablir des statistiques lorsque le nombre dobservation et dvnement est restreint. Que faire si on se retrouve avec 0 au niveau du numrateur ? Une approche conservatrice est de rajouter 3/3 la statistique (3 au numrateur et au dnominateur) afin davoir une estimation conservatrice de la valeur.

10.2 La valeur p
On utilise souvent le terme p-value en recherche clinique. Cette valeur se calcule laide des tables de distribution (comme la table Z ou t). Il sagit de la probabilit rapporte par la table tel que dmontr au cours #8. Malheureusement, plusieurs ne connaissent pas la signification relle de ce terme. La valeur p reprsente la probabilit davoir une valeur aussi ou plus extrme que celle obtenue dans le cas ou il ny aurait pas de diffrence entre les traitements. Cette valeur na pas de signification si les deux traitements sont diffrents dans la ralit. Par exemple, une valeur p de 0.02 signifie que si deux traitements sont identiques, les risques davoir un rsultat aussi extrme que celui mesur est de 2 %. Ceci ne signifie pas que la probabilit davoir une diffrence est de 2%. On recherche habituellement une valeur p< 0.05 pour conclure quil y a une diffrence mais il existe certaine circonstance o lon prfrera avoir une valeur de p < 0.01. Lutilisation de p< 0.05 implique que si on fait 20 tudes en comparant des mdicaments lefficacit semblable, il devrait y en avoir 1 qui montre une diffrence statistiquement significative. Cest pour cette raison quon ne peut que trs rarement conclure dfinitivement avec les rsultats dune seule tude. Si on a une valeur p de 0.15, ceci ne signifie pas que les 2 traitements sont semblables. Ceci signifie que si les 2 traitements taient semblables on obtiendrais un rsultat aussi ou plus extrme que celui mesur 15% du temps. 10.2.1 tudes dquivalence Il existe 2 faons de dmontrer que 2 traitements sont semblables : Il faut avoir une valeur p > 0.05 et montrer que lon avait la puissance de dtecter une diffrence. La puissance dune tude se mesure avec la valeur de lerreur . Lerreur est une erreur o lon dit quil ny a pas de diffrence entre 2 traitements alors quil en existe une (On dit faussement que les 2 traitements sont quivalents). On choisit au dbut de ltude lampleur de lerreur recherche (elle est habituellement de 10% ou 20%). La puissance est gale 1- erreur Plus lerreur est petite, plus le nombre de participants devra tre lev. Pour affirmer que 2 traitements sont semblables, il faut avoir une puissance dau moins 90% donc beaucoup de participants. On peut aussi le dmontrer laide de lintervalle de confiance de la diffrence entre les 2 traitements. Si les limites de lintervalle sont lintrieur de ce qui serait cliniquement quivalent, on peut conclure que les traitements sont semblables. Par exemple, une tude randomise sur leffet du Gravol sur le risque de vomissement, montre que la diffrence entre les taux dhospitalisation est de 2.7% plus lev dans le groupe placebo(95%CI 1.2-4.2%). Lintervalle de confiance montre quil y a une diffrence statistique entre les 2 groupes mais que cette diffrence dhospitalisation nest pas plus grande que 4,2%. Les investigateurs peuvent conclurent que les 2

Page8

Cours dpidmio #10 pour rsidents version mai 2008 traitements sont quivalents car ils jugent quune diffrence de 4,2% est cliniquement bnigne.

10.3 Les tests de signifiance


Il existe 2 types dinfrence statistique. Le premier, lintervalle de confiance, fut dj dcrit. Le test de signifiance est le deuxime type. Les tests de signifiance valuent la concordance entre une hypothse concernant une population et les donnes mesures. Voici les tapes suivre pour effectuer un test de signifiance : 1. Il faut dfinir une hypothse de base (nomm H1). Cest lhypothse que lon croit vraie et que lon veut valuer. Exemple : le mdicament A est meilleur quun placebo dans le traitement des rhumes car il rduit le temps ncessaire la gurison. 2. On dfinit lhypothse nulle (nomm H0). Cest le contraire de lhypothse de base. Exemple : le mdicament A a une efficacit identique celle du placebo dans le traitement des rhumes. Cest lhypothse que lon va utiliser pour appliquer le test statistique. Le but de lexercice est de rejeter lhypothse nulle afin de conclure que lhypothse de base est vraie. Voici une reprsentation algbrique des 2 hypothses : TA < Tp Temps pour la gurison avec traitement A < placebo a. H1 b. H0 TA = Tp Temps pour la gurison avec traitement A = placebo On peut aussi dfinir que H0 : TA - Tp = 0 Il ny a pas de diffrence entre les 2 temps - On doit toujours considrer que les hypothses ne concernent pas seulement les participants ltude mais les populations entires. - Un autre point important est de dterminer si les hypothses sont uni ou bidirectionnelles (one-sided vs two sided). Une hypothse unidirectionnelle signifie que lhypothses de base peut diffrer de lhypothse nulle dans une seule direction (comme dans lexemple prcdent). Une hypothse bidirectionnnelle signifie quelle peut diffrer de lhypothse nulle dans les 2 directions (donc tre diffrent en plus grand ou plus petit). Certains statisticiens suggrent de toujours utiliser une approche bidirectionnelle. 3. On dfinit les zones de rejets. On dfinit habituellement quune hypothse nulle est rejete si la valeur p est plus petite que 0.05. Il peut exister certaines situations o lon se doit dtre plus prudent avant de rejeter lhypothse nulle. Dans ces cas, on utilise une valeur de p plus petite comme 0.01. 4. On applique un test de signifiance. Il sagit dun test statistique qui mesure la compatibilit entre lhypothse nulle et les donnes. Il existe plusieurs tests diffrents selon le type de paramtres tudis mais il y a 2 caractristiques importantes au test de signifiance : a. Le test est bas sur les paramtres spcifis dans les hypothses. Ainsi si lhypothse est tablie en unit de temps, le test en sera de mme. b. Une valeur obtenue loigne de H0 est un argument pour rejeter H0 et conclure que lhypothse de base est vraie. On applique habituellement le test statistique afin de calculer la valeur Z du rsultats obtenus (en utilisant la loi normale). partir de cette valeur Z de la loi normale, on dtermine la valeur P. Ainsi on veut mesurer quelle est la probabilit davoir un rsultats aussi extrme que celui obtenu si lhypothse nulle tait vraie. La majorit des tests statistiques ont une structure ressemblant lquation suivante :

Page9

Cours dpidmio #10 pour rsidents version mai 2008

Z= Diffrence entre les 2 valeurs / (variance/ racine carr de n) 5. On conclut. Cest ce quon appelle tre statistiquement significatif. Si la valeur P est plus grande que 0.05, on ne peut pas rejeter lhypothse nulle et il faut laccepter. Ceci ne veut pas dire quelle est ncessairement vraie mais nous ne pouvons pas lexclure. Voici quelques exemples de tests de signifiances : - Test Z pour la moyenne dune population : pour tester si une valeur moyenne mesure est gale la moyenne dune population dj connue. Par exemple, on veut tester si le poids des bbs allaits est plus grand 1 an en comparaison avec la moyenne nationale. Si on sait que la moyenne nationale ( est de 10kg avec une dviation standard () de 1 kg. On mesure chez 100 bbs allaits un poids moyen(x) 11 kg. Thorie x = 0 H0 La formule sera Z = ( x-0 ) / ( / rac carr de n) Exemple H0 x = 10kg

Z = (11-10) / (1/10) Z = 10 Selon la table Z, la probabilit davoir une valeur aussi extrme que celle obtenue si lhypothse nulle tait vraie serait plus petite que 0.001. On peut donc rejeter lhypothse nulle et dire que les bbs allaits sont plus gros. - Test t de student pour la diffrence entre 2 moyennes : Pour tester sil y a une diffrence entre les moyennes de 2 valeurs mesures, la formule mathmatique est plus complexe parce quil y plus dinconnus. De plus, il faut utiliser la table t de student parce que les valeurs de dviation standard sont infres. Par exemple, on veut tester si le poids des bbs allaits est plus grand en comparaison avec ceux qui sont non allaits. On mesure chez 100 bbs allaits un poids moyen(xa) 11 kg avec une dviation standard de 1kg. On mesure chez 100 bbs non allaits un poids moyen (x0) 10.5kg avec une dviation standard de 1 kg. Thorie H0 xa - x0 = 0 La formule sera t = (xa - x0) / (Rac carre ( S2a / na + S20 / n0)) Exemple H0 xa - x0 = 0 t = (0.5) / Rac car ( 2/100) t = 25

Selon la table t, la probabilit davoir une valeur aussi extrme que celle obtenue si lhypothse nulle tait vraie serait plus petite que 0.001. On peut donc rejeter lhypothse nulle et dire que les bbs allaits sont plus gros. Test de signifiance pour 2 proportions : Pour tester sil y a une diffrence entre les proportions dvnements chez 2 populations on utilise lapproximation normale si la taille dchantillon est grande. Par exemple, on veut tester si la proportion de nourrisson ayant eu une otite dans la premire anne de vie est plus grande chez les bbs allaits en comparaison
Page10

Cours dpidmio #10 pour rsidents version mai 2008 avec ceux qui sont non allaits. On mesure chez 100 bbs allaits la proportion ayant eu une otite (Pa) 20%. On mesure chez 100 bbs non allaits un taux (P0) 25%. Thorie Pa - P0 = 0 H0 Exemple H0 Pa - P0 = 0

La formule sera Z = (Pa - P0) / (Rac carre (P (1-P) (1 / na + 1 / n0)) Z = (-0.05) / Rac car ( 0.00375) Z = -0.81 Selon la table Z, la probabilit davoir une valeur aussi extrme que celle obtenue si lhypothse nulle tait vraie serait de 0.2090. On ne peut donc pas rejeter lhypothse nulle et dire que les bbs allaits ont moins dotite. :

Page11

Cours dpidmio #10 pour rsidents version mai 2008 Table t de student

http://rfv.insa-lyon.fr/~jolion/STAT/t7.png

Page12