Vous êtes sur la page 1sur 6

Kinesither Rev 2013;13(138):25–30

Dossier
Bio-statistiques : la dimension collective de nos individualités

Quelles biostatistiques pour quelles


études ?
What biostatistics for what studies?

Groupe d'études et de recherches appliquées à la rééducation (GERAR), Mathieu Vergnault


société française des professionnels en activités physiques adaptées (SFP-APA),
20, rue d'Aubervilliers, 75019 Paris, France

Reçu le 25 mai 2012 ; accepté le 8 mars 2013

RÉSUMÉ
Mots clés
Le résultat statistique n'est que la finalité de l'analyse statistique. Si le thérapeute ne respecte
pas les conditions d'applications des tests statistiques, les valeurs ne seront pas fausses Analyse statistique
parce que le test ne se trompe pas, mais l'analyse statistique employée le sera. Le résultat Biais
de l'analyse statistique dépend de nombreux paramètres qu'il est important de maîtriser afin de Biostatistiques
se protéger d'éventuelles erreurs. La littérature n'est pas exempte de ces erreurs, il est donc Signification statistique
primordial d'accorder une attention particulière aux traitements statistiques des données. L'inter- Significativité clinique
prétation du résultat se rapporte à la question posée par l'étude ou aux hypothèses posées au
départ. Cette interprétation est donc sujette aux précédentes problématiques mais aussi aux Keywords
liens de causalité accordée par le thérapeute. La question du statistiquement significatif et du Statistical analysis
cliniquement significatif prend alors tout son sens lorsqu'il s'agit de prendre des décisions Bias
thérapeutiques pour un patient. Biostatistics
Niveau de preuve. – Non adapté. Statistical significance
© 2013 Elsevier Masson SAS. Tous droits réservés. Clinically relevant

SUMMARY
The statistical result is that the purpose of statistical analysis. If the therapist does not comply
with conditions of applications of statistical tests, the values will not be false because the test
is not mistaken, but the statistical analysis will be used. The outcome of the statistical
analysis is dependent on many settings: it is important to master in order to protect
themselves from errors. Literature is not free of these errors, it is essential to give a special
attention to the statistical treatment of data. The interpretation of results refers to question
asked by the study or hypothesis at the outset. This interpretation is prone to previous issues
but also causal links given by the therapist. The question of statistically significant and
clinically relevant takes its full meaning when it comes to make therapeutic decisions for a
patient. DOIs des articles originaux :
Level of evidence. – Not applicable. http://dx.doi.org/10.1016/j.
© 2013 Elsevier Masson SAS. All rights reserved. kine.2013.03.003,
http://dx.doi.org/10.1016/j.
kine.2013.03.004,
http://dx.doi.org/10.1016/j.

I
l n'existe pas une analyse statistique pour
L'ANALYSE STATISTIQUE kine.2013.03.002
une étude précise. La variabilité des don-
nées et des objets d'études, pousse les Les variables
chercheurs à utiliser des traitements statisti-
ques toujours différents. Cependant, avant de En biostatistique, une variable est une infor- Adresse e-mail :
choisir un test statistique, quelques critères mation ou une observation. Au vu du nombre mathieu.vergnault@hotmail.
doivent être pris en compte [1–4]. d'informations que le thérapeute rencontre sur fr

© 2013 Elsevier Masson SAS. Tous droits réservés.


http://dx.doi.org/10.1016/j.kine.2013.03.001 25
Dossier M. Vergnault

Bio-statistiques : la dimension collective de nos individualités

le terrain, ces variables peuvent être de différentes modalités. ce soit au lecteur critique de déterminer le type et la nature des
Les plus importantes pour la sélection d'un test statistique sont variables utilisées et vérifier leurs adéquations à l'analyse
les variables quantitatives (VQT) ou qualitatives (VQL) et les statistique employée [5,19–21].
variables dépendantes (VD) ou indépendantes (VI) de l'objet
de l'observation. Les tests statistiques
Les VQT sont associées à un chiffre pouvant être mesurées,
alors que les VQL ne possèdent pas de sens arithmétique Une mauvaise analyse statistique vous donne également des
propre [2,5–8]. Les VD sont des variables qui subissent p-values, des IC95 % et autres sigles statistiques à interpréter.
Le problème c'est que le logiciel utilisé ne vous dira jamais si
l'influence des VI. Le phénomène observé se traduit par la
VD, de ce fait, la VD est fonction de la VI. Le protocole d'une vous avez respecté les conditions pour utiliser ce test plutôt
étude se monte en contrôlant les VI afin d'éviter toute variation qu'un autre. Il est alors nécessaire d'aiguiser son sens critique
non maîtriser sur les VD [4,9]. et de vérifier votre analyse statistique [20]. Le Tableau I repré-
Par manque de rigueur, certaines VI peuvent devenir des sente quelques tests statistiques couramment utilisés dans la
variables confondantes. Ce fut le cas d'une étude parue en littérature scientifique.
1993 [10], où les auteurs ne purent conclure sur l'impact du
tabagisme passif sur le cancer du poumon chez les couples où Normalité de l'échantillon
un des concubins fumait au domicile, du fait de la présence La mauvaise utilisation d'un test en rapport avec la normalité
d'oiseaux en cage dans la majorité des ménages étudiés. de l'échantillon est l'une des erreurs les plus courante relevée
Cette conclusion est bien sûr à rapprocher des conflits d'inté- dans la littérature scientifique [3,22,23].
rêts des auteurs. Cela souligne l'importance de rigueur dans la
mise en place d'un protocole d'étude clinique afin d'éloigner le Par consensus, au-dessus de 30 sujets, le groupe
maximum de biais entre les variables et les liens de causes assume une distribution normale ou gaussienne
à effets existants [11–13]. [7,21,24,25].
Les diverses stratégies de randomisation peuvent être consi-
dérées comme une solution pour éviter les variables confon-
dantes et différents biais de sélection [14–17]. La Mais ce n'est pas toujours vrai, il est donc nécessaire de tester
randomisation de certains essais cliniques est remise en cette normalité par différents tests statistiques qui comparent
cause par certains, prétextant que des études bien contrôlées la distribution de l'échantillon avec une distribution normale de
étaient mieux menées que des études randomisées par une valeurs. Mais ces tests de normalité sont soumis aux tests
meilleure rigueur méthodologique [18]. d'hypothèses. Votre résultat est alors assujetti aux deux ris-
De ce point de vue, l'analyse statistique doit absolument ques d'erreurs [3,11,26] (voir le 1er article de ce dossier). Il est
passer par la définition du type de variable [8,9], bien que donc primordial de vérifier cette normalité de distribution en

Tableau I. Différents tests statistiques rencontrés dans la littérature scientifique.


Tests paramétriques Tests non paramétriques Objectif du test Exemple
équivalents
Test de t groupes Test de Wilcoxon Comparer un groupe Évolution de la flexion de genou avant
appariés de sujets à 2 moments et après une séance d'arthromoteur
distincts (VQT)

Test de t groupes Test de Mann-Whitney Comparer 2 groupes Comparaison du temps de maintien unipodal
non appariés indépendants au même chez des seniors sains et des seniors ayant
moment (VQT) subi une arthroplastie de hanche

Analyse de variances Analyse de Kruskall-Wallis Multiples comparaisons Différence de force isocinétique des
Anova pour un groupe à plusieurs muscles de la cuisse à 4, 6 et 8 mois
moments via les tests de après une ligamentoplastie de genou
t ou de Wilcoxon (VQT)

Anova à 2 facteurs Kruskall-Wallis à 2 facteurs Même système que Suivant le même exemple qu'au dessus,
précédemment, mais avec déterminer s'il existe une différence
l'ajout d'une seconde variable selon le genre

Test de x2 Test exact de Fischer Comparaison entre 2 Comparaison des progrès, en pourcentage,
groupes indépendants (VOL) de la force des extenseurs du genou entre
un groupe de sédentaire et un groupe
de sportif

Coefficient de Coefficient de corrélation Force d'association entre Relation entre la distance parcourue lors
corrélation r Rang de Spearman 2 variables d'un test de marche de 6 minutes et
de Pearson différents niveaux d'immersion aquatique

26
Kinesither Rev 2013;13(138):25–30
Dossier
Bio-statistiques : la dimension collective de nos individualités

Figure 2. Exemple des représentations graphiques du standard


deviation (SD), du standard error of the mean (SEM et de l'IC95 %.

perte d'indépendance de certaines observations [32]. Les


critères d'appariement sont sous-jacents aux modalités
d'inclusion et d'exclusion fixés au début de l'étude. Selon le
traitement statistique, deux cas de comparaisons sont possi-
bles. Soit l'analyse s'effectue entre deux groupes à un temps
précis (tests statistiques non appariées) soit celle-ci s'attache
à évaluer un groupe à deux temps différents (tests statistiques
appariés) [28].
Il est nécessaire d'analyser le test statistique choisi en rapport
avec le type d'appariement dépendant du protocole de l'étude
Figure 1. Histogramme d'un échantillon suivant une loi normale et [26].
sa courbe gaussienne (a) et un échantillon suivant une autre loi de
distribution (b). Unilatérale ou bilatérale
L'investigateur d'une étude estime que l'effet qu'il cherche
analysant l'allure générale des valeurs via un histogramme à prouver (s'il existe) ne peut se produire que dans un seul
(Fig. 1) [24,27]. sens, dans ce cas l'analyse statistique est unilatérale. La zone
Les tests statistiques exigeant une distribution normale des de rejet de l'hypothèse principale est donc placée d'un seul
valeurs sont qualifiés de paramétriques, contrairement aux côté de la distribution de probabilité de référence et de ce fait
tests non paramétriques utilisés lorsque la distribution des est plus puissant. C'est le cas par exemple, des études qui
valeurs ne suit pas une courbe gaussienne. Les tests para- compare une thérapeutique à un placebo [1].
métriques sont plus puissants et se basent sur les valeurs Sinon, le chercheur utilisera des analyses statistiques bilaté-
elles-mêmes ou leurs différences, et non sur leurs rangs rales car il ne sait pas dans quel sens l'effet se produira, et ne
(position de chaque valeur), comme c'est le cas lors de tests se préoccupe pas nécessairement du sens de la différence.
statistiques non paramétriques [5,26,28–30]. Par prudence, la plupart des chercheurs préconisent l'usage
Certains indices de dispersion comme l'écart-type (standard de tests bilatéraux à moins de justifier l'utilisation de tests
deviation [SD]) ou l'écart-type à la moyenne (standard error of unilatéraux [1,33,34].
the mean [SEM]) sont utiles pour analyser la distribution si, et
seulement si elle respecte une loi normale. Le SEM (variabilité
de la moyenne pour une population) est plus pratique et plus Multicomparaison
utilisé lors de comparaison entre plusieurs groupes. De par La multiplication des tests statistiques dans une étude est
son calcul, il possède des valeurs plus petites que le SD, il est souvent contestée car celle-ci est soumise à des erreurs
parfois utilisé à tort pour prétendre à une plus grande précision fréquentes. Ces multiples comparaisons sont réalisées la plu-
pour la variabilité d'un échantillon [22,25,31]. Les conclusions part du temps sur des VD, augmentant le risque de conclure
faites sur l'amplitude de l'IC sont aussi soumises à une nor- à tort à des différences et à des résultats faussement signifi-
malité de l'échantillon (Fig. 2). catifs [4,22,23,27,35]. Il faut donc se méfier des études compa-
rant de nombreux critères.
Sans ajustements statistiques, un chercheur s'appliquant
Appariement à comparer cinq thérapeutiques, se voit donc réaliser dix
L'appariement d'un groupe intervient afin de diminuer la varia- comparaisons. Si le risque d'erreur a est fixé à 0,05, le degré
bilité sur un ou plusieurs critères étudiés et de ce fait, vise à la de chance de ne pas commettre l'erreur a pour un seul test est

27
Dossier M. Vergnault

Bio-statistiques : la dimension collective de nos individualités

de 0,951. Dans cet exemple, la chance de ne pas commettre des solutions pour objectiver une concordance entre deux
l'erreur a est égale 0,9510, soit 0,60. De ce fait, l'erreur de type I méthodes, même si cette concordance est laissée à l'apprécia-
passe de 5 % à 40 % [27,36]. La méthode de Bonferroni-Holm tion du chercheur (choix des limites) [44]. Il n'est pas rare de
est une alternative afin que l'ensemble des comparaisons rencontrer l'utilisation à tort, de la régression et du coefficient de
accepte un risque global d'erreur a à 5 %, même si celle-ci corrélation pour justifier de la concordance entre deux variables,
est peu utilisée [37]. Cette stratégie d'ajustement consiste alors que ces analyses mesurent l'intensité et l'existence d'un
à diviser le risque a par le nombre de comparaisons lien entre deux mesures [45,46].
[1,27,38]. Pour l'exemple précédent, le nouveau seuil de signi- Dans le cas des études de reproductibilité (test et retest), le
ficativité serait de 0,5 %. coefficient de corrélation intraclasse (CCI) est privilégié.
L'analyse de variance (Anova) est considérée comme la solu- Comme tout coefficient il est compris entre 0 et 1 et un coef-
tion pour ne pas tomber dans ce type de piège lorsque votre ficient égal ou supérieur à 0,80 est un strict minimum pour
analyse comporte plusieurs groupes à comparer [3,36]. estimer que les tests réalisés sont reproductibles [47].

Corrélation et régression
CLINIQUE VERSUS STATISTIQUE
Les tests de corrélation analysent l'existence d'une liaison
entre deux VQT indépendantes suivant une loi normale. Cette Les associations retrouvées en termes mathématiques ne
relation est traduite par un coefficient « r » ou r de Pearson reposent sur aucun lien de causalité, bien que la statistique
compris entre –1 et 1. Plus ce coefficient est proche d'une des ne soit qu'une mathématique contextualisée [48]. Il faut alors
extrémités, plus la liaison est forte [2,26]. À partir d'un coef- se pencher sur la signification du statistiquement significatif.
ficient de corrélation supérieur à 0,8, la force de liaison entre
les variables étudiées est considérée comme bonne. Ce coef- Est-ce que des résultats statistiquement significatifs
ficient doit être accompagné de sa p-value et de son IC afin de sont cliniquement intéressants ?
d'exprimer plus précisément la force de liaison. La corrélation
n'implique pas d'autres variables que celles testées et cette Une diminution significative de 0,8 8C de la température cutanée
liaison statistique n'est pas un critère de causalité. Le coef- au niveau du genou dans un groupe de patients opérés d'une
ficient de détermination est la mise au carré du « r » de ligamentoplastie améliore-t-elle la flexion ou la douleur à deux
Pearson. Ce coefficient de détermination permet de jauger
semaines postopératoires ? Est-ce qu'une augmentation signi-
la qualité de la régression et est très utilisé pour préciser la ficative de 14 mètres au test de marche de six minutes améliore
relation entre les variables étudiées [39]. l'autonomie des patients insuffisants cardiaques ?
La régression correspond à l'équation permettant de connaître Il y a alors confusion entre d'un côté un événement qui ne
ou prédire la valeur d'une variable (VD) grâce à une autre (VI) semble pas arriver par hasard (statistique) et de l'autre un effet
[5,40,41]. Par consensus, les VI sont placées sur l'axe des sur la santé du sujet (clinique) [6,49,50].
abscisses et les VD sur l'axe des ordonnées [12]. Le plus
souvent une droite est tracée via une représentation graphique
Dénoncée depuis longtemps, l'erreur est donc de
en nuage de points. En fonction de l'équation de la droite, la
considérer que plus un résultat est significatif, plus il
régression sera alors considérée linéaire ou non linéaire [24].
sera cliniquement intéressant [51].
La régression décrit la façon dont la variable placée sur l'axe
des ordonnées est liée à la variable placée sur l'axe des
abscisses et non l'inverse. Ce dernier point est souvent la L'analyse critique des résultats passe par la recherche de
cause de conclusions erronées dans la littérature scientifique relation avec la pratique et souvent, des résultats statistique-
lorsque les auteurs examinent l'ordre de grandeur des coef- ment significatifs n'ont aucun intérêt sur le terrain pour le
ficients de corrélations trouvés, et les relations de cause à effet thérapeute ou le patient [4,30,52–55]. Il n'existe pas de
vis-à-vis des régressions [22,40]. consensus sur la significativité clinique, car celle-ci est dépen-
dante des situations, des professionnels, des patients, des
pathologies et a fortiori du référentiel de l'étude. Il faut alors
Concordance éviter toute généralisation des résultats et contextualiser les
La comparaison de deux méthodes différentes ou d'une seule conclusions sous-jacentes [1,22,56].
méthode par deux observateurs différents est un des thèmes Les valeurs de la p-value, de l'IC, de la TE et de la PS ainsi que
largement abordés dans le domaine de la rééducation. Ces de la taille de l'échantillon sont importantes à considérer lors-
comparaisons font l'objet de diverses erreurs d'analyse sta- qu'il est question d'effet clinique. [22,52,57,58].
tistique à cause des différences entre les VQT et les VQL.
Dans le cas des VQL, la comparaison d'un test par deux
observateurs se réalise grâce au coefficient kappa. La concor- QUELLES BIOSTATISTIQUES POUR QUELLES
dance est alors la proportion de sujets pour lesquels les ÉTUDES ?
examinateurs sont d'accord entre eux. Plus ce coefficient
kappa est proche de 1, plus le degré de concordance est Rappeler en introduction, la grande variabilité des études, des
excellent. Cette mesure d'accord entre deux observateurs doit données mesurées, des protocoles cliniques, ainsi que des
être analysée en fonction du contexte clinique [42,43]. questions et hypothèses posées occasionnent des traitements
La validation d'une nouvelle méthode thérapeutique de mesure et des analyses statistiques toujours différentes. Le choix du
par rapport à une autre méthode (souvent placée en tant que ou des tests statistiques répondent à divers critères. Les points
méthode de référence), porte essentiellement sur des VQT. La à prendre en compte pour le choix d'un test statistique se
méthode graphique de Bland et Altman semble être la meilleure retrouvent dans le Tableau II [1–4].

28
Kinesither Rev 2013;13(138):25–30
Dossier
Bio-statistiques : la dimension collective de nos individualités

Déclaration d'intérêts
Tableau II. Critères à prendre en compte pour la sélec- L'auteur déclare ne pas avoir de conflits d'intérêts en relation avec cet
tion d'un test statistique. article.
Critères pour le choix d'un test statistique
Question posée par l'étude
Remerciements
Nature des variables – VI, VD, VQL, VQT Je remercie les membres du GERAR, Anne Ayala et Nathanaël
Grandeurs étudiées – moyennes, pourcentages, etc. Shahmaei, pour avoir pris le temps de lire, d'analyser, de vérifier et
de critiquer ce travail.
Conditions du test d'hypothèse – risque a et b
Latéralité du test
Distribution des données – normalité de l'échantillon
Type d'appariement
RÉFÉRENCES
Nombre de comparaison [1] Roy PM, Calvel L, Dubart AE, Jabre P, Ricard-Hibon A, Thys F,
et al. Guide pratique de recherche clinique. S-Éditions; 2008.
[2] Ancelle T. Statistique épidémiologie, 3rd ed., Maloine: Collection
La facilité des analyses statistiques fréquentistes, dévelop- « sciences fondamentales »; 2007.
pées par Pearson et Fisher, a contribué à l'utilisation presque [3] Riou B, Landais P. Principes des tests d'hypothèse en statis-
exclusive de leurs méthodes dans la littérature médicale [58]. tique : alpha, bêta et P. Ann Fr Anesth Reanim 1998;17:1168–80.
Pourtant, la biostatistique fréquentiste est sujette à des criti- [4] Riffenburgh RH. Statistics in medicine, 2nd ed., Elsevier Aca-
ques importantes depuis plus de 40 ans. Selon différents demic Press; 2006.
auteurs, un consensus interpelle les différents acteurs de la [5] Greenleagh T. How to read a paper. Statistics for the non sta-
recherche prétextant que « les tests d'hypothèse nulle ne sont tisticians. I: different types of data need different statistical tests.
pas complètement stupides, mais les statistiques bayésiennes BMJ 1997;315:364–6.
sont meilleures » [51,59]. Allons-nous observer la disparition [6] Bewick V, Cheek L, Ball J. Statistics review 8: qualitative data –
des p-value et des tests d'hypothèse pour prendre en compte tests of association. Crit Care 2004;8:46–53.
de manière plus appropriée l'IC, la PS et la TE pour les futures [7] Estrade JL. Statistiques appliquées à la kinésithérapie. Les dif-
analyses statistiques ? férentes variables. Kinesither Rev 2008;78:48–52.
Cette remise en cause en faveur de la théorie de Bayes, qui [8] Couraud S. Biostatistiques avec feuilles de calcul Excel© ou
applique son raisonnement sur des probabilités événemen- équivalent. Rev Pneumol Clin 2009;65:377–85.
tielles, pourrait revoir totalement l'utilisation de la logique sta- [9] Gore SM. Assessing methods – Many variables. Br Med J
tistique fréquentiste étudiée ici. C'est d'ailleurs l'inférence 1981;283:901–5.
bayésienne qui est privilégiée lors des méta-analyses. Même [10] Gardiner A, Lee P. Pet birds and lung cancer. Br Med J 1993;6869
si l'utilisation des biostatistiques bayésiennes présente des (306):60.
limites, le prochain modèle statistique semble se créer à partir [11] Glantz SA. Primer of biostatistics, 6th ed., McGraw-Hill Medical
des théories fréquentistes et bayésiennes [60]. Publishing division; 2005.
La prépondérance des analyses statistiques au sein de la [12] Salmi LR. Lecture critique et rédaction médicale scientifique,
littérature scientifique fait de la biostatistique une discipline comment lire, rédiger et publier une étude clinique ou épidémio-
à part entière. Sa compréhension dans les études scientifi- logique. Elsevier; 1998.
ques ainsi que son autorité dans le protocole d'une étude [13] Shapiro S, Rosenberg L, Palmer LJ. Biais in case-control
clinique fait de la biostatistique un élément majeur de la forma- studies. In: Elston R, Olson J, Palmer, editors. Biostatistical
tion du thérapeute. Néanmoins, l'aide d'un biostatisticien est genetics and genetic epidemiology. Wiley; 2002.
souvent nécessaire lors de la vérification de protocole et [14] Greenland S. Confounding. In: Elston R, Olson J, Palmer, editors.
certaines analyses statistiques poussées, justifiant l'impor- Biostatistical genetics and genetic epidemiology. Wiley; 2002.
tance de la pluridisciplinarité dans le domaine de la rééduca- [15] Gore SM. Assessing clinical trials – Why randomise? Br Med J
tion/réhabilitation [1]. 1981;282:1958–60.
[16] Gore SM. Assessing clinical trials – Restricted randomisation. Br
Med J 1981;282:2114–7.
[17] Gore SM. Assessing clinical trials – Simple randomisation. Br
Med J 1981;282:2036–9.
Points à retenir [18] Dreyfuss D. Faut-il continuer à faire des études randomisées ?
Rev Mal Respir 2005;22:381–5.
 La mauvaise utilisation d'un test en rapport [19] Greenhalgh T, Taylor R. How to read a paper. Papers that go
beyond numbers (qualitative research). BMJ 1997;315:740–3.
avec la normalité de l'échantillon est l'une [20] Conceicao MJ. Critical reading of the statistical data in scientific
des erreurs les plus courantes. studies. Rev Bras Cir Cardiovasc 2008;3(23):396–9.
 Il faut se pencher sur la signification du statis- [21] Septans AL, Kwiatkowski F. Choix du bon test statistique. In:
tiquement significatif. Kramar A, Mathoulin-Pélissier S, editors. Méthodes biostatisti-
 L'analyse critique des résultats passe par la ques appliquées à la recherche clinique en cancérologie. John
recherche de relation avec la pratique. Libey Eurotext; 2011.
[22] Lang T. Twenty statistical errors even YOU can find in biomedical
research articles. Croat Med J 2004;45:361–70.

29
Dossier M. Vergnault

Bio-statistiques : la dimension collective de nos individualités

[23] Glantz SA. Biostatistics: how to detect, correct and prevent errors [42] Fuhrman C, Chouaïd C. Concordance de deux variables : les
in the medical literature. Circulation 1980;61:1–7. approches numériques. Rev Mal Respir 2004;21:123–5.
[24] Falissard D. Comprendre et utiliser les statistiques dans les [43] McGinn T, Wyer PC, Newman TB, Keitz S, Leipzig R, Guyatt G.
sciences de la vie, 3rd ed., Masson; 2005. Tips for learners of evidence-based medicine: 3. Measures of
[25] Carlin JB, Doyle LW. Statistics for clinicians. 3: basic concepts of observer variability (kappa statistic). Can Med Assoc J 2004;11
statistical reasoning: standard errors and confidence intervals. J (171):1369–73.
Paediatr Child Health 2000;36:502–5. [44] Grenier B, Dubreuil G, Journois D. Comparaison de deux
[26] Greenhalgh T. How to read a paper: the basics of evidence-based méthodes de mesure d'une même grandeur : méthode de Bland
medicine, 3rd ed., Blackwell Publishing, BMJ Books; 2006. et Altman. Ann Fr Anesth Reanim 2000;19:128–35.
[27] Aptel F, Cucherat M, Blumen-Ohana E, Denis P. Interprétation [45] Journois D. Concordance de deux variables : l'approche gra-
des essais cliniques. J Fr Ophtalmol 2011;34:755–61. phique. Rev Mal Respir 2004;21:127–30.
[28] Whithley E, Ball J. Statistics review 5: comparison of means. Crit [46] Tooth LR, Ottenbacher KJ. The K statistic in rehabilitation
Care 2002;6:424–8. research: an examination. Arch Phys Med Rehabil 2004;85:
[29] Whithley E, Ball J. Statistics review 6: nonparametric methods. 1371–6.
Crit Care 2002;6:509–13. [47] Weir JP. Quantifying test-retest reliability using the intraclass
[30] Coutant C. Introduction à l'analyse critique statistique d'un arti- correlation coefficient and the SEM. J Strength Cond Res
cle. Tribune des internes. Gynecol Obstet Fertil 2009;37: 2005;19(1):231–40.
765–8. [48] Gattuso L. L'enseignement de la statistique, où, quand,
[31] Chatelier G, Durieux P. Moyenne, médiane, et leurs indices de comment, pourquoi pas ? Stat Enseignement 2011;2(1):5–30.
dispersion : quand les utiliser et comment les présenter dans un [49] Akobeng AK. Confidence intervals and p-values in clinical deci-
article scientifique ? Rev Mal Respir 2003;20:421–4. sion-making. Acta Pædiatrica 2008;97:1004–7.
[32] Carrat F. Comparer deux groupes. Rev Med Interne 2000;21: [50] Vicente KJ, Torenvliet GL. The Earth is spherical (p < 0:05):
118–21. alternative methods of statistical inference. Theor Issues Ergon
[33] Champely S, Verdot C. Que signifie la significativité statistique ? Sci 2000;1(3):248–71.
L'apport de la taille d'effet et de la puissance statistique. Staps [51] Lecoutre B, Poitevineau J. Aller au-delà des tests de signification
2007;77:49–61. traditionnels : vers de nouvelles normes de publication. Année
[34] Laurencelle L. Inventer ou estimer la puissance statistique ? Psychol 2000;100(4):683–713.
Quelques considérations utiles pour le chercheur. Tutorials [52] Whithley E, Ball J. Statistics review 3: hypothesis testing and P
Quant Methods Psychol 2007;2(3):35–42. values. Crit Care 2002;6:222–5.
[35] Rubinstein LV. Statistical review for medical journals, guidelines [53] Maisonneuve H. Guide du thésard, 7th ed., Éditions Scientifi-
for authors. In: Redmond C, Colton T, editors. Biostatistics in ques L&C; 2010.
clinical trials. Wiley; 2001. [54] Perneger T, Perrier A. Analyses de variance (1re partie). Rev Mal
[36] Bewick V, Cheek L, Ball J. Statistics review 9: one-way analysis Respir 2004;21:797–801.
of variance. Crit Care 2004;8:130–6. [55] Durlak JA. How to select, calculate, and interpret effect sizes. J
[37] Duval X. Analyse d'un essai thérapeutique. Presse Med Pediatr Psych 2009;34(9):917–28.
2007;36:519–23. [56] Friedman L. Clinical significance versus statistical significance.
[38] Guyatt G, Jaeschke R, Heddle N, Cook D, Shannon H, Walter In: Redmond C, Colton T, editors. Biostatistics in clinical trials.
S. Basic statistics for clinicians: 1. Hypothesis testing. Can Med Wiley; 2001.
Assoc J 1995;152(1):27–32. [57] Whithley E, Ball J. Statistics review 2: samples and populations.
[39] Poinsot D. 2004. Statistiques pour statophobes. [en ligne : Crit Care 2002;6:143–8.
http://perso.univ-rennes1.fr/denis.poinsot] Consulté le 28 avril [58] Ada L. Laissez tomber le petit p. Kinesither Rev 2009;96:1.
2012. [59] Gliner JA, Leech NL, Morgan GA. Problems with null hypothesis
[40] Guyatt G, Walter S, Shannon H, Cook D, Jaeschke R, Heddle significance testing (NHST): what do the textbooks say? J Exp
N. Basic statistics for clinicians: 4. Correlation and regression. Educ 2002;71(1):83–92.
Can Med Assoc J 1995;152(4):497–504. [60] Wong AYL, Warren S, Kawchuk GN. A new statistical trend in
[41] Bewick V, Cheek L, Ball J. Statistics review 7: correlation and clinical research – Bayesian statistics. Phys Ther Rev 2010;15
regression. Crit Care 2003;7:451–9. (5):372–81.

30