Cours Théorique 1 - INTRODUCTION STATISTIQUES

1/15
Méthodologie d’Investigation et Statistique
Année scolaire 2016/2017

Bibliographie principale
Notes et feuilles d’exercices fournies par le professeur
Basic & Clinical Biostatistics, Dawson et al., fourth edition, McGrawhill, designee pour BCB4
Toujours que possible est utilisée la terminologie statistique adoptée par la Société Portugaise de la
Statistique (voir http://glossario.spestatistica.pt/).
1) Introduction à l’investigation et statistique
Référence de cette section: Chapitre 1 – “Study designs in medical research”, Basic & Clinical
Biostatistics, Dawson et al., fourth edition, McGrawhill
Un futur professionel de la santé à la responsabilité de maîtriser efficacement les outils statistiques afin
d’éviter d’une part affirmation erronées au travail et d’autre d’avoir la capacité d’analyser de maniére
critique le travail des autres. L’argument principal de cette formation est en derniére analyse la valeur
de la vie humaine, qui peut être mise en peril par omission de diagnostic ou de traitement approprié.
Avec cette formation il est prévu que les futurs professionnels ont la possibilité de:
Soutenir des équipes dans la domaine de la pratique clinique, présentant la littérature scientifique et la
sélection des meilleures procédures de diagnostic et thérapeutique et la meilleure façon de mettre en
œuvre
Rester à jour face aus résultats de l’investigation scientifique
Interpréter les problèmes épidémologiques notamment les données de prévalence de la maladie et de
sa variation en fonction de la localisation geographique, les facteurs de risque, la période de l’année, les
facteur de propagation, etc.
Interpréter les données stastistiques sur le médicaments et les équipements. L’industrie veut toujours
montrer comment leurs produits sont meilleurs face à la concurrence. C’est de la responsabilité du
professionnel éffectuer le jugement critique sur les arguments présentés. (Pour une vision três critique
voir par exemple le livre Bad Science”, de Ben Goldacre).
Déssiner des études d’investigation adéquates, répondre à des questions comme: combien de
personnes seront analysée? Seront-elles suffisantes pour extrapoler avec un grand degré de confiance
les mêmes résultats si elle serait apliquée à toute la population ? Combien de groupe d’étude seront
créés? A chacun d’entre eux sera administré le médicament ou certain d’entre eux recevront un
placebo? Etc.
Utiliser et obéir a statistical guidelines de périodique (voir anexe 1)
Être capable d’utiliser les fonctions de base du logiciel d’analyse statistique comme SPSS
“No one who reads the current medical literature, and certainly no one who performs clinical studies
these days, can be unware of the growing importance of statistics. Sound clinical research, as well as
Pág. 1/15
2/15
the ability to understand published results of research, increasingly depends on a clear comprehension
of the fundamental concepts of statistical design and analysis” (Extrait du Préface à la 1ère édition du
livre“Medical Uses of Statistics”, de 1986, disponible en 3ème édition
de 2012, John C. Bailar (editor), David C. Hoaglin (editor), Wiley)
Arnorld S. Relman, M.D.
Editor, New England Journal of Medicine
Le paragraphe suivant du chapitre 1 de BCB4 illustre la situation qui a été vécue en 1992 et que,
dans de nombreux cas, est toujours valable aujoud’hui.
“ Les problémes avec les études dans la littérature médicale ont été largement documentés et
nous suggérons que certaines des références suivante sois consultés pour plus d’information. L’un dés
plus étendu rapports sur le sujet Williamson et ses collégues (1992), qui se sont porter sur 28 articles
portant sur l’adéquation scientifique des graphique d’etude, la collecte des donnés et de méthodes
statistiques dans plus de 4200 études médicales publiées. Les études portaient sur des essais
pharmacologiques et les méthodes de diagnostic, de chirurgie, thérapeutiques, publiés dans plus de 30
revues, dont la plus part sont bien connus et prestigieux (ex.: British Medical Journal, Journal of the
American Medical Association, New England Journal of Medicine, Canadian Medical Association
Journal, and Lancet). Williamson et ses collègues ont déterminé que seulement 20% des 4235 articles
scientifique atteint les criètes proposés de validité. 8 des articles portant sur l’adéquation scientifique
les études ont recherché une relation entre la fréquence des résultats positifs et l’adéquation des
méthodes des utilisée dans l’investigacion concluant que 80% des études mal conçues trouve des
résultats positifs, tandis que les études bien conçues ont trouvé que 25% des résultats positifs(...)”.
Fonte: BCB4
Un article scientifique plus récent du même type, dans lequel il fait une méta-analyse d’articles
publiés, Müllner et al (2002) soulignent que dans de nombreux cas aucun contrôle sur les variables qui
peuvent affecter le résultat. De plus, on évidencie, deux affirmations intéressantes:
In 64 of the 169 articles (38%), at least one author was a methodologist (that is, he or she was
affiliated with a department of statistics, epidemiology, or public health). Among papers with a
methodologist-author, the rate of any inappropriate reporting was about half that of papers without a
methodologist-author
Why articles published in journals with a very high impact factor have a lower rate of
inappropriate reporting remains a matter of speculation. It may relate to the fact that these journals
more frequently use statistical reviewers than do lower-ranking journals.
Source: Reporting on Statistical Methods To Adjust for Confounding: A Cross-Sectional
Survey, Marcus Müllner, MD; Hugh Matthews, BSc, MBBS; and Douglas G. Altman, Dsc, Ann Intern
Med. 2002;136:122-126.
Exemples pharmaceutical sciences - l’étude VIGOR et la statistique (Vioxx Gastrointestinal
Outcomes Research)
Références:
Pág. 2/15
3/15
● Comparison of upper gastrointestinal toxicity of rofecoxib and naproxen in patients with
rheumatoid arthritis, Bombardier et al, NEJM, 2000;
● Expression of Concern: Bombardier et al. Comparison of Upper Gastrointestinal Toxicity of
Rofecoxib and Naproxen in Patients with Rheumatoid Arthritis, Gregory D. Curfman et al,
NEJM, 2005
● Response to Expression of Concern Regarding VIGOR Study, Bombardier et al. / Alise Reicin
et al, NEJM, 2006
● Expression of Concern Reaffirmed, Gregory D. Curfman et al, NEJM, 2006
● http://en.wikipedia.org/wiki/Rofecoxib
Avec cette courte introduction, nous espérons avoir démontré la nécessité d’une solide
connaissance de la statistique en medicine dentaire. Voyons donc d’abor les types les plus communs
d’études dans la littérature pour tester des hypothéses scientifiques.
Pág. 3/15
4/15
2 – Résumer et présentes des données dans des tableaux et graphiques
Référence de cette section: Chapitre 2 - “Summarizing data & presenting data in tables & graphs”,
Basic & Clinical Biostatistics, Dawson et al., fourth edition, McGrawHill
2.1) Les Variables
L’évaluation du type de variable aura une influence sur le type d’analyse statistique à réaliser et donc
l’importance de la distinction.
Les variables qualitatives
Nominales – les variables nominales sont utilisées pour d’écrire des observations qualitatives ou
catégorielles. Les variables nominales n’ont pas d’ordres et s’excluent mutuellement. En cas de
données, elles peuvent être placées dans deux catégories seulement, on les appelle binaire.
Exemples: profession, lieu de résidence, le sexe, état civil, mort/vivant, malade/non-malade
Observation Profession Sexe
1 Professeur Masculin
2 Électricien Feminin
… … ...
Ordinales – quand les catégories peuvent êtres ordonné, nous sommes confrontés à des variables
ordinales. Malgré que l’ordre existe dans les catégories d’échelles ordinales, la différence entre les
catégories adjacentes peut ne pas avoir toujours le même sens tout au long de l’échelle. Les Variables
ordinales sont utilisée par exemple dans la classification de l’état de l’evolution de tumeurs ou d’autres
maladies, ou dans l’attribution d’ une note pour certaines catégories de l’autonomie fonctionnelle, ou de
la qualité de vie d’un patient, ou du niveau de coma.
Exemples: le niveau de développment du cancer du sein – I,II,III, IV, échelle d’ Apgar (l’évaluation de
l’êtat de santé d’un nouveau-né).
Observation Stade du cancer
1 I
2 III
3 II
4 I
5 IV
6 IIA
Pág. 4/15
5/15
Les données qualitatives sont généralement décrites en terme de pourcentages ou de rapports, sont
presentés par exemple sous forme de tableaux ou des graphiques à barres.
Les variables quantitatives

Les variables quantitatives peuvent être divisées en variables discrètes et continues.
Discret – les variables discrètes ne peuvent seulement que prendre un certain ensemble de valeurs, par
exemple, le nombre de frères et soeurs d’un certain patient, le nombre naissances par jour dans une
maternité, le nombre de traitements que le patient reçoit, etc. Se sont des exemples de variables
discrètes.
Continue –les variables telles que la taille, le poids, obtenu atravers des instruments de laboratoire, etc.
sont des variables continues et souvent utilisés comme tels. L’âge d’un adulte, par exemple, en dépit
d’être une variable et parfois approché à l’entier le plus proche traduisant l’ âge en années (variable
discrète). Dejá l’âge d’un nouveau-né est souvent approchée les mois.
D’autres exemples de variables continues: l’indice de masse corporelle, la pulsation, la pression
sanguine, la concentracion de leucocytes.
Les variables quantitatives en termes graphiques sont généralement représentés par des histogrammes,
diagramme à boite de moustaches, graphiques de dispersion. Souvent, les données quantitatives sont
résumées par la moyenne et l’écart-type.
2.2) Résumer les données

Note: dans les articles scientifiques définez toujours les variables statistiques et les symboles:
“Although many statistical terms such as mean, median, and standard deviation of the observations
have clear, widely adopted definitions, different fields of endeavor often use the same symbols for
different entities. Authors have extra difficulty when they need to distinguish between the true value of
a quantity (a parameter such as a population mean, often symbolized by the Greek letter µ) and a
sample mean (often written as x̄ ” (voir les références mentionné à l’annexe 1).
2.2.1. Mesures de tendance central (revision rapide)

Rappelez-vous ensuite les mesures de tendance central plus fréquentes.
Moyenne – la moyenne arithmétique est des mesures les plus fréquentes pour sommer des données
numériques. Elle est definie comme, X̄= ∑ X ou f(i).x(i)
n
par exemple. X̄= ∑ X = 0.52+ 0.48+0.79 +0.56+ .. .+0.54 =0.64

n 17
La moyenne est sensible aux valeurs extremes dans un ensemble d’observations en particulier lorsque
la taille de l’échantillion est petit.
Pág. 5/15
6/15
Médiane – la médiane est définie comme le point d’observation central à laquelle la moitie des
observations sont en dessous de ce niveau et l’autre moitié au-dessus de cette valeur. La médiane est
moins sensible aux valeurs extremes. En données ordinales, on utilize la médiane plutôt que la
moyenne.
5 7 8 9 10 12 15 → la médiane est 9
5 7 8 9 11 15 → la médiane est 8.5
Vous devez utiliser la moyenne ou la médiane?
Considérons deux groupes de 7 personnes suivantes différents régimes.
Le 1er groupe a perdu en moyenne 15.0 Kg.
Le 2eme groupe a perdu en moyenne 10.9 Kg.
Recommanderiez-vous immédiatement que le regime du primiér groupe est le plus éfficace? Si
vous connaisez les observations:
Groupe 1: 12, 13, 9, 8, 7, 6, 50 (masse en Kg)
Groupe 2: 9, 11, 12, 11, 11, 12, 10 (masse en Kg)
Analysant la médiane imaginez qu’on obtient les valeurs:
1er groupe, 9 Kg
2eme groupe, 11 Kg.
Pour ce type de données, il est préférable d’utiliser la médiane.
Mode – la mode est la valeur qui apparait avec plus de fréquence. Si la même valeur ne se produit pas
deux ou plus de fois alors il n’y a pas de mode. Si un ensemble de données dispose de deux modes, on
dit bimodal. Parfois sont établies des classe de valeurs. La classe avec le plus grand nombre de coups
Dans le cours théorique 1 sur le exercice sur la mode, la mode est le 7 parce qu'il apparaît 3 fois et 10 apparaît deux fois. Il peut y avoir des
est dit classe modale. exercices où deux numéros sont répétés le même nombre de fois, puis nous avons une distribution bimodale (deux modes). Par exemple 2, 3,
4 5, 5, 5, 8, 8, 8, 9, 10, 12
la mode est le 5 et le 8.
Exemple: On parle de classe modale lorsque nous travaillons avec des données groupées en classes. Par exemple, pour vérifier l'occurrence de caries
dentaires dans les groupes de 10 à 20 d'âge, 20-30, 30-40, etc.
4, 5, 6, 7, 7 ,7, 8, 9, 10, 10: la mode est 7
Dans les cours de résolution d’exercices seront présentés quelques caractéristiques du calcul de
quantités précédentes, par exemple pour des données regroupées par cours.
2.2.2) Mesures de dispersion

Les mesures de tendance central ne suffisent pas pour résumer un échantillon de sorte à l’interpréter
d’une manière convenable. Nous aurons une meilleure idée de la distribution si nous calculons
comment les diferentes valeurs trouvées sont réparties autour des valeurs centrales.
L’écart-type (standard deviation)– l’écart type (généralement représenté par S ou SD) est
calculé comme:
Pág. 6/15
7/15
s=S D=
√ ∑ ( X− X̄ )2
n−1
A noter qu’on n’utilize pas simplement la somme des écarts par rapport à la valeur moyenne,
car elle se traduirait par un total de zero, à savoir,
Observations: 1 2 6 12
Moyenne: 5.25
∑ ( X − X̄ )=( 1−5.25)+( 2−5.25)+( 6−5.25 )+( 12−5.25)=0

Aussi, on n’utilize pas la somme de la valeur pour chaque écart par rapport à la valeur
moyenne, car il n’y a pas de propriétés statistiques importantes. Donc, on somme les écarts élevés au
carré et à la fin de la division par n-1 on calcule la racine carrée. La division par n-1 permet estimer
mieux le véritable écart type de la population (c'est à dire, si les observations n’étaient pas faites dans
un échantillon, mais dans l’ensemble de la population) que la simple division par n. La valeur s² on
l’appelle variance.
Pour ilustrer certains des concepts présentés dans cette section, nous allons utiliser des données
fictives sur la base de l’étude de réferénce: “Criteria for the Safe Use of D-Dimer Testing in Emergency
Department Patients With Suspected Pulmonary Embolism: A Multicenter US Study”, Kline et al,
Annals of Emergency Medicine 39:2 February 2002, où s’enregistrent des valeurs du rythme cardiaque
et la pression artérielle systolique dans les groupes avec et sans emboilie pulmonaire. Le shock_index
est défini comme (Heart rate / Systolic blood pressure). Dans le site web du cours, vous retrouverez des
données fictives au sujet de cette étude dans le format, XLS et CSV.
Exemple 1: Calculer l’écart type dans SPSS

Démarrer SPSS.
Importez le fichier shockindex_withoutpe.xls
Analyze → Descriptive Statistics → Descriptive. Em “Options” ativar Std. Deviation
Coefficient de variation – le coefficient de variation est défini comme C V = S D (100 %) .

X̄
Le coefficient de variation n’est pas plus qu’ un écart par rapport à la moyenne. Il ne serait pas
logique de comparer, par exemple, l’écart type du rytme cardiaque avec l’écart type de la pression
artérielle systolique, car ils sont mesurés sur des échelles très différentes. Cependant, on pourrait
comparer les coefficients de variation.
Par exemple, supposons que pour le groupe sans l’embolie pulmonaire la moyenne et l’écart
type du shock index étaient: 0.70 e 0.28, respectivement et pour la pression systolique étaient 145 et 33.
Alor le CV de shock index venait (0.28/0.70)×100%=40.0% et la pression systolique venait
(33/145)×100%=22.7%. La variation relative dans le shock índex est supérieure à la pression
Pág. 7/15
8/15
systolique.
Percentiles –un percentile est le pourcentage de la distribution qui est égal ou inferieur à un certain
nombre, en particulier. Par exemple, dans les habituelles courves de croissances dans les bulletins
attribués aux enfants.
Si un enfant de 18 mois a un poids d’environ de 9.2 Kg alors il se situe alors précisément au percentile
5% (point rouge). Si un enfant de 18 mois a un poids d’environ de 13.2 Kg , il se situe alors
précisément au percentile 95% (point bleu). L’interprétation de ces deux percentiles en particulier est la
suivante: l’échantillon utilisé pour construire les graphiques, des enfants de 18 mois 5% ont un poids
Pág. 8/15
9/15
inférieur à 9.2 Kg, et 95% ont un poids inférieur à 13.2 Kg. Ref: règles circulaires Nº: 05/DSMIA ,
DATA: 21/02/06 de la Direction-Générale de la Santé.
Le percentile 25% se dénomine habituellement de 1 er quartile, et le percentile 75% généralement de 3º
quartile. La médiane correspond au percentile 50%.
Exemple: calcul de percentiles et quartiles de la pression artérielle au SPSS

Démarrer SPSS.
Importer le fichier shockindex_withoutpe.xls
Analyze → Descriptive Statistics → Frequencies. Em “Statistics” ativer Quartiles/Cut points 10
(par exemple) equal groups.
Intervalle interquartile – l’intervalle entre le premier et le troisième quartile (percentile 25%,

75%), que contient 50% des observations. Limite inférieur = Q1 - (1,5.IQR)
Limite supérieur = Q3 + (1,5.IQR)
Observation:
Les mesures de tendance centrale telle que la moyenne ou l’écart-type en population sont
désignés paramètres, fixe et invariable. Dans les échantillons, cependant, la moyenne observée et
l’écart type calculés à partir de l’échantillon sont des estimations de ces paramètre: les estimations sont
désignées par les statistiques. Les paramètres sont généralement désignés par des lettres grecques alors
que les statistiques sont généralement écrites avec des lettres romaines.
Parâmetre Statistique
Moyenne μ X̄
Écart-type σ S D(ou)s
2 2
Variance σ s
Corrélation ρ r
Proportion π p
2.3) Présentation des données dans des tableaux et des graphiques

Tableaux de fréquence
La fréquence absolue est le nombre de fois où une observation donnée se produit dans une
certaine donnée de valeurs. La fréquence relative représente nombre de fois où se produit une certaine
observation par rapport au nombre total d’observations. La fréquence relative cumulée est la somme
des fréquences relatives précédente.
Pág. 9/15
10/15
Exemple: En utilisant les mêmes données de la section précédente et en transformant le shock index par
une échelle ordinale de 0.2 en 0-2 ( généralement on utilise toutes les informations disponibles sur la
variable, ne réduisant pas les informations sur la même comme ça arrive en efectuant cette
transformation), nous pouvons rapidement obtenir les fréquences suivantes. Par exemple, dans la classe
0-4 à 0-6 la fréquence relative est calculée comme 7/30.
Classes Fréquence Fréquenc Fréquence

absolue e relative relative
de shock index
%
cumulée
0,20 à 0,39 4 13,3 13,3
0,40 à 0,59 7 23,3 36,7
0,60 à 0,79 11 36,7 73,3
0,80 à 0,99 5 16,7 90,0
1,00 à 1,19 0 0 90,0
1,20 à 1,39 2 6,7 96,7
1,40 à 1,59 1 3,3 100,0
Total 30 100,0
Histogrammes et polygones de fréquence

Un histogramme présente une mesure d’intérêt le long de l’axe des X et un nombre ou pourcentage
d’observation le long de l’axe Y. La taille de chaque “bin” doit être choisi de telle sorte que vous puvez
visionner la forme de la distribution de données, mais ne devrait pás être trop petit pour ne pas
visualiser les flutuations constantes dans la distribuition. Les pourcentages sont souvent utilisés lorsque
l’on veut comparer deux histogrammes avec un nombre total de sujets observés différents.
Pág. 10/15
11/15
Exemples
La comparaison des histogrammes sur la même graphique pour groupes n’est pas toujours facile. Si on
représente des polygones de frequénce, reliant par une ligne les valeurs centrales de chaque colonne de
l’histogramme, il sera plus facile de faire cette comparaison. Si le nombre de sujets en deux groupes est
différent, il est nécessaire d'ajuster les fréquences par pourcentages, afin que ce soit possible de les
comparer.
Pág. 11/15
12/15
Note: les cercles sont tracés dans les centres des bins de l'histogramme de la page précédente
Diagramme boîte-moustaches Box-Plot

Un diagramme de boîte-moustaches permet d’illustrer des emplacements spéciaux dans les
distributions en particulier et pour une certaine catégorie: la valeur minimale observée (moustache de
bas), le premier quartile, la médiane, le troisième quartile, la valeur maximalela observée (moustache
de haut). Donne aussi une perception générale sur la façon dont les valeurs sont distribuées.
Parfois, certaines personnes préfèrent dessiner les moustaches à l'aide d'autres méthodes, par exemple:
Si le 3ème quartile (3º Q) plus 1.5 multiplié par l'intervalle interquartile (IQR) est inférieure à
la maximale, alors nous utilisons le plus grand point égal ou inférieur au 3º Q + 1.5 IQR pour
la moustache de haut sachant que les points au-dessus de cette valeur sont représentés comme
(outliers).
Si le 1er quartile (1º Q) moins 1,5 multiplié par le IQR est supérieur à la valeur minimale, on
utilise le plus petit point supérieure ou égal à 1ºQ-1.5 IQR, au lieu du minimum, sachant que
les points au-dessous de cette valeur sont représentés comme (outliers).
Pour le groupe avec l'embolie pulmonaire est connu que:

mean sd IQR 0% 25% 50% 75% 100% n
0.8753333 0.3171613 0.3575 0.38 0.685 0.85 1.0425 1.51 30
La valeur minimale est: 0.38

La valeur maximale est: 1.51
Comme ça:
Le 1er quartile moins 1.5IQR é: 0.685-1.5*0.3575 =0.122 est inférieure à la valeur minimale
Pág. 12/15
13/15
Le 3ème quartile plus 1.5IQR é: 1.0425+1.5*0.3575=1.58 Ce qui est supérieur à la valeur maximale
Pour le groupe sans l'embolie pulmonaire, ont sait que :
mean sd IQR 0% 25% 50% 75% 100% n
0.698 0.2837362 0.295 0.32 0.515 0.645 0.81 1.42 30
La valeur minimale est: 0.33
La valeur maximale est: 1.42
Ainsi,
Le 1er quartile moins 1.5IQR est: 0.515-1.5*0.2950 =0.0725 est inférieure à la valeur minimale
Le 3ème quartile plus 1.5IQR est: 0.81+1.5*0.295=1.25 inférieure à la valeur maximale et donc la
moustache de haut devrait être au maximum 1.25 et les points restants sont représentés comme outliers.
Le point le plus proche de 1.25, si vous regardez toutes les données est 0.97, et il sera la qui finit le
moustache de haut.
Les graphiques vient donc,
Sans l'embolie
Avec l'embolie pulmonaire
pulmonaire
Pág. 13/15
14/15
ANEXE 1
Presque tous les périodiques dans le domaine de la santé ont des directives statistiques 8statistical
guidelines) qui doivent être suivies pour l'enquête soit publié. A titre d'exemple, voir la statistical
guidelines do New England Medical Journal:
“The basis for these guidelines is described in Bailar JC III, Mosteller F. Guidelines for statistical
reporting in articles for medical journals: amplifications and explanations. Ann Intern Med
1988;108:266-73.
· Exact methods should be used as extensively as possible in the analysis of categorical data.
For analysis of measurements, nonparametric methods should be used to compare groups when
the distribution of the dependent variable is not normal.
· Results should be presented with only as much precision as is of scientific value. For
example, measures of association, such as odds ratios, should ordinarily be reported to two
significant digits.
· Measures of uncertainty, such as confidence intervals, should be used consistently,
including in figures that present aggregated results.
· Except when one-sided tests are required by study design, such as in noninferiority trials,
all reported P values should be two-sided. In general, P values larger than 0.01 should be
reported to two decimal places, those between 0.01 and 0.001 to three decimal places; P values
smaller than 0.001 should be reported as P<0.001. Notable exceptions to this policy include P
values arising in the application of stopping rules to the analysis of clinical trials and genetic-
screening studies.
· For tables comparing treatment or exposure groups in a randomized trial (usually the first
table in the trial report), significant differences between or among groups should be indicated
by * for P < 0.05, ** for P < 0.01, and *** for P < 0.001with an explanation in the footnote if
required. The body of the table should not include a column of P values.
· In manuscripts that report on randomized clinical trials, authors may provide a flow diagram
in CONSORT format and all of the information required by the CONSORT checklist. When
restrictions on length prevent the inclusion of some of this information in the manuscript, it may
be provided in a separate document submitted with the manuscript. The CONSORT statement,
checklist, and flow diagram are available on the CONSORT website. “Nota: consulte o sítio
web do CONSORT e veja alguns dos exemplos disponíveis no endereço http://www.consort-
statement.org/consort-library/.
Fonte: http://www.nejm.org/page/author-center/manuscript-submission
Il est fait référence à un article de John Bailar. Dans cet article “Guidelines for Statistical
Reporting in Articles for Medical Journals, Amplifications and Explanations”, John C. Bailar et al,
Annals of Internal Medicine, 15 February 1988. 108:266-273” les auteurs proposent que la science
articles sont élaborées en tenant en compte un certain nombre de recommandations du point de vue des
statistiques et qui peut se résumer en 15 points (voir l'article pour plus de détails).
1. Describe statistical methods with enough detail to enable a knowledgeable reader with access to
the original data to verify the reported results.
2.When possible, quantify findings and present them with appropriate indicators of measurement
error or uncertainty (such as confidence intervals).
3. Avoid sole reliance on statistical hypothesis testing, such as the use of P values, which fails to
convey important quantitative information.
Pág. 14/15
15/15
4. Discuss eligibility of experimental subjects
5. Give details about randomization
6. Describe the methods for, and success of, any blinding of observations.
7. Report treatment complications.
8. Give numbers of observations.
9. Report losses to observation (such as dropouts from a clinical trial).
10.References for study design and statistical methods should be to standard works (with pages
stated) when possible rather than to papers where designs or methods were originally reported.
11.Specify any general-use computer programs used
12.Put general descriptions of statistical methods in the Methods section. When data are
summarized in the Results section, specify the statistical methods used to analyze them.
13.Restrict tables and figures to those needed to explain the argument of the paper and to assess its
support. Use graphs as an alternative to tables with many entries; do not duplicate data in graphs
and tables.
14.Avoid non-technical uses of technical terms in statistics, such as "random" (which implies a
randomizing device), "normal," "significant," "correlation," and "ample."
15.Define statistical terms, abbreviations, and most symbols.
Autres lectures recommandées:

“How to read a paper: the basics of evidence-based Medicine”, Trisha Greenhalg, BMJ Books;
3 edition (January 26, 2006), ISBN-13: 978-1405139762
Pág. 15/15

Cours Théorique 1 - INTRODUCTION STATISTIQUES

Transféré par

Informations du document

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

Cours Théorique 1 - INTRODUCTION STATISTIQUES

Transféré par

Droits d'auteur :

Formats disponibles

1/15

Méthodologie d’Investigation et Statistique

Année scolaire 2016/2017

Les variables quantitatives

2.2) Résumer les données

2.2.1. Mesures de tendance central (revision rapide)

par exemple. X̄= ∑ X = 0.52+ 0.48+0.79 +0.56+ .. .+0.54 =0.64

2.2.2) Mesures de dispersion

∑ ( X − X̄ )=( 1−5.25)+( 2−5.25)+( 6−5.25 )+( 12−5.25)=0

Exemple 1: Calculer l’écart type dans SPSS

Coefficient de variation – le coefficient de variation est défini comme C V = S D (100 %) .

Exemple: calcul de percentiles et quartiles de la pression artérielle au SPSS

Intervalle interquartile – l’intervalle entre le premier et le troisième quartile (percentile 25%,

2.3) Présentation des données dans des tableaux et des graphiques

Classes Fréquence Fréquenc Fréquence

0,20 à 0,39 4 13,3 13,3

0,40 à 0,59 7 23,3 36,7

0,60 à 0,79 11 36,7 73,3

0,80 à 0,99 5 16,7 90,0

1,00 à 1,19 0 0 90,0

1,20 à 1,39 2 6,7 96,7

1,40 à 1,59 1 3,3 100,0

Histogrammes et polygones de fréquence

Diagramme boîte-moustaches Box-Plot

Pour le groupe avec l'embolie pulmonaire est connu que:

La valeur minimale est: 0.38

Autres lectures recommandées:

Vous aimerez peut-être aussi