Académique Documents
Professionnel Documents
Culture Documents
ENSEIGNEMENT PRATIQUE
S. Couraud a,∗,b
a
Service de pneumologie, centre hospitalier Lyon-Sud,
165, chemin du Grand-Revoyet, 69495 Pierre-Bénite cedex, France
b
Université Claude Bernard Lyon 1, France
MOTS CLÉS Résumé Pour de nombreux praticiens et notamment pour les plus jeunes, les analyses bio-
Biostatistiques ; statistiques sont difficiles et hermétiques. Il existe pourtant un logiciel familier permettant
Excel© ; de réaliser la plupart des calculs statistiques nécessaires en pratique courante : les feuilles de
Méthodologie ; calculs Excel© et équivalents. Cet article propose de guider le lecteur pas à pas dans le pro-
Épidémiologie ; gramme pour l’aider à réaliser ses calculs. Bien que ces conseils ne dispensent en aucun cas
Recherche clinique d’un avis spécialisé, ils permettront aux lecteurs de se familiariser avec des notions de bases
de statistiques.
© 2009 Elsevier Masson SAS. Tous droits réservés.
KEYWORDS Summary Many practitioners, especially young ones, find biostatistical analysis fastidious.
Statistics; However, there is a very usual tool for most basic calculations: Excel© and similar software.
Excel software© ; This article proposes to help the reader, step by step, carry out many statistical functions.
Methodology; Although this paper does not avoid the advice of a specialist, it lets the reader become familiar
Epidemiology; with the rules of basic statistics and calculus.
Clinical trials © 2009 Elsevier Masson SAS. All rights reserved.
Introduction
Que ce soit pour la rédaction d’une thèse, d’un article scientifique ou encore pour les
données d’activités, les statistiques sont inévitables en médecine. Pour beaucoup, cette
matière apparaît souvent hermétique et difficile. Il est donc fréquent de voir des praticiens
∗ Auteur correspondant.
Adresse e-mail : sebastien.couraud@chu-lyon.fr.
0761-8417/$ — see front matter © 2009 Elsevier Masson SAS. Tous droits réservés.
doi:10.1016/j.pneumo.2009.08.007
378 S. Couraud
Moyenne et de la médiane
La moyenne correspond à la somme des valeurs de la
variable observée divisée par le nombre de valeur. Il ne
faut pas la confondre avec la médiane qui correspond à la
valeur pour laquelle la moitié des valeurs observées sont
plus grandes et la moitié plus petite.
1
n
Figure 6. Copie d’écran des tableaux de contingences obtenus :
Moyenne = x̄ = xi
effectifs observés en haut et effectifs espérés (calculés) en bas. n
(i=1)
x̃ = x((n+1)/2)
Pour la médiane, la procédure est strictement identique. série. Il est comprend 25 % des valeurs de part et d’autres
Il est simplement nécessaire de sélectionner la fonction de la médiane. Il est bien mis en valeur dans le diagramme
« MEDIANE » dans la liste de choix du menu « insérer une « en boîte ».
fonction ». Attention, également à sélectionner uniquement
la série, sans y intégrer la moyenne précédemment calcu- Le diagramme en boîte
lée !
Il est possible d’obtenir une représentation graphique de
Paramètres de dispersion par rapport à la distribution de la série à l’aide des valeurs calculées ci-
dessus. Il s’agit du diagramme dit box-plot ou « en boîte ».
la médiane : valeur maximale, minimale
Malheureusement, le logiciel ne peut y intégrer la médiane
et quartiles qui y figure habituellement. Pour créer ce diagramme, la
procédure est la suivante :
Valeur maximale, valeur minimale et quartiles sont des • créer un tableau comme représenté ci-dessus (attention :
paramètres qui, associés à la médiane, peuvent aider à
les lignes doivent être exactement dans le même ordre) ;
rendre compte de la distribution d’une série. Si ces deux • cliquer sur « Insertion » puis sur « insérer un tableau » ;
premiers paramètres sont aisément compréhensibles, les • il faut alors choisir dans la catégorie des graphiques
quartiles sont en général moins connus. Le premier quar-
intitulés « stocks », le modèle « ouverture-max-min-
tile correspond à la valeur pour laquelle un quart (25 %)
fermeture » ; puis cliquer sur suivant ;
des valeurs observées sont plus petites et trois quarts (75 %) • sélectionner ensuite les valeurs à entrer en cliquant sur
plus grandes. Le troisième quartile correspond à l’inverse :
le bouton situé à droite du champ « sélectionner les
75 % des valeurs observées sont plus petites et 25 % plus
données » ; il faut alors choisir les valeurs du premier
grandes. Pour mémoire, le deuxième quartile correspond. . .
quartile, maximales, minimales et du troisième quartile,
à la médiane. . .
dans cet ordre, en une fois, grâce à la souris (cliquer-
Sur Excel© , il est donc possible de mettre en évidence les
glisser). Cliquer à nouveau sur le bouton à droite du champ
valeurs maximales et minimales d’une série. La procédure
pour intégrer les données. Sélectionner ensuite le bouton
est la même que précédemment pour la moyenne. Il suffit
« ligne » en dessous des données sélectionnées (le bouton
de choisir les fonctions « MAX » et « MIN »de la liste.
« colonne » est coché par défaut).
Il est également possible de calculer les quartiles de la
série. Il faut alors suivre la procédure ci-dessus en sélec- NB : dans l’onglet « séries », il est possible d’intégrer les
tionnant la fonction « QUARTILE ». Après avoir entré les noms des catégories : en bas du formulaire, il existe un
coordonnées de la série étudiée (la colonne des âges des champ « étiquettes de catégories X ». Cliquer sur le bouton
non-fumeurs, par exemple, en excluant les éventuelles situé à droite et sélectionner les noms des catégories dans
cellules à la suite dans lesquelles auraient été calculées les cellules correspondantes (non-fumeurs et fumeurs).
la moyenne, la médiane. . .), il est nécessaire de rentrer • cliquer sur « suivant » pour insérer le titre du tableau et
une information complémentaire dans le champ intitulé des axes ;
« quart ». Cette valeur est une commande pour le logiciel • cliquer sur « terminer ».
(elle ne correspond à rien de particulier) :
NB : La légende des séries apparaissant sur le côté droit
• « 0 » permet de calculer la valeur minimale de la série
du graphique n’a pas de réalité. Il est possible de la suppri-
(déjà calculée précédemment) ;
mer par un clic droit puis « supprimer ».
• « 1 » permet de calculer le premier quartile (Q25 ) ;
On obtient ainsi la Fig. 6. Pour ajouter les valeurs, cli-
• « 2 » permet de calculer la médiane ;
quer droit sur le graphique puis sur « options du graphique ».
• « 3 » permet de calculer le troisième quartile (Q75 ) ;
Dans l’onglet « étiquettes de données », cliquer sur le bouton
• « 4 » permet de calculer la valeur maximale.
« valeur » puis « OK ».
En entrant la commande « 2 » dans le champ « quart »
on obtient donc la valeur du premier quartile. En répé- Paramètre de dispersion par rapport à
tant la procédure ci-dessus (en entrant « 3 » dans le la moyenne : variance et écart-type
champ « quart ») on obtient la valeur du troisième quartile
(Tableau 3). L’écart-type (ou déviation standard issue de l’anglais stan-
Bien qu’habituellement peu utilisé, l’intervalle inter- dard deviation) est une variable de dispersion autour de la
quartile est un paramètre exprimant la dispersion d’une moyenne d’une série très utilisée en statistique. Ce para-
mètre correspond à la racine carrée de la variance d’une
série. La variance est un paramètre peu utilisé (mais néan-
Tableau 3 Résultats pour les quartiles. moins utile. . .) qui correspond à la moyenne de la « somme
du carré des écarts par rapport à la moyenne ». En d’autres
Non-fumeur Fumeur termes, pour chaque valeur observée, on calcule son écart
Moyenne 43,1 50,3 par rapport à la moyenne de la série. La somme de tous ces
Médiane 37,5 56,5 écarts, élevé au carré puis divisé par le nombre de valeurs
Troisième quartile 59,5 61,0 observées, correspond à la variance. La définition de ce
Valeur maximale 75,0 85,0 paramètre reflète bien qu’il s’agit d’un paramètre de dis-
Valeur minimale 18,0 18,0 persion par rapport à la moyenne. Néanmoins, la variance ne
Premier quartile 32,5 35,3 s’exprime pas dans l’unité de mesure de la valeur observée
mais dans son carré (âge2 dans notre série. . .). C’est l’une
384 S. Couraud
n
2
Variation = SCE = (xi − x̄)
(i=1)
Variance = s2 = SCE/n
√ √
Écart- type = s = s2 = variance