Vous êtes sur la page 1sur 29

Utilisation du logiciel Excel

pour des analyses simples


de bases donnes

Catherine Raux (interne Sant Publique)


et Benot Lepage (AHU), Service dEpidmiologie du CHU de Toulouse

Version 1.1 Avril 2012

I) Saisir des donnes dans un tableau Excel


1) Les variables sont toujours saisies en colonnes

Ecrire le nom des variables sur la premire ligne


Toujours prvoir une premire colonne avec un identifiant unique pour chaque patient
(ou chaque mdecin si le recueil concerne des donnes par mdecin). Par exemple, il
peut sagir dun numro ou dun code pour chaque patient. Ce numro ou ce code ne
devra pas apparatre deux fois dans la colonne.
Une variable par colonne
o Attention, pour une question choix multiple, par exemple :
Antcdents : cardiologiques
pneumologiques
neurologiques
Il faut compter 3 variables (une pour chaque antcdent oui/non) plutt quune
seule variable
Eviter les regroupements de cellules
Donner un nom chaque colonne (pas de cellule vide dans cette premire ligne de la
base de donnes)

2) Entrer ensuite les donnes pour chaque variable

ASTUCE 1 certaines oprations peuvent sautomatiser. Par exemple pour crire une suite de
chiffres 1, 2, 3, 4, etc pour le numro didentification des patients :
1

Commencer par entrer les premiers numros : 1, 2, 3.


Slectionner les chiffres dj inscrits (clic gauche grosse croix blanche)

Positionner la souris sur le petit carr noir en bas droite de la slection ; la souris devient
une petite croix noire.
Clic gauche
Puis tirer vers le bas en maintenant clic gauche

Lcher le clic gauche : Excel a complt la suite logique automatiquement

Pour entrer les autres variables :

Pour les variables quantitatives (un chiffre comme lge par exemple), ninscrire que la valeur
chiffre sans commentaire. Si vous souhaitez ajouter des commentaires, le faire dans une
autre colonne cot. Les commentaires ne peuvent tre exploits pour faire des calculs de
moyenne ou deffectifs.
Pour les variables qualitatives (avec des catgories comme le sexe, le traitement ou les
antcdents) :
o Il est possible dinscrire la rponse en toute lettre (homme / femme) ou par un code
(par exemple H / F ou 1 / 2)
o Toujours utiliser le mme code ou le mme mot pour une mme catgorie (en
respectant les espaces, les majuscules et minuscules). Par exemple AVC et
accident vasculaire crbral seront considrs comme deux catgories distinctes

II) Exploiter les donnes dans un tableau Excel


Exemple de base de donnes

Description dune variable quantitative comme lge


Pour dcrire la distribution de lge, classiquement on indique lge moyen (paramtre de position)
et lcart type de lge (paramtre de dispersion).
En cas de distribution asymtrique, on peut utiliser galement la mdiane de lge (position) et
lintervalle interquartile [1er quartile ; 3me quartile] (dispersion). Il est galement possible de dtailler
les valeurs extrmes (minimum et maximum).

Description dune variable qualitative (en classes) comme le traitement


Pour dcrire la variable traitement, on indiquera leffectif et le pourcentage dans chacune des
classes.

Tous ces indicateurs sont faciles obtenir dans Excel

1) Calcul dune moyenne


On va ici calculer la moyenne dge de notre chantillon.
-

Slectionner une cellule en bas de la colonne age

En haut droite de la page Accueil dExcel se situent les commandes pour les
diffrentes fonctions mathmatiques.
Slectionner Autres fonctions

La fentre suivante apparat :

Slectionner MOYENNE et cliquer sur OK

La fentre suivante apparat :

Slectionner les cellules concernes par le calcul de la moyenne.

NB : Pour plus de visibilit du tableau Excel, on peut rduire la fentre Arguments de la


fonction en cliquant sur le bouton ci-contre

Appuyer sur entre : la moyenne dge apparat dans la case slectionne initialement

On peut ajouter ou enlever des dcimales au moyen de la fonction suivante : (ASTUCE 2)


(les formats daffichage dune cellule sont galement disponibles par lintermdiaire du clic
droit > format de cellule)

2) Calcul dun cart type


-

Mmes principe que pour la moyenne mais en slectionnant la fonction ECARTYPE pour
estimer lcart type partir de donnes issues dun chantillon de la population.
(viter la fonction ECARTYPEP, qui calcule lcart type dans le cas dune population
exhaustive plutt que dun chantillon, sauf bien sur si vous disposez dune population
exhaustive)

3) Calcul dune mdiane


-

Mmes fonctions en slectionnant MEDIANE

NB : par dfaut, Excel ouvre la catgorie des dernires fonctions utilises. Pour avoir accs toutes
les fonctions, slectionner Tous ou le chapitre Statistiques pour les fonctions statistiques

10

4) Calcul des quartiles


-

Mme principe en slectionnant la fonction QUARTILE

Aprs avoir slectionn les cellules, dfinir le quartile devant tre calcul (1 pour le premier
quartile ou 3 pour le 3me quartile ; note= le 2me quartile correspond la mdiane)

5) Recherche de la valeur minimale et de la valeur maximale


-

Mme principe en slectionnant les fonctions MIN ou MAX

11

6) Calculs des effectifs par classe pour une variable qualitative (par
exemple le sexe)
Exemple : On veut connatre le nombre dhommes et le nombre de femmes
-

Slectionner une cellule sous la colonne sexe

Toujours dans les fonctions, slectionner NB.SI . Cette fonction permet de compter les
cellules en fonction de leur contenu ( NB pour nombre avec une condition .SI
=> compter le nombre de cases dont le contenu est H par exemple)

12

Slectionner les cellules concernes


Ajouter la condition ou critre de calcul ; ici H ou F.

NB : Attention le code H ou F doit tre mis entre guillemets car le codage est en lettres. Les
guillemets ne sont pas ncessaires lorsque le code est en chiffres.

Dans notre exemple, on comptait 9 hommes.


Une fois leffectif calcul, on peut calculer le pourcentage correspondant :
-

Slectionner une cellule ct de leffectif


Ecrire =
Slectionner la cellule chiffre, ici 9
Diviser par leffectif total (ici 19)

13

Le chiffre apparat sous forme de nombre dcimal


Pour lafficher en pourcentage, slectionner la cellule puis cliquer sur % en haut de page
(ou clic droit > format de cellule)

Autre exemple : On veut connatre le nombre de personnes ayant des


antcdents cardio (1) et le nombre de personnes nen ayant pas (0)
On procde de la mme manire que prcdemment avec la fonction NB.SI .
Attention, il sagit ici de chiffres, la condition ne doit donc pas tre entre guillemets.

14

7) Crer une nouvelle variable pour dcrire les combinaisons possibles


dantcdents (ici dans la colonne H )
Noter que la prsence des antcdents (oui / non) a t cod en 1 / 0 dans le tableau.
On souhaite obtenir une variable dcrivant les diffrentes combinaisons possibles
dantcdents, partir des trois variables spares antcdents cardio , antcdents
pneumo et antcdents neuro , par exemple :
- cardio & neuro, mais pas pneumo
- cardio seuls
- pneumo seuls
- cardio & pneumo & neuro
- etc
En thorie, le nombre de combinaisons possible est de 23 = 8

Nous allons crer cette variable qui code automatiquement chaque combinaison possible
partir des trois variables dantcdents.
A partir des codes en 0/1 des colonnes E, F et G, on dfinit le codage suivant pour la
combinaison des trois variables :
cardio pneumo neuro combinaison
0
0
0
000
1
0
0
100
0
1
0
010
0
0
1
001
1
1
0
110
1
0
1
101
0
1
1
011
1
1
1
111
Le codage de la variable combinaison est obtenu partir de lquation :
(cardio 100) + (pneumo 10) + (neuro)

15

Slectionner la cellule H du premier patient

Dans la cellule H2, crire =

puis slectionner la cellule correspondante E2

multiplier E2 par 100 au moyen de la touche *

additionner la case F2 au calcul prcdant en crivant + et en slectionnant la cellule F2


multiplier F2 par 10
de la mme manire additionner la case G2

16

Appuyer sur Entre :

Noter que les formules utilises pour un calcul automatique peuvent tre visualises en double
cliquant sur la cellule (exemple double cliquer sur H2).

17

On peut automatiser la formule toutes les cellules de la colonne H en utilisant lASTUCE 1


(ctrl+clic pour suivre le lien)

18

8) Croisement de donnes au moyen de tableaux croiss dynamiques


a. Insertion du tableau
-

Utiliser une nouvelle feuille Excel pour insrer les tableaux

Se placer dans une cellule de la feuille 2 et en haut gauche de la feuille, cliquer sur
Insertion puis Tableau crois dynamique

19

La fentre suivante apparat :

Revenir sur la feuille 1 et slectionner lensemble de la base de donnes. Attention :


slectionner aussi les titres des colonnes !

Puis cliquer sur OK.

20

Un tableau vide apparat avec le nom des variables droite.


Au dessous des variables droite apparait la structure du tableau (variables en colonnes,
variables en ligne et contenu du tableau), pour linstant ce contenu est vide.

Nous allons commencer par calculer la moyenne dge par sexe :


o Avec la souris cocher ou faire glisser la variable sexe en ligne

21

o Puis cocher ou glisser la variable age lintrieur du tableau

o On peut faire cette manipulation directement dans la table ou dans la structure du


tableau au dessous des variables. Si on prfre faire un tableau en colonne, glisser
la variable sexe sur les tiquettes en colonne plutt quen ligne.

22

o Pour le moment, Excel affiche la somme des ges par sexe, ce qui ne nous intresse
pas, on souhaite plutt calculer la moyenne dge par sexe.
o Pour modifier la fonction mathmatique applique aux donnes :
 clic gauche sur Somme de ge (dans la structure du tableau sous les
noms de variables) puis slectionner Paramtres des champs de valeur .
 ou bien sur les valeurs affiches dans le tableau crois,
clic droit > paramtres des champs de valeur
 Slectionner la fonction mathmatique souhaite ; ici Moyenne
De la mme manire, on pourra calculer lcart type en fonction du sexe
par la fonction ECARTYPE

On obtient la moyenne dge par sexe

On peut rduire le nombre de dcimales comme expliqu prcdemment

23

Nous venons de croiser une variable quantitative (ge) avec une variable qualitative (sexe).

Nous allons prsent croiser deux variables qualitatives (le sexe et le traitement)
-

Pour cela, il faut repartir dun tableau vide (mme principe que prcdemment, il est aussi
possible de copier-coller le tableau prcdent et de dcocher les variables).

Cocher / glisser les variables traitement en colonne et sexe en ligne

24

Pour afficher les effectifs, il faut galement :


o faire glisser la variable didentifiant unique (dans notre exemple la variable
patients ) lintrieur du tableau.

o Excel calcule par dfaut la somme des numros didentification ce qui ne nous
intresse pas
o changer les paramtres de champs de valeurs pour calculer le nombre
didentifiants uniques dans chaque croisement du sexe et du traitement

25

o on obtient alors le tableau des effectifs

26

b. Mise en forme de tableau, type article mdical


Une fois lensemble des calculs raliss on peut les afficher sous forme dun tableau comme cidessous. Excel se prte bien la ralisation de ce type de tableau, il se copie-colle ensuite
facilement dans un document Word.

Pour faire ce type de tableau :


- Prparer les enttes de colonnes et de lignes
o H, F, n, moyenne, cart type
o Age, A B C
-

Copier coller les moyennes, carts types et effectifs obtenus dans les tableaux croiss
dynamiques (attention, il vaut mieux utiliser la fonction collage spcial > valeur qui ne garde
que la valeur sans la formule dynamique)

27

Calculer les pourcentages associs aux effectifs comme dans le paragraphe 6)

Pour crer les bordures du tableau :


-

Slectionner les cellules concernes


Clic droit
Slectionner format de la cellule
Puis bordure

28

Vous aimerez peut-être aussi