Vous êtes sur la page 1sur 7

B ON N E S P R AT I QU E S P OU R A N A L Y S E R V O S D ON N É E S

A VE C E XC E L 1

Table des matières


I. Introduction ............................................................................................................ 1
II. Comment concevoir et gérer votre base de données ............................................. 2
II.1. Conception des bases de données ................................................................... 2
II.2. Gestion de données ......................................................................................... 3
III. Analyser vos données dans Excel ......................................................................... 4
III.1. Formules ........................................................................................................ 4
III.2. Tableau croisé dynamique (Table pivot) ........................................................ 5
III.3. Conseils généraux pour l'analyse dans Excel ................................................. 7

I. Introduction
Excel est le logiciel de tableau le plus répandu qui vous permet de stocker, gérer et analyser
vos données. Selon la version, il vous permet de charger et d'élaborer des données dans
plusieurs formats tels que ceux ci-dessous :

L'avantage d'Excel réside dans sa polyvalence et dans sa facilité d'apprentissage par rapport
aux autres outils d'analyse statistique tels que R, Stata, SPSS, etc. Bien que non libre ou open
source, c'est un outil que Terre Des hommes (Tdh) utilise. Cependant, la gestion de très
grands ensembles de données dans Excel peut être problématique, d'autres outils devraient
donc être privilégiés pour effectuer cette tâche.

1
Ce document fût traduit par Bruno, bénévole CartONG

License: CC-by-SA Bonnes pratiques pour analyser les données avec Excel Page 1 | 7
II. Comment concevoir et gérer votre base de données
Il est important de garder à l'esprit que l'analyse est aussi importante que les données elles-
mêmes. Pour effectuer une bonne analyse avec Excel la base de données doit donc être conçue
correctement, les données doivent être nettoyées et fiables. Vous trouverez ci-dessous
quelques conseils sur la conception de votre base de données et la gestion de vos données
dans Excel.

II.1. Conception des bases de données

La conception d'une base de données doit toujours être basée sur un "plan d'analyse", quelle
que soit la source des données (collecte de données numériques ou saisie directe dans Excel).
Le plan d'analyse indique généralement quelles sont les données nécessaires et pourquoi, ainsi
que la manière dont elles seront collectées et comment elles seront analysées.

Example de plan d'analyse

Source: ACAPS, Conception de questionnaire pour l'évaluation des besoins dans les situations
d'urgence humanitaire, juillet 2016, pp. 13-14, extrait de:
https://www.acaps.org/sites/acaps/files/resources/files/acaps_technical_brief_questionnaire_d
esign_july_2016_0.pdf

Une fois le plan d'analyse créé et disponible, il est possible de commencer la conception de la
base de données en gardant à l'esprit les conseils suivants :

 Lorsque cela est possible, la base de données devrait commencer à


la ligne 1 et à la colonne 1
 Vous ne devez jamais utiliser des cellules fusionnées, ce qui
complique le traitement des données
 Les cellules doivent toutes contenir une seule valeur chacune (pas
de cellules avec plusieurs valeurs)

License: CC-by-SA Bonnes pratiques pour analyser les données avec Excel Page 2 | 7
 Les questions doivent être aussi "fermées" que possible (avec une liste d'options). Si la
saisie est faite directement dans Excel, utiliser des listes déroulantes2 si possible, afin
de réduire le risque d'erreur lors de la saisie des données

 Le formatage de la table doit être utilisé

II.2. Gestion de données

Une fois que votre base de données est prête et que vous exécutez votre collecte de données,
respectez les principes suivants dans la gestion de vos données :

 Eviter autant que possible la duplication (évitez si possible d'entrer les mêmes données
sur deux feuilles ou fichiers différents), afin de réduire le risque de perdre la trace de la
base de données mise à jour et d'éviter les problèmes de traçabilité.

2 2
Les listes déroulantes de Excel devraient toujours être basée sur une liste nommée définie dans le fichier Excel
(souvent dans une feuille dédiée) et la saisie manuelle des données dans les listes déroulantes devrait être évitée.

License: CC-by-SA Bonnes pratiques pour analyser les données avec Excel Page 3 | 7
 Le même type de données collectées à des moments différents doit toujours être saisi
dans le même fichier Excel (par exemple, une base de données annuelle unique). Si
possible, évitez d'utiliser une feuille par semaine ou par mois, etc.
 Si cela est inévitable, utilisez plusieurs feuilles dans le même fichier plutôt que des
fichiers différents.
 Si possible, nettoyez vos données régulièrement tout en les entrant, au lieu d'attendre
la fin du projet pour nettoyer l'ensemble des données. Assurez-vous de nettoyer les
données source (par exemple directement dans votre base de données en ligne si vous
utilisez un tel outil pour votre collecte de données, plutôt que dans vos données Excel
exportées).
 Assurez-vous que chacun de vos ensembles de données clés possède des identifiants
uniques pour faciliter la gestion et l'analyse de toute collecte de données.
Pour plus d'informations sur le nettoyage des données, reportez-vous au document "Bonnes
pratiques pour le nettoyage des données".

III. Analyser vos données dans Excel


III.1. Formules

Excel propose une grande quantité de formules 3 permettant différents types de calculs et
analyses. Les formules disponibles vont des formules de base comme "= SUM" (somme des
valeurs sélectionnées), ou "= MAX" (valeur maximale dans la plage sélectionnée), à des
formules plus complexes incluant "= STDEV" (écart-type), et " = COVAR "(covariance). Lors de
la configuration d'une formule dans Excel, une petite fenêtre apparaît, indiquant quelles
références sont nécessaires pour la formule, afin de guider l'utilisateur dans le processus.

Habituellement, les formules les plus utilisées pour effectuer des analyses de base dans le
domaine humanitaire et du développement sont celles qui se rapportent à la statistique
descriptive et à la référence. Les principales comprennent :

 SUBTOTAL (fournissant un type spécifique de sous-total - sélectionnable à l'aide de


codes connexes - dans une colonne de la base de données)
 IF (renvoie une valeur spécifique si une condition est vraie, alors qu'une autre valeur si
la même condition est fausse.) Il est possible de lier différentes fonctions IF avec AND
(renvoie « vrai » si toutes les conditions sont vraies) ou OR (renvoie « vrai » si une
condition est vrai).
 COUNTIF (dans une plage, compte les cellules qui répondent à un critère spécifique)
 COUNTIFS (dans une plage, compte les cellules qui répondent à un ou plusieurs
critères)

3
Bien que dans ce document soit en Français les noms des formules Excel n'ont pas été traduites. L’équivalent des
formules en Français peut être trouvé en ligne sur : https://fr.excel-translator.de/translator/

License: CC-by-SA Bonnes pratiques pour analyser les données avec Excel Page 4 | 7
 VLOOKUP (recherche verticale dans une table pour une référence liée à une valeur
donnée)

Beaucoup d'autres formules utiles sont disponibles et, en fonction des besoins d'analyse
et il vaut la peine d'explorer leurs fonctions. Il y a plusieurs sites Web qui les
expliquent, n'hésitez pas à chercher sur le web pour des explications.

Si vous utilisez la collecte mobile de données , assurez-vous que tous les calculs
possibles soient directement configurés dans l'outil de collecte de données (cela vous
fera gagner du temps dans la phase d'analyse des données)

III.2. Tableau croisé dynamique (Table pivot)

Les tableaux croisés dynamiques sont des tableaux récapitulatifs avec des calculs
automatiques, convertissant "une table de données en table d'inférence, ce qui aide à prendre
des décisions". Les tableaux croisés dynamiques sont relativement faciles à apprendre et
économisent à l'utilisateur le temps et l'effort de créer manuellement les formules pour obtenir
les calculs désirés.

Les tableaux croisés dynamiques permettent d'afficher les différentes variables en rangées et
colonnes, avec des calculs effectués sur les valeurs sélectionnées en cliquant sur la valeur puis
sur "paramètres champ valeur" (les calculs possibles incluents : somme, moyenne, max, min,
compte, écart-type, etc.)

License: CC-by-SA Bonnes pratiques pour analyser les données avec Excel Page 5 | 7
Les tableaux croisés dynamiques incluent également une fonction de filtrage, qui augmente le
niveau de complexité d'analyse possible. Plusieurs filtres peuvent être ajoutés, ce qui
augmente le niveau de détail que la table peut fournir.

Une fois le tableau croisé dynamique terminé, il est possible de générer automatiquement un
graphique en appuyant simplement sur F11 (sur PC) ou Fn + F11 (sur Mac), ou en cliquant sur
"insérer" et en sélectionnant le type de graphique que vous souhaitez générer.

License: CC-by-SA Bonnes pratiques pour analyser les données avec Excel Page 6 | 7
Une fois le graphique créé, il est alors possible de le modifier comme n'importe quel graphique
normal dans Excel. Pour la conception de graphiques et de diagrammes, voir la documentation
sur la représentation graphique.

Les fonctionnalités supplémentaires des tableaux croisés dynamiques incluent :

 Tri par valeur (du plus petit au plus grand, ou du plus grand au plus petit)
 Affichage des valeurs en% du total général, % du total des colonnes, etc.
 Classement par valeur

III.3. Conseils généraux pour l'analyse dans Excel

Quelques conseils généraux à garder à l'esprit lors de l'analyse des données dans Excel :

 Tous les calculs doivent être effectués à l'aide des formules spécifiques, afin d'assurer la
traçabilité et de faciliter l'identification des erreurs éventuelles
 Par la suite, les calculs doivent toujours être fournis avec les données brutes originales
associées
 Les tableaux croisés dynamiques et les graphiques doivent être préférés (les tableaux
croisés dynamiques permettent également la tabulation croisée)
 La fusion de cellules doit être évitée, car il est ensuite difficile de faire « pivoter » les
données

License: CC-by-SA Bonnes pratiques pour analyser les données avec Excel Page 7 | 7

Vous aimerez peut-être aussi