Vous êtes sur la page 1sur 14

Data Analyser - v1.

22
Tutoriel FR

Introduction
Rendre compatible un formulaire XLS Form avec l’outil Data Analyser v1.22
1.1 Obligation de codage/formatage
1.2 Astuces de codage pour une utilisation optimale de l’outil:
1.3 Transfert vers le fichier Data Analyser.xls
Structure du fichier Data Analyser
2.1 Onglet Config
2.2 Onglet CHOICE
2.3 Onglet UNIQUE
2.4 Onglet VALUE
2.5 Onglet RANK
2.6 Onglet SCORE
2.7 Onglet COMPARE
Aller plus loin
3.1 Transférer les analyses dans un rapport (.doc) / présentation (ppt)

Introduction
L’outil d’analyse a été créé par Nick Imboden, OCHA. Il a pour objectif de faciliter l’analyse
des données récoltées suite à des sondages réalisés sous ODK avec des questionnaires
codés sous Excel: XlsForm. L’outil permet de visualiser les réponses et réalise en quelques
minutes et sans expertise technique, des premières analyses. Cependant l’expertise
analytique est toujours essentielle afin que les résultats ne soient pas mal interprétés.

Le fichier Excel Data Analyser est disponible en téléchargement ici:


https://www.humanitarianresponse.info/applications/kobotoolbox/document/kobotoolbox-
excel-data-analyser-v122
I. Rendre compatible un formulaire XLS Form avec
l’outil Data Analyser v1.22

1.1 Obligation de codage/formatage


● Un formulaire contenant des loop ne pourra pas être utilisé
● L’outil n’analyse pas les questions de type text
● Le formulaire doit contenir un unique ID, généralement attribué par Kobo ou
Aggregate sous la forme : uuid:8023d50a-bf2a-433e-aa4b-e0d0a61110f9
● La langue doit être spécifiée dans le formulaire même si qu’une seule langue utilisée
→ label::Français / hint::Français ...
● Le formulaire ne doit pas contenir de ligne vide

OK Non

1.2 Astuces de codage pour une utilisation optimale de l’outil:

Valeurs des réponses de type select_one ou select_multiple :


● Préférer coder en valeur numérique: oui/non → 1/0
● Mettre des valeurs négatives pour les réponses “Ne sait pas” → -1

Questions de classement (rank) :

L’outil d’analyse reconnaît automatiquement les questions de classement si elles sont


correctement codées dans le formulaire xlsForm.
Chaque classe correspond à une question donc une ligne dans le formulaire.
Ces questions doivent être dans un groupe et le nom des variables doivent être normées :
même racine + suffixe numéraire.
Exemple: Selon vous, quels sont les 3 besoins prioritaires pour pouvoir vous abriter ?

1. Les questions sont dans un groupe


2. Les noms des variables commencent toutes par A_abrispriorites
3. Le suffixe est numéraire : _1 / _2 / _ 3

Questions de Score/ Pondération ?

L’objectif de ces questions est de traduire en valeur une appréciation. Elles accordent alors
une valeur aux différentes réponses possibles ce qui facilite par la suite les calculs et
l’analyse.
Onglet survey :
Les questions pondérées doivent se trouver dans un groupe et le nom des variables doit
être normées : même racine + suffixe textuel
Exemple: Pourcentage approximatifs présents : filles

1. les questions sont dans un groupe


2. Les noms de variables commencent toutes par E_presence_ENSG
3. le suffixe est textuel : _AVANT / _APRES

Onglet choices :
Le poids est attribué directement dans la
valeur de la réponse
La réponse Toutes est ici assimilée à 100%
et la réponse Aucune à 0.
1.3 Transfert vers le fichier Data Analyser.xls
Une fois les données récoltées, celles-ci ainsi que les onglets du formulaire xlsForm doivent
être copiés dans le fichier Data Analyser.xls
Dans le formulaire :
1. Cliquer droit sur l’onglet survey
2. Move or Copy
3. Choisir le fichier Data Analyser .xls de destination ainsi que la position de la feuille
4. Cocher la case : Create a copy
5. Recommencer la procédure pour l’onglet choices, ainsi que pour l’onglet data du
fichier .csv téléchargé avec Kobo ou Aggregate
II. Structure du fichier Data Analyser
Le fichier Data Analyser doit maintenant contenir au minimum tous les onglets suivants:
data, survey, choices, Config, CHOICE, UNIQUE, VALUE, RANK, SCORE, COMPARE

2.1 Onglet Config


L’onglet Config permet de gérer les différents paramètres afin que l’outil puisse fonctionner
correctement.

1 Paramètres principaux
Choisir la langue du fichier d’analyse
Remplir les noms des feuilles : data pour données, survey pour Enquête, choices pour
Options
Définir la langue dans laquelle a été conduite l'enquête.
2 Traductions pour les éléments graphiques
Les traductions correspondent au titres et légendes qui apparaîtront dans les graphs
d’analyse. Il est possible de rajouter autant de langage que souhaité.

3 Paramètres avancés
Cette fenêtre n’a pas à être modifiée si les instructions précédentes (comment coder un
xlsform) sont respectées. Si ça n'était pas le cas, les modifications suivantes peuvent être
apportées :
● Colonne de références - Données : reporter ici le nom de la colonne de l’onglet data
comportant l’unique ID.
● Colonne de référence - Enquête : reporter ici le nom de la colonne de l’onglet survey
comportant les types de questions
● Colonne de référence - Options : reporter ici le nom de la colonne de l’onglet choices
comportant le nom des listes de choix
● Ligne maximale: nombre d’enregistrements maximum traités par le fichier
● Suffixe de rang: cf. ci-dessus, définition du suffixe numéraire pour les questions de
classement
● Suffixe de notation: cf. ci-dessus, définition du suffixe textuel des questions
pondérées
● Suffixe de comparaison: mettre la concaténation des suffixes de rang et des suffixes
de notation
4 Seuils pour les modèles de regroupement de numéros
Pour une question de type Integer les réponses vont variées, les modèles définis
permettent de classer les différents nombres obtenus.
Chaque colonne est un modèle. Chaque modèle permet de définir un regroupement.
Exemple: Âge la personne enquêtée, regroupement >0-15 ; >15 - 49; >49 -90
2.2 Onglet CHOICE
L’onglet CHOICE est l’onglet par défaut analysant toutes les questions de manière
indépendante

1. Choix de la question à analyser


2. Résultat en graphique
3. Possibilité de désagrégation avec les graphiques qui s’affichent au-dessous Si plus de
6 graphiques, il est possible de faire défiler la fenêtre vers le bas.
4. Les propriétés des graphiques sont modifiables
5. Paramètres avancés :
a. Options à exclure : définir dans la zone de texte les valeurs à ne pas prendre
en compte dans l’analyse
b. Autres paramètres : pour une meilleure lisibilité du graphique
c. Regroupement de numéros: actif si nécessaire, permet de choisir le modèle
de regroupement de numéro à appliquer (cf. ci-dessus)
2.3 Onglet UNIQUE
Même principe que CHOICE, le résultat est en Pie Chart.

1. Choix de la question à analyser


2. Résultat en graphique
3. Possibilité de désagrégation avec les graphiques qui s’affichent au-dessous Si plus de
6 graphiques, il est possible de faire défiler la fenêtre vers le bas.
4. Les propriétés des graphiques sont modifiables
5. Des fenêtres blanches permettent de masquer les zones avec Pie Chart vides.
6. Paramètres avancés :
d. Options à exclure : définir dans la zone de texte les valeurs à ne pas prendre
en compte dans l’analyse, le Pie Chart est alors automatiquement recalculé
pour avoir un total de 100%
e. Autres paramètres : pour une meilleure lisibilité du graphique
f. Regroupement de numéros: actif si nécessaire, permet de choisir le modèle
de regroupement de numéro à appliquer (cf. ci-dessus)
2.4 Onglet VALUE
L’onglet Value est plus complexe en termes d’analyse. Il permet d’analyser les questions à
réponses multiples. Il catégorise une réponse spécifique par une autre question. Se rajoute
à cette fonction, la possibilité de désagrégation comme dans les onglets précédents.

1. Choix de la question à analyser


2. Choix d’une des réponses, ou bien fonction numérique possible si valeur numérique à
analyser (voir 6.c)
3. Catégorisation par une autre question
4. Si valeurs numériques analysées, la moyenne est automatiquement calculée et
s’affiche à cet endroit
5. Désagrégation possible et les graphiques s’affichent au-dessous.
6. Paramètres avancés :
a. Options à exclure : définir dans la zone de texte les valeurs à ne pas prendre
en compte dans l’analyse, le Pie Chart est alors automatiquement recalculé
pour avoir un total de 100%
b. Autres paramètres : pour une meilleure lisibilité du graphique
c. D. Si valeur numérique alors la fonction numérique utilisée pour l’analyse est
à définir ici grâce à la liste déroulante.
Note: on voit ici l'intérêt de coder les valeurs des réponses avec une valeur numérique. On
peut en effet analyser sur les valeurs numériques ainsi que sur les valeurs textuelles des
réponses.
Exemple à trouver
Valeur textuelle : on choisit la réponse à afficher
Valeur numérique comment on fait peut avoir le maximum.

Les Onglets suivants RANK, SCORE et COMPARE, sont toute la plus-


value et la puissance de cet outil Excel

2.5 Onglet RANK


L’onglet RANK permet d’analyser les questions de classement uniquement si celles-ci ont
été codées correctement dans le formulaire. Le cas échéant le fichier Excel les reconnaît
automatiquement.

1. Choix de la question à analyser


2. Désagrégation possible
3. Paramètres avancés :
a. Options à exclure : définir dans la zone de texte les valeurs à ne pas prendre
en compte dans l’analyse.
b. Autres paramètres : pour une meilleure lisibilité du graphique
c. Poids attribué au rang. Ces valeurs peuvent être modifiées.
2.6 Onglet SCORE
L’onglet SCORE permet d’analyser les questions de SCORE/Pondération uniquement si
celles-ci ont été codées correctement dans le formulaire. Le cas échéant le fichier Excel les
reconnaît automatiquement.

1. Choix de la question à analyser


2. Désagrégation possible
3. Paramètres avancés :
a. Options à exclure : définir dans la zone de texte les valeurs à ne pas prendre
en compte dans l’analyse.
b. Autres paramètres : pour une meilleure lisibilité du graphique
c. Valeur attribuée à la catégorie.
d. Fonction numérique possible si coder avec des valeurs numériques
Note: on comprend ici l’importance d’utiliser des valeurs négatives pour les NSP. Ou bien
pour une échelle : médiocre moyen bon, ou moyen aurait la valeur 0.
2.7 Onglet COMPARE
L’onglet COMPARE permet d’analyser les questions de classement et les questions de score.
A cette différence que les poids et les valeurs ne sont pas pris en compte. Les questions
sont analysées dans leur ensemble. Cet onglet est comparable à l’onglet CHOICE mais pour
les questions de rang et de score.

1. Choix de la question à analyser


2. Désagrégation possible
3. Paramètres avancés :
a. Options à exclure : définir dans la zone de texte les valeurs à ne pas prendre
en compte dans l’analyse.
b. Autres paramètres : pour une meilleure lisibilité du graphique
c. Modèle de regroupement des numéros à définir le cas échéant

III. Aller plus loin


● Un fichier Data Analyser.xls peut contenir plusieurs enquêtes. Pour obtenir les
bonnes analyses correspondantes aux bonnes données, les onglets sont à définir
dans l’onglet Config
● Les propriétés des graphs sont modifiables pour tous les onglets
3.1 Transférer les analyses dans un rapport (.doc) / présentation
(ppt)
Vous l’aurez remarqué ce fichier permet de créer des analyses rapidement. Cependant
celles-ci restent dynamiques. Il faut donc les sauvegarder et les utiliser dans des rapports
ou présentations.
1. Sélectionner l’analyse faite:
1.1. Le graphique uniquement

1.2 Entourée en vert : le cadre comprenant le graphique ainsi que la désagrégation

1. Dans les 2 cas : Clic-Droit et Copier


2. Se placer dans le document Word ou la présentation PPT et faite un Clic-Droit, et
Coller
Enjoy !
Thanks to Nick for creating this amazing tool !