Académique Documents
Professionnel Documents
Culture Documents
Le terrain étant achevé, le chargé d’étude se trouve avec une pile de questionnaires,
représentant une masse d’informations brute. Celle-ci doit être traitée, de manière à pouvoir
répondre clairement aux questions posées lors de la définition des objectifs. Les analyses
prennent des formes plus ou moins complexes.
Avant toute analyse, les données doivent être vérifiées très soigneusement et très strictement
de manière à éviter tout risque d’erreur lors du travail d’enregistrement des données. Cette
étape consiste en une relecture systématique de chaque questionnaire et en une vérification
de leur contenu. Elle Pour se faire, il s’agit de :
Pages manquantes
Réception après date limite
Répondant non éligible (âge p. ex.)
A ce stade il faut préparer les données recueillies de manière à ce qu’elles puissent être
traitées par l’ordinateur.
La codification consiste à traduire les données dans le langage qui permet le traitement sur
ordinateur. Le code doit regrouper sous une même rubrique les réponses reflétant une idée
commune. Toute codification entraîne une altération ou une simplification arbitraire des
réponses obtenues. Elle demeure cependant le passage obligé pour le traitement de grands
échantillons.
oui = 2, non = 1
Pour les questions ouvertes, elle est parfois plus problématique, surtout quand le nombre de
réponses possibles est grand ou mal connu au moment de l’enquête.
Quand le nombre de réponses possibles est limité, il suffit d’établir une liste exhaustive avant
l’enquête. Au moment de l’encodage, il suffit d’attribuer le code correspondant à la liste
initiale.
Dans le cas de questions d’une question ouverte où une liste exhaustive ne peut être établie au
préalable, la procédure de codification est plus complexe et intègre les règles suivantes :
La transcription des données impose la construction d’un tableau dans lequel les individus
figurent en lignes, et les variables en colonnes. En d’autres termes, à l’intersection d’une ligne
et d’une colonne données, on retrouve la réponse d’un individu à une question.
Vérifier données hors norme (anormales), p. ex. « 6 » pour une variable codifiée 1 à
5 : Vérifier en triant chaque colonne
Si non contrôlé à l’étape de la vérification des questionnaires : Réponses suspectes
(incohérences)
Retourner au questionnaire
Substitution par valeur manquante (p. ex. 99)
Substitution par valeur neutre (p. ex. moyenne) : Discutable, introduit biais
Substitution par valeur imputée (déduction par rapport autres réponses) : Introduit
biais
Suppression du répondant : Si nombreuses réponses manquantes, possibilité de biais
lié à l’échantillon
A. Pondération
Exemple :
Il arrive très souvent que les variables brutes d'une base de données ne soient pas suffisantes
pour effectuer certaines analyses. On peut avoir besoin de créer une ou des nouvelles
variables à partir des variables existantes
- Transformer les catégories pour comparer les données d’une étude avec celles d’une
autre étude
- Équilibrer des données manifestement biaisées (standardisation - COMPLEXE)
- Compute
- Recode
Cette astuce est utilisée lorsqu’on étudie les relations entre plusieurs variables dont certaines
sont numériques, d’autres nominales, et que l’on veut appliquer des modèles d’analyses
conçus pour des variables numériques (régression linéaires, par exemple).
Variables utilisées pour représenter différents groupes dans la population sans utiliser
une échelle ordinale qui aurait peu de sens
Utilisées dans les analyses de régression
Valeurs les plus fréquentes sont 0 et 1 (binaire)
Re-spécification d’une variable avec K catégories nécessite l’utilisation de K-1
variables muettes
2 Femme 0 1
Deuxième variable
Nominale Intervalles ou
ou ordinale proportion (ratio)
Tris croisés :
- Analyse de la relation existant entre deux variables (bivariée) ou trois variables (multivariée)
Comparaison moyennes :
- P. ex., la différence entre les 26-45 ans et les 46-65 ans par rapport au pourcentage de
personnes qui achètent une croisière
Corrélation :
Régression :
- P. ex., la relation entre le niveau d’estime de soi et le choix une résidence luxueuse
C. Tests de comparaison
Type de
données
X2 ≥ valeur théorique
Test t :
Permet d’énoncer des conclusions sur l’existence de différences significatives entre les
moyennes de deux échantillons
t ≥ 1,98 ou t ≤ -1,98