Vous êtes sur la page 1sur 29

Etudes de marché

Préparation des données


Sommaire

 Processus de préparation des données


 Vérification et édition des questionnaires
 Codage, transcription et nettoyage des données
 Ajustement statistique des données
 Stratégie d’analyse des données

2
ENCG El Jadida Etudes de marché
Le processus de préparation des
données
Vérification des questionnaires

Edition des questionnaires

Codage des questions

Transcription des données

Nettoyage des données

Ajustement statistique données

Sélection d’une
Stratégie d’analyse des données 3
ENCG El Jadida Etudes de marché
Vérification des questionnaires (1/2)

 Ne pas attendre la fin de la collecte de données


 Raisons de rejet d’un questionnaire:
Certaines parties du questionnaire sont incomplètes
L’enchaînement des réponses indique que le répondant n’as
pas compris ou suivi les instructions (ex. indications de
renvois)
Trop faibles variance des réponses (ex. choix systématique
de 4 sur une échelle de 1 à 7)

4
ENCG El Jadida Etudes de marché
Vérification des questionnaires (2/2)

 Une ou plusieurs pages manquantes


 Réception du questionnaire après la date limite
 Répondant non éligible (ex. catégorie d’âge)

5
ENCG El Jadida Etudes de marché
Edition des questionnaires

 Editer les questionnaires consiste à les passer en revue


 Objectif : améliorer l’exactitude des réponses
 L’édition vise à identifier les réponses illisibles,
incomplètes, incohérentes, ou ambiguës et difficiles à
interpréter
 Réponses difficiles à lire (questions ouvertes)
 Réponses incohérentes (ex. revenu trop faible et fréquentation
régulière des magasins de luxe)
 Réponses multiples à une question à choix unique (ex. cocher 2
et 3 sur une échelle de 1 à 7)

6
ENCG El Jadida Etudes de marché
Edition des questionnaires: traitement des réponses
insatisfaisantes
 Solutions si trop de manques sont constatés sur le
questionnaire :
– Gros échantillons : éliminer le répondant (attention
possibilité de biais)
– Echantillons de taille réduite: contacter le répondant pour
effectuer des corrections OU en sélectionner un nouveau en
respectant la méthode d’échantillonnage
– Le chargé d’études pourra décider d’attribuer une valeur
spécifique aux réponses insatisfaisantes (en cas de difficulté
de renvoyer les questionnaires)

7
ENCG El Jadida Etudes de marché
Codage des questions

 Codage: transformer les réponses en données


quantifiables
o Ex: « 1 » pour les étudiants et « 2 » pour les non étudiants
 Choix d’une ou plusieurs valeurs pour les données
manquantes (ex. -1 , 9 ou 99)

8
ENCG El Jadida Etudes de marché
Codage des questions fermées (1/3)

 Le chargé d’études attribue un code à chacune des


réponses de chaque question (voir ex. 1)

9
ENCG El Jadida Etudes de marché
Exemple

Combien de temps en moyenne, par jour, passez-vous sur Internet ?

Moins de 30 minutes…………... (1) (code de réponse)


30 à 59 minutes……………………. (2)
1h à 1h29…………………………….. (3)
1h30 à 1h59…………………………. (4)
2h à 2h29…………………………….. (5)
2h30 à et plus………………………. (6)

10
ENCG El Jadida Etudes de marché
Codage des questions fermées (2/3)

 Cas d’une seule réponse autorisée = le codage ne


nécessite qu’une seule colonne (voir ex. 2)

11
ENCG El Jadida Etudes de marché
Exemple

 «Avez-vous l’intention de voyager dans les six prochains mois?»

Très peu probable


Peu probable
Incertain
Probable
Très probable

12
ENCG El Jadida Etudes de marché
Codage des questions fermées (3/3)

 Cas de plusieurs réponses autorisées = chaque


possibilité de réponse se voit attribuer une colonne
spécifique (voir ex. 3)

13
ENCG El Jadida Etudes de marché
Exemple

 Quels types de voyages envisagez-vous dans les six prochains mois ?

Voyage d’affaires
Voyage de découverte
Voyage sportif
Voyage d’aventure

14
ENCG El Jadida Etudes de marché
Codage des questions ouvertes

 Codage plus complexe


 Les réponses fournies aux questions ouvertes sont
retranscrites
 On élabore ensuite les codes correspondant à ces
réponses
 Attribuer un code distinct à tout élément critique même si
aucun répondant n’en fait état (ex. package comme
facteur de préférence d’un produit)
 Conserver un niveau de détail le plus élevé possible sans
exagérer le nombre de codes

15
ENCG El Jadida Etudes de marché
Transcription des données

 Saisie des données


 Construction d’une base de données (feuille de calcul Excel,
SPSS)
 Champ (colonne) et enregistrement (ligne)
 Variables :
– Numérotation
– Une colonne pour chaque variable
– Un champ représente un élément unique d’information (ex.
profession)
 Questionnaires (répondants) :
– Numérotation
– Une ligne pour chaque questionnaire (répondant)
– Un enregistrement est constitué d’une série de champs: la
situation de famille, l’âge, la taille du foyer, la profession, etc.
16
ENCG El Jadida Etudes de marché
Transcription des données

17
ENCG El Jadida Etudes de marché
Nettoyage des données : Contrôle d’uniformité

 Le contrôle d’uniformité vise à détecter les données anormales,


celles qui sont incohérentes d’un point de vue logique ou qui
présentent des valeurs extrêmes
 Exemple de données hors norme: « 6 » pour une variable
codifiée 1 à 5
 Exemple d’incohérence logique: âge et profession
 Réponses très peu variées (ex. choix des extrêmes)

18
ENCG El Jadida Etudes de marché
Nettoyage des données : Réponses manquantes
(1 de 2)
 Retourner au questionnaire
 Substitution par valeur manquante (ex. -1)
 Substitution par valeur neutre (ex. moyenne) :
– Introduit biais
 Substitution par valeur imputée (déduction par rapport
aux autres réponses) :
– Introduit biais

19
ENCG El Jadida Etudes de marché
Nettoyage des données : Réponses manquantes
(2 de 2)
 Suppression du répondant :
– Si nombreuses réponses manquantes
– Possibilité de biais lié à l’échantillon
 Suppression appariée :
– Plutôt que de supprimer les questionnaires qui présentent de réponses
manquantes, retenir, pour chaque calcul, les répondants dont les
réponses s’avèrent complètes
– Il peut arriver dès lors que les différents calculs de l’analyse s’appuient
sur différentes tailles d’échantillon

20
ENCG El Jadida Etudes de marché
Ajustement statistique des données

 Pondération
 Re-spécification de variables
 Changement d’échelle

21
ENCG El Jadida Etudes de marché
1- Pondération

 Pondération :
– Ajuster le rapport d’importance entre les catégories de
répondants
– Utilisée pour augmenter la représentativité d’un échantillon
(Voir exemple de pondération)

22
ENCG El Jadida Etudes de marché
Exemple de pondération

Proportion Proportion Poids


Age (1)
échantillon (2) population (3) (3/2)

16-25 22% 11% 0,50

26-35 7% 14% 2,00

36-45 20% 18% 0,90

46-55 17% 17% 1,00

56-65 22% 25% 1,14

23
ENCG El Jadida Etudes de marché
2- Re-spécification de variables

 Création d’une nouvelle variable :


– Calcul d’un indice composé (X2/X1)
– Synthèse de plusieurs variables (somme de plusieurs variables)
– Création de catégories (ex. âge)
– Création de variables muettes

24
ENCG El Jadida Etudes de marché
Création de variables muettes

• Une variable muette est une variable utilisée pour expliquer des
valeurs qualitatives dans un modèle de régression.
• Les modèles de régression tentent d'expliquer une variable en
fonction des autres. Par exemple, le salaire d'une personne en
fonction de son âge, de son éducation et de son expérience. Ces
variables peuvent être quantifiées. L'âge, l'éducation et l'expérience
d'une personne peuvent être quantifiés en nombre d'années.

• Mais que se passe-t-il lorsque nous avons des variables qui ne


peuvent pas être quantifiées ? Par exemple la couleur des cheveux, le
pays où vous vivez ou le sexe. La solution à ce problème réside dans
les variables muettes. Ce sont des variables qui prennent
généralement des valeurs binaires. C'est-à-dire la valeur zéro ou un.
25
ENCG El Jadida Etudes de marché
Création de variables muettes

 Variables utilisées pour représenter différents groupes dans la


population
 Utilisées dans les analyses de régression
 Valeurs les plus fréquentes sont 0 et 1 (binaire)
 Re-spécification d’une variable avec K catégories nécessite
l’utilisation de K-1 variables muettes

26
ENCG El Jadida Etudes de marché
Exemple de variables muettes (deux catégories)

Par exemple, la variable sexe, avons-nous dit, est une variable


qualitative. Pour l'inclure dans un modèle de régression, vous
devez créer une variable fictive.

On appellera la variable « femme » telle que :


Femme = 1 (si l'individu est une femme)
Femme = 0 (si l'individu n'est pas une femme, c'est-à-dire qu'il est
un homme)
Dans ce cas, « homme » est considéré comme une catégorie de
référence ou un groupe de base.

27
ENCG El Jadida Etudes de marché
Exemple de variables muettes (deux catégories)

Equation de la régression:
Ventes = 322.6 – 114.4 Prix + 21.6 Température + 349.9 Magasin

28
ENCG El Jadida Etudes de marché
3- Changement d’échelle

 Le changement d’échelle consiste à manipuler les échelles de valeurs


de manière à garantir leur comparabilité réciproque (échelle
sémantique différentielle en 7 points, une échelle de Likert en 5
points)
– Transformer les échelles pour comparer les données d’une étude
avec celles d’une autre étude
– Équilibrer des données manifestement biaisées (valeur centrée-
réduite): ex. choix des extrêmes

29
ENCG El Jadida Etudes de marché

Vous aimerez peut-être aussi