Académique Documents
Professionnel Documents
Culture Documents
Quand toutes les données sont encodées, la phase d’analyse commence, il s’agit de synthétiser
de manière pertinente l’information accumulée sur les questionnaires de manière à la rendre
utilisable pour les besoins de la recherche. Les réponses à un questionnaire de 200 répondants
à 20 questions représentent 4000 observations qui, individuellement, ne peuvent être
interprétées. Le chargé d’étude doit procéder à leur regroupement, rechercher les indicateurs
de tendance centrale et de dispersion, et évaluer le caractère représentatif des résultats.
1. Analyse de fréquences
2. Mesures de position centrale
3. Mesures de dispersion
4. Mesures de forme
1. Analyse de fréquences
Elle consiste à réaliser un tri à plat pour toutes les variables. Le tri à plat visualise les
réponses obtenues au questionnaire, variable par variable. Comme il y a souvent un nombre
élevé de questionnaires, on calcule une « distribution de fréquences » c’est-à-dire le nombre
de réponses obtenues pour chaque question ou pour chaque item figurant dans la question.
Cette distribution de fréquences est souvent absolue, relative (%) et en cumulée, ce qui facilite
la lecture des résultats, et représentée en forme de graphe.
En effet, une simple tabulation ne permet pas de prendre en considération l’influence d’une
variable sur une autre. Se limiter à des tris à plat limite considérablement l’utilité de l’étude et
augmente considérablement les risques d’erreurs.
En plus de donner une vue d’ensemble des résultats, les tabulations simples présentent
d’autres avantages importants :
Il est possible d’identifier rapidement les points aberrants, c’est-à-dire correspondant à des
valeurs manifestement en dehors des normes et qui constituent soit des erreurs, soit des cas
tout à fait exceptionnels qui demandent un traitement séparé.
Etude de marché, H. EL BAYED SAKALLI Page 2
UNIVERSITÉ CHOUAÏB DOUKKALI
École Nationale de Commerce et de Gestion
(ENCG) - EL JADIDA
Par exemple, en examinant les réponses à une question, on constate que deux entreprises
déclarent affecter 70% de leur chiffre d’affaires à la recherche- développement. Un résultat
étonnant qui, s’il est exact, peut s’observer dans une entreprise en phase de lancement mais
n’est certainement pas représentatif du comportement moyen des entreprises.
Exemple
Consommation
Cumulative
Frequency Percent Valid Percent Percent
Valid Plus 30 17,1 17,4 17,4
Comparable 110 62,9 64,0 81,4
Moins 32 18,3 18,6 100,0
Total 172 98,3 100,0
Missing 9 3 1,7
Total 175 100,0
Les tris à plats terminé, il convient de résumer l’information. Ce sont les indicateurs de
tendance centrale qui sont utilisés dans ce cas. Comme mesure de tendance centrale, ce sera
le mode, la médiane ou la moyenne.
Mode (Mo) : C’est la valeur la plus fréquente. Certaines données peuvent être
bimodales
Médiane (Me) : c’est la moyenne de position. Le nombre d’observations inférieures à
la médiane est égal au nombre d’informations supérieures à la médiane. La médiane
divise la distribution en deux nombres égaux d’observations
Moyenne (x): c’est la somme des réponses divisée par le nombre de réponses
NB : Pour une courbe normale, les trois valeurs sont identiques et centrées sur la courbe
Nominale Mode
Souvent peu de réponses, voire aucune, près de la moyenne (grands écarts types)
Ceci nous amène à conclure que la moyenne, indicateur de tendance centrale, est insuffisante
pour décrire une série statistique, puisqu’elle peut masquer des situations différentes, et
conduire à des interprétations erronées. Il faut donc compléter cette information par
l’observation et l’interprétation de la répartition autour de la moyenne. C’est la notion de
dispersion, que nous allons aborder dans le point suivant.
3. Mesures de dispersion
Différentes mesure de dispersion peuvent être utilisées. Cependant il existe deux mesures
courantes de dispersion à savoir :
Écart type (S) : c’est la mesure de dispersion autour de la moyenne. La mesure la plus
utilisée.
Variance est la moyenne des carrés des écarts par rapport à la moyenne. Elle donne une
connaissance de l’écart entre chaque point et la moyenne.
Écart (ou étendue) : c’est la différence entre les valeurs maximale et minimale (deux
valeurs extrêmes)
4. Mesures de formes
Symétrie (skewness) :
Mesure indiquant que les déviations par rapport à la moyenne sont plus importantes dans une
direction, à gauche (si valeur positive), ou à droite (si valeur négative)
Symétrie de la distribution
Aplatissement (kurtosis) :
Mesure indiquant que la courbe de la distribution de fréquence est plus plate (si valeur
négative), ou moins plate (si valeur positive), par rapport à une courbe normale
Aplatissement de la distribution