CH 6 Analyse Des Données

UNIVERSITÉ CHOUAÏB DOUKKALI
École Nationale de Commerce et de Gestion

(ENCG) - EL JADIDA
Professeur : H. El Bayed Sakalli

E-mail : hanaa.sakalli@gmail.Com
Niveau : Semestre 6
Année universitaire : 2019- 2020
Etude de marché, H. EL BAYED SAKALLI Page 1

(ENCG) - EL JADIDA
Quand toutes les données sont encodées, la phase d’analyse commence, il s’agit de synthétiser
de manière pertinente l’information accumulée sur les questionnaires de manière à la rendre
utilisable pour les besoins de la recherche. Les réponses à un questionnaire de 200 répondants
à 20 questions représentent 4000 observations qui, individuellement, ne peuvent être
interprétées. Le chargé d’étude doit procéder à leur regroupement, rechercher les indicateurs
de tendance centrale et de dispersion, et évaluer le caractère représentatif des résultats.
1. Analyse de fréquences
2. Mesures de position centrale
3. Mesures de dispersion
4. Mesures de forme
1. Analyse de fréquences
Elle consiste à réaliser un tri à plat pour toutes les variables. Le tri à plat visualise les
réponses obtenues au questionnaire, variable par variable. Comme il y a souvent un nombre
élevé de questionnaires, on calcule une « distribution de fréquences » c’est-à-dire le nombre
de réponses obtenues pour chaque question ou pour chaque item figurant dans la question.
Cette distribution de fréquences est souvent absolue, relative (%) et en cumulée, ce qui facilite
la lecture des résultats, et représentée en forme de graphe.
Des tableaux de distribution de fréquences, réalisés pour chaque question, présentent

l’avantage de donner une idée des résultats pour toutes les variables, quel que soit le type
de mesure utilisé. Ils constituent le résultat de base d’une étude de marchés et la source
d’informations la plus importante pour l’analyste.
En effet, une simple tabulation ne permet pas de prendre en considération l’influence d’une
variable sur une autre. Se limiter à des tris à plat limite considérablement l’utilité de l’étude et
augmente considérablement les risques d’erreurs.
En plus de donner une vue d’ensemble des résultats, les tabulations simples présentent
d’autres avantages importants :
Les tabulations simples permettent de détecter les erreurs éventuelles d’enregistrement de

données ;
Il est possible d’identifier rapidement les points aberrants, c’est-à-dire correspondant à des
valeurs manifestement en dehors des normes et qui constituent soit des erreurs, soit des cas
tout à fait exceptionnels qui demandent un traitement séparé.
(ENCG) - EL JADIDA
Par exemple, en examinant les réponses à une question, on constate que deux entreprises
déclarent affecter 70% de leur chiffre d’affaires à la recherche- développement. Un résultat
étonnant qui, s’il est exact, peut s’observer dans une entreprise en phase de lancement mais
n’est certainement pas représentatif du comportement moyen des entreprises.
Les tabulations permettent de vérifier le caractère représentatif de l’échantillon interrogé. Il suffit de

comparer les distributions observées pour des variables socio-démographiques clés avec d’autres
distributions disponibles en ce qui concerne l’ensemble de la population.
Les tabulations simples montrent la structure de la distribution des réponses et permettent de

déterminer ensuite le type de regroupements ou de recodification des réponses à adopter.
La distribution de fréquences permet de détecter la structure de la distribution et notamment de

définir son caractère « normal » ou pas
Exemple
Tableau de fréquences : Variable Consommation
Consommation
Cumulative
Frequency Percent Valid Percent Percent
Valid Plus 30 17,1 17,4 17,4
Comparable 110 62,9 64,0 81,4
Moins 32 18,3 18,6 100,0
Total 172 98,3 100,0
Missing 9 3 1,7
Total 175 100,0
Graphique de fréquences : Variable Consommation

(ENCG) - EL JADIDA
2. Mesures de position centrale
Les tris à plats terminé, il convient de résumer l’information. Ce sont les indicateurs de
tendance centrale qui sont utilisés dans ce cas. Comme mesure de tendance centrale, ce sera
le mode, la médiane ou la moyenne.
Mode (Mo) : C’est la valeur la plus fréquente. Certaines données peuvent être
bimodales
Médiane (Me) : c’est la moyenne de position. Le nombre d’observations inférieures à
la médiane est égal au nombre d’informations supérieures à la médiane. La médiane
divise la distribution en deux nombres égaux d’observations
Moyenne (x): c’est la somme des réponses divisée par le nombre de réponses
NB : Pour une courbe normale, les trois valeurs sont identiques et centrées sur la courbe

(ENCG) - EL JADIDA
 Mesures de position centrale en fonction du type d’échelle utilisé
Échelle Mesure de tendance centrale
Nominale Mode
Ordinale Médiane, mode
D’intervalles Moyenne, médiane
De proportions (rapport, ratio) Moyenne, médiane
 Problèmes avec la moyenne
Statistique très affectée par les valeurs extrêmes
Souvent peu de réponses, voire aucune, près de la moyenne (grands écarts types)
Ceci nous amène à conclure que la moyenne, indicateur de tendance centrale, est insuffisante
pour décrire une série statistique, puisqu’elle peut masquer des situations différentes, et
conduire à des interprétations erronées. Il faut donc compléter cette information par
l’observation et l’interprétation de la répartition autour de la moyenne. C’est la notion de
dispersion, que nous allons aborder dans le point suivant.

(ENCG) - EL JADIDA
3. Mesures de dispersion
Différentes mesure de dispersion peuvent être utilisées. Cependant il existe deux mesures
courantes de dispersion à savoir :
Écart type (S) : c’est la mesure de dispersion autour de la moyenne. La mesure la plus
utilisée.
Variance est la moyenne des carrés des écarts par rapport à la moyenne. Elle donne une
connaissance de l’écart entre chaque point et la moyenne.
Écart type est la racine carrée de la variance
Écart (ou étendue) : c’est la différence entre les valeurs maximale et minimale (deux
valeurs extrêmes)
 Relation entre l’écart type et la courbe normale

(ENCG) - EL JADIDA
4. Mesures de formes
On distingue généralement deux catégories de mesures de forme : les mesures d'asymétrie et

les mesures d'aplatissement. Elles permettent d’évaluer le degré de normalité de la
distribution des observations.
Symétrie (skewness) :
Mesure indiquant que les déviations par rapport à la moyenne sont plus importantes dans une
direction, à gauche (si valeur positive), ou à droite (si valeur négative)
Symétrie d’une distribution normale = 0
 Symétrie de la distribution
On distingue trois types de distributions selon qu'elles sont dissymétriques (asymétriques) à

gauche, symétriques ou dissymétriques (asymétriques) à droite
Aplatissement (kurtosis) :
Mesure indiquant que la courbe de la distribution de fréquence est plus plate (si valeur
négative), ou moins plate (si valeur positive), par rapport à une courbe normale
Aplatissement d’une distribution normale = 0

(ENCG) - EL JADIDA
 Aplatissement de la distribution
 La courbe de la variable Consommation est-elle normale?

(ENCG) - EL JADIDA
Statistiques de la variable Consommation
 La courbe de la variable Âge est-elle normale?

(ENCG) - EL JADIDA
Statistiques de la variable Age

CH 6 Analyse Des Données

Transféré par

Informations du document

Titre original

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

CH 6 Analyse Des Données

Transféré par

Droits d'auteur :

Formats disponibles

UNIVERSITÉ CHOUAÏB DOUKKALI

École Nationale de Commerce et de Gestion

Professeur : H. El Bayed Sakalli

Etude de marché, H. EL BAYED SAKALLI Page 1

Des tableaux de distribution de fréquences, réalisés pour chaque question, présentent

Les tabulations simples permettent de détecter les erreurs éventuelles d’enregistrement de

Les tabulations permettent de vérifier le caractère représentatif de l’échantillon interrogé. Il suffit de

Les tabulations simples montrent la structure de la distribution des réponses et permettent de

La distribution de fréquences permet de détecter la structure de la distribution et notamment de

Tableau de fréquences : Variable Consommation

Graphique de fréquences : Variable Consommation

Etude de marché, H. EL BAYED SAKALLI Page 3

2. Mesures de position centrale

Etude de marché, H. EL BAYED SAKALLI Page 4

 Mesures de position centrale en fonction du type d’échelle utilisé

Échelle Mesure de tendance centrale

Ordinale Médiane, mode

D’intervalles Moyenne, médiane

De proportions (rapport, ratio) Moyenne, médiane

 Problèmes avec la moyenne

Statistique très affectée par les valeurs extrêmes

Etude de marché, H. EL BAYED SAKALLI Page 5

Écart type est la racine carrée de la variance

 Relation entre l’écart type et la courbe normale

Etude de marché, H. EL BAYED SAKALLI Page 6

On distingue généralement deux catégories de mesures de forme : les mesures d'asymétrie et

Symétrie d’une distribution normale = 0

On distingue trois types de distributions selon qu'elles sont dissymétriques (asymétriques) à

Aplatissement d’une distribution normale = 0

 La courbe de la variable Consommation est-elle normale?

Etude de marché, H. EL BAYED SAKALLI Page 8

Statistiques de la variable Consommation

 La courbe de la variable Âge est-elle normale?

Etude de marché, H. EL BAYED SAKALLI Page 9

Statistiques de la variable Age

Etude de marché, H. EL BAYED SAKALLI Page 10

Vous aimerez peut-être aussi