Vous êtes sur la page 1sur 176

Etude de Marché

Cours réalisé par: Mme Meriem OUDMANE

Semestre 6
Année universitaire: 202O/2021
1
Chapitre introductif

2
Le marché : Définition

• Un marché est un système d'échanges commerciaux ou financiers. Concrètement, ce


sont des individus ou des organisations susceptibles de demander un produit ou un
service sur un territoire donné.
➢Pour qu'un marché fonctionne, un certain nombre de conditions doivent être réunies.

Conditions de fonctionnement d’un marché

L’information
Demandeurs Offreurs Lieu et temps réciproque

3
Conditions de fonctionnements

➢Il faut des personnes, des entreprises ou des organismes qui manifestent des
besoins ou des envies solvables : les demandeurs.
➢Sur ce marché doivent figurer des produits ou des services adaptés aux besoins
ou envies des personnes qui les manifestent : ce sont les offreurs qui répondent à
de tels besoins ou parfois les suscitent.
➢ Les biens ou services, objets de l'échange marchand, doivent être livrés à une
date précise à un lieu précis. Ces règles de lieu et de temps doivent être
respectées
➢Une information réciproque entre demandeurs et offreurs s'impose également.
Information des demandeurs sur les produits ou services existants et sur leurs
conditions d'acquisition, information des offreurs sur les besoins des demandeurs
et leurs possibilités de paiement.

4
Objectifs d’une étude de marché

Pourquoi donc concevoir une étude de marché ?


Mieux connaitre
les clients/
besoins
• L’entreprise doit être rentable.

➢ Il faut donc avoir, au moyen d'une Base des


Etudier la
éléments
étude préalable, une bonne concurrence et
financiers
l’environnement
connaissance de la clientèle, de ses prévisionnels
besoins, de la concurrence, et de leur
évolution
➢ Il y ‘a toujours un intérêt à vérifier
Base de la
et compléter l’information dont stratégie/ du Maximiser
dispose l’entreprise plan l’impact social
opérationnel
5
L’étude de marché: définition

• Une démarche systématique et scientifique de collecte, traitement et


interprétation des informations, qui a pour objectif principal de réduire les
incertitudes et de minimiser les risques.

➢ Elle permet de vérifier s' il existe un marché et une demande potentielle, à


partir du plus grand nombre possible de sources.
➢ Elle contribue, de diminuer les risques de démarrage en apportant la preuve
de la validité du projet
➢Elle permet également d'estimer le chiffre d'affaires prévisionnel, qui lui-même
permettra de valider la faisabilité du projet

6
L’étude de marché: définition

• L’étude de marché est donc avant tout ,un processus, une démarche
rationnelle qui permet d'examiner des problèmes à résoudre, et
d'obtenir des réponses précises à partir d'investigations.

Apporter des
Poser des réponses en vue de
Analyser/examiner
questionnements prendre des
décisions optimales

7
L’étude de marché: définition

Plusieurs aspects peuvent être considérés:

L’avis La synthèse de ces informations


d’experts sera une aide à la décision
L’étude des modes reconnus dans
de leur domaine
L’étude de la
concurrence consommation/
L’étude des besoins de
données consommateurs
socioécono potentiels
miques de
l’environne
ment

8
L’étude de marché: Une approche globale

• Une entreprise désireuse de réaliser une étude de marché devra prêter attention au marché
global (recouvrant à la fois des notions de micro-environnement mais aussi de macro-
environnement), afin d'obtenir une vue plus large de son marché.

9
La place pour l'étude de marché dans le business plan

• Un business model, appelé également modèle


Définition d’un économique ou modèle d’affaires, décrit
business Plan précisément comment l’entreprise va gagner de
Chiffrage de ce
l'argent. En pratique, cela revient à définir ce
business Model qu’elle allez vendre, auprès de quels clients, dans
quel but, de quelle manière et pour quel bénéfice.
Définition d’un
business Model • Un Business Plan c'est un document écrit,
synthétique et prospectif qui présente votre projet
Réalisation d’une
étude de marché
• Le business model est la façon dont l'entreprise
génère son profit, tandis que le business plan
Idée de ou plan d'affaires est un document présentant la
départ/Une stratégie de l'entreprise et ses implications
question financières pour les années à venir.

10
Quelques fiascos dus à l’absence d’études

• Deux créations d’Apple furent des échecs notoires:

• Macintosh portable: Lancé en 1989, son retrait intervient deux ans plus tard. Il coûtait 6
500 dollars et pesait plus de 7 kg.

• Macintosh TV. Premier Macintosh à tuner TV intégré, véritable hybride qui mêlait un
téléviseur Sony Trinitron et un Apple Performa 520, il fut lancé en 1993. Il permettait de
regarder la télévision, mais on ne pouvait pas l’utiliser en même temps en tant
qu’ordinateur. Il était peu évolutif et peu puissant. Produit à 10 000 exemplaires, il
disparut six mois plus tard
➢ Une véritable méconnaissance des attentes des consommateurs

11
La démarche méthodologique

- Une fois la définition du concept d'étude de Quantifier


marché précisée, il est important de décrire le
protocole d'une étude de marché.
Stratégie et plan
-L’étude documentaire, encore appelée desk opérationnel
research, permet de recueillir des informations Cerner
sur le marché du produit ou du service quel'
entreprise désire lancer
Etude
-L’étude qualitative, qui permet, en se Etude quantitative
rapprochant du terrain, de comprendre les qualitative
Etude
freins et les motivations des consommateurs
documentaire
vis à-vis du produit ou du service quel'
entreprise souhaite lancer Idée Comprendre

-L'étude quantitative, a pour but d'obtenir des


informations plus précises et surtout
quantifiées.
12
De l’émergence du problème à la détermination de l’idée de l’étude

• Un problème surgit généralement quand par exemple un manager est confronté à une décision
incertaine.
• L’incertitude existe lorsque celui-ci envisage plusieurs solutions ou événements sans pouvoir
déterminer lequel est préférable.
• Or la valeur ajoutée de l’étude de marché est la réduction de l’incertitude du décideur par la
production d’informations utilisables pour résoudre un problème spécifique.

13
De l’émergence du problème à la détermination de l’idée de l’étude

• Les renseignements fournis permettent d’évaluer les risques associés à chaque solution, par
exemple :
• « Quels sont les risques d’échec respectifs d’un lancement de produit effectué avec l’emballage A,
B ou C ? »
• « Quel prix retenir pour le lancement : 1 DH,1,5 DH ou 2DH? »

➢ Dans cette perspective, un des critères d’appréciation de l’efficacité d’une étude réside dans
sa capacité à orienter le manager vers les « bonnes » décisions

14
Exemples de question d’étude à analyser
Questions managériales initiales Questions d’étude envisageables

Quelle est l’efficacité de la campagne de publicité faite pour la – Comparer (toutes choses égales par ailleurs) les ventes
marque X avant et après la campagne de publicité.
– Estimer les scores de mémorisation et d’agrément selon les
médias.
Quel est le marché potentiel d’un nouveau service de – Déterminer les meilleures cibles.
dépannage à domicile ? – Estimer les intentions d’achats.
Faut-il proposer le GPS en série ou en option sur une voiture Déterminer si cet avantage correspond à une attente
? déterminante.
– Mesurer les variations des intentions d’achat, dans chaque
cas, selon les scénarios de prix.
– Observer les choix des concurrents

Peut-on augmenter le prix du produit ? – Estimer les volumes de ventes avec un prix supérieur de 10
%.
– Évaluer l’impact sur l’image de marque.
– Comparer les prix des concurrents ayant un positionnement
proche

Faut-il distribuer le produit en grandes surfaces ou chez les -Mesurer l’image de chaque canal et comparer avec le
distributeurs spécialisés ? positionnement voulu.
– Étudier les prix publics et la présence des marques dans
chaque canal.
15
Etude documentaire
• Recenser l’ensemble des personnes et organismes clés du
secteur d’activité ciblé
• Obtenir un maximum d’informations et d’études réalisées sur
le marché

• COMMENT ?

Collecter OBJECTIF PRINCIPAL

Prendre connaissance des informations


existantes, les structurer et les intégrer

Traiter/analy Structurer
ser

16
L’approche qualitative

• Dans l'approche qualitative d'investigation, l’analyste part d'une situation


concrète comportant un phénomène particulier intéressant et ambitionne de
comprendre le phénomène et non de démontrer, de prouver, de contrôler quoi
que ce soit
• L'intention (but, objectif) est donc de reconnaître, de nommer, de découvrir,
de décrire les variables et les relations découvertes, et par-là, de comprendre
une réalité d’un phénomène donnée
• La recherche qualitative recourt à des techniques de recherche qualitatives
pour étudier des faits particuliers (étude de cas, observation, analyse
qualitative de contenu, entretien semi-structuré ou non structuré, etc).
L’approche quantitative

• L'approche quantitative d'investigation vise à recueillir des données observables


et quantifiables. Elle se fonde sur l'observation des faits, des événements, des
conduites, des phénomènes existants indépendamment du chercheur.
• La recherche vise ici à décrire, à expliquer, à contrôler, à prédire.
• La recherche quantitative s'appuie sur des instruments ou techniques de
recherche quantitatives de collecte des données dont en principe la fidélité et la
validité sont assurées.
• Elle aboutit à des données chiffrées qui permettent de faire des analyses
descriptives, des tableaux et graphiques, des analyses statistiques de recherche de
liens entre les variables ou facteurs, des analyses de corrélation ou d'association

18
L’enquête

• L’enquête par questionnaire est un outil méthodologique


d’observation qui comprend un ensemble de questions s’enchaînant
de manière structurée et logique.
• Ce type d’enquête vise à obtenir des données
statistiques quantifiables et comparables sur une population précise.
Pour cela, le questionnaire est administré à un échantillon
représentatif de la population visée.

19
Définitions et concepts fondamentaux : l’échantillon
• Une population est un ensemble, fini ou non, d 'éléments que l'on souhaite étudier. Ces éléments portent
le nom d' individus ou d’ unités statistiques. II peut s'agir par exemple d 'êtres humains (adultes, enfants,
chômeurs, salariés, etc.), d’ animaux ou encore d 'objets (entreprises, voitures, ordinateurs, incendies,
accidents, etc.).
Restreindre l’étude

l'échantillonnage
aléatoire simple

• Un échantillon est ainsi un sous-ensemble de l'échantillonnage


Méthode des
la population considérée qui doit posséder « en boule de
quotas
les mêmes caractéristiques statistiques que la neige »
population dont il est issu.

• À partir d' un échantillon dit représentatif, il


est alors possible d'effectuer des analyses et
l'échantillonnage Méthode des
d’en déduire des conclusions valables pour la stratifié itinéraire
population.
20
La démarche de construction d’un questionnaire
• L’élaboration et l’administration d’un questionnaire permet d’étudier des comportements (acheter ou non des
actions d’une entreprise privatisée), des opinions (opinions sur une campagne publicitaire réalisée par telle
banque), des attitudes (attitudes vis-à-vis de l’argent), des intentions (intention ou non d’épargner) et sur les
caractéristiques ou identité de la personne interrogée (sexe, âge...).
• La démarche de construction d’un questionnaire comprend quatre phases :

Définir le type de
questions à poser
Répertorier les
et leur forme
éléments réaliser le prétest Evaluer la fiabilité
(question ouverte,
d’informations du questionnaire du test
fermée...), leur
souhaités
nombre et l’ordre
des questions

21
Méthode d’administration du questionnaire
• La méthode ou le mode d'administration est la méthode selon laquelle un questionnaire
d'étude est soumis aux individus faisant partie de l'échantillon pour être complété.
• L'administration d'un questionnaire peut se faire en face à face avec :

Face à face

Par
Par
téléphon
internet
e

Par voie postale

22
Analyse de données

• Analyses univariées :

o Statistiques descriptives a une variable


• Analyses bivariées :

o Croisement des variables

o Indicateurs de liaison : coefficient de corrélation, test de Khi 2, analyse de la


variance ANOVA/MANOVA

• Analyses multivariées
o Plus généralement elles concernent les modélisations économétrique: Une variable a
expliquer en fonction de plusieurs variables explicatives
Résultats

Pertinents/ répondent à
la problématique

Issus d’une exploitation Correctement lus et


optimale des données interprétés
Etudes exploratoires « Documentaire et
qualitatives »

25
Étude de marché

• On fait des études de marché pour guider les prises de décision et pour réduire les risques.
Les études de marché sont une condition nécessaire à de bonnes décisions au sein de l’entreprise.

Pour anticiper et
intégrer les évolutions
Pour concevoir et Pour mener des
Pour affronter les du
conduire une projets de
attaques de la macroenvironnement
politique marketing er développements
concurrence qui auront un impact
commerciale réalistes
sur l’offre et la
demande

Une entreprise a besoin d’un ensemble d’informations sur ses marchés

26
Étude de marché

• Il est certes possible de se lancer sans aucune étude, sur la base d’une conviction
ou d’une intuition

Mais on accroît par là considérablement le risque d’échec car on se fonde sur


des hypothèses non validées ou sur des préconceptions (sur la taille du marché, les
besoins des clients, la valeur perçue apportée par l’offre…) qui peuvent se révéler
fausse

27
La démarche méthodologique

- Une fois la définition du concept d'étude de Quantifier


marché précisée, il est important de décrire le
protocole d'une étude de marché.
Stratégie et plan
-L’étude documentaire, encore appelée desk opérationnel
research, permet de recueillir des informations Cerner
sur le marché du produit ou du service que l'
entreprise désire lancer
Etude
-L’étude qualitative, qui permet, en se Etude quantitative
rapprochant du terrain, de comprendre les qualitative
Etude
freins et les motivations des consommateurs
documentaire
vis à-vis du produit ou du service qu l'
entreprise souhaite lancer Idée ou Comprendre
questions
-L'étude quantitative, a pour but d'obtenir des de départ
informations plus précises et surtout
quantifiées.
28
Les études dites exploratoires : études documentaires et qualitatives

• On parle d’enquêtes « exploratoires » pour les études documentaires et


qualitatives qui n’ont pas vocation à donner des résultats représentatifs, mais à
éclairer la complexité d’un sujet, à en montrer les différents aspects.

• Les études exploratoires précèdent généralement les études quantitatives : elles


aident à construire des hypothèses que des études quantitatives permettent
ensuite de valider et de quantifier.

29
Exemple

• Une étude qualitative auprès des clients d’un distributeur permet d’esquisser une
typologie de clients, c’est-à-dire d’identifier des groupes de clients qui ont des
attentes similaires.
• Une étude quantitative peut quantifier ces types de clients pour mesurer leurs
poids dans la fréquentation et de la identifier le chiffre d’affaires de l’enseigne.

30
Nature et complémentarité des études exploratoires et quantitatives

31
Les études documentaires

• Les études documentaires consistent à sélectionner, synthétiser et analyser des informations


secondaires qui, par définition, n’ont pas été produites pour les besoins de l’étude. Ce type
d’études a l’avantage d’être relativement rapide à mener si on s’appuie sur des données facilement
accessibles, et il est peu onéreux si elles sont publiques.

Aujourd’hui, l’explosion des informations disponibles sur Internet (archives des journaux, sites
d’entreprise, bases de données, etc.) a grandement facilité l’accès aux informations secondaires, ce
qui rend les études documentaires particulièrement attrayantes

32
Les études documentaires: Existence de certains biais

Toutefois, les données secondaires sur lesquelles s’appuient les études documentaires ne sont pas
nécessairement fiables : des biais apparaissent souvent quand les études sont réalisées par des
organismes qui cherchent à défendre des positions ou des intérêts propres (il est rare que des
organismes professionnels publient des études qui contredisent leurs positions et leurs intérêts !)

33
Les études documentaires: les sources d’information

Sources d’information

Externes
Internes « Elles sont offline ou online, la plupart de ces sources ayant
désormais une version en ligne »

-Les sites de la concurrence : ils fournissent souvent des


-Comptes clients : répartition des clients, typologie des
informations intéressantes mais les entreprises apprennent
clients, type et quantité des produits achetés, lieu d’achat,
à être de plus en plus prudentes.
évolution des achats, indicateurs de fidélité, etc.
-Les bases de données : certaines sont payantes, d’autres,
-Données de ventes : chiffre d’affaires, évolution,
d’origine publique, sont gratuites. Les bibliothèques
répartition par produits, par zone géographique, par réseau
peuvent donner accès à de nombreuses bases de données
de distribution, etc.
spécialisées.
-La presse : son accès a été grandement facilité par la mise
-Sources diverses : rapports des commerciaux, lettres de
en ligne de ses contenus, l’accès aux archives nécessitant
réclamation, données de trafic sur le site Web, études
souvent un abonnement
antérieures, interventions du service après vente, etc
34
Etude documentaire: base de données

35
Etude documentaire: base de données
Exemple: base de électronique de Cairn

36
Les études qualitatives ou « études en profondeur »

• Les études qualitatives, appelées aussi « études non directives », « études en profondeur »
ou « études de motivations », cherchent à mieux comprendre le comportement de publics
cibles et ses raisons, c’est-à-dire les usages mais aussi les attitudes, les motivations, les
besoins, les opinions.

• Elles se distinguent des études quantitatives (enquêtes classiques par questionnaire) par la
complexité plus grande de leurs méthodes, inspirées des techniques de la psychologie
appliquée, au détriment de la représentativité de leurs résultats

37
Exemple

• Si l’on demande à un automobiliste : « Pourquoi avez-vous acheté une Audi TT ? », il invoquera


sans doute le confort, l’esthétique, la sécurité ou la robustesse de ce modèle, mais pas le désir
d’impressionner son entourage, le plaisir de laisser sur place les autres automobilistes, ni
l’influence possible de la publicité ou d’un représentant habile, parce que ce sont autant de
motivations qu’il ne voudrait pas (s’) avouer.
• C’est pourquoi, lorsqu’on veut découvrir les attitudes et motivations profondes des clients,
lorsqu’on cherche des « insights consommateur », il faut faire appel à des méthodes différentes
du questionnaire classique.

38
Les techniques des études qualitatives

39
Les techniques des études qualitatives

TAF : Trois travaux à synthétiser

40
Etude quantitative

41
L’étude quantitative

• L’étude quantitative d'investigation vise à recueillir des données observables et


quantifiables. Elle se fonde sur l'observation des faits, des événements, des
conduites, des phénomènes existants indépendamment du chercheur.
• La recherche vise ici à décrire, à expliquer, à contrôler, à prédire.
• La recherche quantitative s'appuie sur des instruments ou techniques de
recherche quantitatives de collecte des données dont en principe la fidélité et
la validité sont assurées.
• Elle aboutit à des données chiffrées qui permettent de faire des analyses
descriptives, des tableaux et graphiques, des analyses statistiques de recherche
de liens entre les variables ou facteurs, des analyses de corrélation ou
d'association
42
L’enquête

• L’enquête par questionnaire est un outil méthodologique


d’observation qui comprend un ensemble de questions s’enchaînant
de manière structurée et logique.
• Ce type d’enquête vise à obtenir des données
statistiques quantifiables et comparables sur une population précise.
Pour cela, le questionnaire est administré à un échantillon
représentatif de la population visée.

43
Construction d’un questionnaire

44
Qu’est ce qu’un questionnaire ?

• Le questionnaire est l’une des trois grandes méthodes pour étudier un phénomène
donné. C’est une méthode de recueil des informations en vue de comprendre et
d’expliquer les faits. Les deux autres méthodes les plus couramment utilisées étant
l’entretien et l’observation.
• C’est une méthode quantitative qui s’applique à un ensemble (échantillon).

✓ C’est le nombre d’éléments de l’ensemble qui assure au questionnaire sa validité et qui


permet aux informations obtenues d’être jugées dignes de confiance. À l’inverse, dans une
observation ou un entretien, c’est la qualité qui est le critère de pertinence

45
Le questionnaire
• L’élaboration et l’administration d’un questionnaire permet d’étudier des comportements (acheter
ou non des un produit ou un service ), des opinions (opinions sur une campagne publicitaire
réalisée par telle banque), des attitudes (attitudes vis-à-vis de l’argent), des intentions (intention ou
non d’épargner) et sur les caractéristiques ou identité de la personne interrogée (sexe, âge...).
• La démarche de construction d’un questionnaire comprend quatre phases :

Définir le type de
questions à poser
Répertorier les
et leur forme Evaluer la validité
éléments réaliser le prétest
(question ouverte, des échelles de
d’informations du questionnaire
fermée...), leur mesures
souhaités
nombre et l’ordre
des questions

46
I-Analyse du problème étudié

47
I-Analyse du problème étudié

• Dans une première étape, il convient de réaliser une analyse précise du


phénomène étudié (opinions, intentions, comportements, attitudes) avant
d’élaborer les questions.

• Les questionnaires peuvent servir dans un but exploratoire à décrire des


nouvelles attitudes, de nouveaux comportements mais ils sont également
utilisés pour valider des hypothèses.

48
II-La Nature des questions

49
II-Nature des questions

• Dans une seconde étape il convient de définir les questions à poser et la forme qu’elles doivent
prendre.
• Il convient notamment de se demander si la question est strictement nécessaire, si une seule question
suffit à obtenir l’information recherchée et si l’interlocuteur voudra et pourra répondre à celles-ci.
• Il convient, lors de la formulation des questions, d’éviter l’emploi de termes mal définis (la réponse
doit être sans ambiguïté pour éviter qu’une même réponse recouvre des idées différentes), de termes
trop techniques (qu’il convient alors de définir ou d’illustrer par un exemple), de questions complexes
ou suggérant la réponse.

50
Nature des questions : La forme des questions

▪ Ce type de questions est à privilégier Questions Questions


dans le cadre d’études où l’on dispose de
très peu d’éléments d’informations sur le
Ouvertes fermées
phénomène étudié ou que celui-ci est
difficilement mesurable.
Aucune réponse n’est
préétablies. Elle Réponses sont
permet d’obtenir des préétablies
réponses spontanées
▪ Dans le cadre d’un entretien, la
personne se sent davantage valorisée par
ce type de question mais le traitement de
questions ouvertes se révèle souvent plus Le sondé effectue un
La personne
choix entre un
long. interrogée formule sa
nombre de réponses
propre réponse
prédéterminées

51
Exemple: Questions Ouvertes

52
Nature des questions: Les questions fermées

• Dans les questions fermées les réponses sont préétablies, il y a une liste
exhaustive, exclusive, catégorisée de réponses possibles.
• La standardisation des questions et des réponses possibles permet de réaliser
facilement de bons traitements statistiques.

53
Nature de questions: les avantages et les inconvénients des questions ouvertes/fermées

54
Les questions fermées

55
III-catégories des questions fermées

Les questions
dichotomiques: (
Parmi les questions fermées offrant une seule
on peux distinguer: alternative au
répondant)

Les questions
correspondant à Les questions à
des échelles choix simple ou
mesurant un multiple
phénomène

56
III-1La catégorie des questions fermées: les questions dichotomiques

• Ce type de question permet de scinder l’échantillon en deux sous-


échantillons (par ex: les hommes d’un côté, les femmes de l’autre) et offre
alors la possibilité des tests de comparaison (par ex: entre hommes et
femmes, ceux qui connaissent l’assurance auto et les autres)

57
III-1 La catégorie des questions fermées: les questions dichotomiques

• Ces questions n’offre qu’une seule alternative de réponse au sondé.

• À chaque question peut être associée une variable binaire prenant par exemple la valeur 1 si oui
ou 0 dans le cas contraire.
• Ce type de question sert à caractériser un comportement (Y = 1 si achat ou Y = 0 si non achat), une
identité (X = 1 si homme, X = 2 si femme)

58
III-2: La catégorie des questions fermées: la réponse nominale

• Dans ce type de question à


chaque réponse possible est
associé un chiffre mais
l’attribution de ce chiffre ne
correspond à aucune relation
d’ordre.

• La réponse peut être unique


comme dans la question 1 ou
multiple comme dans la
question 2

59
III-2: la catégorie des questions fermées: la réponse nominale

• Dans le cas de réponses nominales exclusives, il y a Agriculteur


une seule variable par question (comme question
1). Les éléments de statistique descriptive pouvant Artisan, commerçant et
10% 10% chef d'entreprise
être employés sont les diagrammes circulaires ou 9%
10% Cadre, profession libérale et
en barres, les tableaux avec les modalités et les intéllectuelle supérieure
fréquences relatives, le mode . 7%
Profession intermédiaire
2%
• Dans le cas de réponses nominales multiples
Employé
(question 2), il faut coder chaque réponse par une 14% 34%
variable binaire prenant la valeur 0 ou 1 si la 10% 4% Ouvrier
réponse est entourée et l’on retrouve les
traitements proposés pour les variables Retraité
dichotomiques.

60
III-3.Les échelles de notation

• Les échelles de notation traduisent l’intensité du jugement exprimé et sont souvent


utilisées pour mesurer les comportements, attitudes et phénomènes cognitifs. On
distingue:
• L’échelle dite verbale lorsque toutes les catégories de réponses sont repérées par des
mots.

• L’échelle dite numérique lorsque toutes les catégories de réponses sont repérées par
des chiffres

61
III-4. Les questions semi fermées
Caractéristiques:
• • Elles comportent des réponses proposées et offrent la
possibilité d’ajouter des réponses libres. -Utiles quand on ne maitrise
qu’une partie du champ des
Ex : Pourquoi suivez-vous cet enseignement ? réponses possibles.
1-Parce qu’il m’est imposé dans un programme de cours
– Permettent de diminuer les
2-Parce qu’il constitue un préalable `a d’autres
enseignements que je souhaite suivre non-réponses pour absence
3-Parce que le sujet m’intéresse d’exhaustivité.
4-Parce qu’il me permet d’améliorer une formation
5-Parce qu’il me permettra d’avoir une promotion dans ma
profession
• Autres raisons à préciser: . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
...................................................
...............................

62
III-ORDRE DES QUESTIONS ET PRÉ-TEST

63
Ordre des questions et prétest: « Effets de halo»/ « effets de contamination »

• Le questionnaire doit commencer par des questions générales (relativement faciles) et


progresser vers des questions plus précises et difficiles. Il convient lorsque l’on formule les
questions d’éviter les « effets de halo » et de « contamination ».

• L’effet de halo correspond à la situation où la personne interrogée a tendance à répondre


toujours de la même manière lorsque plusieurs questions sont posées sous formes d’échelles
orientées dans le même sens. Pour éviter ce biais il est judicieux de changer de temps en
temps le sens des échelles.
• Il y a effet de contamination lorsqu’une réponse à une question influence la réponse à une
autre question.

64
Ordre des questions et prétest: « Effets de halo»/ « effets de contamination »

Exemple

• Il est possible de poser des questions filtres qui


permettent de détecter les personnes qui sont
concernées par un ensemble de questions
(parce que par exemple, elles ont acheté le
produit ou le service pour lequel on souhaite
savoir sa satisfaction) et qui vont pouvoir
répondre aux questions suivantes et d’autres
qui ne sont pas concernées (exemple : elles
n’ont pas acheté le produit

65
Règles et consignes

66
Formulation des questions

• Il est bon d’anticiper les possibilités de non-réponses. En particulier, il faut


prévoir, explicitement ou non, la possibilité de dire ”je ne sais pas”, ”je suis
sans opinion” ou ”je refuse de répondre”. Attention cependant `a la tentation
de se réfugier dans ces rubriques.
• Le choix des mots utilisés dans une question et sa formulation sont
importants

67
Agencement du questionnaire

a) Introduction et demande de collaboration


Transparence de l’origine de l’enquête et des objectifs.
b) Renseignements d’identification
Nom, adresse, sexe, ...
c) Premières questions
Questions générales et simples, faciles à répondre . Il ne faut pas rebuter la personne interrogée et lui faire renoncer `a
continuer.

d) Enchainement des questions


1) Rassembler les questions par théme.
2) Les premi`eres questions d’un thème doivent être suffisamment larges pour que l’on soit certain que la population vis´ee soit
incluse dans ce premier ensemble. Ensuite, par une série de questions plus précises, on definit une partition de ce dernier et
on delimite´ précisément la cible.
3) Intercaler entre les questions difficiles des questions plus faciles, dites questions ”de repos”.
4) Veiller `ala cohérence, aux liaisons entre thèmes, aux redondances, aux contrôles.
5) Faire attention à la longeur du questionnaire 68
Formulation des questions

Il existe quelques consignes générales à respecter :

• Une question ne doit contenir qu’une et une seule idée.


• Elle doit être simple (utiliser des mots simples du langage courant parlé).
• Elle doit être claire et précise (choisir des mots qui ont une seule signification et qui ne peuvent être mal
interprètes par l’enquêté).
• Elle doit être courte et directe (craindre les négations et surtout ne pas utiliser de doubles négations).
• Elle doit être lue (ou entendue) facilement.
• Elle ne doit pas suggérer une réponse particulière.
• Elle ne doit pas comporter d’éléments d’émotivité.
• Les questions ne doivent pas - dans la mesure du possible - contribuer à la production de non-réponses
(manque d’exhaustivité, questions d´délicates, . . . )

69
Vérifier l’intégrité de chaque question

70
Ordre des questions et prétest

• Dans une dernière étape le pré-test du questionnaire auprès d’un


petit échantillon permet de vérifier le degré de compréhension des
questions, l’absence de biais et conduit à la rédaction finale du
questionnaire

71
IV- La validation d’une échelle de mesure

72
Introduction
Les concepts sont mesurés avec plusieurs questions ou items. Lors d’une étude, nous
distinguons deux types de variables

Variable Manifeste Variable latente

Une variable manifeste est une


variable ou un facteur qui peut être Une variable latente (dimension
directement mesuré ou observé. théorique) n'est pas (par définition)
observable directement. Elle est
Elle peut être directement étudiée appréhendée ou estimée à travers
par un chercheur ou un statisticien un ensemble d'observations
lorsqu'elle est représentée dans un indicateur qui vont la représenter.
diagramme

Une variable manifeste est l'opposé


Pour définir une variable latente, on
d'une variable latente, qui est un
utilise ce qu'on appelle un modèle
attribut masqué et qui ne peut donc
de mesure
pas être observé directement

73
Variables Manifestes versus Variables latentes:
Exemples

Sexe intention

Age
Variable Niveau
attitude
Variable Motivation
éducation
Manifeste latente

Salaire Risque

74
Variables latentes
• Exemple : Pour mesure l’innovativité du consommateur relative à une catégorie de
produits donnée, le chargé d’étude pose plusieurs questions :
Figure: échelle de l’innovativité appliquée au Cinéma

Plus un individu aura un score élevé, plus il pourra être considéré


75
comme un innovateur en matière de cinéma.
La problématique de la validation de la mesure
• La validation des échelles de mesure est une condition nécessaire de la qualité
des résultats de la recherche.
• Elle se décline en deux principales préoccupations:
Deux principes de Validation
d’une échelle de mesure :
Mesure t-on ce que l’on
entend de mesurer ?

I – La validité d’une échelle


Préoccupations
de mesure
La mesure obtenue est
elle de qualité ? II- la fiabilité d’une échelle
de mesure

76
La problématique de la validation de la mesure
• La fiabilité (ou fidélité) est vérifiée lorsque, utilisé plusieurs fois dans les
mêmes conditions, un instrument donne les mêmes résultats.
• La validité est bonne lorsqu’un instrument mesure vraiment le
phénomène que l’on cherche à mesurer.
• La fiabilité et la validité peuvent être affectées par nombreuses sources
d’erreurs pouvant être regroupées en deux grande catégories :

Les erreurs Les erreurs


aléatoires systématiques

77
Les types d’erreurs affectant la fiabilité et la viabilité d’une mesure

• L’erreur aléatoire est due à des problèmes de fiabilité et survient


lorsque le phénomène étudié connaît des aléas comme les facteurs
situationnels, l’humeur des répondants ou des variations dans les
conditions de collecte des données.

• L’erreur systématique se produit lorsque l’outil de mesure utilisé a un


écart systématique avec le phénomène étudié ; elle affecte
directement la validité des mesures.

78
La démarche méthodologique pour développer des échelles de mesure

Le paradigme de churchill ( 1979)

Churchill (1979) a proposé une méthodologie


de construction et/ou de validation des échelles
de mesure connue sous le nom de Paradigme
de Churchill (figure 2).

Cette méthodologie dont la finalité est de


systématiser la procédure de développement et
d’étude de la fiabilité et de la validité des outils
de mesure préconise de mener une revue de la
littérature approfondie sur le construit étudié,
de procéder à des études qualitatives pour en
explorer le domaine, puis de recourir à une
batterie de tests statistiques pour établir la
fiabilité et la validité de l’échelle
psychométrique construite.
Cette démarche s’applique uniquement dans le cas où il s’agit
de développer une échelle multi-items
79
I- La validité d’une échelle de mesure

• La validité d’une échelle de mesure désigne sa capacité à appréhender un


phénomène (Hair et al., 2006). Les tests de validité ont pour objectif de vérifier si
les différents items d’un instrument sont une bonne représentation du
phénomène étudié : mesure-t-on ce que l’on cherche à mesurer? (Evrard et al.,
2003).

La validité
La validité du trait
faciale ou du
construit

80
La validité faciale ou du contenu

• Il s’agit de savoir si la mesure capture les différents aspects du


phénomène étudié. Elle est fondée sur le jugement du chercheur et
de ses pairs.
• Par exemple: lors du test du questionnaire, des experts du domaine
peuvent émettre un avis sur la capacité des items à recouvrir tous les
aspects d’un concept

81
la validité de trait ou de construit :

• Il s’agit ici de savoir si les différents indicateurs offrent une bonne


représentation du phénomène étudié ?
• Il faut vérifier si les indicateurs censés mesurer le même phénomène
sont corrélés (validité convergente) et s'ils se distinguent des
indicateurs censés mesurer des phénomènes différents (validité
discriminante) (Evrard et al., 2003).

L’analyse factorielle exploratoire (AFE) permet de


tester ces deux validités
82
II- La fiabilité d’une échelle de mesure
• La fiabilité correspond au degré avec lequel les instruments utilisés mesurent de
façon constante le construit étudié (Evrard et al., 2003). Par conséquent, une
échelle est fidèle si l’on retrouve plusieurs fois les mêmes résultats sur les mêmes
sujets.
• Trois méthodes permettent de tester la fiabilité d’une mesure

La méthode
La méthode La technique
du « Split half
du « des formes
», ou des deux
test/retest » alternatives
moitiés

83
la méthode du « test/retest »

• la méthode du « test/retest » : le questionnaire est administré deux


fois à la même population et les résultats obtenus sont comparés.
Cette technique est particulièrement appropriée pour la mise au
point d’instrument de mesure.

84
2Méthode du test/retest: Exemple

85
La méthode du « Split half »

• La méthode du « Split half », ou des deux moitiés : le questionnaire


est administré au même moment à des échantillons différents
(l’échantillon est scindé en deux) et les résultats sont comparés. Il
existe cependant un risque de sélection, les deux échantillons sont-ils
appariés?

86
La technique des formes alternatives :

• il s’agit d’introduire dans le questionnaire plusieurs questions sur le même phénomène mais
formulées différemment. Le questionnaire est administré aux mêmes individus. Le coefficient
alpha de Cronbach est calculé pour vérifier si les énoncés partagent des notions communes, et
s’ils sont en cohérence entre eux

• La valeur du coefficient α est comprise entre 0 et 1. Plus la valeur du coefficient α est proche de 1,
plus les items qui composent l’énoncé sont corrélés entre eux.

• Lorsque la valeur de α est proche de 1 on dira qu’il existe une bonne cohérence interne entre ces
items qui participent à expliquer le même phénomène

87
III-L ’analyse Factorielle

• L’analyse factorielle sert à identifier les dimensions de la structure et à


déterminer dans quelle mesure chaque variable peut expliquer chaque
dimension. Les deux objectifs de l’analyse factorielle sont :

• Résumer les données. L’analyse factorielle fait ressortir les dimensions sous-
jacentes qui, une fois interprétées, décrivent les données de manière
synthétique.
• Réduire les données. Elle calcule des scores pour chaque dimension et les
substitue aux variables originelles.

88
Exemple

89
Exemple

90
Les conditions et options de l’analyse factorielle

La taille de l’échantillon

La rotations L’adéquation
des facteurs des données

L’extraction des facteurs

91
La taille de L'échantillon nécessaire

• La taille de l'échantillon dépend du nombre d'items soumis à l'AFE. Le nombre


total d'observations doit être d'au moins 50 et il est souhaitable d'interroger au
moins 100 individus.

92
L’adéquation des données

Avant de réaliser l'analyse, il est important de s'assurer que les données sont
factorisables. Elles doivent former un ensemble cohérent pour pouvoir y chercher
des dimensions communes qui aient un sens (Evrard et al., 2009).

Plusieurs indicateurs peuvent être utilisés, notamment:


• Le « Measure of Sampling Adequacy » (MSA) ou Kaiser- Meyer-Olkin (KMO) teste si
les corrélations partielles entre les variables ne sont pas trop faibles.
• Des valeurs de KMO comprises entre 0,3 et 0,7 représentent des solutions
factorielles tout juste acceptables. Il est préférable que le KMO dépasse le seuil de
0,7.

93
L’extraction des facteurs

• Il n’existe pas de base quantitative exacte pour déterminer le nombre de facteurs


à extraire. Les critères sont souvent choisis sur la part de variance de chaque item
qu’un facteur permet d’expliquer :
• l’« eigenvalue », ou valeurs propres > 1 ou règle de Kaiser-Guttman : une valeur propre
représente la quantité d’informations capturée par un facteur. Un facteur qui aurait une valeur
propre inférieure à 1 représenterait moins d’informations qu’un simple item.
• le critère du pourcentage de variance : il s’agit d’une approche par laquelle on observe les
pourcentages cumulés de la variance extraite par les facteurs successifs. L’objectif est de s’assurer qu’un facteur explique
une quantité significative de variance. Il est souvent conseillé d’arrêter l’extraction lorsque 50
% de la variance expliquée est extraite

94
La rotation des facteurs

• La rotation permet d'identifier des groupes de variables fortement liés les uns
aux autres. En faisant tourner le système d'axe, la rotation minimise la distance
entre les variables et les axes de telle sorte que chaque item initial ne soit
fortement corrélé qu'à un seul facteur.
• Lorsque les axes sont maintenus à 90 degrés, on parle de rotation orthogonale;
lorsque les axes ne sont pas contraints à être indépendants, c'est-à dire non
corrélés entre eux, on parle de rotation oblique.
• À noter que dans la solution factorielle obtenue sans rotation, les axes sont
orthogonaux, c'est-à-dire que les composantes principales partagent une
corrélation nulle.

95
Les méthodes de rotations des facteurs

Varimax : rotation orthogonale qui minimise le nombre de variables ayant


de fortes corrélations sur chaque facteur. Simplifie l’interprétation des
facteurs.
• Oblimin direct : rotation oblique, c’est-à-dire dans laquelle les axes se
positionnent en fonction des items et ne sont donc pas orthogonaux.
Quartimax : méthode qui minimise le nombre de facteurs requis pour
expliquer chaque variable. Simplifie l’interprétation des variables observées.
Equamax : méthode de rotation qui minimise à la fois le nombre de
variables qui pèsent fortement sur un facteur et le nombre de facteurs requis
pour expliquer une variable (combinaison des méthodes Varimax et
Quartimax).

96
Epuration d’une échelle de mesure se fait en deux temps

• La formation des facteurs repose sur le poids des variables initiales dans l'explication
de ces facteurs. Les « communalités » (part de variance des composantes expliquées
par l'item) doivent dépasser 0,5 et si possible 0,7.

• Une communalité de 0,5 signifie que 50 % de la variance de l'item est prise en


compte ou « expliquée» par les facteurs. Une valeur faible révèle que l'item n'est
pas suffisamment corrélé avec les autres.

• Le niveau des communalités est considéré comme moyen s'il est compris entre 0,40
et 0,65, bon s'il est compris entre 0,65 à 0,80 et excellent au-delà*.
• Il est d'usage d'éliminer les items de communalité inférieure à 0,5.
* (Evrard et al; 2009).
97
Epuration d’une échelle de mesure se fait en deux temps

Ensuite, il faut observer la matrice des composantes.


• Même si, en toute rigueur, la rotation n'est pas toujours nécessaire, elle améliore
et simplifie dans la quasi- totalité des cas la solution obtenue. Nous lirons donc en
priorité la matrice des composantes après rotation.
Deux critères doivent être considérés:
- Nous envisageons d'éliminer des items dont les coefficients structurels trop
faibles ou trop moyens < 0,6)
- Nous envisageons d'éliminer des items moyennement corrélés à plusieurs axes
à la fois, en pratique ceux qui ont des coefficients structurels supérieurs à 0,3 sur
plusieurs axes et qui ne sont pas fortement corrélés à un axe et un seul.

98
Exemple de l’échelle destinée à mesurer
l’ambition professionnelle

99
Exemple de l’échelle destinée à mesurer l’ambition
professionnelle
Dans cet exemple, nous testons l’échelle destinée à mesurer l’ambition professionnelle. Cette échelle
unidimensionnelle de 10 items est issue de la littérature. Les réponses aux questions sont collectées grâce à
une échelle de Likert à cinq échelons allant de « Pas du tout d’accord » à « Tout à fait d’accord »

Item 1 - J'aimerais avoir un poste plus important et que les autres m'envient.
Item 2 - J'aime bien discuter avec des gens importants.
Item 3 - Je veux être une personne importante dans la communauté.

Item 4 - Si j'avais suffisamment d'argent, je ne travaillerais plus.


Item 5 - Même si je gagnais beaucoup d'argent au jeu, je continuerais
à exercer mon métier.
Item 6 - Si je pouvais toucher le chômage, je préférerais ne pas travailler.
Item 7 - J'aime être admiré(e) pour ma réussite.
Item 8 - Je n'aime pas être remarqué(e).
Item 9 - J'aime que des employés me demandent conseil.
Item 10 - J'aime que des employés sollicitent mon aides.

100
Une valeur
propre
représente la
quantité
d'information
s capturée
par un
facteur. Un
facteur qui
aurait une
valeur propre
inférieure à 1
représenterai
t moins
d'information
s qu'un
simple item
initial.
Choix de la méthode de rotation.

Oblimin directe rotation oblique, c’est-à-dire dans laquelle les


axes se positionnent en fonction des items et ne sont donc pas
orthogonaux. 103
104
Interprétation des résultats de l’AFE : KMO, test de
Bartlett et communalités.

• L’indice KMO (0,816) ainsi que le test de


Bartlett (signification < 0,001) indiquent
que les données sont factorisables et
permettent d'accepter les résultats de
cette analyse factorielle.

105
L'application du critère de la valeur propre conduit à ne garder que deux composantes principales qui
n'expliquent pas plus de 50 % (48,21) de la variance initiale

Cette faible valeur s'explique certainement par la présence d'items qui ne sont pas suffisamment
corrélés aux autres. Le tableau des communalités permet de les identifier. Nous éliminons les items
dont les communalités sont trop faibles (soit 8r et 9 qui ont des communalités respectives de 0,24 et
106
0,19).
Le tableau de droite indique la corrélation entre les
composantes principales. On constate qu'elle est
faible. Cela nous amènerait à privilégier par la suite,
une rotation Varimax.

Ici, seuls deux items (5r et 6) sont très faiblement


corrélés à la composante 1 et fortement corrélés à la
composante 2. Or, ce second facteur n'explique, à
son tour, qu'une faible part de la variance. Nous
éliminons donc ces deux items.
Pour simplifier la lecture, dans l'onglet Options, nous demandons usuellement
que les coefficients structurels soient classés par tailles et que ceux qui sont
inférieurs à 0,2 (très faible corrélation de l'item avec la composante)
n'apparaissent pas.
La solution est maintenant, comme dans la théorie, unidimensionnelle, mais elle ne
parvient toujours pas à expliquer plus de 50 % de la variance. Dès lors, l'item 3r dont la
communalité est insuffisante (0,38) est supprimé.
Cette dernière solution unidimensionnelle permet d'expliquer 53,72 % de la variance .
N.B : La communalité de l'item ambition 2 est très moyenne et cet item pourrait être
supprimé.
La matrice des composantes indique que tous les items ont
un coefficient structurel supérieur à 0.65 et sont donc
conservés pour le reste de l’analyse.
Le calcul de du coefficient d’alpha de Cronbach, indicateur de
cohérence interne, pour vérifier la fiabilité d’une échelle de
mesure.
RAPPEL

Ambition1
Ambition1
Ambition2
Ambition2
Ambition3
Ambition3 Ambition1
Ambition4 Ambition2
Ambition4
Ambition5
Ambition5 Ambition4
Ambition6
Ambition6
Ambition7 Ambition7
Ambition7
Ambition8 Ambition10
Ambition9
Ambition8
Ambition10
Ambition9
Ambition10
Détermination de l’échantillon

115
Intérêt

• La population à étudier doit être définie avec le plus grand soin (par exemple les
clients d’une enseigne de distribution). Cette définition inclut celle des unités
de sondage (l’individu détenant l’information) qui sont l’objet de l’observation.
• Dans de nombreux cas, en marketing, on ne se préoccupe pas de l’ensemble de
la population mais plutôt des consommateurs de tel ou tel produit, ou catégorie
de produits, qui constituent la cible des actions envisagées

116
Les méthodes d’échantillonnage

▪ La méthode probabiliste, est une


méthode dans laquelle chaque individu
de la population concernée a une
probabilité connue d’appartenir à
l’échantillon, permet d’obtenir des
échantillons représentatifs.
Généralement utilisée sur de grands
échantillons, elle s’avère très coûteuse

▪ Les méthodes non probabilistes (ou


méthodes empiriques) permettent de
constituer un échantillon résultant d’un
choix raisonné qui vise à le faire
ressembler à la population dont il est
issu

117
Les méthodes d’échantillonnage

• Tirage au hasard : l’échantillon aléatoire consiste à tirer au hasard un individu de la population


avec une probabilité connue et différente de zéro d’appartenir à l’échantillon.
• Échantillonnage stratifié : dans le cas où les variables étudiées sont fortement dispersées,
c’est-à-dire dans ceux où des classes seraient sous- ou surreprésentées en raison du tirage au
hasard, il peut s’avérer utile d’utiliser des variables dites de stratification, qui permettent de
réaliser une répartition de la population en classes appelées « strates »

118
Les méthodes non probabilistes

• Méthode des quotas : cette méthode présente l’avantage de la simplicité : on choisit quelques
caractéristiques dont on connaît la distribution statistique dans la population étudiée (par
exemple, sexe, âge, catégorie socioprofessionnelle [CSP] du chef de famille), puis on donne à
chaque enquêteur un plan de travail qui lui impose le respect de certaines proportions au sein des
interviewés.
• Méthode des itinéraires (ou random route) : dans une commune, par exemple, on impose à
l’enquêteur un point de départ et un itinéraire à suivre, avec tirage systématique des logements dans
lesquels il doit effectuer des interviews (par exemple, interroger les foyers toutes les trois portes
dans un immeuble).

119
Les méthodes non probabilistes

• Échantillonnage de convenance : il est conçu par l’enquêteur pour des raisons de praticité. Il fait
généralement appel à des personnes interceptées dans la rue, à la sortie des caisses en magasin,
etc. C’est la moins coûteuse et la plus rapide de toutes les techniques d’échantillonnage mais elle
présente de fortes limites : biais de sélection, non-représentativité. Il n’est donc théoriquement;
pas significatif de généraliser les résultats.

• Échantillonnage « boule de neige » : on choisit un premier groupe de répondants, au hasard


généralement, puis on leur demande d’indiquer d’autres répondants potentiels appartenant à la
population ciblée. Cette méthode peut être utile pour des enquêtes sur les leaders d’opinion par
exemple.

120
La détermination de la taille de l’échantillon

• La détermination de la taille de l’échantillon est une étape cruciale en analyse de données. Un


échantillon trop petit peut induire une perte d’informations importante ou empêcher la
réalisation de nombreux tests soumis à des contraintes en termes de nombre d’observations. À
l’inverse, un échantillon trop important constitue une perte de temps et de budget dommageable
pour la réussite de l’étude.
• il est important de noter que la précision de l’information recueillie dépend principalement de la
taille de l’échantillon et non du taux de sondage (défini par le rapport n/N, où n est la taille de
l’échantillon et N celle de la population).

121
La détermination de la taille de l’échantillon

• Dans la pratique, les chargés d’études utilisent des abaques (feuilles de calcul)
donnant la taille de l’échantillon en fonction du degré de précision des résultats
que l’on veut obtenir.
• Pour trouver la taille adéquate de l’échantillon N, une règle empirique facile à
appliquer – même si elle est contestable d’un point de vue purement statistique –
consiste à partir de l’erreur, exprimée en pourcentage, que l’on est prêt à tolérer :
N = 1/erreur2.
• Par exemple, si l’on accepte une erreur de +/–5 % au niveau de la précision des
résultats, on obtient une taille d’échantillon de 1/0,052, soit 400 répondants.

122
Mode d’administration

123
Méthode d’administration du questionnaire
• Il existe deux méthodes pour administrer un questionnaire : soit on fait appel à un enquêteur,
soit on demande aux individus retenus dans l’échantillon de remplir eux-mêmes le
questionnaire qui est alors dit « auto-administré »

124
Méthode d’administration du questionnaire: Avantages/ inconvénients

125
Analyse des données

126
Intérêt

• La description des données est une étape importante de la démarche d’analyse. La plupart des
enquêtes se limitent à cette étape, qui donne un premier niveau de lecture des résultats ou
l’identification de certaines relations entre des variables de l’étude.
• Cette étape peut servir de fondement, d’une à des analyses plus poussées et plus sophistiquées,
de nature explicative (régressions, analyses de variance, analyse conjointe, etc.).

Tests
d’hypothèses
Analyses Analyses
paramétriques
Univariées Bivariées
et non
paramétrique

127
Analyse Univariée: Variable qualitative
Tri à plat : variable situation matrimoniale

• La description d’une variable qualitative consiste


à présenter les effectifs, c’est-à-dire le nombre
d’individus de l’échantillon pour chaque modalité
de la variable, et les fréquences, c’est-à-dire le
nombre de réponses associées aux modalités de
la variable étudiée.
• En effet, dans de nombreux cas, le chargé d’étude
cherche à répondre à une série de questions ne
concernant qu’une seule et même variable

Sur Spss on procède comme suit: Analyse >


Statistiques descriptives > Effectifs…,

128
Analyse Univariée: Variable quantitative

• Plusieurs critères permettent de décrire une variable quantitative,


les principaux critères sont :
• les mesures de la tendance centrale : moyenne, médiane, mode ;
• les mesures de la dispersion : étendue, variance, écart type, coefficient de
variation;

129
Analyse Univariée: Variable quantitative

• Les mesures de la tendance centrale ont pour objet de résumer la série d’observations par une
valeur considérée comme représentative.
• La moyenne révèle la tendance centrale en ce sens que les réponses se trouvent réparties de part
et d’autre de la moyenne. Si certaines valeurs sont très éloignées les unes des autres, elles
peuvent avoir une influence importante sur la moyenne. Dans ce cas, il vaut mieux utiliser la
médiane, qui n’est pas sensible aux valeurs aberrantes ou extrêmes (outliers).
• La médiane représente la valeur au-dessus et au-dessous de laquelle se situent la moitié des
observations, c’est-à-dire le 50e centile .
• Le mode représente la valeur présentant la plus grande fréquence d’occurrence. Si plusieurs
valeurs à la fois présentent la plus grande fréquence d’occurrence, chacune d’entre elles est un
mode

130
Analyse Univariée: Variable quantitative

• Les mesures de la dispersion reposent sur les indicateurs suivants : l’étendue, la variance, l’écart
type et le coefficient de variation.
• L’étendue (ou intervalle) est la différence entre la plus grande et la plus petite des valeurs
observées.
• La variance est la mesure de la dispersion autour de la moyenne, égale à la somme des carrés des
écarts par rapport à la moyenne, divisée par le nombre d’observations moins un. Lorsque les
données se concentrent autour de la moyenne, la variance est faible. Si les données sont
dispersées autour de la moyenne, la variance est élevée. Il s’agit d’une mesure plus fine de la
dispersion, au sens où toutes les données sont prises en compte. En revanche, elle est sensible
aux valeurs extrêmes.
• L’écart type est la mesure de la dispersion autour de la moyenne, exprimée dans la même unité
que la variable. L’écart type est la racine carrée de la variance

131
Analyse Bivariée

• L’examen de variables uniques permet une première lecture intéressante des résultats mais elle
ne présente pas de véritable intérêt en termes d’analyse. Les descriptions faites sur les variables
soulèvent toute une série de questions sur leurs relations, qui devront être mises en lumière en
les rapprochant deux à deux dans des analyses bivariées.
• Les tris croisés, par exemple, permettent d’examiner les relations entre deux ou plusieurs
variables. Ces relations peuvent être symétriques – l’analyse cherche à mesurer la liaison entre les
deux variables et à en tester la signification –, ou dissymétriques – l’analyse cherche à expliquer
les variations d’une variable dépendante par les variations d’une variable indépendante (Evrard et
al., 2003).

132
Analyses bivariées: Tris croisés

• Les tableaux croisés à deux ou plusieurs modalités


sont en général complétés par des mesures Tris croisés : sexe et dépenses
d’association qui permettent de démontrer la
signification statistique d’une association observée
entre les variable
• Les tris croisés ont pour objet de rassembler dans un
tableau unique les distributions de fréquences de
deux ou plusieurs variables.
• Ce premier outil d’analyse des relations entre deux
variables, ou relations bivariées, permet de répondre
à des questions qui se posent dès l’origine de l’étude
(par exemple : « Les hommes dépensent-ils plus que
les femmes sur le point de vente? »; « Le sexe et les Sur Spss: Analyse > Statistiques descriptives >
revenus ont-ils une influence sur le montant moyen Tableaux croisés… ou bien depuis le menu
dépensé? ») Analyse > Tableaux > Tableaux personnalisés…

133
Tests d’association statistique

• Les tris croisés présentent la distribution des fréquences de réponse pour deux ou plusieurs
variables mises en relation mais ils ne permettent pas de démontrer l’existence de cette
association du point de vue statistique.
• Pour mesurer véritablement la relation entre les variables, il est nécessaire de mettre en place
des tests de signification statistique de l’association

• Les tests statistiques reposent sur le principe d’inférence, c’est-à-dire le fait de procéder à des
généralisations sur les comportements d’une population. Ils sont fondés sur des mesures
effectuées sur des variables ou sur des facteurs à partir d’observations réalisées sur un
échantillon de cette population.
• L’objectif de la statistique dans la logique inférentielle est donc de tester des hypothèses
formulées essentiellement sur la base d’une théorie préexistante ou de résultats antérieurs.

134
Tests d’association statistique: L’hypothèse statistique

• Une hypothèse statistique est un énoncé quantitatif concernant les


caractéristiques d’une population ou, plus précisément, une affirmation portant
sur une ou plusieurs variables. Elle se présente traditionnellement sous la double
forme d’une première hypothèse, appelée hypothèse nulle, et d’une seconde
hypothèse, appelée hypothèse alternative.
.
• Exemple : on peut poser l’hypothèse nulle Ho qu’il n’existe pas de différence de
ventes entre les points de vente situés en centre-ville et ceux de la périphérie
urbaine, et l’hypothèse alternative H1 qu’elles sont différentes en centre-ville et
en périphérie urbaine

135
Tests d’association statistique: tests d’hypothèses

• Les tests d’hypothèses, ou tests d’inférence, ont pour objectif de


mesurer l’effet d’une variable indépendante sur une variable
dépendante, en fonction du nombre d’échantillons et en fonction de
la nature des variables étudiées.
• On nomme tests paramétriques les approches reposant sur des données
métriques (et par suite sur des paramètres connus tels que la moyenne ou
l’écart type, par exemple),
• et tests non paramétriques les approches reposant sur des données non
métriques (et qui, par suite, peuvent s’affranchir de conditions de distribution
particulières).

136
Les tests d’hypothèses

• Deux types de mesures peuvent être distinguées

Mesures Mesures
indépendantes appariées

Lorsque les même


Lorsque l’on étudie
individus sont mesurés
deux populations
sur une même variable
distinctes sur une
dans deux situations
même variable
distinctes

Exemple: comparer les Exemple: Comparer les


clients et les non niveaux de prix à deux
clients) périodes distinctes

137
Tests d’hypothèses

138
Tests paramétriques

• Les deux principaux tests paramétriques sont le test t et le test Z, qui ont pour objet de tester des
différences de moyenne.
• Ils permettant de comparer les moyennes de deux groupes d’échantillons. Il s’agit donc de savoir
si les moyennes des deux groupes sont significativement différentes au point de vue statistique.

• Pour l’échantillon unique: il s’agit de comparer une moyenne observée à une moyenne
théorique

139
Tests non paramétriques

• Les tests non paramétriques sont souvent mis en œuvre dans la pratique en marketing : ils
s’appliquent aux variables qualitatives et s’avèrent relativement performants sur de petits
échantillons, même s’ils sont moins puissants que les tests paramétriques.

Tests non
paramétriques

Tests de comparaison Tests de comparaisons


Test d’ajustement d’échantillons indépendants ( d’échantillon appariés (test de
(Kolomogorov-Sminov) test de U Mann Whiteny, test Wilcoxon, le test de signe le
de médiane) test de MCNemar)

140
Test d’ajustement: le test de Kolomogorov-Smirov

• En présence d’un tableau de résultats pour une variable qualitative, le chargé d’études peut utiliser des tests non paramétriques
destinés à comparer la répartition obtenue pour les différentes réponses avec une répartition connue (par exemple, celle de la
population mère) ou une répartition théorique, issue d’une loi statistique (ex : loi normale)
• Dans ce cadre, le test de Kolmogorov-Smirov est un test dit d’ajustement, car il permet d’établir si deux échantillons ont la même
distribution ou si bien un échantillon est normalement distribué.
• Exemple
Ce test permet de répondre à des questions du type :
• -Je connais la répartition de ma population selon les CSP. Mon échantillon est-il représentatif de cette population sur ce critère
• - Nous avons défini un plan de charge nous permettant d’ouvrir nos caisses en fonction de la fréquentation de notre magasin. Ce
modèle est-il validé par nos observations sur un échantillon de jours et d’heures donné ?

Ho: l’échantillon de la population est normalement distribué


H1:L’échantillon de la population n’est pas normalement distribué

On rejette l’hypothèse Ho di la valeur de la probabilité et la p-value ( sans spss c’est la


valeur « sig » est inférieur à 0,05 ( si in adopte le seuil de 5%)
141
Tests de comparaisons d’échantillons indépendants

• Le test de Mann-Whitney permet de • Test de la médiane


vérifier que deux échantillons (ou groupes)
proviennent bien de la même population.
• Ce test permet de comparer la • Ce test, moins puissant que le U de
distribution de deux échantillons Mann-Whitney, permet de déterminer si
indépendants. deux groupes sont issus de populations
• La statistique du test U réunit les deux ayant la même médiane, en estimant la
échantillons et ordonne les observations position de chaque observation par
par ordre croissant de taille.
rapport à la médiane globale des deux
• le test calcule le nombre de fois où un échantillons
résultat du groupe 1 précède un résultat
du groupe 2, ainsi que le nombre de fois
où un résultat du groupe 2 précède un
résultat du groupe 1

142
Test de comparaisons d’echantillons appariés

• Test de Wilcoxon
• Le test de Wilcoxon est utilisé dans le cas de la comparaison de deux échantillons appariés, c’est-à-dire
lorsque l’on souhaite, par exemple, comparer deux types de réponses : avant/après l’exposition à un
message publicitaire, attitude par rapport à une marque A et une marque B, etc.
• La statistique z du test de Wilcoxon s’obtient en calculant la différence entre les scores des deux
observations par paires d’observations, puis en calculant le rang de toutes les différences, et enfin la
somme des rangs positifs et des rangs négatifs. On rejette l’hypothèse nulle (absence de différence entre
les deux groupes) s’il y a une différence entre la somme des rangs positifs et la somme des rangs négatifs.
Le sens de la statistique indique le sens de la différence de la paire examinée.

143
Exercice d’application
• Une enseigne de grands magasins souhaite ouvrir un nouveau point de vente, mais elle ne le fera que si le
potentiel de marché est suffisant. Une enquête a donc été réalisée sur 400 répondants, en face-à-face. Le
chargé d’étude cherche à explorer les données dont il dispose et souhaite que vous l’accompagné dans ce
travail.
• 1-L’enseigne souhaite en savoir un peu plus sur les préférences des répondants : « Quel type de
programme radio les répondants écoute le plus souvent? ».
• 2. Quel est le profil type du client de ce point de vente ?
• 3. L’enseigne mise sur ses clients les plus fidèles. L’équipe du magasin considère en effet que les clients
ayant la plus forte intention d’effectuer leurs achats dans le magasin sont également ceux qui sont
susceptibles de dépenser le plus. L’équipe a-t-elle raison de penser de la sorte ? Combien ces clients sont-
ils susceptibles de dépenser pour un tee-shirt? Les prix moyens affichés dans le magasin étant de 9 €,
qu’en concluez-vous?
• 4. L’enquête s’intéresse également aux goûts des clients potentiels. L’enseigne a lancé des pistes en ce qui
concerne les prix, mais pouvez-vous aider l’équipe marketing du magasin à choisir la bonne musique
d’ambiance : plutôt rock ou plutôt classique ?

144
1-Le programme le plus souvent écouté

Le mode représentant la valeur la plus fréquemment obtenue pour chaque modalité, le


résultat est confirmé dans le tableau ci-dessus où la radio rock est la plus fréquemment
écoutée (39,8 % des réponses).
145
2-Pour établir le profil type du client de ce point de vente, il est nécessaire de décrire un certain
nombre de variables de catégorisation, tels l’âge, le sexe (nous avons déjà décrit cette variable dans
la partie théorique du chapitre), les revenus, le niveau d’études etc….

Pour conclure rapidement, on peut dire que l’âge moyen du répondant est de 49,33 ans, qu’il s’agit de
ménages aisés (seuls 29 % des foyers gagnent moins de 50 000 € annuels), ayant fait des études supérieures
(plus de 80 % ont au moins une licence). 146
3- Pour apporter une réponse à l’équipe marketing du magasin, il faut d’abord sélectionner les
répondants qui nous intéressent . Il faut donc sélectionnez les observations de la variable intention
(« Seriez-vous prêt à faire vos achats dans ce point de vente ? ») selon la condition logique :
intention = 5

• Nous cherchons donc à calculer la moyenne des


dépenses du groupe des répondants ayant la plus
forte intention d’achat, en essayant d’établir s’ils
sont prêts à payer plus que la moyenne des clients
du magasin (on suppose ici que le prix moyen est
le prix affiché).
• Il s’agit d’un test t sur échantillon unique où la
valeur comparée sera le prix affiché (p = 9). Les
résultats apparaissent dans les tableaux à coté

• Les clients ayant la plus forte intention d’achat dépensent en moyenne plus
de 18 € pour un tee-shirt, soit plus du double du prix affiché. Ces résultats
sont significatifs (p < 0.05), ce qui signifie que la différence moyenne
constatée (+9,13 € ) est statistiquement différente du prix moyen affiché.
Une piste pour élargir la fourchette des prix pratiqué

147
• 4-. On peut comparer les réponses à deux questions mesurées de la même
manière par le biais d’un test t pour échantillons appariés, ou bien en mettant en
place un test de Wilcoxon si l’on préfère un test non paramétrique

▪ Le premier tableau reprend les moyennes de


réponses ainsi que les statistiques associées.
On constate que la préférence va à la musique
rock.

▪ Le second tableau permet de rejeter


l’hypothèse nulle relative à l’égalité des deux
mesures. Il existe donc une préférence
significative pour une musique d’ambiance de
type rock.

148
Le test de Wilcoxon confirme le résultat précédent. Le sens de
la statistique confirme également le sens de la différence
examinée, en faveur du second élément de la paire : la
musique rock.
149
La segmentation du marché: L’analyse typologique

150
Intérêt

• De nombreuses enquêtes, surtout celles en marketing on procède au classement des individus


en groupes homogènes, afin, par exemple, de procéder à une segmentation du marché

L’analyse typologique permet de réduire le nombre des observations en les regroupant en des classes (ou
types) homogènes et différenciées. (Evrard et al., 2003)

151
Intérêt

• La réalisation d’une typologie, ou encore d’une taxinomie repose sur le principe de


classification, c’est-à-dire de l’affectation des individus aux différents groupes.
• L’analyse typologique, peut être utilisée dans ce cadre pour simplifier la lecture des
données en regroupant des observations ayant des caractéristiques communes, ou
encore pour faire émerger des groupes d’individus homogènes des données
collectées.
• Cette approche est fréquemment retenue en marketing, où l’une des premières
décisions stratégiques consiste à agréger des segments de marché en fonction des
attentes des consommateurs afin de définir les choix de marchés possibles.

152
Intérêt

• Le marketing considère, en effet, que les marchés sur lesquels il opère peuvent être constitués
d’attentes plus ou moins homogènes, qu’il s’agira de rendre intelligibles. On parle de marketing
de masse lorsque les attentes sont homogènes, de marketing individualisé lorsque les attentes
sont fortement hétérogènes, et de marketing segmenté lorsque les attentes sont groupées.

153
Intérêt

• Le rôle du chargé d’étude dans cette perspective est de créer des groupes de consommateurs
similaires entre eux mais différents des autres segments.
• Le principe de la segmentation, c’est-à-dire « le fait de former des groupes de clients
homogènes », est directement fondé sur des caractéristiques propres des individus (les
consommateurs en l’occurrence) qui nous indiquent pourquoi les segments diffèrent.
• Ces critères vont permettre au chargé d’étude d’identifier et de rapprocher les membres d’un
segment

Remarque: Il n’existe pas de segmentation optimale : la segmentation est un moyen par lequel on
pourra, par exemple, identifier les cibles d’une campagne de mailing, orienter une extension de gamme
de produits, définir le message publicitaire adapté à un profil de consommateurs, etc

154
Exemple de variable prises en compte dans segmentation

Pour regrouper des consommateurs, on considérera des variables de segmentation :

• géographiques : région, type d’habitat, type d’agglomération, etc.;


• sociodémographiques : âge, sexe, taille du foyer, revenus, catégorie socioprofessionnelle,
niveau d’éducation, etc.;
• psychographiques : style de vie, rapport au temps, personnalité, valeurs, etc.;
• comportementales : attitudes, préférences, comportement d’achat (Récence, Fréquence,
Montant)

Lorsque l’on procède à l’analyse typologique, les résultats doivent montrer une forte homogénéité
intragroupe (proximité des mesures au sein d’un groupe), et une forte hétérogénéité intergroupe
(distance entre les groupes)

155
Exemple illustratif

• La figure à coté représente un nuage de points issu du


croisement de deux variables, soit par exemple l’âge
(V1) et la fréquence d’achat (V2) d’un produit X.

• Le centre de gravité du nuage de points est représenté


par le point au centre des trois segments.

• Trois grands groupes émergent lorsque l’on croise ces


deux variables.

• On constate que les individus regroupés sont relativement homogènes, proches, et différents – c’est-à
dire distants – des autres membres des deux autres segments en termes d’âge et de fréquence d’achat.
• Le chargé d’étude pourra aisément recommander des stratégies pour servir ces trois segments en termes
de promotion ou de message publicitaire, par exemple.
• On peut voir, en effet, que les consommateurs les plus âgés, puis les plus jeunes, achètent le plus
fréquemment, alors que les consommateurs des classes d’âge intermédiaires achètent le moins
fréquemment
156
Concepts associés à l’analyse typologique

• Le chargé d’étude, doit , être en mesure de décider du nombre de segments satisfaisant les
objectifs de l’enquête, et interpréter correctement le contenu de chacun des segments générés.
• Il existe un certain nombre de concepts associés à l’analyse typologique. Deux dimensions
principales doivent être abordées

Les mesures Le
statistiques processus
de distance de
entre les constitution
individus des groupes

157
La mesure de la distance

• Le concept de distance est aisément compréhensible si l’on se réfère à l’analyse


factorielle.
• Lors d’une analyse factorielle, la matrice des corrélations est employée pour
regrouper des variables deux à deux au sein de différents facteurs. La corrélation
représente le lien entre deux variables parmi toutes les observations.
• L’analyse factorielle regroupe donc au sein d’un même facteur toutes les variables
ayant de fortes corrélations entre elles. La démarche est un peu similaire lors
d’une analyse typologique

158
La mesure de la distance

Illustration de la distance
• La mesure de distance est calculée pour chaque paire
euclidienne
d’objets sur la base de leurs caractéristiques telles
que spécifiées par l’analyste.

• Les mesures de distance, comme leur nom l’indique,


représentent l’éloignement entre deux observations
en fonction de leurs caractéristiques, une valeur
élevée représentant une faible proximité.

• La principale mesure utilisée est la distance


euclidienne, qui consiste à calculer la racine carrée de
la somme des carrés des différences entre les valeurs
de chaque variable. La figure à coté illustre cette
mesure.

159
Exemple: distance euclidienne
La distance euclidienne en M1 ( 0,4) et M2 (1,1)
est égale à ( 0 − 1 2 +(4 − 1))2 = 3,1

160
La mesure de la distance

• D’autres mesures de distance peuvent s’avérer appropriées dans le cadre de


données métriques :

• le coefficient de corrélation de Pearson : c’est une mesure d’association qui permet


d’établir si deux variables mesurées sur le même ensemble d’observations varient de
façon analogue ou non

• La distance de Tchebycheff : il s’agit de la différence maximale absolue entre les valeurs


relatives aux éléments de la classification

• la distance de Minkowski : c’est la racine nième de la somme des différences absolues


entre les valeurs relatives aux éléments à la puissance n

161
Constitution des groupes: Choix de la méthode de classification

• Il existe deux types de méthodes de constitution des groupes (classification) : les méthodes dites
hiérarchiques et les méthodes non hiérarchiques

• Les méthodes de classification hiérarchique


consistent à établir une structure arborescente
ascendante (à partir de chaque individu de groupe
différent en constituant des groupes de plus en
plus gros) ou descendante (à partir de tous les
individus regroupés).

• Les méthodes de classification non hiérarchique


visent à constituer k groupes (k étant spécifié en
début d’analyse) à partir des n individus de départ

162
Classification hiérarchique ascendante

La classification hiérarchique ascendante est un processus relativement simple et répétitif. Les


individus/observations sont regroupés en segments aux caractéristiques communes. On peut définir
le processus de classification comme suit :

• chaque observation représente un groupe, le nombre de groupes est par conséquent égal au
nombre d’observations;
• les deux groupes aux caractéristiques les plus proches sont agrégés au sein d’un même
groupe en fonction de la mesure de distance choisie (euclidienne par exemple) et de la
méthode d’agrégation retenue
• le processus d’agrégation ci-dessus est répété n – 1 fois (n étant le nombre d’observations),
c’est-à-dire jusqu’à ce qu’il n’y ait plus qu’un seul groupe.

163
Classification hiérarchique ascendante

• En ce qui concerne la constitution des groupes, là encore plusieurs approches peuvent


être envisagées (Malhotra et al., le s2007). On retiendra trois grandes méthodes (ou
algorithmes) d’agrégation principales

• Saut minimum : cette méthode consiste à prendre la plus petite


distance mesurée entre un élément de chaque groupe, puis la plus
petite distance suivante, etc.;
• la distance du diamètre : la distance entre deux groupes est
calculée partir de la distance entre leurs deux points les plus
éloignés

164
Classification hiérarchique ascendante

• la méthode de Ward : on calcule les moyennes pour toutes les variables de chaque groupe, puis, pour
chaque individu, le carré de la distance euclidienne au centre de la classe. C’est un critère qui maximise la
variance intergroupe ou minimiser la variance intragroupe

Une partition est bonne si :


• Les deux individus d’un même groupe sont proches
• Les individus de deux classes sont éloignés
En mathématique cela se traduit par :
• Une variabilité intra-classe petite
• Une variablité inter-classe grande

Selon le thérorème de Huygens: l’inertie


totale= l’inertie intra+ l’inertie inter

165
Représentation graphiques des résultats de la classification

• La figure ci dessous représente ce que l’on nomme un dendogramme, autrement dit la représentation
graphique des résultats de la classification des individus en groupes. On lit le dendogramme de gauche à
droite pour une classification hiérarchique ascendante, et de droite à gauche pour une classification
hiérarchique descendante

166
Exemple
Nous considérons 8 points : A, b, c,d,e,f,g,h, ett les cordonnées de ces points sur deux
dimensions

167
168
Classification hiérarchique descendante

• La classification hiérarchique descendante consiste à considérer l’ensemble des


observations rassemblées au sein d’un même segment, puis à les diviser en deux
segments, puis en trois, quatre, etc., jusqu’à obtenir un nombre maximum de segments
(des groupes ne contenant qu’un seul individu).

169
Procédure sur Spss
Le menu graphique vous permet de générer un arbre
hiérarchique ou dendogramme (voir ci-après) souvent utile
pour l’interprétation. En ce qui concerne la méthode plusieurs
possibilités existent : le saut minimum, la distance du
diamètre, et la méthode de Ward (la plus couramment
utilisée)

170
La classification non hiérarchique

• Les méthodes de classification non hiérarchiques visent à constituer k groupes (k étant spécifié en
début d’analyse) à partir des n individus de départ. Ces méthodes sont très largement utilisées
car elles permettent de traiter des volumes importants tout en optimisant les critères de
classification
• La particularité de ces méthodes, à la différence des méthodes de classification hiérarchique, est
que le choix du nombre de groupes se fait en début de processus
• C’est un élément qui peut poser problème, étant donné que l’on ne connaît jamais ex ante le
nombre idéal de groupes existant au sein d’une population étudiée. Dans la pratique, il est
préférable de ne pas avoir à traiter un nombre trop élevé de groupes, ce qui rendrait difficile
l’interprétation
• Il est recommandé donc de faire plusieurs essais avec des nombres de groupes différents afin
d’identifier la meilleure solution au regard de critères statistiques de validité (la variance
intergroupe divisée par la variance totale par exemple). On utilise en général des solutions
comprenant entre 5 et 10 groupes.

171
La classification non hiérarchique

• On distingue deux méthodes principales de classification non


hiérarchique, qui sont en réalité deux niveaux d’une même approche :
la méthode des centres mobiles et la méthode des nuées dynamique

172
la méthode des centres mobiles :

• La méthode des centres mobiles : méthode décomposant un ensemble


d’individus en un nombre n de classes choisies a priori par un processus itératif
convergeant de sélection des représentants de chaque classe (un centre par
classe), qui peut être initialisé au hasard ou par l’utilisateur de la méthode.
• Les individus sont donc regroupés autour de ces centres de classe, les groupes
étant constitués des individus les plus proches du centre du groupe. Une fois les
individus affectés, on remplace les centres par les barycentres (c’est-à-dire le
point d’équilibre de tous les points pris en compte) afin de recalculer les classes;

173
Exemple

174
175
La méthode des nuées dynamiques

• la méthode des nuées dynamiques : il s’agit d’une généralisation de la méthode


des centres mobiles, dans laquelle chaque classe est représentée par un noyau de
plusieurs éléments et non plus par un seul. Par ailleurs, le barycentre de chaque
groupe est recalculé à chaque nouvel individu et non lors de l’affectation de tous
les individus. La convergence est ainsi plus rapide et parfois même possible en
une seule itération, ce qui peut être utile sur de gros volumes de données

176

Vous aimerez peut-être aussi