Vous êtes sur la page 1sur 37

2023-2024

Boulahoual.adil@gmail.com
2
3
4
5
6
SEGMENTER

De nombreuses enquêtes en marketing ont pour objet de


classer des individus en groupes homogènes. Comme l‘AFE,
l'analyse typologique permet de réduire le nombre des
observations en les regroupant en classes (ou types)
homogènes(Evrard et al. 2009).
Cependant, contrairement à l‘AFE, les résultats peuvent
fortement diverger en fonction des choix effectués. Nous
verrons, dans ce chapitre, les concepts clés liés à cette
méthode, les mesures statistiques associées, ainsi que les
principaux éléments de sa mise en œuvre.

7
Le rôle du chargé d'étude dans cette perspective est d'identifier
des groupes similaires entre eux mais différents des autres
segments.
Il n'existe pas de segmentation optimale: la segmentation
est un moyen par lequel on pourra, par exemple, identifier les
cibles d'une campagne de mailing, orienter une extension de
gamme de produits, définir le message publicitaire adapté à un
profil de consommateurs, etc. Il existe donc plusieurs résultats
possibles lors d'une segmentation, et le chargé d'étude devra
réaliser des choix, afin de concilier exigence statistique et besoin
d'opérationnalité de la décision.

8
Nous distinguerons à ce niveau la segmentation a priori fondée
sur la connaissance qu'a le manager de son marché de la
segmentation aléatoire fondée sur le traitement de données et
les méthodes d'analyse typologique.
Pour regrouper des consommateurs, nous considérerons les
variables de segmentation:
Géomarketing.
Sociodémographiques.
psycho graphiques: Style de vie, personnalité, etc.
Comportementales : Attitudes, préférences, etc.

9
ANALYSE TYPOLOGIQUE
«Étant donné un ensemble d'objets (ou d'individus) décrits par un
certain nombre de caractéristiques (ou variables), constituer des
groupes (ou types) d'objets tels que les objets soient les plus
similaires possibles au sein d'un groupe et que les groupes
soient aussi dissemblables que possible entre eux; la
ressemblance ou la dissemblance étant mesurée sur l'ensemble
des variables décrivant les objets»

(Evrard et al. 2009).

10
Fréquence d’achat Méthode d'agrégation de Ward

.....
.....
......
Y2 ......
..... .... .
..... .... .
Y1 . .. ... .. ..
. .. ... . . . .

Barycentre

-Le coefficient de corrélation linéaire ......


de Pearson
......
-La distance de Tchebycheff
.... .
-La distance de Minkowski
-L'indice de Sokal et Michener .... .
-L'indice de Rogers et Tanimoto Age

X1 X2
11
CONSTITUTION DE GROUPES

CLASSIFICATION

HIERARCHIQUE NON HIERARCHIQUE

ASCENDANTE DESCENDANTE CENTRES NUEES


MOBILES DYNAMIQUES

12
CLASSIFICATION HIÉRARCHIQUE
ASCENDANTE

Au départ, chaque observation représente une classe, le


nombre de classes est par conséquent égal au nombre
d'observations.
Les deux groupes aux caractéristiques les plus proches sont
agrégés pour créer une nouvelle classe de taille plus
importante ; le processus d'agrégation varie selon la
méthode d'agrégation retenue (voir ci-après) et la mesure
de distance utilisée.
Le processus d'agrégation est répété n -1 fois (n étant le
nombre d'observations), c'est-à-dire jusqu'à ce qu'il n'y ait
plus qu'une seule et unique classe.

13
CLASSIFICATION HIÉRARCHIQUE
DESCENDANTE

La classification hiérarchique descendante consiste à


considérer l'ensemble des observations rassemblées au
sein d'une même classe, puis à les diviser en deux classes,
puis en trois, quatre, etc., jusqu'à obtenir un nombre
maximum de classes (des groupes ne contenant qu'un seul
individu).

14
CHOISIR LE NOMBRE DE GROUPES
Etant donné le nombre d'observations, le chargé d'étude
décide de mettre en place une classification hiérarchique
afin de constituer les groupes. Les résultats sont
représentés dans l'arbre de décision.

Ascendante

Descendante

15
CLASSIFICATION NON
HIÉRARCHIQUE
La particularité de ces méthodes, à la différence des
méthodes de classification hiérarchique, est que le choix
du nombre de groupes se fait en début de processus. Il
s'agit d'un paramètre à fixer avant de lancer l'algorithme.
C'est un élément qui peut poser problème, étant donné
que l'on ne connaît jamais ex ante le nombre idéal de
groupes existant au sein d'une population étudiée.
Nous recommandons donc de faire plusieurs essais avec
des nombres de groupes différents afin d'identifier la
meilleure solution au regard de critères statistiques de
validité (La variance interclasse divisée par la variance totale,
par exemple).

16
LA MÉTHODE DES CENTRES MOBILES

La méthode décomposant un ensemble d'individus en un


nombre k de classes choisies a priori par un processus
itératif. k centres de classes sont initialement choisis (au
hasard ou par l'utilisateur de la méthode) parmi les n
individus. Puis chaque individu est affecté au centre de
classe dont il est le plus proche et k groupes sont ainsi
formés. Les centres de classes de ces groupes (points
moyens) sont alors recalculés. De nouveau, chaque individu
est affecté au centre de classe dont il est le plus proche.
L'algorithme s'arrête lorsque les centres de classes sont
stabilisés.

17
LA MÉTHODE DES NUÉES DYNAMIQUES

C’est une généralisation de la méthode des centres


mobiles. Par ailleurs, le barycentre de chaque groupe est
recalculé lors de l'affectation de chaque nouvel individu et
non à l'issue de l'affectation de tous les individus au centre
de classe initial. La convergence est ainsi plus rapide et
parfois même possible en une seule itération, ce qui peut
être utile sur de gros volumes de données (Tufféry, 2006).

18
EXERCICE

Une entreprise de grande distribution internationalisée a


réalisé une enquête sur les habitudes alimentaires en
Europe afin d’adapter sa politique d’achat et de
référencement. Les données concernant 25 pays portent
sur les indices globaux de consommation de 9 catégories
de produits alimentaires : Viande rouge, viande blanche,
œuf, lait, poisson, céréales, féculents, oléagineux, fruits et
légumes.

T.A.F: faites une analyse des données collectées.

19
L'utilité pour l'enseigne est multiple: En faisant émerger ces
grands types de consommation, elle sera à même
d'optimiser sa stratégie de négociation avec les
fournisseurs, sa politique d'achat, structurer son
département achat par régions, etc.
L'enquête porte sur seulement 25 observations, une
classification hiérarchique semble donc appropriée car le
volume de calcul à réaliser reste limité.
Un premier essai en utilisant la méthode de Ward et le
carré de la distance euclidienne (indispensable lorsqu'on
utilise la méthode de Ward) pourrait s'avérer fructueux.

20
21
S1

S2

22
23
EXERCICE

Une enquête portant sur un nombre élevé de répondants(


1.400 questionnaires exploitables) est menée pour mieux
comprendre le comportement du consommateur, c’est-à-
dire si son comportement on-line diffère de son
comportement off-ligne ( Magasin traditionnel).

T.A.F
Quelle démarche peut-on mettre en œuvre?
Décrivez puis interprétez les segments obtenus.

24
Le nombre élevé d'observations nous oriente assez
naturellement vers une méthode de classification non
hiérarchique. Ces méthodes, rappelons-le, visent à
constituer k groupes (nombre spécifié dès le départ) à
partir des n individus (1 400 dans cet exemple).
La plupart des données que nous utilisons sont des échelles
en 5 points qui peuvent être considérées comme des
variables quantitatives..
Deux variables qualitatives dichotomiques, l'une portant sur
la récence de la visite d'un site d'e-Commerce et le sexe,
ont étaient exclues,

25
De plus, les mesures des variables sont hétérogènes (des
variables dichotomiques, des échelles, des variables
quantitatives comme le nombre de visites ...). Il est donc
préférable de standardiser les variables.

Pour ce faire, on peut utiliser le menu Analyse> Statistiques


descriptives> Descriptives. Faites glisser l'ensemble des
variables dans la zone Variable (s), puis cochez
Enregistrer les valeurs standardisées dans les variables.

De nouvelles variables, standardisées, précédées d'un Z


apparaissent

26
27
28
29
30
31
32
33
34
La lecture du tableau se fait en comparant chaque
moyenne à la ligne totale. On s'aperçoit assez rapidement
qu'il s'agit principalement d'hommes et que les classes
diffèrent peu à ce niveau La classe 1 est proche de la
moyenne pour les variables fréquence, attrait, recherche,
sécurité et outil et visites mais se distingue par son faible
goût pour l'achat online (moyenne = 1,23 contre 1,83
pour l'ensemble de l'échantillon).
La classe 2 achète rarement (1,39 contre 2,82), n'est pas
très attirée par Internet (1,61 contre 2,82), etc. C'est une
classe très réticente à l'achat en ligne et à l'utilisation de
l'Internet commercial.

35
La classe 3 est nettement au-dessus de la moyenne de
l'échantillon pour toutes les variables (par exemple, pour
le plaisir à acheter online : 3,95 contre 1,83). Elle est
clairement favorable à l'achat en ligne et à l'utilisation de
l'Internet commercial.
La classe 4 semble encore plus favorable à l'achat en
ligne que la classe 3, ses moyennes sont nettement plus
élevées que le reste de l'échantillon (par exemple, pour le
nombre de visites: 9,75 contre 6,61). C'est un acte
complètement intégré dans la vie courante, à tel point
qu'à la différence de la classe 3, il ne représente plus un
plaisir (moyenne de online = 1,41 contre 1,83).

36
On peut conclure ce travail par un commentaire critique.
Cette typologie est exagérément fine: les différences
entre la classe 3 et la classe 4 semblent minimes. Une
typologie en trois, voire deux classes pourrait se révéler
suffisante. Intéressons-nous également aux écarts types
car ils donnent une indication sur l'homogénéité des
classes, donc sur la validité de la typologie. Il est toujours
difficile de fixer des seuils, mais on notera que les écarts
types dans les classes sont généralement faibles par
rapport aux écarts types pour l'ensemble de l'échantillon.
C'est une indication favorable.
ANOVA A 1 FACTEUR ….

37

Vous aimerez peut-être aussi