Académique Documents
Professionnel Documents
Culture Documents
Boulahoual.adil@gmail.com
2
3
4
5
6
SEGMENTER
7
Le rôle du chargé d'étude dans cette perspective est d'identifier
des groupes similaires entre eux mais différents des autres
segments.
Il n'existe pas de segmentation optimale: la segmentation
est un moyen par lequel on pourra, par exemple, identifier les
cibles d'une campagne de mailing, orienter une extension de
gamme de produits, définir le message publicitaire adapté à un
profil de consommateurs, etc. Il existe donc plusieurs résultats
possibles lors d'une segmentation, et le chargé d'étude devra
réaliser des choix, afin de concilier exigence statistique et besoin
d'opérationnalité de la décision.
8
Nous distinguerons à ce niveau la segmentation a priori fondée
sur la connaissance qu'a le manager de son marché de la
segmentation aléatoire fondée sur le traitement de données et
les méthodes d'analyse typologique.
Pour regrouper des consommateurs, nous considérerons les
variables de segmentation:
Géomarketing.
Sociodémographiques.
psycho graphiques: Style de vie, personnalité, etc.
Comportementales : Attitudes, préférences, etc.
9
ANALYSE TYPOLOGIQUE
«Étant donné un ensemble d'objets (ou d'individus) décrits par un
certain nombre de caractéristiques (ou variables), constituer des
groupes (ou types) d'objets tels que les objets soient les plus
similaires possibles au sein d'un groupe et que les groupes
soient aussi dissemblables que possible entre eux; la
ressemblance ou la dissemblance étant mesurée sur l'ensemble
des variables décrivant les objets»
10
Fréquence d’achat Méthode d'agrégation de Ward
.....
.....
......
Y2 ......
..... .... .
..... .... .
Y1 . .. ... .. ..
. .. ... . . . .
Barycentre
X1 X2
11
CONSTITUTION DE GROUPES
CLASSIFICATION
12
CLASSIFICATION HIÉRARCHIQUE
ASCENDANTE
13
CLASSIFICATION HIÉRARCHIQUE
DESCENDANTE
14
CHOISIR LE NOMBRE DE GROUPES
Etant donné le nombre d'observations, le chargé d'étude
décide de mettre en place une classification hiérarchique
afin de constituer les groupes. Les résultats sont
représentés dans l'arbre de décision.
Ascendante
Descendante
15
CLASSIFICATION NON
HIÉRARCHIQUE
La particularité de ces méthodes, à la différence des
méthodes de classification hiérarchique, est que le choix
du nombre de groupes se fait en début de processus. Il
s'agit d'un paramètre à fixer avant de lancer l'algorithme.
C'est un élément qui peut poser problème, étant donné
que l'on ne connaît jamais ex ante le nombre idéal de
groupes existant au sein d'une population étudiée.
Nous recommandons donc de faire plusieurs essais avec
des nombres de groupes différents afin d'identifier la
meilleure solution au regard de critères statistiques de
validité (La variance interclasse divisée par la variance totale,
par exemple).
16
LA MÉTHODE DES CENTRES MOBILES
17
LA MÉTHODE DES NUÉES DYNAMIQUES
18
EXERCICE
19
L'utilité pour l'enseigne est multiple: En faisant émerger ces
grands types de consommation, elle sera à même
d'optimiser sa stratégie de négociation avec les
fournisseurs, sa politique d'achat, structurer son
département achat par régions, etc.
L'enquête porte sur seulement 25 observations, une
classification hiérarchique semble donc appropriée car le
volume de calcul à réaliser reste limité.
Un premier essai en utilisant la méthode de Ward et le
carré de la distance euclidienne (indispensable lorsqu'on
utilise la méthode de Ward) pourrait s'avérer fructueux.
20
21
S1
S2
22
23
EXERCICE
T.A.F
Quelle démarche peut-on mettre en œuvre?
Décrivez puis interprétez les segments obtenus.
24
Le nombre élevé d'observations nous oriente assez
naturellement vers une méthode de classification non
hiérarchique. Ces méthodes, rappelons-le, visent à
constituer k groupes (nombre spécifié dès le départ) à
partir des n individus (1 400 dans cet exemple).
La plupart des données que nous utilisons sont des échelles
en 5 points qui peuvent être considérées comme des
variables quantitatives..
Deux variables qualitatives dichotomiques, l'une portant sur
la récence de la visite d'un site d'e-Commerce et le sexe,
ont étaient exclues,
25
De plus, les mesures des variables sont hétérogènes (des
variables dichotomiques, des échelles, des variables
quantitatives comme le nombre de visites ...). Il est donc
préférable de standardiser les variables.
26
27
28
29
30
31
32
33
34
La lecture du tableau se fait en comparant chaque
moyenne à la ligne totale. On s'aperçoit assez rapidement
qu'il s'agit principalement d'hommes et que les classes
diffèrent peu à ce niveau La classe 1 est proche de la
moyenne pour les variables fréquence, attrait, recherche,
sécurité et outil et visites mais se distingue par son faible
goût pour l'achat online (moyenne = 1,23 contre 1,83
pour l'ensemble de l'échantillon).
La classe 2 achète rarement (1,39 contre 2,82), n'est pas
très attirée par Internet (1,61 contre 2,82), etc. C'est une
classe très réticente à l'achat en ligne et à l'utilisation de
l'Internet commercial.
35
La classe 3 est nettement au-dessus de la moyenne de
l'échantillon pour toutes les variables (par exemple, pour
le plaisir à acheter online : 3,95 contre 1,83). Elle est
clairement favorable à l'achat en ligne et à l'utilisation de
l'Internet commercial.
La classe 4 semble encore plus favorable à l'achat en
ligne que la classe 3, ses moyennes sont nettement plus
élevées que le reste de l'échantillon (par exemple, pour le
nombre de visites: 9,75 contre 6,61). C'est un acte
complètement intégré dans la vie courante, à tel point
qu'à la différence de la classe 3, il ne représente plus un
plaisir (moyenne de online = 1,41 contre 1,83).
36
On peut conclure ce travail par un commentaire critique.
Cette typologie est exagérément fine: les différences
entre la classe 3 et la classe 4 semblent minimes. Une
typologie en trois, voire deux classes pourrait se révéler
suffisante. Intéressons-nous également aux écarts types
car ils donnent une indication sur l'homogénéité des
classes, donc sur la validité de la typologie. Il est toujours
difficile de fixer des seuils, mais on notera que les écarts
types dans les classes sont généralement faibles par
rapport aux écarts types pour l'ensemble de l'échantillon.
C'est une indication favorable.
ANOVA A 1 FACTEUR ….
37