Académique Documents
Professionnel Documents
Culture Documents
La Segmentation
des Marchés
2
A- Définitions
3
Représenter les individus par un ensemble
de parties hiérarchiquement emboîtées.
Méthode Méthode
« descendante »: « ascendante »:
du groupe aux individus des individus au groupe
explicative descriptive
4
B- Les approches de la segmentation statistique
Revenu
Possession d’une
voiture de sport
Effectif au foyer
7
La première étape consiste à réduire chaque variable à une
variable dichotomique en trouvant le découpage le plus
pertinent.
Si l’on examine, par exemple, le lien entre
Effectif au foyer Possession de voiture de sport
1 20 60 80
2 40 160 200
3 10 150 160
4 et plus 10 350 360
80 720 800
(10%) (90%) (100%)8
On calculera le nombre de personnes qui devraient posséder une
voiture théoriquement si l’effectif au foyer ne jouait aucun rôle
(effectif théorique).
9
Il s’agit par la suite de trouver le découpage qui maximise l’écart (C)
entre l’effectif observé (Oi) et l’effectif théorique (Ei).
et on calcule dans chaque cas la somme des écarts entre l’effectif observé et
l’effectif théorique défini précédemment.
Pour éviter que les écarts positifs et les écarts négatifs se compensent, on élève
chaque écart au carré.
Les résultats sont résumés dans le tableau suivant:
10
Segmentation dichotomique: effets théoriques
OUI NON TOTAL
10% 90%
1 10% x 80 90% x 80 80
2 10% x 200 90% x 200 200
3 10% x 160 90% x 160 160
4 et + 10% x 360 90% x 360 360
80 720 800
distribution observée effets théoriques
𝑬𝒊 − 𝑶𝒊 𝟐
11 𝒊=𝟏
Segmentation dichotomique: réduction à deux modalités.
𝒊=𝟐
Découpages possibles 𝑬𝒊 − 𝑶𝒊 𝟐
Écart C
𝒊=𝟏
1 personne
contre (8 – 20)2 + (72 – 60)2 288
2 personnes et plus.
1 et 2 personnes
contre (28 – 60)2 + (252 – 220)2 2 048
3 personnes et plus.
1 à 3 personnes
contre (44 – 70)2 + (396 – 370)2 1 352
4 personnes et plus.
Dans ce cas, le découpage le plus discriminant est celui qui oppose les familles
comprenant une ou deux personnes à celles qui comptent trois personnes ou
plus.
Ce qui semble parfaitement logique car les voitures de sport n’ont le plus souvent
que deux places confortables.
12
Après avoir examiné le lien entre
La deuxième étape consiste à déterminer parmi les trois variables (Eff. Foyer,
Revenu et Age) celle qui est la plus discriminante.
Pour cela, on commence par appliquer applique le même raisonnement que
précédemment, et l’on calcule pour chaque variable préalablement réduite la
somme des écarts au carré entre l’effectif théorique et l’effectif observé (voir
tableau suivant):
13
Possession
d’une OUI NON Total
voiture de Eff. obs. Eff. th. Eff. obs. Eff. th. (E)
sport
Eff. 1 ou 2 p 60 28 220 252 280
foyer
3p ou + 20 52 500 468 520
18 à 49a 55 48 425 432 480
Age
50a et + 25 32 295 288 320
80M€ (A) 50 12 70 108 120
Revenu
Moins 80 30 68 650 612 680
(BCD)
80 80 720 720 800
Après, faudrait à calculer pour chaque variable ainsi réduite à deux modalités, la somme des
écarts au carré entre l’effectif théorique et l’effectif observé; on obtient pour :
Effectif Foyer : (28 - 60)² + (252 - 220)² = 2048 ;
Effectif Age : (48 – 55)2 + (432 – 425)2 = 98 et
Revenu : (12 – 50)2 + (108 – 70)2 = 2888
Le revenu est donc le critère le plus discriminant pour la possession d’une voiture
de sport. 14
Arbre de segmentation
Taux de
possession d’une
800
voiture de sport
10%
120 680
Catégorie A Catégories BCD
Taux de Taux de
possession 41% possession 4,4%
PourPour
affiner la segmentation,
affiner la segmentation,il faut reprendre
il faut dansdans
reprendre chaque catégorie
chaque de revenu
catégorie (A, B, C, D)
de revenu
les (A,
calculs
B, C,précédents (y compris
D) les calculs précédentsla phase de réduction)
(y compris la phaseafin
de de compléter
réduction) afinl’arbre
de de
1 compléter
ou 2 personnes
segmentation. 3 personnes et
l’arbre de segmentation. Moins de 35 ans 35 ans et plus
au foyer plus au foyer Taux de Taux de
NB:NB:le Taux de qui qui
critère
le critère intervient Taux
intervienten en desecond
second n’est possession
paspas
n’est nécessairement
nécessairement le le possession
même
même sursurchaque
possession
branche
chaque 50% dedesegmentation.
de branche
l’arbre possession
l’arbre 8%
de segmentation. 15% 1%
Les pourcentages sont donnés par les tableaux de contingences relatifs à chaque segment détecté.
15
Synthèse:
16
1ére étape consiste à réduire chaque variable en variable
dichotomique (deux modalités).
Comme nous l’avons fait avec la première variable (effectif par foyer).
Nous refont le même travail avec le deux variables restantes.
Nous avons obtenu pour l’Age deux modalités (18 à 49 ans ; 50 ans et
plus), pour le Revenu (80M€ et plus ; BCD).
17
La troisième étape consiste à reprendre dans chaque catégorie de revenu
(« A » d’un côté et « BCD » de l’autre coté) les calculs précédents.
On les reprend avec les deux variables restantes l’«Age» et l’«Effectif par
foyer». On reprend les calculs précédents (de nouvelles réductions à deux
modalités et de nouveaux calculs des sommes des carrés des écarts entre
les effectifs théorique et les effectifs réels) d’abord pour les 120 individus
de la Classe « A » et ensuite pour les « 680 » individus des classe BCD.
18
Age
Revenu A
- ]18 – 35]
(120)
- ] 35 – 49]
Age
Revenu BCD - ]18 – 35]
(680) - ] 35 – 49]
Eff. au foyer
Revenu BCD
- 1 ou 2 p
(680)
- 3 et + p
19
Arbre de segmentation
Taux de
possession d’une
voiture de sport
10%
21
Un échantillon de 585 ménages est analysé.
OUI
NON
22
AGE
1/2
ETUD
1/2
PROF
1/2
CLHD
0 /1
FAM
1/2
ENFT
1/2
24
Pour identifier le premier critère de partition de la population entre
clients et non-clients du hard discount (variable CLHD), cette variable est
croisée avec chacun des cinq descripteurs, et le test de Khi-deux est
appliqué à chacun des tableaux de contingence ainsi élaborés (tableau
2).
25
Pour rechercher le critère de segmentation suivant, l'échantillon est scindé en
deux groupes selon les modalités de la variable CLASAGE.
26
À l'intérieur de la classe d'âge 1, le test de Khi-deux a la valeur la plus
élevée la relation entre la variable de comportement et le critère de
segmentation « Niveau d'études » (CLASETUD). Cette variable définira le
deuxième niveau de segmentation du marché hard discount.
27
Tableau 4 – Test de khi-deux au troisième niveau de segmentation
CLASFAM Khi-2 1 0,5881 0,4432 0,0136 0,9070 2,4420 0,1181 1,4722 0,2250
CLASENFT Khi-2 1 1,3653 0,2426 0,0860 0,7694 3,2550 0,0712 0,3068 0,5797
28
Echantillon
complet (N=585)
Khi-2 = 26,92
29
Si l’on applique le second critère de segmentation (niveau d’études), on voit
que la clientèle de niveau d’études primaire ou secondaire constitue le cœur
de la cible de la HD qui réalise un taux de pénétration dans cette population
de 62% chez les moins de 40 ans, et encore 47% chez les plus de 40 ans.
31
• Typologie des méthodes descriptives multivariées
32
• Typologie des méthodes de classification:
33
Si le nombre d’acheteurs est réduit, tel sur les marchés « B to
B », c’est la classification hiérarchique ascendante qui est
conseillée. Nous développerons, dans ce qui suit, en premier lieu
cette méthode (selon Ward) qui consiste à regrouper pas-à-pas les
individus, en privilégiant, à chaque étape, la similarité la plus
forte, en fonction de la distance entre deux individus.
34
• Principes de la classification hiérarchique ascendante
Les deux classes choisies pour être fusionnées sont celles qui
sont les plus "proches", en d'autres termes, celles dont la
dissimilarité entre elles est minimale.
35
Comme on rassemble d'abord les individus les plus proches, la
première itération a un indice d'agrégation faible, mais celui-ci va
croître d'itération en itération. On procède ainsi jusqu’à parvenir à
un nombre de groupes optimal. Celui-ci sera atteint lorsque l’ajout
d’un nouveau regroupement ne ferait pas gagner en capacité
discriminatoire.
36
• Mise en œuvre
Méthode Méthode
« descendante »: « ascendante »:
du groupe aux individus des individus au groupe
37
Classifications hiérarchiques
Méthode « ascendante »
38
Dendrogramme
indice
nœud 9
nœud 8
nœud 6 nœud 7
Individu d’origine
39
Classifications hiérarchiques
Méthode « ascendante »
Etape 1 Etape 2 Etape 3
1 1 1
2 2 2
3 3 3
5 5 5
4 4 4
Etape 4 Etape 5
1 1
2 2
3
3
5 5
4 4
40
Individu F1 F2 Analyse typologique - Classifications hiérarchiques
Individu 1 -1.3844 0.7654
Individu 2 -2.0832 -0.0437
1.5
Individu 3 1.8071 0.9340
- 1.5
1 2 3 4 5 6 7 8 9 10
1
2 1.069
3 3.196 4.011
4 1.694 0.822 4.117
5 3.153 3.591 1.547 3.384
6 3.877 4.453 1.278 4.318 0.968
7 0.202 1.154 3.290 1.838 3.318 4.019
8 1.320 0.369 4.033 0.453 3.471 4.368 1.440
9 3.736 4.376 0.970 4.299 1.059 0.317 3.867 4.317
10 2.704 3.064 1.815 2.832 0.553 1.510 2.882 2.928 1.558
1.5
1.0 3
7
1
0.5
-1.5 -1.0 9
-2.0 -0.5
0.0 0.5 1.0 1.5 2.0
2
1 8 6
-0.5
5
7 10
4
- 1.0
0 0.5 1
- 1.5
0.202
43
Sur la figure, ce sont les éléments (1) et (7) que l’on agrège en un
seul élément noté (1/7) appelé nœud.
Chaque nœud est défini par :
44
Classifications hiérarchiques
Individu F1 F2
Individu 1/7 -1.4335 0.8537
Individu 2 -2.0832 -0.0437
Individu 3 1.8071 0.9340
Individu 4 -1.9049 -0.8467
Individu 5 1.4685 -0.5759
Individu 6 2.3667 -0.2153
Individu 8 -1.9978 -0.4031
Individu 9 2.2904 0.0925
Individu 10 0.9201 -0.6492
45
Classifications hiérarchiques
1/7 2 3 4 5 6 8 9 10
1/7
2 1.10
3 3.242 4.011
4 1.765 0.82 4.117
5 3.235 3.591 1.547 3.384
6 3.948 4.453 1.278 4.318 0.968
8 1.378 0.369 4.033 0.453 3.471 4.368
9 3.80 4.376 0.970 4.299 1.059 0.317 4.317
10 2.792 3.064 1.815 2.832 0.553 1.510 2.928 1.558
46
Classifications hiérarchiques - Dendrogramme
1.5
6
9 1.0 3
1/7
0.5
-1.5 -1.0 9
-2.0 -0.5
0.0 0.5 1.0 1.5 2.0
2
1 8 6
-0.5
5
7 10
4
- 1.0
0 0.5 1
- 1.5
0.317
47
Classifications hiérarchiques
1/7 6/9 2 3 4 5 8 10
1/7
6/9 3.872
2 1.108 4.412
3 3.242 1.124 4.011
4 1.765 4.306 0.822 4.117
5 3.235 1.002 3.591 1.547 3.384
8 1.378 4.340 0.369 4.033 0.453 3.471
10 2.792 1.526 3.064 1.815 2.832 0.553 2.928
48
Classifications hiérarchiques - Dendrogramme
1.5
6
9 1.0 3
1/7
2 0.5
8 6/9
-2.0 -1.5 -1.0 -0.5
0.0 0.5 1.0 1.5 2.0
2
1 8
-0.5
5
7 10
4
- 1.0
0 0.5 1
- 1.5
0.369
49
Classifications hiérarchiques - Dendrogramme
1
7
0.5 1
0.553 50
Classifications hiérarchiques - Dendrogramme
0.5 1
0.638 51
Classifications hiérarchiques - Dendrogramme 1/7 6/9 5/10 2/8/4 3
1/7
6/9 3.872
5/10 1.402 4.340
3
5
10
2
8
4
1
7
0.5 1 1.5 2
1.124
52
1/7 5/10 2/8/4 6/9/3 Classifications hiérarchiques - Dendrogramme
1/7
1/7 2/8/4 5/106/9/3
5/10 3.009
1/7
2/8/4 1.402 3.195
2/8/4 1.402
6/9/3 3.635 1.305 4.209
6 5/106/9/3 3.338 3.782
9
3
5
10 1/7/2/8 5/10/6
/4 /9/3
2
1/7/2/8/4
8
5/10/6/9/3 3.545
4
1
7
0.5 1 1.5 2 3
3.545
1.305 1.402 53
Classifications
hiérarchiques
54
Classifications hiérarchiques - Dendrogramme
✂
6
9
3
5
10
2
8
4
1
7
0.5 1 1.5 2 3
✂
✂
55
Classifications hiérarchiques
Résultats SPAD
56
LISTE DES 3 MEILLEURE(S) PARTITION(S)
ENTRE 3 ET 7 CLASSES
1 - PARTITION EN 5 CLASSES
2 - PARTITION EN 4 CLASSES
3 - PARTITION EN 7 CLASSES
57
Classifications hiérarchiques
Résultats SPAD
✂
✂
58
Classifications hiérarchiques
1.5
7 1.0 3
Inertie inter-classes + 1
Groupe 1
Inertie intra-classes =
0.5
Inertie totale Groupe 4
9
-2.0 -1.5 -1.0 -0.5
2 0.0 0.5 1.0 1.5 2.0
6
8 Groupe 3 -0.5
5
10
4
- 1.0
- 1.5
59
Interpréter et valider la typologie : une étape décisive
60
Votre expertise au service de vos analyses
61