Chap 4 Segmentation Statistique

Chapitre IV-
La Segmentation
des Marchés
2
A- Définitions
La segmentation est le découpage du marché total en sous-

ensembles, appelés segments de marché, homogènes du point de
vue des besoins, des comportements, des motivations, d’achat, et
susceptibles de constituer des marchés potentiels distincts.
La macro segmentation: est la segmentation qui identifie les

couples produits-marchés ou les domaines d’activités
stratégiques
La micro- segmentation: est la segmentation qui identifie des
segments d’acheteurs à l’intérieur de chacun des domaines
d’activité stratégiques ou couples produits-marchés retenus.
3
Représenter les individus par un ensemble
de parties hiérarchiquement emboîtées.
Méthode Méthode
« descendante »: « ascendante »:
du groupe aux individus des individus au groupe
explicative descriptive
Les différents regroupements peuvent être

représentés graphiquement
4
B- Les approches de la segmentation statistique
1- L’approche descendante de segmentation explicative
Dans cette approche, le marketeur considère plusieurs critères, pour

ne retenir que celui selon lequel les groupes de consommateurs ont
le comportement d’achat le plus différencié.
Plusieurs méthodes quantitatives permettent de déterminer des critères

discriminants par la construction d’arbres de segmentation, à savoir:
- méthode de Belson,
- méthode AID (Automatic Interaction Detector) basée sur le test statistique du
X2 et
- méthode CART (Classification and Regression Trees)...
Pour chacune, le risque est d’avoir un trop grand nombre de critères, ce qui
augmente le niveau de segmentation et rend difficile la constitution des groupes.
D’autres techniques, comme les Réseaux de Neurones Artificiels (RNA), peuvent
permettre la segmentation en introduisant de fortes non-linéarités entre les
variables (en raison, par exemple, de phénomènes de saturation).
5
Cas 1: La méthode de Belson (approche descendante)
Pour segmenter le marché en fonction du type de véhicule possédé

(voiture familiale, de sport, utilitaire…), on testera des critères de
segmentation liés, à priori, aux caractéristiques intrinsèques des
véhicules;
Pour les voitures de sport par exemple, dont le prix est élevé,
l’habitacle réduit et le confort approximatif, il est raisonnable
d’essayer des variables telles que …
Sur la base des caractéristiques On pose les Variables

intrinsèques du produit étudié
Prix élevé Revenu
Habitacle réduit Effectif au foyer
Confort approximatif Age,
Genre, etc.
La démarche consiste à identifier pas à pas les variables les plus

discriminantes
6
Age
Revenu
Possession d’une
voiture de sport
Effectif au foyer
Le découpage plus pertinent ??

Les critères les plus pertinents??
7
La première étape consiste à réduire chaque variable à une
variable dichotomique en trouvant le découpage le plus
pertinent.
Si l’on examine, par exemple, le lien entre
Effectif au foyer Possession de voiture de sport
on observera la répartition suivante:
Segmentation dichotomique C de Belson; distribution observée.

OUI NON TOTAL
1 20 60 80
2 40 160 200
3 10 150 160
4 et plus 10 350 360
80 720 800
(10%) (90%) (100%)8
On calculera le nombre de personnes qui devraient posséder une
voiture théoriquement si l’effectif au foyer ne jouait aucun rôle
(effectif théorique).
Pour cela, on peut dire que le pourcentage moyen de possession

d’une voiture de sport dans la population totale (dans l’ensemble
10 %) devrait s’appliquer à l’effectif des foyers comprenant une
personne (80), à l’effectif des foyers comprenant deux personnes
(200), etc.
La distribution théorique qui résulte de l’application de ce

raisonnement est donnée par le tableau suivant:
9
Il s’agit par la suite de trouver le découpage qui maximise l’écart (C)
entre l’effectif observé (Oi) et l’effectif théorique (Ei).
Pour cela, on définit les différents découpages possibles:
1er découpage 1 personne vs 2 p et plus

?
2ème découpage Plus
1 et 2 p au foyer vs 3 p et plus
discriminant
?
3ème découpage 1 à 3 p au foyer vs 4 p et plus
et on calcule dans chaque cas la somme des écarts entre l’effectif observé et
l’effectif théorique défini précédemment.
Pour éviter que les écarts positifs et les écarts négatifs se compensent, on élève
chaque écart au carré.
Les résultats sont résumés dans le tableau suivant:
10
Segmentation dichotomique: effets théoriques
OUI NON TOTAL
10% 90%
1 10% x 80 90% x 80 80
2 10% x 200 90% x 200 200
3 10% x 160 90% x 160 160
4 et + 10% x 360 90% x 360 360
80 720 800
distribution observée effets théoriques
OUI NON OUI NON

10% 90%
20 60 1 8 72
40 160 2 20 180
10 150 3 16 144
10 350 4 et + 36 324
80 720 𝒊=𝟐
෍ 𝑬𝒊 − 𝑶𝒊 𝟐
11 𝒊=𝟏
Segmentation dichotomique: réduction à deux modalités.
𝒊=𝟐
Découpages possibles ෍ 𝑬𝒊 − 𝑶𝒊 𝟐
Écart C
𝒊=𝟏
1 personne
contre (8 – 20)2 + (72 – 60)2 288
2 personnes et plus.
1 et 2 personnes
contre (28 – 60)2 + (252 – 220)2 2 048
1 à 3 personnes
contre (44 – 70)2 + (396 – 370)2 1 352
Dans ce cas, le découpage le plus discriminant est celui qui oppose les familles
comprenant une ou deux personnes à celles qui comptent trois personnes ou
plus.
Ce qui semble parfaitement logique car les voitures de sport n’ont le plus souvent
que deux places confortables.
12
Après avoir examiné le lien entre
Effectif au foyer Possession de voiture de sport
La deuxième étape consiste à déterminer parmi les trois variables (Eff. Foyer,
Revenu et Age) celle qui est la plus discriminante.
Pour cela, on commence par appliquer applique le même raisonnement que
précédemment, et l’on calcule pour chaque variable préalablement réduite la
somme des écarts au carré entre l’effectif théorique et l’effectif observé (voir
tableau suivant):
Age Possession de voiture de sport
Revenu Possession de voiture de sport
13
Possession
d’une OUI NON Total
voiture de Eff. obs. Eff. th. Eff. obs. Eff. th. (E)
sport
Eff. 1 ou 2 p 60 28 220 252 280
foyer
3p ou + 20 52 500 468 520
18 à 49a 55 48 425 432 480
Age
50a et + 25 32 295 288 320
80M€ (A) 50 12 70 108 120
Revenu
Moins 80 30 68 650 612 680
(BCD)
80 80 720 720 800
Après, faudrait à calculer pour chaque variable ainsi réduite à deux modalités, la somme des
écarts au carré entre l’effectif théorique et l’effectif observé; on obtient pour :
Effectif Foyer : (28 - 60)² + (252 - 220)² = 2048 ;
Effectif Age : (48 – 55)2 + (432 – 425)2 = 98 et
Revenu : (12 – 50)2 + (108 – 70)2 = 2888
Le revenu est donc le critère le plus discriminant pour la possession d’une voiture
de sport. 14
Arbre de segmentation
Taux de
possession d’une
800
voiture de sport
10%
120 680
Catégorie A Catégories BCD
Taux de Taux de
possession 41% possession 4,4%
PourPour
affiner la segmentation,
affiner la segmentation,il faut reprendre
il faut dansdans
reprendre chaque catégorie
chaque de revenu
catégorie (A, B, C, D)
de revenu
les (A,
calculs
B, C,précédents (y compris
D) les calculs précédentsla phase de réduction)
(y compris la phaseafin
de de compléter
réduction) afinl’arbre
de de
1 compléter
ou 2 personnes
segmentation. 3 personnes et
l’arbre de segmentation. Moins de 35 ans 35 ans et plus
au foyer plus au foyer Taux de Taux de
NB:NB:le Taux de qui qui
critère
le critère intervient Taux
intervienten en desecond
second n’est possession
paspas
n’est nécessairement
nécessairement le le possession
même
même sursurchaque
possession
branche
chaque 50% dedesegmentation.
de branche
l’arbre possession
l’arbre 8%
de segmentation. 15% 1%
Les pourcentages sont donnés par les tableaux de contingences relatifs à chaque segment détecté.
15
Synthèse:
Pour arriver à cet arbre de segmentation final, on a procédé comme

suit :
Etudes préalables: des études exploratoires nous ont permis de

déterminer qu’il y a trois variables sociodémographiques (nominales) qui
pourraient influer sur l’acquisition des voitures de sport :
- l’effectif par foyer (désigné en classes),
- l’Age (désigné en classes) et
- le Revenu (ou classes sociales désignées par catégories A, B, C, D)
Le but de la démarche et d’élaborer une segmentation statistique très

utile pour distinguer les groupes d’acheteurs d’un Marché de Référence
dans le cadre d’une segmentation stratégique ou macro segmentation.
16
1ére étape consiste à réduire chaque variable en variable
dichotomique (deux modalités).
Comme nous l’avons fait avec la première variable (effectif par foyer).
Nous refont le même travail avec le deux variables restantes.
Nous avons obtenu pour l’Age deux modalités (18 à 49 ans ; 50 ans et
plus), pour le Revenu (80M€ et plus ; BCD).
La 2éme étape consiste à calculer pour chaque variable ainsi réduite à

deux modalités, la somme des écarts au carré entre l’effectif
théorique et l’effectif observé; on obtient pour :
Effectif Foyer : (28 - 60)² + (252 - 220)² = 2048 ;
Effectif Age : 98 et
Revenu : 2888.
Le revenu est donc le critère le plus discriminant pour la possession

d’une voiture de sport.
17
La troisième étape consiste à reprendre dans chaque catégorie de revenu
(« A » d’un côté et « BCD » de l’autre coté) les calculs précédents.
On les reprend avec les deux variables restantes l’«Age» et l’«Effectif par
foyer». On reprend les calculs précédents (de nouvelles réductions à deux
modalités et de nouveaux calculs des sommes des carrés des écarts entre
les effectifs théorique et les effectifs réels) d’abord pour les 120 individus
de la Classe « A » et ensuite pour les « 680 » individus des classe BCD.
Pour les Revenus « A » la variable la plus discriminante est l’effectif par

foyer (1 ou 2 personnes ; 3 personnes et plus). Pour les Revenus BCD, la
variable la plus discriminante est l’Age (moins de 35 ans ; 35 ans et plus).
Nous remarquons au passage que la réduction de la variable Age à
l’intérieur de la classe Revenus « BCD » nous a donné deux nouvelles
modalités (moins de 35 ans ; 35 ans et plus), alors que dans toute la
population on obtenait (18 à 49 ans ; 50 ans et plus).
La dernière étape consiste à dessiner l’arbre de segmentation. Les

pourcentages sont donnés par les tableaux de contingences relatifs à
chaque segment détecté.
18
Age
Revenu A
- ]18 – 35]
(120)
- ] 35 – 49]
Revenu A Eff. au foyer

(120) - 1 ou 2 p
- 3 et + p
Age
Revenu BCD - ]18 – 35]
(680) - ] 35 – 49]
Eff. au foyer
Revenu BCD
- 1 ou 2 p
(680)
- 3 et + p
19
Arbre de segmentation
Taux de
possession d’une
voiture de sport
10%
Catégorie A Catégories BCD

Taux de possession Taux de possession
41% 4,4%
1 ou 2 personnes 3 personnes et + Moins de 35 ans 35 ans et plus

au foyer au foyer
Taux de possession Taux de possession Taux de possession Taux de possession
50% 8% 15% 1%
Les pourcentages sont donnés par les tableaux de contingences relatifs à

chaque segment détecté.
20
CAS 2: Segmentation du hard discount par la méthode du Khi-deux
Le premier magasin alimentaire hard discount en France a ouvert

dans la banlieue de Lille en 1989. Deux ans plus tard, le
développement de cette forme de vente est encore limité, et se
concentre dans les régions du nord et de l’est de la France.
Pour évaluer le potentiel d'expansion de cette forme de vente, il est
souhaitable de caractériser le profil de ses premiers clients.
Une étude a été réalisée dans une ville de Lorraine en 1990.
Pour la commodité de la présentation, toutes les variables de cette

étude sont traitées sous forme dichotomique:
- client vs non-client d'au moins une enseigne de hard discount pour
la variable expliquée,
- et traitement dichotomique des modalités des variables nominales
définissant les critères de segmentation.
21
Un échantillon de 585 ménages est analysé.
OUI
NON
Une proportion de 55,73 % de ces ménages est cliente d‘une enseigne

de hard discount (CLHD)
22
AGE
1/2
ETUD
1/2
PROF
1/2
CLHD
0 /1
FAM
1/2
ENFT
1/2
Descripteurs sociodemo Var. de comportement

Explicatives (indépendantes) À expliquer (dépendante)
23
Cinq descripteurs sociodémographiques de cet échantillon ont été
mesurés. Pour la commodité de la présentation, rappelons qu’ils sont
codés dans cette analyse sous forme binaire :
Variables Modalité CLAS N

Age Moins de 40 ans CLASAGE = 1 303
Plus de 40 ans CLASAGE = 2 282
Niveau d’Etudes Prim. / Secd CLASETUD = 1 455
ETUD Supérieur CLASETUD = 2 130
Catégorie supérieur CLASPROF = 1 143
Professionnelle Basse / Moyenne CLASPROF = 2 442
PROF
Effectif Famille 3 ou moins CLASFAM = 1 370
FAM Plus de 3 CLASFAM = 2 215
Nombre enfants 0 ou 1 CLASENFT = 1 368
ENFT 2 ou plus CLASENFT = 2 217
24
Pour identifier le premier critère de partition de la population entre
clients et non-clients du hard discount (variable CLHD), cette variable est
croisée avec chacun des cinq descripteurs, et le test de Khi-deux est
appliqué à chacun des tableaux de contingence ainsi élaborés (tableau
2).
Cette variable (Age) définit le premier niveau de segmentation du marché

du HD
25
Pour rechercher le critère de segmentation suivant, l'échantillon est scindé en
deux groupes selon les modalités de la variable CLASAGE.
Les quatre critères de segmentation restant sont croisés avec la variable de

comportement, et le test de Khi2 est appliqué à chacun des tableaux de
contingence ainsi élaborés. Le tableau 3 suivant présente le résultat de cet
ensemble de traitements.
Tableau 3 – test de dépendance de la var. de comportement et des critères de
segmentation par classes d’âge
Classe âge 1 Classe âge 2
Critères de seg. Stat DF Valeur Proba. Valeur Proba.
CLASPROF Khi-2 1 11,7363 0,0006 ,7052 0,1916
CLASETUD Khi-2 1 14,3471 0,0002 6,8264 0,0090
CLASFAM Khi-2 1 1,1348 0,2867 3,0765 0,0794
CLASENFT Khi-2 1 2,3852 0,1225 3,3416 0,0675
26
À l'intérieur de la classe d'âge 1, le test de Khi-deux a la valeur la plus
élevée la relation entre la variable de comportement et le critère de
segmentation « Niveau d'études » (CLASETUD). Cette variable définira le
deuxième niveau de segmentation du marché hard discount.
Le même résultat est obtenu à l’intérieur de la classe d’âge 2. C’est donc le

même critère de segmentation qui sera retenu pour définir le deuxième
niveau de segmentation du marché à l’intérieur des classes d’âge.
Les effectifs des quatre groupes issus du 2ème niveau de la segmentation

sont compatibles avec la mise en œuvre du test de khi-deux pour
rechercher l’influence éventuelle d’un 3ème critère de segmentation.
A l’intérieur de chacun de ces quatre groupes, un test de khi-deux est

donc appliqué au croisement de la variable de comportement et des trois
critères de segmentation qui n’ont pas encore été retenus: catégorie
professionnelle, effectif de la famille et nombre d’enfants.
27
Tableau 4 – Test de khi-deux au troisième niveau de segmentation
Classe âge 1 Classe âge 2

Etude 1 Etude 2 Etude 1 Etude 2
Critères de Stat DF Valeur Proba. Valeur Proba. Valeur Proba. Valeur Proba.
seg.
CLASPROF Khi-2 1 1,5507 0,2130 1,2440 0,2647 0,0800 0,7773 0,0556 0,8136
CLASFAM Khi-2 1 0,5881 0,4432 0,0136 0,9070 2,4420 0,1181 1,4722 0,2250
CLASENFT Khi-2 1 1,3653 0,2426 0,0860 0,7694 3,2550 0,0712 0,3068 0,5797
Le tableau 4 montre qu’il n’est plus possible de retenir un troisième niveau de

segmentation , puisqu’aucun test de khi-deux n’est significatif à un seuil de 5%
La figure suivante décrit la structure complète de la segmentation retenue.
28
Echantillon
complet (N=585)
Khi-2 = 26,92
Classe Âge 1 Classe Âge 2

(N= 282) (N = 303)
Khi-2 = 14,34 Khi-2 = 6,82
Niveau Etudes 1 Niveau Etudes 2 Niveau Etudes 1 Niveau Etudes 1

(N = 202) (N = 80) (N = 253) (N = 50)
Figure: Résultat de l’application des deux critères de segmentation
29
Si l’on applique le second critère de segmentation (niveau d’études), on voit
que la clientèle de niveau d’études primaire ou secondaire constitue le cœur
de la cible de la HD qui réalise un taux de pénétration dans cette population
de 62% chez les moins de 40 ans, et encore 47% chez les plus de 40 ans.
Il est remarquable d’observer que contrairement a une idée reçue persistante,

la catégorie professionnelle n’est pas un critère de segmentation significatif
pour cette forme de vente.
30
2- Les méthodes de segmentation typologiques ascendantes ou
descriptives.
• Principes généraux de la classification:
La démarche descriptive est différente: elle consiste à regrouper les

individus aux comportements visiblement proches pour ensuite
tenter d’identifier leurs caractéristiques communes.
Les bases de données décrivant les consommateurs peuvent, en
effet, être soumises à des techniques typologiques dites de
clustering.
La typologie donne lieu à des groupes de consommateurs tels que
l’homogénéité soit maximale à l’intérieur des groupes et minimale
entre les groupes. Cependant, dans la pratique, les limites entre les
groupes, et surtout le nombre de groupes, restent parfois
arbitraires.
31
• Typologie des méthodes descriptives multivariées
32
• Typologie des méthodes de classification:
fondées sur la classification, de nombreuses méthodes sont disponibles

pour effectuer des typologies, qu’elles soient basées sur une approche
intuitive ou sur l’application d’algorithmes mathématiques.
Parmi les méthodes les plus répandues de classification, notons la

classification à vue, la classification hiérarchique ascendante (Hierarchical
Cluster Analysis) et la classification non hiérarchique par les centres
mobiles ou les nuées dynamiques (K-Means Cluster Analysis).
33
Si le nombre d’acheteurs est réduit, tel sur les marchés « B to
B », c’est la classification hiérarchique ascendante qui est
conseillée. Nous développerons, dans ce qui suit, en premier lieu
cette méthode (selon Ward) qui consiste à regrouper pas-à-pas les
individus, en privilégiant, à chaque étape, la similarité la plus
forte, en fonction de la distance entre deux individus.
Si le nombre d’observations est supérieure à 100, il est

recommandé d’utiliser les nuées dynamiques. C’est d’ailleurs la
plus couramment utilisée dans les travaux de segmentation des
marchés « B to C ». Sur ces marchés, la classification hiérarchique
est trop longue au delà de 100 individus.
34
• Principes de la classification hiérarchique ascendante
Initialement, chaque individu forme une classe et on cherche à

réduire le nombre de classes, en procédant, à chaque étape, à la
fusion de deux classes, dans le but de réduire ainsi le nombre de
classes.
Les deux classes choisies pour être fusionnées sont celles qui
sont les plus "proches", en d'autres termes, celles dont la
dissimilarité entre elles est minimale.
35
Comme on rassemble d'abord les individus les plus proches, la
première itération a un indice d'agrégation faible, mais celui-ci va
croître d'itération en itération. On procède ainsi jusqu’à parvenir à
un nombre de groupes optimal. Celui-ci sera atteint lorsque l’ajout
d’un nouveau regroupement ne ferait pas gagner en capacité
discriminatoire.
La visualisation de ce procédé se fait sur un graphe de

regroupement appelé dendrogramme, qui nous donne la
composition des différentes classes, ainsi que l’ordre dans lequel
elles ont été formées.
36
• Mise en œuvre
Représenter les individus par un ensemble

de parties hiérarchiquement emboîtées.
Méthode Méthode
« descendante »: « ascendante »:
du groupe aux individus des individus au groupe
Les différents regroupements peuvent être

représentés graphiquement à l’aide d’un
dendrogramme.
37
Classifications hiérarchiques
Méthode « ascendante »
38
Dendrogramme
indice
nœud 9
nœud 8
nœud 6 nœud 7
(1) (2) (3) (4) (5)
Individu d’origine
39
Méthode « ascendante »
Etape 1 Etape 2 Etape 3
1 1 1
2 2 2
3 3 3
5 5 5
4 4 4
Etape 4 Etape 5
1 1
2 2
3
3
5 5
4 4
40
Individu F1 F2 Analyse typologique - Classifications hiérarchiques
Individu 1 -1.3844 0.7654
Individu 2 -2.0832 -0.0437
1.5
Individu 3 1.8071 0.9340
Individu 4 -1.9049 -0.8467 1.0 3

Individu 5 1.4685 -0.5759 7
1
Individu 6 2.3667 -0.2153 0.5
Individu 7 -1.4825 0.9420 9

-2.0 -1.5 -1.0 -0.5
Individu 8 -1.9978 -0.4031
0.0 0.5 1.0 1.5 2.0
2
Individu 9 2.2904 0.0925 8 6
-0.5
5
Individu 10 0.9201 -0.6492 10
4
- 1.0
- 1.5
d(I3 /I4) = 𝑭𝟏 𝟑 − 𝑭𝟏 𝟒 𝟐 + 𝑭 𝟐 𝟑 − 𝑭𝟐 𝟒 𝟐 = 4.11

41
1 2 3 4 5 6 7 8 9 10
1
2 1.069
3 3.196 4.011
4 1.694 0.822 4.117
5 3.153 3.591 1.547 3.384
6 3.877 4.453 1.278 4.318 0.968
7 0.202 1.154 3.290 1.838 3.318 4.019
8 1.320 0.369 4.033 0.453 3.471 4.368 1.440
9 3.736 4.376 0.970 4.299 1.059 0.317 3.867 4.317
10 2.704 3.064 1.815 2.832 0.553 1.510 2.882 2.928 1.558
Indice d’agrégation faible 42

Classifications hiérarchiques - Dendrogramme
1.5
1.0 3
7
1
0.5
-1.5 -1.0 9
-2.0 -0.5
0.0 0.5 1.0 1.5 2.0
2
1 8 6
-0.5
5
7 10
4
- 1.0
0 0.5 1
- 1.5
0.202
43
Sur la figure, ce sont les éléments (1) et (7) que l’on agrège en un
seul élément noté (1/7) appelé nœud.
Chaque nœud est défini par :
• ses deux successeurs : l’aîné et le benjamin (éléments (7) et (1)),

• son poids (nombre d’éléments: 2)
• et son indice de niveau qui n’est autre que la distance entre les
éléments ((7) et (1)).
44
Individu F1 F2
Individu 1/7 -1.4335 0.8537
Individu 2 -2.0832 -0.0437
Individu 3 1.8071 0.9340
Individu 4 -1.9049 -0.8467
Individu 5 1.4685 -0.5759
Individu 6 2.3667 -0.2153
Individu 8 -1.9978 -0.4031
Individu 9 2.2904 0.0925
Individu 10 0.9201 -0.6492
45
1/7 2 3 4 5 6 8 9 10
1/7
2 1.10
3 3.242 4.011
4 1.765 0.82 4.117
5 3.235 3.591 1.547 3.384
6 3.948 4.453 1.278 4.318 0.968
8 1.378 0.369 4.033 0.453 3.471 4.368
9 3.80 4.376 0.970 4.299 1.059 0.317 4.317
10 2.792 3.064 1.815 2.832 0.553 1.510 2.928 1.558
46
1.5
6
9 1.0 3
1/7
0.5
-1.5 -1.0 9
-2.0 -0.5
0.0 0.5 1.0 1.5 2.0
2
1 8 6
-0.5
5
7 10
4
- 1.0
0 0.5 1
- 1.5
0.317
47
1/7 6/9 2 3 4 5 8 10
1/7
6/9 3.872
2 1.108 4.412
3 3.242 1.124 4.011
4 1.765 4.306 0.822 4.117
5 3.235 1.002 3.591 1.547 3.384
8 1.378 4.340 0.369 4.033 0.453 3.471
10 2.792 1.526 3.064 1.815 2.832 0.553 2.928
48
1.5
6
9 1.0 3
1/7
2 0.5
8 6/9
-2.0 -1.5 -1.0 -0.5
0.0 0.5 1.0 1.5 2.0
2
1 8
-0.5
5
7 10
4
- 1.0
0 0.5 1
- 1.5
0.369
49
1/7 6/9 2/8 3 4 5 10

1/7
6 6/9 3.872
9 2/8 1.236 4.372
3 3.242 1.124 4.018
5 4 1.765 4.306 0.638 4.117
10 5 3.235 1.002 3.527 1.547 3.384
2 10 2.792 1.526 2.991 1.815 2.832 0.553
8
1
7
0.5 1
0.553 50
1/7 6/9 2/8 5/10 3 4

1/7
6 6/9 3.872
9 2/8 1.236 4.372
5/10 3.009 1.261 3.258
5 3 3.242 1.124 4.018 1.664

10 4 1.765 4.306 0.638 3.108 4.117
2
8
4
1
7
0.5 1
0.638 51
Classifications hiérarchiques - Dendrogramme 1/7 6/9 5/10 2/8/4 3
1/7
6/9 3.872
5/10 1.402 4.340
6 2/8/4 3.009 1.261 3.195

9 3 3.242 1.124 4.040 1.664
3
5
10
2
8
4
1
7
0.5 1 1.5 2
1.124
52
1/7 5/10 2/8/4 6/9/3 Classifications hiérarchiques - Dendrogramme
1/7
1/7 2/8/4 5/106/9/3
5/10 3.009
1/7
2/8/4 1.402 3.195
2/8/4 1.402
6/9/3 3.635 1.305 4.209
6 5/106/9/3 3.338 3.782
9
3
5
10 1/7/2/8 5/10/6
/4 /9/3
2
1/7/2/8/4
8
5/10/6/9/3 3.545
4
1
7
0.5 1 1.5 2 3
3.545
1.305 1.402 53
Classifications
hiérarchiques
54
✂
6
9
3
5
10
2
8
4
1
7
0.5 1 1.5 2 3
✂
✂
55
Résultats SPAD
NUM. AINE BENJ EFF POIDS INDICE

11 7 1 2 2 0.00204
12 8 9 2 2 0.00503
13 6 2 2 2 0.00682
14 5 10 2 2 0.01530
15 4 13 3 3 0.02712
16 12 3 3 3 0.08419
17 16 14 5 5 0.20424
18 15 11 5 5 0.23599
19 17 18 10 10 3.14170
Somme des indices de niveau = 3.72244
56
LISTE DES 3 MEILLEURE(S) PARTITION(S)
ENTRE 3 ET 7 CLASSES
1 - PARTITION EN 5 CLASSES
57
Résultats SPAD
✂
✂
58
1.5
7 1.0 3
Inertie inter-classes + 1
Groupe 1
Inertie intra-classes =
0.5
Inertie totale Groupe 4
9
-2.0 -1.5 -1.0 -0.5
2 0.0 0.5 1.0 1.5 2.0
6
8 Groupe 3 -0.5
5
10
4
- 1.0
- 1.5
59
Interpréter et valider la typologie : une étape décisive
A l’issue de la CAH, le chargé d’études devra comparer les différents scénarios de

classification en évaluant leur capacité discriminante à composer des groupes les
plus différents possibles. L’analyse des variables internes permet ainsi de vérifier
que chaque groupe obtient des valeurs statistiquement différentes sur les
variables employées dans la construction de la typologie.
Avec la variable fermée créée à partir de la classification, chaque individu sera

alors affecté dans un des groupes. Il sera alors possible de croiser cette variable
avec d’autres variables de l’enquête. Dans un premier temps, il s’agira des
variables d’identité qui serviront à qualifier les populations de chaque classe et
donc à mieux comprendre comment la population étudiée se découpe. Cela
permettra notamment de nommer les différents groupes de manière à mieux les
identifier et simplifier la lecture des analyses pour la suite.
60
Votre expertise au service de vos analyses
Au-delà de la maîtrise des techniques statistiques qui les sous-

tendent, les typologies requièrent une capacité d’interprétation et
donc une excellente compréhension du sujet de l’étude. Par ailleurs,
elles nécessitent un certain talent dans la mise en forme des résultats,
pour que les chiffres et les statistiques se transforment en
informations utiles à la connaissance et la prise de décision.
Utilisées avec modération et en toute connaissance de cause, les

typologies permettent au chargé d’études de dégager et de
représenter efficacement les informations essentielles contenues dans
les résultats d’une enquête.
61

Chap 4 Segmentation Statistique

Transféré par

Informations du document

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

Chap 4 Segmentation Statistique

Transféré par

Droits d'auteur :

Formats disponibles

Chapitre IV-

La segmentation est le découpage du marché total en sous-

La macro segmentation: est la segmentation qui identifie les

Les différents regroupements peuvent être

1- L’approche descendante de segmentation explicative

Dans cette approche, le marketeur considère plusieurs critères, pour

Plusieurs méthodes quantitatives permettent de déterminer des critères

Pour segmenter le marché en fonction du type de véhicule possédé

Sur la base des caractéristiques On pose les Variables

La démarche consiste à identifier pas à pas les variables les plus

Le découpage plus pertinent ??

on observera la répartition suivante:

Segmentation dichotomique C de Belson; distribution observée.

Pour cela, on peut dire que le pourcentage moyen de possession

La distribution théorique qui résulte de l’application de ce

Pour cela, on déﬁnit les différents découpages possibles:

1er découpage 1 personne vs 2 p et plus

OUI NON OUI NON

Effectif au foyer Possession de voiture de sport

Age Possession de voiture de sport

Revenu Possession de voiture de sport

Pour arriver à cet arbre de segmentation final, on a procédé comme

Etudes préalables: des études exploratoires nous ont permis de

Le but de la démarche et d’élaborer une segmentation statistique très

La 2éme étape consiste à calculer pour chaque variable ainsi réduite à

Le revenu est donc le critère le plus discriminant pour la possession

Pour les Revenus « A » la variable la plus discriminante est l’effectif par

La dernière étape consiste à dessiner l’arbre de segmentation. Les

Revenu A Eff. au foyer

Catégorie A Catégories BCD

1 ou 2 personnes 3 personnes et + Moins de 35 ans 35 ans et plus

Les pourcentages sont donnés par les tableaux de contingences relatifs à

Le premier magasin alimentaire hard discount en France a ouvert

Pour la commodité de la présentation, toutes les variables de cette

Une proportion de 55,73 % de ces ménages est cliente d‘une enseigne

Descripteurs sociodemo Var. de comportement

Variables Modalité CLAS N

Cette variable (Age) définit le premier niveau de segmentation du marché

Les quatre critères de segmentation restant sont croisés avec la variable de

Le même résultat est obtenu à l’intérieur de la classe d’âge 2. C’est donc le

Les effectifs des quatre groupes issus du 2ème niveau de la segmentation

A l’intérieur de chacun de ces quatre groupes, un test de khi-deux est

Classe âge 1 Classe âge 2

Le tableau 4 montre qu’il n’est plus possible de retenir un troisième niveau de

La figure suivante décrit la structure complète de la segmentation retenue.

Classe Âge 1 Classe Âge 2

Khi-2 = 14,34 Khi-2 = 6,82

Niveau Etudes 1 Niveau Etudes 2 Niveau Etudes 1 Niveau Etudes 1

Figure: Résultat de l’application des deux critères de segmentation

Il est remarquable d’observer que contrairement a une idée reçue persistante,

• Principes généraux de la classification:

La démarche descriptive est différente: elle consiste à regrouper les

fondées sur la classification, de nombreuses méthodes sont disponibles

Parmi les méthodes les plus répandues de classification, notons la

Si le nombre d’observations est supérieure à 100, il est

Initialement, chaque individu forme une classe et on cherche à

La visualisation de ce procédé se fait sur un graphe de

Représenter les individus par un ensemble

Les différents regroupements peuvent être

(1) (2) (3) (4) (5)

Individu 4 -1.9049 -0.8467 1.0 3

Individu 7 -1.4825 0.9420 9

d(I3 /I4) = 𝑭𝟏 𝟑 − 𝑭𝟏 𝟒 𝟐 + 𝑭 𝟐 𝟑 − 𝑭𝟐 𝟒 𝟐 = 4.11

Indice d’agrégation faible 42