Académique Documents
Professionnel Documents
Culture Documents
TYPOLOGIQUE
R. JAHIDI ADD 1
Objectifs
R. JAHIDI ADD 2
ETAPES DE
L’ANALYSE
R. JAHIDI ADD 3
A) Choix des variables de classifications
R. JAHIDI ADD 4
B) Données
Variables
X1 X2 X3 ... Xp
O1
O2
Objets
ou O3
Individus ..
.
On
R. JAHIDI ADD 5
Transformer les données brutes en
une matrice de proximité des objets
ou individus
Objets ou individus
O1 O2 O3 ... On
O1
O2
Objets
ou O3
Individus ..
.
On
R. JAHIDI ADD 6
Exemple de mesure de la distance
R. JAHIDI ADD 8
Chaque individu constitue une classe en soi. Dans
la première étape, les deux individus les plus
proches sont fusionnés pour former une classe …
et ainsi de suite… la fusion pouvant se faire entre
les classes, entre une classe et un individu.
L’allocation d’un individu à une classe donnée est
irrévocable; une fois qu’un individu a été associé
à une classe, il ne peut plus être dissocié pour
être fusionné avec d’autres individus
appartenant à une autre classe.
R. JAHIDI ADD 9
Puisque la première classe sera
composée de deux individus, il
faudra déterminer la méthode
de calcul des distances entre
classes.
R. JAHIDI ADD 10
le saut minimum
l’individu le plus proche
R. JAHIDI ADD
11
la distance moyenne entre classes
R. JAHIDI ADD
12
Méthode de Ward
Minimiser
la variance
intra classe
R. JAHIDI ADD 13
Décomposition de la somme des carrés
totale
Xp*
* * * G2
G1 * * *
* * g2
* *
g1 * **
* * g
*
* X2*
*
*
* g3 *
* G3
X1* * *
n K K
i , g)
d 2
i =1
(x *
= k (g k , g)
n d
k =1
2
+ i , gk )
d 2
(x
k =1 iG k
*
R. JAHIDI ADD Somme des carrés Somme des carrés Somme des 14 carrés
totale = (n-1)*p = inter-classes + intra-classes
Classification ascendante hiérarchique
(Méthode de Ward)
G2
Xp*
* *
* * * * *g *
G1 * 2 Cette distance
* * *g * * * *
1* * correspond à la
* * *
*
*
Perte d’inertie
*
* X2* consécutive au
* *g3 **
* * G3
regroupement de
* *
X1 * Gi et Gj
nin j
Distance de Ward : D(Gi, Gj) = d 2 (g i , g j )
(n i + n j )
ni = effectif de la classe Gi et gi centre de la classe Gi
15
Coefficient : Somme des carrés
intra-classes de la typologie en K classes
Distance de Ward(13,15)
Chaîne des agrégations
Qualité de la typologie
en K classes :
Regroupement de Etape d'apparition de
classes la classe Etape
(261 - Coeff[n-K])/261
Etape Classe 1 Classe 2 Coeffi ci ents Classe 1 Classe 2 suivante
1 13 15 4,135E-02 0 0 2
2 13 24 ,397 1 0 18
3 12 22 ,780 0 0 19
4 3 7 1,241 0 0 16
5 28 29 1,727 0 0 14
6
Qualité de la typologie
8 23 2,267 0 0 11
7 16 17 2,810 0 0 12
en 2 classes :
8 9 25 3,636 0 0 12
9 2 26 4,670 0 0 19
indice
R. JAHIDI ADD
Individu d’origine 17
R. JAHIDI ADD 18
D) Interprétation des groupes
R. JAHIDI ADD 19
3
ACP suggère 3 11
ou 4 classes
2
6
4
20 288
23 5
29
1
25
10 19
7 1524
0 9 13 16
14 1
3 17
2
18
26
-1 12 22 21
30 27
-2
R. JAHIDI ADD
-3 -2 -1 0 1 20 2
Chaîne des agrégations
Solutions en 4 classes
Solutions en 3 classes
R. JAHIDI ADD 22
E) Validation des groupes
R. JAHIDI ADD 23
R. JAHIDI ADD 24