Académique Documents
Professionnel Documents
Culture Documents
UNIVERSITE MOHAMMED V
FACULTES DES SCIENCES JURIDIQUES
ECONOMIQUES ET SOCIALES
MODULE :
ANIME PAR :
A. ELMARHOUM
Analyse des données.
6.1. INTRODUCTION.
A. ELMARHOUM
Analyse des données.
- matrice de rangs, formée de variables ordinales, les éléments de
la matrice représentent des rangs.
- matrice logique (binaire ou matrice de présences-absences),
composée de variables binaires ou dichotomiques. Les éléments de
la matrice sont des codes 0 et 1 qui indiquent que l’individu ou
l'objet à analyser est caractérisé par la présence ou l'absence d'un
attribut.
a) La distance euclidienne :
A. ELMARHOUM
Analyse des données.
(X −XiB ) .
p
2
dAB = iA
i =1
b) La distance rectangulaire :
p
dAB =
i =1
XiA −XiB ;
c) La distance de Mahalanobis :
Elle tient compte des corrélations entre les variables, c’est une
distance appropriée pour des variables corrélées.
d) La distance de Minkowski :
A. ELMARHOUM
Analyse des données.
p
r
dAB = r XiA −XiB
i =1
e) La distance de khi-deux :
Elle mesure les écarts entre des effectifs observés et des effectifs
théoriques, elle est à la base de l'analyse factorielle des
correspondances.
A. ELMARHOUM
Analyse des données.
- Coefficient de Jaccard et Sneath : P / (P+U)
Dans le cas des variables nominales, les données sont souvent des
codes numériques servant d’étiquettes identifiant les différentes
modalités d’une variable nominale, pour mesurer les distances entre
individus, on doit transformer cette variable nominale en autant de
variables binaires qu'il y a de modalités pour la variable nominale,
et de procéder alors comme le cas d’une matrice logique.
monothétiques
non hiérarchiques
Méthodes
polythétiques as cendantes(agglomératives)
hiérarchiques
descendantes(divis ives)
A. ELMARHOUM
Analyse des données.
6.2.3.1. Méthodes monothétiques
A. ELMARHOUM
Analyse des données.
A2. Méthode du voisin le plus éloigné (chaînage complet,
agrégation suivant le diamètre, complete linkage method)
A. ELMARHOUM
Analyse des données.
b) Méthodes de classification non hiérarchiques :
A. ELMARHOUM
Analyse des données.
- réallocation des individus aux différents groupes pour optimiser
un certain critère. Chaque individu est déplacé d'un groupe à un
autre s’il améliore le critère choisi, sinon, l'individu ne bouge pas.
Ici un même individu peut être classé dans plusieurs groupes. Cette
analyse considère au départ la matrice des corrélations entre
individus plutôt qu'entre variables. Chaque facteur correspond à un
groupe. Comme un individu peut appartenir à plusieurs facteurs avec
des poids différents, l'interprétation des groupes est très difficile.
(X −XiB ) .
p
2
dAB = iA
i =1
1 2 3 4 5 6 7 8 9 10
1
2 4,362
3 3,492 6,646
4 2,135 5,553 ,166
5 5,228 14,087 1,894 2,026
6 9,947 6,798 2,832 3,788 8,592
7 2,432 5,786 ,09554 ,009673 1,964 3,527
8 8,960 7,249 1,951 2,884 6,762 ,119 2,628
9 6,946 4,178 2,036 2,511 7,747 ,348 2,366 ,434
10 8,135 10,653 ,967 1,935 2,944 1,892 1,671 1,066 2,257
Phase 0 :
[1] ; [2] ; [3] ; [4] ; [5] ; [6] ; [7] ; [8] ; [9] ; [10]
Phase 1 :
Phase 2 :
1 2 3 4;7 5 6 8 9 10
1
2 4,362
3 3,492 6,646
4;7 2,2835 5,6695 ,13077
5 5,228 14,087 1,894 1,995
6 9,947 6,798 2,832 3,6575 8,592
8 8,960 7,249 1,951 2,756 6,762 ,119
9 6,946 4,178 2,036 2,4385 7,747 ,348 ,434
A. ELMARHOUM
Analyse des données.
10 8,135 10,653 ,967 1,803 2,944 1,892 1,066 2,257
Un nouveau groupe est obtenu par fusion des 2 groupes les plus
semblables. La plus petite distance est 0,119 entre l’individu 6 et
l’individu 8. On a alors les 8 groupes suivants :
Phase 3 :
1 2 3 4;7 5 6;8 9 10
1
2 4,362
3 3,492 6,646
4;7 2,2835 5,6695 ,13077
5 5,228 14,087 1,894 1,995
6;8 9,4535 7,0235 2,3915 3,20675 7,677
9 6,946 4,178 2,036 2,4385 7,747 ,391
10 8,135 10,653 ,967 1,803 2,944 1,479 2,257
Un nouveau groupe est obtenu par fusion des 2 groupes les plus
semblables. La plus petite distance est 0,13077 entre l’individu 3
et le groupe [4 ;7]. On a alors les 7 groupes suivants :
Phase 4 :
A. ELMARHOUM
Analyse des données.
On calcule de nouveau la distance moyenne de chaque groupe
restant avec le groupe [3 ;4 ;7]. la nouvelle matrice des distances
est donc :
1 2 3;4;7 5 6;8 9 10
1
2 4,362
3;4;7 2,6863 5,995
5 5,228 14,087 1,9613
6;8 9,4535 7,0235 2,935 7,677
9 6,946 4,178 2,3043 7,747 ,391
10 8,135 10,653 1,5243 2,944 1,479 2,257
Un nouveau groupe est obtenu par fusion des 2 groupes les plus
semblables. La plus petite distance est 0,391 entre l’individu 9 et
le groupe [6 ;8]. On a alors les 6 groupes suivants :
Phase 5 :
1 2 3;4;7 5 6;8;9 10
1
2 4,362
3;4;7 2,6863 5,995
5 5,228 14,087 1,9613
6;8;9 8,61767 6,075 2,7248 7,7003
10 8,135 10,653 1,5243 2,944 1,7383
A. ELMARHOUM
Analyse des données.
Un nouveau groupe est obtenu par fusion des 2 groupes les plus
semblables. La plus petite distance est 1,5243 entre l’individu 10
et le groupe [3 ;4 ;7]. On a alors les 5 groupes suivants :
Phase 6 :
1 2 3;4;7;10 5 6;8;9
1
2 4,362
3;4;7;10 4,0485 7,1595
5 5,228 14,087 2,207
6;8;9 8,61767 6,075 2,4782 7,7003
Un nouveau groupe est obtenu par fusion des 2 groupes les plus
semblables. La plus petite distance est 2,207 entre l’individu 5 et
le groupe [3 ;4 ;7 ;10]. On a alors les 4 groupes suivants :
Phase 7 :
1 2 3;4;5;7;10 6;8;9
1
2 4,362
A. ELMARHOUM
Analyse des données.
3;4;5;7;10 4,2844 8,545
6;8;9 8,61767 6,075 3,5226
Un nouveau groupe est obtenu par fusion des 2 groupes les plus
semblables. La plus petite distance est 3,5226 entre le
groupe[6 ;8 ;9] et le groupe [3 ;4 ;5 ;7 ;10]. On a alors les 3
groupes suivants :
Phase 8 :
1 2 3;4;5;6;7;8;9;10
1
2 4,362
3;4;5;6;7;8;9;10 5,9094 7,61875
Un nouveau groupe est obtenu par fusion des 2 groupes les plus
semblables. La plus petite distance est 4,362 entre l’individu 1 et
l’individu 2. On a alors les 2 groupes suivants :
[1;2] ; [3;4;5;6;7;8;9;10]
Phase 9 :
1;2 3;4;5;6;7;8;9;10
A. ELMARHOUM
Analyse des données.
1;2
3;4;5;6;7;8;9;10 6,764
Un nouveau groupe est obtenu par fusion des 2 groupes restant.
On a alors le groupe suivant :
[1;2;3;4;5;6;7;8;9;10]
A. ELMARHOUM
Analyse des données.
relativement homogènes et faibles. Les 6 groupes retenus par la
typologie sont donc : [1] ; [2] ; [3; 4 ;7] ; [5] ; [6;8;9] et [10].
Groupe 1 :
Groupe 2 :
Groupe 3 :
A. ELMARHOUM
Analyse des données.
Groupe 4 :
Groupe 5 :
Groupe 6 :
- Analyse
Classification
Classification hiérarchique
- Dans Variables, sélectionner les variables de classification.
A. ELMARHOUM
Analyse des données.
- Dans Graphique, cocher arbre hiérarchique.
- Dans Méthode :
Dans méthode d’agrégation, sélectionner Distance moyenne
entre classes.
Dans mesure, sélectionner le type de distance, (dans notre
exemple, carré de la distance euclidienne).
Dans transformer les variables, sélectionner standardiser
centrer-réduire
(X −XiB ) .
p
2
dAB = iA
i =1
A. ELMARHOUM
Analyse des données.
Matri ce de proximité
A. ELMARHOUM
Analyse des données.
Dans une deuxième étape, un nouveau groupe est obtenu par fusion
des 2 groupes les plus semblables. La plus petite distance est 0,119
entre l’individu 6 et l’individu 8. On a alors les 8 groupes suivants :
A. ELMARHOUM
Analyse des données.
[1] ; [2] ; [3] ; [4 ;7] ; [5] ; [6;8] ; [9] ; [10]
Dans une troisième étape, un nouveau groupe est obtenu par fusion
des 2 groupes les plus semblables. La plus petite distance est 0,131
entre l’individu 3 et le groupe [4 ;7]. On a alors les 7 groupes
suivants :
Dans une quatrième étape, un nouveau groupe est obtenu par fusion
des 2 groupes les plus semblables. La plus petite distance est 0,391
entre l’individu 9 et le groupe [6 ;8]. On a alors les 6 groupes
suivants :
Dans une sixième étape, un nouveau groupe est obtenu par fusion
des 2 groupes les plus semblables. La plus petite distance est 2,207
entre l’individu 5 et le groupe [3 ;4 ;7 ;10]. On a alors les 4 groupes
suivants :
Dans une septième étape, un nouveau groupe est obtenu par fusion
des 2 groupes les plus semblables. La plus petite distance est 3,523
entre le groupe[6 ;8 ;9] et le groupe [3 ;4 ;5 ;7 ;10]. On a alors les 3
groupes suivants :
A. ELMARHOUM
Analyse des données.
Dans une huitième étape, un nouveau groupe est obtenu par fusion
des 2 groupes les plus semblables. La plus petite distance est 4,362
entre l’individu 1 et l’individu 2. On a alors les 2 groupes suivants :
[1;2] ; [3;4;5;6;7;8;9;10]
Dans une neuvième étape, un nouveau groupe est obtenu par fusion
des 2 groupes restant. On a alors le groupe suivant :
[1;2;3;4;5;6;7;8;9;10]
Appartenance à la classe
A. ELMARHOUM