Académique Documents
Professionnel Documents
Culture Documents
Analyse de Donnees Multidimensionnelle
Analyse de Donnees Multidimensionnelle
Conclusion
Introduction :
Démarche statistique
Distance projection
Orthogonale
Le choix de la distance
Entre individus : INERTIE
Donc le cas les variances sont centrées réduits S i²=1 Inertie to-
tal est alors égale à p (nombre des variables).
« LA SOLUTION DU PROBLÈME POSÉ »
La recherche d’axes portant le maximum d’inertie équivaut à la construction de
nouvelles variables de variance maximale.
En d’autres termes, on effectue un changement de repère dans Rp de façon à se
placer dans un nouveau système de représentation où le premier axe apporte le
plus possible de l’inertie totale du nuage, le deuxième axe le plus possible de
l’inertie non prise en compte par le premier axe, et ainsi de suite.
a. Axes principaux :
On appelle axes principaux d’inertie les axes de direction les vecteurs propres
de V normés à 1. Il y en a p.
Le premier axe est celui associé à la plus grande valeur propre on le note u1.
Le deuxième axe est celui associé à la dexième valeur propre on le note u2.
…………….
…………….
…………….
b. Composantes principales :
Par Exemple :
Les composantes principales sont non corrélées deux à deux (en effet les
axes associés sont orthogonaux).
Cpj
2
C
Xi
r (c2 , xi )
r (c2 , xi ) C1
Etudiant 1
E
1
7 12 11 9 14 20 9 14,5 18 7,5 10 13 13,5 8,5
Etudiant 2
E
2
5 7 10 6 13 18 12 14,5 7 5 10 14 11,5 10,5
Etudiant 3
E
3
6 14 11,5 11 5 12,5 13 11,5 15 1 5 12 11,5 15
Etudiant 4
E
4
8,5 11 10 3 2 5 10 12 10 5 10 15 10 12,5
Etudiant 5
E
5
10,5 10 12,5 10 8 11,5 11 10 9 10 10 18 6 14,5
Etudiant 6
E
6
11 8 12,5 9 13 3 10 11,5 9 7 7 6 4,5 11
Etudiant 7
E
7
12 15 11 13 18 14 14 15,5 18 8,5 5 12 14,5 13,6
Etudiant 8
E
8
11 15 16 13 10 7 6 12 19 15 12 10 18 14
Etudiant 9
E
9
10 10 15 18 11 15 15 9 12 19 16 14 10 13
Etudiant 10
E
10
10 15 18 11 8 10 12 12 14 12 19 14 16 18
M1 :introduction à l’économie M2 :microéconomie 1 M3 :comptabilité générale 1 M4 :management 1 M5 : statistique descriptif M6 :
analyses mathématique M7 :LT 1 M8 :macroéconomie M9 :microéconomie 2 M10 :comptabilité générale 2 M11 :management 2
M12 :probabilités M13 :algèbres et math fin M14 : LT 2
On dispose les notes de 1er années économie et gestion dont 14 modules (variables statistiques)
on note M (M1 à M14) avec 10 étudiants (individus) on note E (E à E ).
i i 1 10
On transfert notre base de données dans le SPSS et en suite en décodé les variables.
droite.
Dans notre exemple, plusieurs variables sont corrélées entre elles l’ACP
satisfait on peut continuer.
Mesure de l'adéquation de l'échantillonnage (KMO)
Cette mesure donne un aperçu global de la qualité des corrélations inter-
items. L’indice KMO varie entre 0 et 1 et donne une information
complémentaire à l’examen de la matrice de corrélation.
Son interprétation va comme suit :
0,80 et plus Excellent 0,70 et plus Bien 0,60 et plus Médiocre 0,50 et plus Misérable
Moins de 0,50 Inacceptable
Cet indice augmente 1) plus la taille de l’échantillon est grande, 2) plus les
corrélations inter-items sont élevées, 3) plus le nombre de variables est grand
et 4) plus le nombre de facteurs décroît.
Combien de facteurs retenir ?
Trois règles sont applicables :
• 1ere règle : la règle de Kaiser qui veut qu’on ne retienne que les facteurs
aux valeurs propres supérieures à 1.
• 2eme règle : on choisit le nombre d’axe en fonction de la restitution
minimale d’information que l’on souhaite. Par exemple, on veut que le
modèle restitue au moins 80% de l’information.
Pour ces deux premières règles, on examine le tableau « Variance totale
expliquée ».
A₋ΦI =0 Avec :
A : matrice
Φ : valeur propre de la matrice A
I : matrice identité
3eme méthode : le « Tracé d'effondrement test » ou test du coude. On
observe le graphique des valeurs propres et on ne retient que les valeurs qui
se trouvent à gauche du point d’inflexion. Graphiquement, on part des
composants qui apportent le moins d’information (qui se trouvent à droite),
on relie par une droite les points presque alignés et on ne retient que les axes
qui sont au-dessus de cette ligne.
Composante
1 2 3 4 5
Comme observe que M14 et M11 très corrélé de plus M10 et M3 ainsi de
suite pour les autres variables on peut observer simplement les variables.
Le graphique donner une aide sur dispersion des notes des modules
C’est l’objet principale de l’ACP.