Académique Documents
Professionnel Documents
Culture Documents
Solution Sommaire du TD
Les données sont hétérogènes. D’une part, les unités de mesure sont différentes et en
plus la variance du MRI est plus grande que les variances des autres variables. Ainsi, Il
fallait donc diagonaliser la matrice de corrélation (i.e. on est ramené à centrer
réduire les variables initiales).
3.2 Justifier, a posteriori et d’après le tableau des valeurs propres, le choix de la matrice
de variance covariance ou la matrice de corrélation Ω ?
Par définition, l’inertie totale n’est que la variance totale et qui n’est que la somme des
variances des variables utilisées initialement pour effectuer l’ACP. Ainsi, dans le cas où
les variables sont centrées réduites, la variance est égale à 1 pour chaque variable
et par conséquent, l’inertie totale égale au nombre de variables dans le cas où elles
sont centrées réduites. Par conséquent, dans notre cas, l’inertie totale est
théoriquement égale à 6, qui est le nombre de variables utilisées.
Si nous avions opté pour la matrice de variance covariance, la trace serait égale à la
somme des variances qui vaut 579.946 + 557.721 + 504.948 + .... + 5.224695e+09, ce qui est trop
loin de 6 = trace de la matrice de corrélation (somme des valeurs propres)
Les variables ont été centrées réduites. Ainsi, la coordonnée de l’étudiant 2M sur l’axe
« MRI » sera : (1001121 - 908755.0) / 72282.0=1.28
3.4 Quelle est la valeur numérique de l’inertie du nuage des points traité ?
Les variables sont centrées réduites et la matrice de corrélation a été utilisée lors de l’ACP.
Par conséquent, l’inertie totale est égale à la somme des valeurs propres et qui vaut 6.
1
b) L'indice de KMO (Kaiser-Meyer-Olkin) qui tend vers 1 ?
0.50 et moins ==> misérable
entre 0.60 et 0.70 ==> médiocre
entre 0.70 et 0.80 ==> moyen
entre 0.80 et 0.90 ==> méritoire
plus que 0.9 ==> merveilleux.
D’après les sorties de l'ACP, on constate que l’indice de KMO est de 0.479. Par
conséquent, cet indice est misérable dans notre cas. Ainsi, cette condition
est rejetée.
Ainsi, on a deux conditions sont vérifiées parmi les trois recommandées. Par conséquent, les
données sont factorisables.
2
3.8 Donner un sens au deuxième axe factoriel ?
3.9 Quel est le pourcentage de variance expliqué par la 1ère CP ? par la 2ème CP ? par
le plan dirigé par les deux premiers axes (O,U1,U2)?
D’après les sorties de l'ACP dans le tableau des valeurs propres, on constate
que le pourcentage de variance expliquée par la première composante principale
est de 49.6% et celui expliqué par la deuxième composante principale est de
34.6%. Par conséquent, le plan dirigé par les deux premiers axes (O,U1,U2)
explique 84.2%.
3.10 Sur le plan (O,U1,U2), y a-t-il des variables mal représentées ? des individus mal
représentés ?
3.11 Selon le cercle de corrélation (O,U1,U2), que peut on dire de la corrélation entre :