Vous êtes sur la page 1sur 5

TDn°2 : Analyse multivariée

Exercice 1
On a rassemblé les résultats de 15 enfants de 10 ans à 6 subtests du WISC (scores 0 à 5).
Les variables observées sont : CUB (Cubes de Kohs), PUZ (Assemblage d'objets), CAL
(Calcul mental), MEM (Mémoire immédiate des chiffres), COM (Compréhension de
phrases), VOC (Vocabulaire).
Le protocole observé est le suivant :

Les données sont traitées par une analyse en composantes principales normée.
Les principaux résultats sont :

Matrice de corrélation
Valeurs propres et % d’inertie

Contributions des variables

Projection des individus sur le plan factoriel (F1xF2) Projection des individus sur (F1xF2)
Questions
1) Pourquoi a-t-on choisi les deux premières composantes principales pour l’analyse des
données ?
2) Quelles informations pouvez-vous tirer à partir de la matrice de corrélation des variables ?
3) Analysez et évaluer la qualité de représentation des variables dans le plan (F1xF2) [les
variables liées, non liées, leur contribution à la formation des axes…]
4) Quel est l’individu le mieux représenté et le mal représenté dans le plan (F1xF2), justifiez
5) Analysez et interprétez la projection des individus sur (F1xF2)
6) Quelle méthode complémentaire proposez-vous pour regrouper les individus les plus
proches ?
Exercice 2
Le tableau donne la répartition d’une population par classe d’âge et loisir préféré

Les données ont été traitées par une AFC et les résultats obtenus sont :
Questions
1) Dans le cas de cet exemple, quel est le nombre maximum d’axes qu’on peut retenir,
pourquoi ?
2) Que représentent les axes retenus dans le cas d’une AFC ? , Discuter leurs inerties
3) Construire les profils ligne et colonne de cet exemple
4) Quels sont les modalités contribuant le plus au premier axe factoriel? Au second axe
factoriel? Interpréter chaque axe en termes de type de loisir et de classe d’âge
5) Quels sont les loisirs préférés de chaque classe d’âge? Comparer la projection sur le plan
factoriel principal et le tableau de contingence
6) Quelles sont les classes d’âge les plus concernées par chaque type de loisir?

Exercice 3
Soit l’ensemble de données suivant : X1 = 0 ; X2 = 2 ; X3 = 6 ; X4 = 11
1) Appliquer un CAH sur ces données en utilisant le lien minimum (single link)
2) Représenter le dendrogramme
3) Discuter les différents clusters obtenus selon la distance d’agrégation

Exercice 4
On considère les 6 points M1(0, 0), M2(1, 2), M3(3, 6), M4(3, 0), M5(4, 5) et M6(6, 5).
En supposant que les deux points M1 et M4 sont les centres initiaux
1) Déroulez une itération de l’algorithme des centres mobiles
2) Faites une représentation graphique montrant les points d’étude, les clusters et les centres des
clusters

Vous aimerez peut-être aussi