Académique Documents
Professionnel Documents
Culture Documents
Université de Lille
AFC
Exercice 1 (Questions de cours sur l’AFC) On considère une table de contingence N = (ni,j ) pos-
sédant m1 lignes et m2 colonnes basée sur le croisement de deux variables X1 et X2 .
a) A quoi correspond ni,j ?
b) Donner la définition du χ2 d’indépendance de ce tableau.
c) Donner les définitions des profils marginaux lignes et colonnes. Précisez dans quels espaces ils se
trouvent et ce qu’ils estiment.
d) Donner la matrice de poids des profils-lignes.
e) Donner les expressions matricielles des tableaux des profils-lignes et des profils-colonnes
f ) Calculer le point moyen des profils-lignes (avec les bons poids) et montrer qu’il est égal au profil
marginal-colonne. Comment l’interpréter ?
g) (Distance entre profils-lignes) La distance entre deux profils-lignes i et i0 est donnée par
m2
X n ni,j ni0 ,j
dχ2 (i, i0 ) = − .
n
j=1 ·j
ni· n i0 ·
On remarque que la métrique utilisée est ici nD2−1 avec D2 la matrice des poids des profils-colonne.
Montrer alors que l’inertie totale des profils-lignes est égale à ϕ2 = χ2 /n.
Exercice 2 (Petite AFC avec calculs) Cet exercice a pour but de travailler sur un petit exemple
d’AFC. La base de données est "Couleur des yeux.txt" disponible sur Moodle. Plus précisément, les ob-
jectifs sont les suivants :
— faire des calculs matriciels avec R
— retrouver à la main des éléments théoriques du cours
— interpréter une AFC
a) Charger la base de données "Couleur des yeux.txt" sur Moodle. Attention aux séparateur et aux
"header" et la nommer N . Charger le package "FactoMineR" (pour avoir la focntion "CA"). Pensez
à convertir votre base en "matrix" pour éviter les problèmes si vous utilisez "read.table".
b) Créer un objet R (par exemple "res.CA") contenant le résultat de l’AFC sur la base de données.
Puis donner la première composante principale des profils-lignes.
c) Créer deux matrices "D1" et "D2" qui seront respectivement les poids des profils lignes et des profils
colonnes ainsi que la variable n étant le nombre total d’observations.
d) Créer un objet "res.eigen" donnant les valeurs propres et les vecteurs propres de la matrice D1−1 N D2−1 N 0 .
Remarquer que cette matrice est le produit des profils-lignes et profils-colonnes.
e) Donner les valeurs propres de D1−1 N D2−1 N 0 . En déduire que la première valeur propre est égale à
1 et que le deuxième est égale à la première valeur propre de l’AFC
f ) Observer que la première composante principale diffère du vecteur propre de D1−1 N D2−1 N 0 .
g) Les deux vecteurs de la question précédente sont colinéaires. On veut pouvoir
q passer du vecteur
propre de D1−1 N D2−1 N 0 à la première composante principale. Calculer α = λ1
0 D1
avec λ1 la
u1 n u1
plus grande valeur propre différente de 1 et u1 le vecteur propre associé à cette même valeur propre
pour D1−1 N D2−1 N 0 .
h) Montrer que la première composante principale donnée par "res.CA" est égale à αu1 .
i) Cette question traite de la formule de transition. Montrer que b1 la première composante des profils-
colonnes est égale à √1λ D2−1 N 0 a1 avec a1 la première composante des profils-lignes.
1
Exercice 4 (tâches ménagères) Réaliser l’AFC de la base de données "housetasks" disponible dans le
package "factoextra" donné en cours.