Vous êtes sur la page 1sur 2

M1 E.A.

Université de Lille

AFC

Exercice 1 (Questions de cours sur l’AFC) On considère une table de contingence N = (ni,j ) pos-
sédant m1 lignes et m2 colonnes basée sur le croisement de deux variables X1 et X2 .
a) A quoi correspond ni,j ?
b) Donner la définition du χ2 d’indépendance de ce tableau.
c) Donner les définitions des profils marginaux lignes et colonnes. Précisez dans quels espaces ils se
trouvent et ce qu’ils estiment.
d) Donner la matrice de poids des profils-lignes.
e) Donner les expressions matricielles des tableaux des profils-lignes et des profils-colonnes
f ) Calculer le point moyen des profils-lignes (avec les bons poids) et montrer qu’il est égal au profil
marginal-colonne. Comment l’interpréter ?
g) (Distance entre profils-lignes) La distance entre deux profils-lignes i et i0 est donnée par
m2  
X n ni,j ni0 ,j
dχ2 (i, i0 ) = − .
n
j=1 ·j
ni· n i0 ·

On remarque que la métrique utilisée est ici nD2−1 avec D2 la matrice des poids des profils-colonne.
Montrer alors que l’inertie totale des profils-lignes est égale à ϕ2 = χ2 /n.

Exercice 2 (Petite AFC avec calculs) Cet exercice a pour but de travailler sur un petit exemple
d’AFC. La base de données est "Couleur des yeux.txt" disponible sur Moodle. Plus précisément, les ob-
jectifs sont les suivants :
— faire des calculs matriciels avec R
— retrouver à la main des éléments théoriques du cours
— interpréter une AFC
a) Charger la base de données "Couleur des yeux.txt" sur Moodle. Attention aux séparateur et aux
"header" et la nommer N . Charger le package "FactoMineR" (pour avoir la focntion "CA"). Pensez
à convertir votre base en "matrix" pour éviter les problèmes si vous utilisez "read.table".
b) Créer un objet R (par exemple "res.CA") contenant le résultat de l’AFC sur la base de données.
Puis donner la première composante principale des profils-lignes.
c) Créer deux matrices "D1" et "D2" qui seront respectivement les poids des profils lignes et des profils
colonnes ainsi que la variable n étant le nombre total d’observations.
d) Créer un objet "res.eigen" donnant les valeurs propres et les vecteurs propres de la matrice D1−1 N D2−1 N 0 .
Remarquer que cette matrice est le produit des profils-lignes et profils-colonnes.
e) Donner les valeurs propres de D1−1 N D2−1 N 0 . En déduire que la première valeur propre est égale à
1 et que le deuxième est égale à la première valeur propre de l’AFC
f ) Observer que la première composante principale diffère du vecteur propre de D1−1 N D2−1 N 0 .
g) Les deux vecteurs de la question précédente sont colinéaires. On veut pouvoir
q passer du vecteur
propre de D1−1 N D2−1 N 0 à la première composante principale. Calculer α = λ1
0 D1
avec λ1 la
u1 n u1
plus grande valeur propre différente de 1 et u1 le vecteur propre associé à cette même valeur propre
pour D1−1 N D2−1 N 0 .
h) Montrer que la première composante principale donnée par "res.CA" est égale à αu1 .
i) Cette question traite de la formule de transition. Montrer que b1 la première composante des profils-
colonnes est égale à √1λ D2−1 N 0 a1 avec a1 la première composante des profils-lignes.
1

j) Interpréter l’AFC à partir de "res.CA".


Exercice 3 (Petite enquête AFC) Cet exercice traite de la base de données "sympa.txt". Les per-
sonnes interrogées appartiennent à différentes catégories sociales et devaient choisir 3 réponses parmi
9 pour qualifier au mieux une personnes sympatiques. Les choix sont sérieuse (seri), généreuse (gene),
gaie (gai), honnête (honn), intelligente (intl), serviable (serv), courageuse (cour), compréhensive (comp),
discrète (disc).
a) Charger la base de données dans R.
b) Donner le nombre de personnes interrogées dans cette enquête.
c) Calculer les profils marginaux -lignes et colonnes.
d) Dans quelle proportion les universitaires ont-ils estimé qu’une personne intelligente était sympa-
thique ?
e) Dans quelle proportion les vendeurs ont-ils estimé qu’une personne honnête était sympathique ?
f ) Créer un objet R contenant les résultats de l’AFC de ce tableau.
g) Donner les valeurs propres.
h) Pourquoi l’AFC ne garde–elle que 7 valeurs propres ?
i) Donner les modalités qui définissent le premier plan factoriel.
j) Quelles sont les modalités mal représentées par le premier plan ?

Exercice 4 (tâches ménagères) Réaliser l’AFC de la base de données "housetasks" disponible dans le
package "factoextra" donné en cours.

Vous aimerez peut-être aussi