Afc001final 201215191556

Analyse Factorielle des
Correspondances (AFC)
Inertie du nuage de points
YOUTUBE
https://youtube.com/playlist?list=PLzjg2z2kYUrg6XvYVYMxdZQnouBEwavfQ
J. DABOUNOU - FST DE SETTAT
UNIVERSITE HASSAN Ier
Mai 2020
Introduction
L’analyse factorielle des correspondance se propose de déterminer des liaisons
possible entre des variables qualitatives.
Partants des modalités obtenues pour deux variables qualitatives par rapport à n
individus, l’AFC, utilisera des principes communs à toutes les méthode d’analyse
factorielle pour rendre compte des liaisons entre variables, et permettre une
réduction de la dimensionnalité des données de façon à les ramener dans un espace
qui préserve (ou explique) le maximum d’inertie.
Nous allons présenter des démarches pour réaliser une AFC à travers un exemple
simple.
J. DABOUNOU - FST DE SETTAT AFC001 - 1

Données à manipuler
On considère n individus et deux variables qualitatives V1 et V2. On désigne par xpq
pour p=1,n et q=1,2 la modalité de la variable Vq pour l’individu p. Ces données sont
représentées sous forme matricielle par :
Deux variables
Les modalités d'une variable qualitative sont
V1 V2 les différentes valeurs que cette variable peut
1 x11 x12 prendre.
2 x21 x22
n individus
3 x31 x32 Nous allons noter les I modalités de la

⁞ première variable : m11,…, m1i , … , m1I , et les
p xp1 xp2 J modalités de la deuxième variable : m21,…,
⁞ m2j , … , m2J.
n xn1 xn2
On cherche à savoir s’il y a des liaisons entre les deux variables V1 et V2.
L’analyse Factorielle des Correspondances (AFC) va nous apporter une réponse
« géométrique » à cette question. Elle va nous permettre en même temps de réduire
la dimensionnalité des données.
Tableau de contingence
On construit alors un tableau de contingence (ou tableau croisé) :
Modalités de V2
m21 m22 m2j m2J
m11 n11 n12  n1j  n1J
m12
n21 n22  n2j n2J
Modalités de V1
⁞ ⁞ ⁞
m1i ni1 ni2  nij niJ
⁞ ⁞ ⁞
m1I nI1 nI2  nIj  nIJ
nij désigne le nombre d’individus possédant à la fois la modalité m1i de V1 et la

modalité m2j de V2. On voit facilement que l’on a :
n= nij
i=1,I et j=1,J

Deux variables
Exemple simple 1
Type
bureau
Couleur
noir
2 chaise marron
3 bureau noir
Pour cet exemple, nous avons 30 individus (mobilier de 4 bureau gris
5 armoire marron
bureau) et deux variables, la variable Type (type de 6 bureau noir
mobilier) et la variable Couleur (couleur du mobilier). 7 chaise gris
8 bureau marron
On construit alors un tableau de contingence : 9 bureau marron
10 chaise gris
11 armoire noir
Modalités de Couleur
n individus
12 armoire marron
Modalités de Type
gris marron noir 13 chaise gris

14 chaise noir
armoire 1 3 5 15 bureau marron
16 bureau gris
bureau 2 6 3
17 chaise gris
chaise 5 4 1 18 bureau marron
19 chaise marron
20 bureau marron
21 chaise gris
22 armoire gris
C’est sur la base de ce tableau que nous allons procéder 23 armoire noir
dans toute la suite. 24 bureau marron
25 armoire noir
Nous allons continuer à parler de population et 26 chaise marron
27 armoire marron
d’individus même s’il s’agit de mobilier de bureau. 28 armoire noir
29 chaise marron
30 armoire noir

Données à manipuler (Exemple)
On ajoute au tableau de contingence :
• une marge colonne : colonne à droite contenant la somme des meubles quelque soit
leur couleur pour chaque type de meuble.
• une marge ligne : ligne en bas contenant la somme des meubles quelque soit leur
type pour chaque couleur.
gris marron noir TOTAL
armoire 1 3 5 9
bureau 2 6 3 11
chaise 5 4 1 10
TOTAL 8 13 9 30
On ajoute ensuite :
• une colonne dont les termes sont la proportion de population pour chacune des
modalités de la variable « Type »
• une ligne dont les termes sont la proportion de population pour chacune des
modalités de la variable « Couleur »
gris marron noir TOTAL %
armoire 1 3 5 9 0.300
bureau 2 6 3 11 0.367
chaise 5 4 1 10 0.333
TOTAL 8 13 9 30 1
% 0,267 0,433 0,300 1

Notation en termes de probabilités
n
On note : fij = nij qui spécifie la probabilité conjointe de posséder à la fois la modalité
m1i de la variable V1 et la modalité m2j de la variable V2. On voit alors que la marge
colonne (respectivement la marge ligne) est égale au profil colonne (resp. profil ligne) :
Modalités de V2
m21 m22 m2j m2J Cm
m11 f11 f12  f1j  f1J f1.
m12 f21 f22  f2j f2J f2.
Modalités de V1
probabilités ⁞ ⁞ ⁞ ⁞
m1i fi1 fi2  fij fiJ fi.
contingence ⁞ ⁞ ⁞ ⁞
m1I fI1 fI2  fIj  fIJ fI.
Lm f.1 f.2  f.j f.J 1

Matrice des probabilités (Exemple)
Le tableau de probabilités construit, à partir de notre tableau de contingence permet
de donner plus de signification aux données.
Pour l’exemple en cours, on obtient :
gris marron noir TOTAL Cm gris marron noir Cm

probabilités
armoire 1 3 5 9 0.300 armoire 0,033 0,100 0,167 0.300
2 6 3 bureau 0,067 0,200 0,100 0.367
bureau 11 0.367
5 4 1 chaise 0,167 0,133 0,033 0.333
chaise 10 0.333 contingence Lm 0,267 0,433 0,300 1
TOTAL 8 13 9 30 1
Lm 0,267 0,433 0,300 1

Situation d’indépendance
On peut exprimer le fait que les variables soient indépendantes par : Pour tout i=1,I et
tout j=1,J on doit avoir P(m1i, m2j) = P(m1i) P(m2j), autrement dit fij = fi..f.j.
Ce qui revient à dire que la probabilité conjointe est égale au produit des probabilités
marginales. Modalités de V2
fij
Ou alors, si on se donne j{1,…,J}, avoir f = f.j. m21 m22 m2j m2J Cm
i.
m11 f11 f12  f1j  f1J f1.
Il s’agit ici d’une égalité entre la probabilité
conditionnelle (posséder la modalité m2j m12 f21 f22  f2j f2J f2.
Modalités de V1
sachant qu’on a déjà la modalité m1i) est égale ⁞ ⁞ ⁞ ⁞
à la probabilité marginale (posséder la m1i fi1 fi2  fij fiJ fi.
modalité m2j sans aucune condition sur la ⁞ ⁞ ⁞ ⁞
variable V1). m1I fI1 fI2  fIj  fIJ fI.
On a :
Lm f.1 f.2  f.j f.J 1
P(m1i, m2j) fij
P m2j m1i = =
P(m1i). fi.
et
P(m2j) = f.j
Tableaux en situation d’indépendance
Les variables V1 et V2 sont indépendantes, si pour tout i=1,I et tout j=1,J on a fij = fi..f.j.
Ce qui revient à dire que le tableau des probabilités conjointes est égal au tableau des
produits des probabilités marginales.
Ainsi, on aura :
m21 m22 m2j m2J Cm m21 m22 m2j m2J Cm
m11 f11 f12  f1j  f1J f1. m11 f1..f.1 f1..f.2  f1..f.j  f1..f.J f1.
m12 f21 f22  f2j f2J f2. m12 f2..f.1 f2..f.2  f2..f.j  f2..f.J f2.
⁞ ⁞ ⁞ ⁞ ⁞ ⁞ ⁞ ⁞
=
m1i fi1 fi2  fij fiJ fi. m1i fi..f.1 fi..f.2  fi..f.j  fi..f.J fi.
⁞ ⁞ ⁞ ⁞ ⁞ ⁞ ⁞ ⁞
m1I fI1 fI2  fIj  fIJ fI. m1I fI..f.1 fI..f.2  fI..f.j  fI..f.J fI.
Lm f.1 f.2  f.j f.J 1 Lm f.1 f.2  f.j f.J 1
Tableau des probabilités conjointes Tableau des produits des probabilités

marginales

Tableaux en situation d’indépendance
On en déduit que les variables V1 et V2 sont indépendantes, si pour tout i=1,I et tout
j=1,J on a nij = n.fi.. f.j. Autrement dit, le tableau de contingence est égal au tableau des
effectifs théoriques (ou en situation d’indépendance) :
m21 m22 m2j m2J Cm m21 m22 m2j m2J Total
m11 n11 n12  n1j  n1J n1. m11 n.f1..f.1 n.f1..f.2  n.f1..f.j  n.f1..f.J n1.
m12 n21 n22  n2j n2J n2.
m12 n.f2..f.1 n.f2..f.2  n.f2..f.j  n.f2..f.J n2.
⁞ ⁞ ⁞ ⁞
= ⁞ ⁞ ⁞ ⁞
m1i ni1 ni2  nij niJ ni.
m1i n.fi..f.1 n.fi..f.2  n.fi..f.j  n.fi..f.J ni.
⁞ ⁞ ⁞ ⁞
⁞ ⁞ ⁞ ⁞
m1I nI1 nI2  nIj  nIJ nI.
m1I n.fI..f.1 n.fI..f.2  n.fI..f.j  n.fI..f.J nI.
Lm n.1 n.2  n.j n.J 1
Total n.1 n.2  n.j n.J n
Tableau de contingence Tableau des effectifs théoriques
A noter que : n.fij = nij et n.fi.. f.j = ni..n.j

n
Test d’indépendance du Khi2
Le test d’indépendance du Khi2 étudie la liaison entre deux variables qualitatives V1 et
V2. Soient :
- Hypothèse H0: les variables V1 et V2 sont indépendantes. H0 est dite hypothèse nulle.
- Hypothèse alternative H1: les variables V1 et V2 sont liées.
Le test d’indépendance du Khi2 permet de valider H0 ou de la réfuter au profit de H1.
Ce test analyse l’écart à l’indépendance en comparant le tableau des probabilités

conjointes et le tableau des produits des probabilités marginales, ou le tableau de
contingence et le tableau des effectifs théoriques.
Sous l’hypothèse H0, les variables V1 et V2 sont indépendantes, et pour tout i=1,I et
tout j=1,J on doit avoir fij = fi..f.j.
En toute rigueur, l’égalité parfaite fij = fi..f.j n’est pas exigée. On se donne un seuil de
signification α au-delà duquel l’hypothèse H0 serait rejetée.
• On choisit souvent α=0.05 (ou 5%). Mais selon le problème posé, d’autres valeurs
de α peuvent être utilisées.

Distance du Khi2
La distance du Khi2 calcule l’écart entre effectifs observés et effectifs théoriques.
2
n − nf f
2 = ij i. .j
nfi.f.j
i=1,I j=1,J
On note parfois 2𝑜𝑏𝑠 au lieu de 2 pour préciser qu’il s’agit d’un calcul sur des
données observées.
On peut aussi écrire :
1
2 =n f − fi.f.j 2
fi.f.j ij
i=1,I j=1,J
1
Soit I tel que ∶ 2 = n I, donc : I = f −f f 2
.
fi.f.j ij i. .j
i=1,I j=1,J
2 représente la significativité de la liaison entre les variables. Il mesure l’écart entre

les effectifs observés et les effectifs théoriques .
I représente l’intensité de la liaison entre les variables. Il mesure l’écart entre les
probabilités observées et les probabilités théoriques. Elle permettra par la suite de
caractériser l’inertie des données.
Distance du Khi2 (Exemple)
Données observées :
probabilités
armoire 1 3 5 9 0.300 armoire 0,033 0,100 0,167 0.300
2 6 3 bureau 0,067 0,200 0,100 0.367
bureau 11 0.367
5 4 1 chaise 0,167 0,133 0,033 0.333
TOTAL 8 13 9 30 1
Lm 0,267 0,433 0,300 1
Données théoriques :
probabilités
armoire 2,40 3,90 2,70 9 0.300 armoire 0,08 0,13 0,09 0.300
bureau 2,93 4,77 3,30 11 0.367 bureau 0,10 0,16 0,11 0.367
chaise 2,67 4,33 3,00 10 0.333 chaise 0,09 0,14 0,10 0.333
TOTAL 8 13 9 30 1
contingence Lm 0,267 0,433 0,300 1
Lm 0,267 0,433 0,300 1
Les calculs donnent alors :

1
2 = n f − fi.f.j 2
= 75,35
fi.f.j ij
i=1,I j=1,J
1
Soit I = f − fi.f.j 2 = 2,51
fi.f.j ij
i=1,I j=1,J
Distance du Khi2
Sous l’hypothèse H0 (les deux variables sont indépendantes), pour un effectif aléatoire
de n individus, la somme
2
n − nf f
2 =
ij i. .j
ni.n.j
i=1,I j=1,J
Suit une loi du Khi2 à  = (I-1)(J-1) degrés de liberté. Il s’agit d’une somme des carrés
des écarts relativisés qui constitue une approximation asymptotique d’une somme des
carrés de  distributions normales centrées réduites indépendantes.
On remarque que  = (I-1)(J-1) = IJ-I-J+1.
Dans la somme 2 ci-dessus nous avons IJ termes. Pour ne garder qu’une somme de
terme indépendants :
1. On retranche I (une colonne) car la somme des effectifs dans chaque ligne est fixe,
2. On retranche J-1 (une ligne) parce que la somme des effectifs dans chaque
colonne est fixe. Noter qu’il reste J-1 colonnes après l’opération précédente.
Ce qui permet d’obtenir  termes indépendants.

Conditions d’application du test du Khi2
Conditions d’application du test statistique du Khi2 :
1. Les observations qui permettent de construire le tableau de contingence doivent

être aléatoires
2. Echantillon aléatoire doit avoir une taille n30.
3. Tous les effectifs théoriques tij doivent vérifier tij5.
Si un effectif théorique est inférieur à 5, on peut être amené à regrouper des lignes
(ou des colonnes) et à réinterpréter les modalités correspondantes en conséquence.

Densité de probabilité du Khi
La densité de probabilité du KHI2 pour La densité de probabilité varie selon le
un degré de liberté donné  est degré de liberté  comme le montre la
représentée par une courbe qui a la figure suivante :
forme ci-dessous :
Densité de probabilité du Khi2

Densité de probabilité pour différents ddls
L’expression de cette densité de probabilité
utilise la fonction gamma: La courbe change de forme en fonction
1  x
( 2 − 1) − 2
de . La valeur pour laquelle le maximum
𝑓 (x) =  x e
 est atteint croit avec le degré de liberté,
22 (2)
donc s’éloigne de l’origine.
Test statistique du Khi2
2 mesure l’écart entre les effectifs observés et les effectifs théoriques, donc si les deux
variables sont indépendantes, alors :
il est plus probable que le 2 ait une petite
valeur, ce que illustre la figure suivante.
il est peu probable que le 2

ait une très grande valeur.
La courbe passe par l’origine parce que la probabilité que les effectifs observés
coïncident avec les effectifs théoriques pour une observation aléatoire est nulle.
Valeur critique pour le test du Khi2
On détermine une valeur critique 2𝑐𝑟𝑖𝑡𝑖𝑞𝑢𝑒 à
l’aide de la table du Khi2 en utilisant le seuil
de signification α et le degré de liberté .
Table du Khi2
Règles de décision pour le test du Khi2
On détermine ainsi une valeur critique 2𝑐𝑟𝑖𝑡𝑖𝑞𝑢𝑒 qui dépend de la loi de probabilité
utilisée, donc du seuil de signification α et du degré de liberté , pour laquelle :
• Si l’écart observé 2 < 2𝑐𝑟𝑖𝑡𝑖𝑞𝑢𝑒 alors on rejette l’hypothèse H0
• Si l’écart observé 2  2𝑐𝑟𝑖𝑡𝑖𝑞𝑢𝑒 alors on rejette l’hypothèse H0
Accepter H0
Rejeter H0

Construction de profils colonne
Si les deux variables étaient parfaitement indépendantes alors, si l’on considère les individus qui
possèdent la modalité « gris » de la variable « couleur », alors la répartition des termes par type
doit être égale à celle de la population totale.
Ce qui exprime que le fait d’être gris n’as aucune relation avec la couleur des individus. Vérifions
si cela est vrai. Pour cela, on calcule la proportion pour chacune des modalités de la variable
« Type » par rapport à la population de modalité « gris » pour la variable « Couleur » :
gris % TOTAL %
armoire 1 0.125 9 0.300
bureau 2 0.250 11 0.367
chaise 5 0.625 10 0.333
TOTAL 8 1 30 1
% 0,267

Relation entre profils colonne
Cela doit être répété pour toutes les modalités de la variable « type d'activité ».
gris C1 marron C2 noir C3 TOTAL Cm
armoire 1 0,125 3 0,231 5 0,556 9 0,300
bureau 2 0,250 6 0,462 3 0,333 11 0,367
chaise 5 0,625 4 0,308 1 0,111 10 0,333
TOTAL 8 1 13 1 9 1 30 1
Lm 0,267 0,433 0,300 1
Les colonnes obtenues pour chaque modalité de la variable « Couleur » sont appelées profils
colonne et seront notées respectivement C1, C2 et C3. La colonne qui correspond à la population
totale s’appelle profil colonne moyen et sera notée Cm.
Pour chaque ligne i, on note ni. = ni1+ni2+ni3, et pour chaque colonne j, on note n.j = n1j+n2j+n3j.
Le ième terme de Cm, noté fi. est donc donné par :
ni. ni1+ni2+ni3 ni1 ni2 ni3
fi. = = = + +
n n n n n
ni1 n.1 ni2 n.2 ni3 n.3
Donc, fi. = + +
n.1 n n.2 n n.3 n
n.1 n.2 n.3
et ainsi, on peut écrire Cm = C1 + C2 + C3
n n n
Cette dernière relation permet de considérer Cm comme une moyenne de C1, C2 et C3, pondérée
n n n
par .1, .2 et .3, que nous allons noter respectivement par la suite f.1, f.2 et f.3.
n n n AFC001 - 21
J. DABOUNOU - FST DE SETTAT
Relation entre profils ligne
Cela doit être répété pour toutes les modalités de la variable « type ».
gris marron noir TOTAL Cm

armoire 1 3 5 9 0.300
L1 0,111 0,333 0,556 1
bureau 2 6 3 11 0.367
L2 0,182 0,545 0,273 1
chaise 5 4 1 10 0.333
L3 0,500 0,400 0,100 1
TOTAL 5 10 9 30 1
Lm 0,167 0,333 0,300 1
On construit aussi des profils ligne notés respectivement L1, L2 et L3 et un profil ligne moyen noté
Lm. On adoptant les notations introduites dans les diapositives précédentes, on montre que :
n1. n2. n3.
Lm = L1 + L + L
n n 2 n 3
On peut écrire alors Cm et Lm sous la forme :
Cm = f.1 C1 +f.2 C2 +f.3 C3
et
Lm = f1. L1 + f2. L2 + f3. L3

Les trois séries L1, L2 et L3 n’ont pas la même « forme »:
gris marron noir
L1 0,111 0,333 0,556
L2 0,182 0,545 0,273
L3 0,500 0,400 0,100
Lm 0,267 0,433 0,300
L’attraction entre deux réalités sociales est

révélée par la différence au pourcentage
moyen. Ici il y a attraction entre le fait d’aller à
la chasse et d’être de sexe masculin.
Les trois séries L1, L2 et L3 n’ont pas la même « forme »:
Titre du graphique
0,60
0,50
0,40
0,30
0,20
0,10
0,00
gris marron noir
L1 L2 L3 Lm

Notation en termes de probabilités
Pour donner plus de signification aux notations précédentes, on construit, à partir de notre
n
tableau de contingence, le tableau de probabilités correspondant. On note : fij = ij qui spécifie la
n
probabilité conjointe de posséder à la fois la modalité m1i de la variable V1 et la modalité m2j de
la variable V2. On voit alors que la marge colonne (respectivement la marge ligne) est égale au
profil colonne (resp. profil ligne). On obtient ainsi :
Modalités de V2
m21 m22 m2j m2J Cm
probabilités m11 f11 f12  f1j  f1J f1.
m12 f21 f22  f2j f2J f2.
contingence
Modalités de V1
⁞ ⁞ ⁞ ⁞
m1i fi1 fi2  fij fiJ fi.
On peut maintenant exprimer le fait que les ⁞ ⁞ ⁞ ⁞

variables soient indépendantes. m1I fI1 fI2  fIj  fIJ fI.
Pour tout i=1,I et tout j=1,J on doit avoir fij = fi..f.j.
Ce qui revient à dire que la probabilité conjointe Lm f.1 f.2  f.j f.J 1
est égale au produit des probabilités marginales.
f
Ou alors, si on se donne j{1,…,J}, avoir ij = f.j. Il s’agit ici d’une égalité entre la probabilité
fi.
conditionnelle (posséder la modalité m2j sachant qu’on a déjà la modalité m1i) est égale à la
probabilité marginale (posséder la modalité m2j sans aucune condition sur la variable V1)
Données réelles et données théoriques
probabilités
armoire 1 3 5 9 0.300 armoire 0,033 0,100 0,167 0.300
2 6 3 bureau 0,067 0,200 0,100 0.367
bureau 11 0.367
5 4 1 chaise 0,167 0,133 0,033 0.333
TOTAL 8 13 9 30 1
Lm 0,267 0,433 0,300 1

probabilités
armoire 2,40 3,90 2,70 9 0.300 armoire 0,08 0,13 0,09 0.300
bureau 2,93 4,77 3,30 11 0.367 bureau 0,10 0,16 0,11 0.367
chaise 2,67 4,33 3,00 10 0.333 chaise 0,09 0,14 0,10 0.333
TOTAL 8 13 9 30 1
contingence Lm 0,267 0,433 0,300 1
Lm 0,267 0,433 0,300 1

Profils ligne observés
gris marron noir TOTAL Cm probabilités gris marron noir Cm
armoire 1 3 5 9 0.300 armoire 0,033 0,100 0,167 0.300
bureau 2 6 3 11 0.367 bureau 0,067 0,200 0,100 0.367
chaise 5 4 1 10 0.333 contingence chaise 0,167 0,133 0,033 0.333
TOTAL 8 13 9 30 1 Lm 0,267 0,433 0,300 1
Lm 0,267 0,433 0,300 1

armoire 1 3 5 9 0,300
L1 0,111 0,333 0,556 1
bureau 2 6 3 11 0,367 Armoire (9) Bureau (11) Chaise (10)
L2 0,182 0,545 0,273 1
chaise 5 4 1 10 0,333
L3 0,500 0,400 0,100 1
TOTAL 8 13 9 30 1,000
Lm 0,267 0,433 0,300 1
Tous type de meuble (30)

Profils ligne en cas d’indépendance
gris marron noir Cm
gris marron noir TOTAL Cm probabilités
armoire 2,40 3,90 2,70 armoire 0,08 0,13 0,09 0.300
9 0.300
bureau 2,93 4,77 3,30 bureau 0,10 0,16 0,11 0.367
11 0.367
chaise chaise 0,09 0,14 0,10
2,67 4,33 3,00 10 0.333 contingence 0.333
TOTAL Lm 0,267 0,433 0,300 1
8 13 9 30 1
Lm 0,267 0,433 0,300 1

armoire 2 4 3 9 0,300
L1 0,267 0,433 0,300 1
bureau 3 5 3 11 0,367
L2 0,267 0,433 0,300 1
chaise 3 4 3 10 0,333
L3 0,267 0,433 0,300 1
TOTAL 8 13 9 30 1,000
Lm 0,267 0,433 0,300 1

Représentation synthétique des notations
Le tableau suivant, se basant sur la structure de l’exemple traité, synthétise les notations
utilisées pour analyser les liaisons entre les variables qualitatives.
m21 C1 % m22 C2 % m23 C3 % TOTAL Cm %

m11 f11 f11/f.1 f12 f12/f.2 f13 f13/f.3 n1. f1.
L1 % f11/f1. f1..f.1 f12/f1. f1..f.2 f13/f1. f1..f.3 1
m12 f21 f21/f.1 f22 f22/f.2 f23 f23/f.3 n2. f2.
L2 % f21/f2. f2..f.1 f22/f2. f2..f.2 f23/f2. f2..f.3 1
m13 f31 f31/f.1 f32 f32/f.2 f33 f33/f.3 n3. f3.
L3 % f31/f3. f3..f.1 f32/f3. f3..f.2 f33/f3. f3..f.3 1
TOTAL n.1 1 n.2 1 n.3 1 n 1
Lm % f.1 f.2 f.3 1
Pour l’AFC, on représente les points que constituent les lignes du tableau dans l’espace RJ, où J
désigne le nombre de modalités pour la variable V2. On cherche ensuite à projeter ces points dans
un espace de dimension inférieure, comme cela se fait dans l’ACP.
On passe ensuite aux colonnes, et on refait le même processus.

Nous allons donc commencer par représenter les profils lignes, L1, L2 et L3 dans le contexte de
notre exemple, dans l’espace RJ, où J désigne le nombre de modalités pour la variable V2, J=3
dans notre exemple. On appelle alors cet espace: espace des profils.
A chaque point Li est associé un poids égal à fi.. Ce poids correspond à la proportion de population
représentée par la ligne Li, or cette proportion est justement fi..
Comme nous l’avons déjà montré, Lm constitue le centre de gravité des points Li auxquels on a
affecté les poids associés.
Lm = f1. L1 + f2. L2 + f3. L3
La somme des termes de chaque profil ligne Li est égale à 1. Ceci est vrai aussi pour le profil ligne
moyen. On en déduit que les profils ligne et le profil ligne moyen appartiennent à l’hyperplan
HPL = { x = (x1, x2,x3)  R3 | x1 + x2 + x3 = 1}.
Donc tous les profils ligne se trouvent dans un hyperplan de dimension J-1. Plus précisément
encore, tous les profiles appartiennent au simplexe de sommets e1=(1,0,…,0), e2=(0,1,…0),…,
eJ=(0,…,1). Ici nous avons J=3 ce qui simplifie beaucoup les choses.

Comme cela a déjà été expliqué dans le cours sur l’ACP, la quantité d’information contenue dans
le nuage de point peut être caractérisée par le degré de dispersion du nuage des points Li dans
l’espace RJ, sans oublier que les points ne se valent pas, chacun a un poids comme on l’a
mentionné plus haut.
Cette dispersion est évaluée en calculant l’inertie par rapport à Lm du nuage de points Li, dont la
formule est :
I= fi. d Li , Lm 2
On doit donc définir une distance sur l’ensemble des points de l’espace RJ, en tenant compte de
la nature des points Li.

Expression de l’inertie
En nous réfrénant à la figure ci-dessous, l’expression suivante donne la distance entre L3 et L5 :
2 2 2
2
f31 f11 f32 f12 f31 f31
L3 − L1 = f.1 − + f.2 − + f.1 −
f3.f.1 f1.f.1 f3.f.2 f1.f.2 f3.f.1 f3.f.1
Dans chaque terme, on normalise les éléments des deux lignes en divisant par f.j, qui est le poids
correspondant à la dimension j (ou colonne j). Ensuite, on élève au carré (norme euclidienne) et
on multiplie le résultat par f.j, puisque dans une norme, la contribution de chaque élément doit
être pondérée par le poids de la dimension considérée.
Géométriquement, la projection d’un point, ou ligne, Li = (ai1 , ai2 , ai3) sur l’axe j possède la
a
coordonnée ij.
f.j
m21 m22 m23 Cm

L1 f11/f1. f12/f1. f13/f1. f1.
L2 f21/f2. f22/f2. f23/f2. f2.
L3 f31/f3. f32/f3. f33/f3. f3.
Lm f.1 f.2 f.3 1

Pour deux lignes r et s, on aura: n nous réfrénant à la figure ci-dessous, l’expression suivante
donne la distance entre :
2 2 2
2
fr1 fs1 fr2 fs2 fr3 fs3
Lr − Ls = f.1 − + f.2 − + f.3 −
fr.f.1 fs.f.1 fr.f.2 fs.f.2 fr.f.3 fs.f.3
2
frj fsj
= f.j −
fr.f.j fs.f.j
j=1,J
2
1 frj fsj
= −
f.j fr. fs.
j=1,J
Cette dernière écriture est très convenable, puisqu’elle rappelle la distance euclidienne entre Lr et
1
Ls avec une pondération par .
f.j
On définit ainsi une distance appelée de distance de2.
On a :
2
2
1 frj fsj
d2 Lr , Ls = −
f.j fr. fs.
j=1,J

En particulier la distance entre un profil ligne Li et le profil ligne moyen Lm devient :
2 2
2
fij f.j fij
d2 Li , Lm = f.j − = f.j −1
fi.f.j f.j fi.f.j
j=1,J j=1,J
1 2
= 2 fij − fi.f.j
f f.j
j=1,J i.
On voit en particulier que, si les deux variables sont indépendantes, donc fij − fi.f.j, pour tout i=1,I
et j=1,J, et ainsi :
d2 Li , Lm 2 = 0
Ce qui veut dire que tous les points du nuage seront confondus avec le profil ligne moyen Lm.
La distance des profils ligne par rapport au profil ligne moyen exprime ainsi la dispersion du
nuage de points, et la formule qui donne l’inertie de ce nuage devient :
I= fi. d Li , Lm 2
i
1 2
= f − fi.f.j
fi.f.j ij
i=1,I j=1,J
Il est à noter que l’inertie ne tient pas

compte du nombre d’individus n.
On utilise l’expression de l’inertie à notre exemple, et on obtient :
1
I= f − fi.f.j 2
= 𝟎. 𝟏𝟑𝟒
fi.f.j ij
i=1,I j=1,J
Actifs C1 % Chômeurs C2 % Inactifs C3 % TOTAL Cm %

15 - 24 ans 0,051 0,123 0,015 0,367 0,172 0,319 6 077 913 0,239
L1 % 0,215 0,100 0,064 0,010 0,721 0,129 1
25 - 34 ans 0,123 0,294 0,018 0,439 0,092 0,170 5 936 505 0,233
L2 % 0,527 0,098 0,078 0,010 0,395 0,126 1
35 - 44 ans 0,106 0,254 0,005 0,119 0,074 0,136 4 703 813 0,185
L3 % 0,575 0,077 0,027 0,008 0,398 0,100 1
45 - 59 ans 0,108 0,257 0,003 0,063 0,088 0,163 5 043 847 0,198
L4 % 0,543 0,083 0,013 0,008 0,444 0,107 1
60 ans et plus 0,031 0,073 0,000 0,011 0,114 0,212 3 702 709 0,145
L5 % 0,210 0,061 0,003 0,006 0,787 0,079 1
TOTAL 10 663 271 1 1 051 830 1 13 749 686 1 25 464 787 1,000
Lm % 0,419 0,041 0,540 1
On remarque que dans l’expression de l’inertie du nuage de points représentant les profils ligne, i
et j jouent un rôle symétrique. On en déduit, ce qui peut d’ailleurs être démontré directement,
que l’inertie est la même que l’on considère le nuage de points représentant les profils ligne dans
l’espace RJ ou le nuage de points représentant les profils colonne dans l’espace RI.

Construire le tableau des profils colonne
La figure suivante illustre comment sont représentés les profils ligne dans l’espace des profils. Tous
les profils ligne ainsi que le profil ligne moyen se trouvent dans le triangle d’extrémités (1,0,0),
(0,1,0) et (0,0,1). Inactifs
1
60ans et plus
0.75
15-24ans
0.50
Profil ligne
moyen
0.25
25-34ans
45-59ans
35-44ans

Notation matricielle
On va utiliser des notations matricielles dans les calculs qui seront développés par la suite. Soient
P = (fij) : la matrice des probabilités,
1 1
𝕝I : le vecteur unitaire de RI : 𝕝I = 1 , et 𝕝 : le vecteur unitaire de RJ : 𝕝 = 1
⋮ J J ⋮
1 1
On a, le profil ligne moyen Lm = 𝐏t 𝕝I et le profil colonne moyen Cm = 𝐏 𝕝J. On rappelle que
f.1 f1.
Lm = f.2 et Cm = f2.
⋮ ⋮
f.J fI.
DI = diag(fi.) et DJ = diag(f.j) : les matrices diagonales dont les éléments diagonaux sont constitués
respectivement des composantes (fi.) de Cm et (f.j) de Lm.

Notation matricielle
f
Soit L = ( ij ) la matrice des profils ligne. Pour notre exemple, nous avons :
fi.
m21 m22 m23

f11/f1. f12/f1. f13/f1.
L1 % f11/f1. f12/f1. f13/f1.
f21/f2. f22/f2. f23/f2.
L= L2 % f21/f2. f22/f2. f23/f2.
f31/f3. f32/f3. f33/f3. L3 % f31/f3. f32/f3. f33/f3.
f41/f4. f42/f4. f43/f4. L3 % f41/f4. f42/f4. f43/f4.
L5 % f51/f5. f52/f5. f53/f5.
f51/f5. f52/f5. f53/f5.
Lm % f.1 f.2 f.3
f
De même, C = ( ij )t, la matrice des profils colonne pour notre exemple:
f.j
C1 C2 C3
f11/f.1 f21/f.1 f31/f.1 f41/f.1 f51/f.1
m11 % f11/f.1 f21/f.1 f31/f.1 f41/f.1 f51/f.1
C= f12/f.2 f22/f.2 f32/f.2 f42/f.2 f52/f.2 m12 % f12/f.2 f22/f.2 f32/f.2 f42/f.2 f52/f.2
f13/f.3 f23/f.3 f33/f.3 f43/f.3 f53/f.3 m13 % f13/f.3 f23/f.3 f33/f.3 f43/f.3 f53/f.3
Cm % f1. f2. f3. f4. f5.
On vérifie facilement que l’on a :
L = DI-1 P et C = DJ-1 Pt

Nous avions introduit l’expression de l’inertie du nuage des points formés par les profils ligne :
2 2
f ij f .j f ij
I= fi. d Li , Lm 2 = fi. f.j − = fi. f.j −1
fi.f.j f.j fi.f.j
i=1,I i j=1,J i j=1,J
Ce qui peut s’écrire aussi :
2
fij
− f.j
I= fi. fi.
f.j
i=1,I j=1,J
La dernière expression correspond à l’inertie du nuage de points formé par les profils ligne,
centré par rapport au profil ligne moyen et « réduit » ou normalisé en divisant par la racine
carrée du poids associé à chaque colonne, la somme des termes de l’inertie étant pondérée par
le poids de la ligne considérée. Ce qui rappelle l’expression de l’inertie dans le contexte de l’ACP.
Cependant l’expression :
1
I= fi. f − fi.f.j 2
f.j ij
i=1,I j=1,J
amène à considérer sur l’espace des profils ligne une métrique Euclidienne pondérée par l’inverse
des poids (f.j). Ainsi, le produit scalaire de deux vecteurs u,v de RJ s’écrit :
1
<u , v>2 = uj vj
f.j
j=1,J

On a vu que :
2
fij f.j
I= fi. d Li , Lm 2
= fi. f.j −
fi.f.j f.j
i i j=1,J
Ce qui peut s’écrire aussi :
1
I= f − fi.f.j 2
fi.f.j ij
i=1,I j=1,J
En utilisant les notations matricielles on obtient :

I = tr(DI−1(P − Cm Ltm ) DJ−1(P − Cm Ltm )t)
I représente l’inertie totale du nuage de points formé par les profils ligne.

Projeter les profils ligne sur un axe
Comme pour l’ACP, on cherche un vecteur unitaire u1 pour projeter le nuage de points sur l’axe
qui récupère un maximum d’inertie.
On prend G=Lm comme centre du repère. Nous avions déjà vu que
Lm est le barycentre du nuage des profil ligne Li pondérés par les Li RJ D1
poids (fi.). Nous avions aussi déjà montré que la liaison entre les
deux variables est caractérisée par la dispersion du nuage de points
par rapport à Lm.
u1 O1i
On cherche un vecteur unitaire u1 pour projeter le nuage de points G
sur l’axe qui récupère un maximum d’inertie :
I1 = fi. GO12i
i=1,I
Or on a :
fij 1
GO1i = <GLi , u1 >2 = ( − f.j) u1,j
fi. f.j
j=1,J
Soit F1 le vecteur dont les composantes sont les projections des Li sur la droite D1. c’est-à-dire les
GO1i, on a :
F1 = (DI−1 P − 𝕝I Ltm ) DJ−1 u1

Projeter les profils ligne sur un axe
Le vecteur unitaire u1 qui explique le maximum de l’inertie du nuage de points vérifie :
u1 = arg max Ft (u) DI F(u)
u
où Li RJ D1
F(u) = (DI−1 P − 𝕝I Ltm ) DJ−1 𝐮
Sous la contrainte:
u1 O1i
1 2 G
u 2 = uj = ut DJ−1 u = 1
f.j
j=1,J
On peut finalement écrire :

u1 = arg max ut DJ−1 (DI−1 P − 𝕝I Ltm )t DI (DI−1 P − 𝕝I Ltm ) DJ−1 𝐮
u
ut DJ−1 u = 1
Or on a : DI 𝕝I = Cm
u1 = arg max ut DJ−1 (P − CmLtm )t DI−1(P − Cm Ltm ) DJ−1 𝐮
u

Caractérisation de l’axe principal
Comme pour l’ACP, on utilise la méthode de Lagrange. Soit  le multiplicateur de
Lagrange. On va alors maximiser le Lagrangien:
L (u) = ut DJ−1 (P − CmLtm )t DI−1(P − Cm Ltm ) DJ−1 𝐮 − (ut DJ−1 u − 1)
Le maximum est atteint lorsque la dérivée suivante s’annule :

𝜕L
= 2 DJ−1 (P − CmLtm )t DI−1(P − Cm Ltm ) DJ−1 𝐮 − 2  DJ−1 𝐮 = 0
𝜕𝐮
Ou
(P − CmLtm )t DI−1(P − Cm Ltm ) DJ−1 𝐮 =  𝐮
Ainsi :
• u1 est vecteur propre de 𝐒 = (P − CmLtm )t DI−1(P − Cm Ltm ) DJ−1 associé à une valeur propre 1
• 1 doit être la plus grande des valeurs propres de S
• ut1 DJ−1 u1= 1

Nous avons :
(P − CmLtm )t DI−1(P − Cm Ltm ) DJ−1u1 = 1 u1
−1
2
On multipliant chaque terme de cette égalité par DJ à gauche, on obtient :
−1 −1 −1 −1
DJ (P − CmLtm )t DI−1(P − Cm Ltm )DJ DJ u1 = 1 DJ u1
2 2 2 2
On pose :
−1
2
u1 = DJ u1
On peut écrire :
−1 −1
2
DJ (P − Cm Lt )t D −1(P −
m I
t
Cm Lm )DJ2
u1 = 1 u1
−1 −1
2
u1 est vecteur propre de 𝐒 = DJ (P − Cm Lt )t D −1(P −
m I Cm Lm )DJ associé à la valeur propre 1.
t 2
On vérifie facilement que 𝐒 est symétrique définie-positive de rang r égal à celui de P − CmLtm ,
donc diagonalisable avec les valeurs propres positives ou nulles, on note 1 2  …  r > 0 et u1,
u2, … ur les vecteurs propres unitaires (pour la métrique euclidienne) associés.
1
2
On en déduit que S admet les mêmes valeurs propres et les vecteurs propres us = DJ us.
On a par ailleurs pour s=1,r: uts DJ−1 us = uts us = 1.
Ce qu’on recherchait dans le problème d’optimisation.
Inertie totale et inertie expliquée
Nous avions montré que l’inertie totale du nuage de points formé par les profils ligne est donnée
par l’expression :
I = tr(DI−1(P − Cm Ltm ) DJ−1(P − Cm Ltm )t)
= tr((P − Cm Ltm )t DI−1(P − Cm Ltm ) DJ−1)
Pour une matrice diagonalisable, la trace est égale à la somme des valeurs propres. Donc
I = 1+ 2 + … + r
Les composantes principales portées par le s-ième axe principal (vecteur us) sont données par :
Fs = DI−1(P − Cm Ltm ) DJ−1 us
Nous rappelons que les composantes principales sont constituées à partir des projections du
nuage de points sur l’axe principal. L’inertie expliquée par l’axe s est alors :
s = Fts DI Fs

Inertie du nuage des profils colonne
On considère maintenant le nuage des profils colonne dans l’espace RI. On note Ic l’inertie de ce
nuage de points en prenant comme centre le profil colonne moyen Cm. On a alors :
2
fij fi.
I𝐜 = f.j d Cj , Cm 2
= f.j fi. −
fi.f.j fi.
j=1,J j=1,J i=1,I
2
1 fij
= f.j − fi.
fi. f.j
j=1,J i=1,I
Ce qui peut s’écrire:

I𝐜 = tr(DJ−1(Pt − Lm Ctm ) DI−1(Pt − Lm Ctm )t)
= tr(DJ−1(P − Cm Ltm )t DI−1(P − Cm Ltm )t)
On peut montrer facilement que :
I𝐜 = tr(DJ−1(P − Cm Ltm )t DI−1(P − Cm Ltm )t)=tr(DI−1(P − Cm Ltm ) DJ−1(P − Cm Ltm )t)=I
On voit que les inerties des deux nuages de points (profils ligne et profils colonne) sont égales.
Comme pour l’analyse directe (des profils ligne), on est amené à considérer sur l’espace des
profils colonne une métrique Euclidienne pondérée par l’inverse des poids (fi.). Ainsi, le produit
scalaire de deux vecteurs v,w de RI s’écrit :
1
<v , w>2 = vi wi
fi.
i=1,I
Projeter les profils colonne sur un axe
Cm est le barycentre du nuage des profil colonne Cj pondérés par les
poids (fi.). D’un autre côté, la liaison entre les deux variables est Cj RI D1
caractérisée par la dispersion du nuage de points par rapport à Cm.
On cherche un vecteur unitaire v1 pour projeter le nuage de points
sur l’axe qui récupère un maximum d’inertie : v1 N1j
Cm
I1 = f.j CmN12j
j=1,J
Or on a :
fij 1
CmO1j = <CmCj , v1 >2 = ( − fi.) v1,i
f.j fi.
i=1,I
Soit G1 le vecteur dont les composantes sont les projections des Cj sur la droite D1. c’est-à-dire les
CmN1i, on a :
G1 = (DJ−1 Pt −𝕝J Ctm ) DI−1 v1
Or
DJ 𝕝J = Lm
Donc :
G1 = DJ−1(Pt − Lm Ctm ) DI−1 v1

Projeter les profils colonne sur un axe
Le vecteur unitaire v1 qui explique le maximum de l’inertie du nuage de points vérifie :
v1 = arg max Gt (v) DJ G(v)
v
où Li RJ D1
G(v) = DJ−1(Pt − Lm Ctm ) DI−1 v
Sous la contrainte:
u1 N1i
1 2 G
v 2 = vi = v t DI−1 v = 1
fi.
i=1,I
On peut donc écrire :

v1 = arg max vt DI−1 (Pt − Lm Ctm )t DJ−1 (Pt − Lm Ctm ) DI−1 𝐯
v
Ou encore
v1 = arg max vt DI−1 (P − CmLtm ) DJ−1 (P − CmLtm )t DI−1 𝐯
v
v t DI−1 v = 1

On va alors maximiser le Lagrangien:
L (u) = vt DI−1 (P − CmLtm ) DJ−1 (P − CmLtm )t DI−1 𝐯 − (vt DI−1 v − 1)
 étant le multiplicateur de Lagrange. Le maximum est atteint lorsque la dérivée suivante
s’annule :
𝜕L
= 2DI−1 (P − CmLtm ) DJ−1 (P − CmLtm )t DI−1 𝐯 − 2 DI−1 𝐮 = 0
𝜕𝐮
ou
(P − CmLtm ) DJ−1 (P − CmLtm )t DI−1 𝐯 =  𝐯
Ainsi :
• v1 est vecteur propre de T = (P − CmLtm ) DJ−1 (P − CmLtm )t DI−1 associé à une valeur propre 1
• 1 doit être la plus grande des valeurs propres.
• vt1 DI−1 v1= 1
On rappelle que
𝐒 = (P − CmLtm )t DI−1(P − Cm Ltm ) DJ−1
Donc S et T (produits de mêmes termes) possèdent les mêmes valeurs propres non nulles. Donc
s = s pour s=1,r.

Nous avons :
(P − CmLtm ) DJ−1 (P − CmLtm )t DI−1 𝐯1 = 1 v1
−1
2
On multipliant chaque terme de cette égalité par DI à droite, on obtient :
−1 −1 −1 −1
DI (P − CmLtm ) DJ−1 (P − CmLtm )t DI DI u1 = 1 DI
2 2 2 2
u1
On pose :
−1
2
v1 = D I v1
On peut écrire :
−1 −1
2
DI (P − t
CmLm ) DJ−1 (P − Cm t t 2
L )D v
m I 1 = 1 v1
−1 −1
v1 est vecteur propre de 𝐓 = DI (P − 2 t
CmLm ) DJ−1 (P − Cm Lt )t D 2
m I
associé à la valeur propre 1.
𝐓 est symétrique définie-positive de rang r égal à celui de P − CmLtm , donc diagonalisable avec les
valeurs propres positives ou nulles 1 2  …  r > 0 et v1, v2, … vr les vecteurs propres unitaires
(pour la métrique euclidienne) associés.
−1
2
On en déduit que T admet les mêmes valeurs propres et les vecteurs propres vs = DI vs.
On a par ailleurs pour s=1,r: vts DI−1 vs = vts vs = 1.
Ce qu’on recherchait dans le problème d’optimisation.
Inertie totale et inertie expliquée
L’inertie totale du nuage de points formé par les profils colonne est donnée par l’expression :
I = tr((P − CmLtm ) DJ−1 (P − CmLtm )t DI−1)
= 1+ 2 + … + r
Les composantes principales portées par le s-ième axe principal (vecteur vs) sont données par :
Gs = DJ−1(Pt − Lm Ctm ) DI−1 vs
Gs = DJ−1(P − CmLtm )t DI−1 vs
L’inertie expliquée par l’axe s est alors :

s = Gts DJ Gs

Synthèse des relations matricielles
1 1
On a : us = DJ us et 𝐒 us = s us
2
On a : vs = DI vs et T vs = s vs
2
−1 −1 −1 −1
2
où 𝐒 = DJ (P − Cm Lt )t D −1(P −
m I
t
Cm Lm )DJ2
où T = DI (P − CmLm ) DJ (P − Cm
2 t −1
Lt )t D 2
m I
−1 −1 −1 −1
t t
On pose : X =DI (P − Cm Lm )DJ . On a:
2 2
On pose : X =DI (P − Cm Lm )DJ . On a:
2 2
t t t t
𝐒 = X X = U D U T = X X = V D V
Avec U = u1 | u2 | … | ur et D = diag(s ) Avec V = v1 | v2 | … | vr et D = diag(s )
1 1
t
Fs = DI−1(P − Cm Lm ) DJ us et on pose : Fs = DI Fs
−1 2 −1
Gs = DJ (P − Cm Lt )t D −1 v
m I s et on pose : Gs = D2J Gs
t t t
On voit facilement que: X us = Fs et s = Fts DI Fs = Fs F On voit facilement que: X vs = Gs et s = Gts DJ Gs = Gs G
t
F = X U avec F = F1 | F2 | … | Fr G = X V avec G = G1 | G2 | … | Gr
Les composantes principales s’obtiennent alors par : Les composantes principales s’obtiennent alors par :
−1 −1
2
F = DI F G = DJ2 G

Synthèse des relations matricielles
Les relations matricielles de la diapositive précédente, en s’inspirant du cours sur l’ACP, permettent
1
t 2
d’écrire: X = V Σ U où Σ = D est la matrice diagonale dont les termes diagonaux, appelés valeurs
singulières de X, sont 1, 2, … , r.
Cette décomposition aurait d’ailleurs pu être obtenue directement par la décomposition en valeurs
singulières de X (ou SVD: Singular Value Decomposition). Mais nous avons préféré une construction
directe des matrices pour en saisir la signification.

Factorisation et reconstruction des données
t
Nous avons à la fois X us = Fs et X vs = Gs, qui sont liées aux coordonnées des projections des
profils sur les axes principaux.
t t
On a : = uts X X us = vts X X vs = s. On en déduit : Fs = Gs = s
t
On a aussi : Fs = X us et vs sont des vecteurs propres de X X associés à s donc on peut écrire
pour s=1,r :
t
Fs =X us = s vs et Gs =X vs= s us.
Par ailleurs, à partir deX us = s vs, s=1,r on obtient la relation :

r r
X. usuts = s vs uts
s=1 s=1
Comme les vecteurs propres us, s=1,r sont orthogonaux et de norme 1, on peut écrire :
r
X= s vs uts
s=1

Comme pour l’ACP, les développements de l’AFC nous permettent de factoriser la matrice X. Cela
t
permet de réduire la dimensionnalité des données de IxJ à r(I+J) où r est le rang de la matrice X X.
v1,1 u1,1 u1,2  u1,J v2,1 u2,1 u2,2  u2,J vr,1 ur,1 ur,2  ur,J
v1,2 v2,2 vr,2
X = 1 ⸽ + 2 ⸽ + … + r ⸽
v1,I v2,I vr,I
On voit facilement que cette factorisation de X permet de s’écrire sous une forme plus compacte :
v1,1 v2,1 … vr,1
1 0 … 0 u1,1 u1,2 … u1,J
v1,2 v2,2 … vr,2
0 2 … 0 u2,1 u2,2 … u2,J
X= ⋮ ⋱ ⋮ ⋮ … ⋮
⸽ ⸽ ⸽ ⸽
0 0 … r ur,1 ur,2 … ur,J
v1,I v2,I … vr,I
t
X = V ΣU
On peut négliger des valeurs propres et se limiter à (s) pour s=1,k avec k << r, si l’inertie cumulée
est importante. Cela permet de réduire considérablement la dimensionnalité des données.
Σ U t
X
IxJ
=V Ixk
Ixk kxJ
On peut aussi se limiter aux deux premiers axes principaux pour visualiser les liaisons entre les
variables sur un plan.
Σ t
U
X =V Ixk kxJ
IxJ Ixk

Matrice des probabilités: Exemple
On utilise le code python pour On calcule ensuite le profil ligne moyen Lm et le profil
obtenir la matrice des probabilités P : colonne moyen Cm. Ces deux vecteurs sont utilisés pour
calculer CmLtm .

Caractériser l’écart à l’indépendance
On calcule les matrices diagonales DI et DJ On aurait pu calculer X de façon moins
et on les utilise pour calculer X. élégante :
La matrice X nous permet de caractériser l’écart à l’indépendance.

Déterminer les axes principaux
t t
On calcule 𝐒 = X X et T = X X . Ensuite on Trier les couples (valeur et vecteur propres) de 𝐒 dans
calcule les valeurs et vecteurs propres de 𝐒. l’ordre décroissant des valeurs propres et calculer D.
t
On procède de même pour T = X X .

Calculer les composantes principales
t t
On calcule U = u1 | u2 | … | ur et On peut ainsi vérifier que 𝐒 = X X = U DU et
V = v1 | v 2 | … | v r . t
T = X X = V D V .
t
t
On obtient aussi F = X U et G = X V.
On calcule alors les composantes principales :

−1 −1
F = DI F et G = DJ G.
2 2

Projection sur le plan factoriel
On écrit le code python qui permet de projeter les deux nuages de points sur le plan factoriel.

Projection sur le plan factoriel
Comme pour l’ACP, le plan factoriel va permettre d’analyser les liaisons entre les variables selon les
deux premières composantes principales.

Afc001final 201215191556

Transféré par

Informations du document

Titre original

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

Afc001final 201215191556

Transféré par

Droits d'auteur :

Formats disponibles

Analyse Factorielle des

J. DABOUNOU - FST DE SETTAT AFC001 - 1

3 x31 x32 Nous allons noter les I modalités de la

nij désigne le nombre d’individus possédant à la fois la modalité m1i de V1 et la

J. DABOUNOU - FST DE SETTAT AFC001 - 3

gris marron noir 13 chaise gris

J. DABOUNOU - FST DE SETTAT AFC001 - 4

J. DABOUNOU - FST DE SETTAT AFC001 - 5

J. DABOUNOU - FST DE SETTAT AFC001 - 6

gris marron noir TOTAL Cm gris marron noir Cm

J. DABOUNOU - FST DE SETTAT AFC001 - 7

m21 m22 m2j m2J Cm m21 m22 m2j m2J Cm

Tableau des probabilités conjointes Tableau des produits des probabilités

J. DABOUNOU - FST DE SETTAT AFC001 - 9

m21 m22 m2j m2J Cm m21 m22 m2j m2J Total

A noter que : n.fij = nij et n.fi.. f.j = ni..n.j

Ce test analyse l’écart à l’indépendance en comparant le tableau des probabilités

J. DABOUNOU - FST DE SETTAT AFC001 - 11

2 représente la significativité de la liaison entre les variables. Il mesure l’écart entre

Les calculs donnent alors :

On remarque que  = (I-1)(J-1) = IJ-I-J+1.

J. DABOUNOU - FST DE SETTAT AFC001 - 14

1. Les observations qui permettent de construire le tableau de contingence doivent

2. Echantillon aléatoire doit avoir une taille n30.

3. Tous les effectifs théoriques tij doivent vérifier tij5.

J. DABOUNOU - FST DE SETTAT AFC001 - 15

Densité de probabilité du Khi2

il est peu probable que le 2

J. DABOUNOU - FST DE SETTAT AFC001 - 19

J. DABOUNOU - FST DE SETTAT AFC001 - 20

gris marron noir TOTAL Cm

J. DABOUNOU - FST DE SETTAT AFC001 - 22

gris marron noir

L1 0,111 0,333 0,556

L2 0,182 0,545 0,273

L3 0,500 0,400 0,100

Lm 0,267 0,433 0,300

L’attraction entre deux réalités sociales est

J. DABOUNOU - FST DE SETTAT AFC001 - 24

On peut maintenant exprimer le fait que les ⁞ ⁞ ⁞ ⁞

gris marron noir TOTAL Cm gris marron noir Cm

J. DABOUNOU - FST DE SETTAT AFC001 - 26

gris marron noir TOTAL Cm

Tous type de meuble (30)

gris marron noir TOTAL Cm

J. DABOUNOU - FST DE SETTAT AFC001 - 28

m21 C1 % m22 C2 % m23 C3 % TOTAL Cm %

J. DABOUNOU - FST DE SETTAT AFC001 - 29

HPL = { x = (x1, x2,x3)  R3 | x1 + x2 + x3 = 1}.

J. DABOUNOU - FST DE SETTAT AFC001 - 30

J. DABOUNOU - FST DE SETTAT AFC001 - 31

m21 m22 m23 Cm

J. DABOUNOU - FST DE SETTAT AFC001 - 32

J. DABOUNOU - FST DE SETTAT AFC001 - 33

Il est à noter que l’inertie ne tient pas

Actifs C1 % Chômeurs C2 % Inactifs C3 % TOTAL Cm %

J. DABOUNOU - FST DE SETTAT AFC001 - 35

J. DABOUNOU - FST DE SETTAT AFC001 - 36

P = (fij) : la matrice des probabilités,

J. DABOUNOU - FST DE SETTAT AFC001 - 37

m21 m22 m23

On vérifie facilement que l’on a :

J. DABOUNOU - FST DE SETTAT AFC001 - 38