Académique Documents
Professionnel Documents
Culture Documents
Analyses factorielles
simples et multiples
Objectifs, mthodes et interprtation
4e dition
Brigitte Escofier
Jrme Pags
Algeria-Educ.com
ANALYSES FACTORIELLES
SIMPLES ET MULTIPLES
Objectifs, mthodes et interprtation
ANALYSES FACTORIELLES
SIMPLES ET MULTIPLES
Objectifs, mthodes et interprtation
Brigitte Escoffier
Ancien professeur lUniversit de Rennes et lIUT de Vannes
Jrme Pags
Ingnieur agronome, professeur lAgrocampus de Rennes
4e dition
Illustration de couverture : Digitalvision
Introduction 1
Bibliographie 317
Introduction
Lanalyse des donnes : outil de connaissance dans les domaines les plus divers
Depuis une trentaine dannes, les mthodes danalyse des donnes ont largement
dmontr leur efficacit dans ltude de grandes masses complexes dinformations.
Ce sont des mthodes dites multidimensionnelles en opposition aux mthodes de la
statistique descriptive qui ne traitent quune ou deux variables la fois. Elles per-
mettent donc la confrontation entre de nombreuses informations, ce qui est infiniment
plus riche que leur examen spar. Les reprsentations simplifies de grands tableaux
de donnes que ces mthodes permettent dobtenir savrent un outil de synthse
remarquable. De donnes trop nombreuses pour tre apprhendes directement, elles
extraient les tendances les plus marquantes, les hirarchisent et liminent les effets
marginaux ou ponctuels qui perturbent la perception globale des faits.
Nes luniversit, elles ont dabord t connues essentiellement des chercheurs et
appliques des domaines scientifiques comme lcologie, la linguistique, lconomie,
etc. Elles ont permis daborder des tudes nouvelles plus riches et plus complexes.
Mais leur domaine dapplication dborde depuis longtemps ce cadre universitaire,
surtout depuis que lacquisition et le stockage des informations sont facilits par
le dveloppement de linformatique. Dans tous les domaines (marketing, assurance,
Dunod La photocopie non autorise est un dlit
banque, etc.), dimportants fichiers de donnes sont accumuls. Le premier objectif est
de conserver les informations et de pouvoir les consulter facilement. Mais on saperoit
vite que pour exploiter lensemble de linformation contenue dans ces fichiers, dont le
recueil est souvent coteux, il est ncessaire de disposer doutils statistiques adapts.
(avec les yeux et lanalyse assez mystrieuse que notre cerveau fait dune image), des
regroupements, des oppositions, des tendances, impossibles discerner directement
sur un grand tableau de nombres, mme aprs un examen prolong.
Ces reprsentations graphiques sont aussi un moyen de communication remarquable
car point nest besoin dtre statisticien pour comprendre que la proximit entre deux
points traduit la ressemblance entre les objets quils reprsentent.
Esprit du livre
Cet ouvrage est destin avant tout aux utilisateurs danalyse des donnes. Cest pour-
quoi il prsente des mthodes danalyse factorielle en tentant de dgager leurs objectifs
et les interprtations de leurs rsultats. Pour en faciliter la lecture aux non-spcialistes,
nous avons pris le parti de sparer le plus possible les aspects intuitifs des mthodes
(objectifs, principe gnral et reprsentations gomtriques), des aspects mathma-
tiques et thoriques. Les aspects intuitifs ne ncessitent quun trs faible bagage
statistique et mathmatique et sont donc abordables par beaucoup. Ils sont largement
comments sur quatre exemples.
Les aspects thoriques sont regroups essentiellement dans deux chapitres. Leur
Dunod La photocopie non autorise est un dlit
but est de fournir les justifications des mthodes en prcisant les critres optimiss
et les algorithmes de calcul. La bibliographie est restreinte au minimum : lorsquune
dmonstration risque dalourdir trop le texte, une note en bas de page renvoie une
rfrence plus complte.
Les objectifs. Devant un jeu de donnes analyser, se pose le problme du choix du
traitement statistique, cest--dire du choix du couple indissociable codage-mthode.
Pour bien choisir, il est ncessaire de connatre les moyens dont on dispose, donc
les possibilits des mthodes qui peuvent rpondre chacune un certain nombre
dobjectifs prcis. La rflexion sur les objectifs dune tude est fondamentale. Elle est
plus efficace si elle se fait dans le cadre des possibilits techniques. Cette rflexion doit
toujours intervenir le plus tt possible car elle influe non seulement sur le traitement
statistique mais aussi sur le recueil mme des donnes.
4 Introduction
Contenu du livre
Ce livre contient la fois un rappel des mthodes classiques, des exposs des mthodo-
logies danalyse des tableaux multiples bases sur ces dernires et une introduction aux
mthodes danalyse spcifiques de ces tableaux. Ces dernires ont t conues par les
auteurs et exposes dans le cadre de leurs recherches, mais cet ouvrage est le premier
qui en contient une prsentation gnrale destine aux utilisateurs. Linterprtation
des rsultats dune analyse factorielle, qui est avec le codage la phase la plus dlicate
de ltude, est illustre par quatre exemples tout le long du texte ; elle fait aussi lobjet
dune rflexion gnrale.
La premire partie du livre, qui comprend cinq chapitres, prsente les mthodes
classiques danalyse factorielle : lACP, lAFC et lACM. Le traitement dun exemple
par ACP donne loccasion de prsenter une mthode de classification et son dpouille-
ment conjointement avec celui dune analyse factorielle. Une prsentation formalise
de lACP, de lAFC et de lACM, incluant les dmonstrations essentielles, est faite
dans un cadre commun ces trois mthodes.
La deuxime partie est consacre aux tableaux multiples. Les chapitres 6, 7, 8 et 9
concernent ltude simultane de plusieurs tableaux croisant les mmes individus et
diffrents groupes de variables numriques ou qualitatives. Le chapitre 6 commente
plusieurs traitements de la mme enqute par les mthodes classiques. Cest la fois
une illustration des mthodes prsentes dans les premiers chapitres, une rflexion
sur les objectifs gnraux de ltude de tableaux comprenant plusieurs groupes de
variables, et un bilan sur lintrt et les limites des mthodologies bases sur ces
mthodes. Lanalyse factorielle multiple (AFM), conue pour ce type de donnes,
est introduite dans le chapitre 7 partir des rsultats issus de son application un
second exemple ; sa prsentation complte constitue le chapitre 8 ; une rflexion sur
son utilisation constitue le chapitre 9. Le chapitre 10 traite des tableaux de frquence
ternaires et plus gnralement de ltude simultane de plusieurs tableaux de frquence
binaires. Bien quil sagisse comme dans les quatre chapitres prcdents de tableaux
multiples, la nature des donnes (frquences au lieu de variables) implique des objectifs
fondamentalement diffrents. Ce chapitre tente den dgager les principaux et illustre
sur un mme exemple les mthodologies drives de lAFC et une technique nouvelle,
baptise analyse intra, qui permet dtudier un aspect spcifique des tableaux de
frquence ternaire : les liaisons conditionnelles.
La dernire partie, rduite un chapitre, est entirement consacre linterprtation
des rsultats en analyse factorielle. Elle est issue en partie des rflexions dun groupe de
Introduction 5
travail1 runi par lADDAD2 dans le cadre dun contrat avec la Socit THOMSON.
A partir des expriences confrontes et du regroupement de commentaires pars
dapplications danalyse factorielle, nous avons construit un guide. Ce guide propose
une dmarche gnrale dinterprtation en analyse factorielle en diffrenciant ACP,
AFC, ACM et AFM.
Il est conseill aux lecteurs novices en analyse des donnes de commencer la lecture
de cet ouvrage par les deux premires fiches techniques incluses dans le chapitre 12.
Ces deux fiches dtaillent les reprsentations gomtriques des nuages dindividus
et de variables utilises systmatiquement en analyse factorielle. La troisime fiche,
plus technique, est destine plutt aux lecteurs qui souhaitent approfondir les aspects
mathmatiques et thoriques dvelopps dans les chapitres 5 et 8.
Lindex systmatique reprend lensemble des notions essentielles.
1. Ch. Bastin, Ch. Bourgarit, J. Confais, B. Escofier, B. Gomel, J.P. Fnelon, J.Pags.
2. LAssociation pour le Dveloppement et la Diffusion de lAnalyse des Donnes diffuse aussi les
logiciels correspondants toutes les mthodes dcrites
Chapitre 1
Variables
1 k K
1
Individus
i xik
Figure 1.1 Tableau des donnes en ACP. xik : valeur de la variable k pour lindividu i. I : nombre
dindividus et ensemble des individus. K : nombre de variables et ensemble des variables.
8 1 Analyse en Composantes Principales
Les termes individu et variable recouvrent des notions diffrentes. Par exemple,
dans le tableau tudi au chapitre 6, les individus sont des vins et les variables sont
des critres dcrivant ces vins (acidit, astringence, etc.). Les questions que lon se
pose sur les individus et celles que lon se pose sur les variables ne sont pas de mme
nature.
propos de deux individus, on essaie dvaluer leur ressemblance : deux individus
se ressemblent dautant plus quils possdent des valeurs proches pour lensemble des
variables. En ACP, la distance d(i,l) entre deux individus i et l est dfinie par :
d2 (i, l) = (xik xlk )2
kK
propos de deux variables, on essaie dvaluer leur liaison. En ACP, la liaison entre
deux variables est mesure par le coefficient de corrlation linaire (dans de rares
situations, on utilise la covariance), not usuellement r . Soit :
covariance(k, h)
r (k, h) =
variance(k) variance(h)
1 xik xk xih xh
=
I sk sh
iI
i i
xik xk xih xh
r (k, h) = pi
sk sh
i
Les programmes complets dACP permettent tous dintroduire des poids dindividus.
d2 (i, l) = m k (xik xlk )2
kK
Toutefois, comme nous le verrons dans le chapitre 5 qui contient lensemble des
rsultats techniques concernant les analyses factorielles, ces poids ne modifient en rien
les principes gnraux de lanalyse. Afin de ne pas alourdir lexpos de ce chapitre,
nous considrons dans la suite que les individus possdent le mme poids ( pi = 1/I
quel que soit i I ) ainsi que les variables (m k = 1 quel que soit k K ).
xik xk
Variables
RK
1 k K
1 NI
i
Individus
xik xk
i sk variable k
O=G
xik xk
sk
Figure 1.2 Tableau des donnes et nuage des individus associ dans lespace R K . Du fait du
centrage, lorigine des axes est confondue avec le centre de gravit du nuage.
Dunod La photocopie non autorise est un dlit
factorielles en gnral, et dans ce cas particulier de lACP, qui fournissent des images
planes approchant le mieux possible (au sens dun critre dfini et discut section 1.5)
un nuage de points situ dans un espace de grande dimension.
Variables RI
1 k K 1
1
NK
h
k
Individus
i xik xk
sk individu i
I 1 xik xk
sk
Figure 1.3 Tableau des donnes et nuage des variables associ dans lespace R I .
cos( Oh, Ok) = r (h, k)
Ainsi, lorsque les variables sont centres rduites, chaque variable a pour lon-
gueur 1 : le nuage N K est alors situ sur une sphre de rayon 1 (on dit aussi
hypersphre pour rappeler que R I est de dimension suprieure 3). Pour cette
raison, lACP sur donnes centres-rduites est dite ACP norme. Lorsque les
variables sont seulement centres, leur longueur est gale leur cart-type et on
parle alors dACP non norme.
2. Le cosinus de langle form par les vecteurs reprsentant les deux variables h
et k, obtenu en calculant le produit scalaire not h, k entre ces deux vecteurs
norms, est gal au coefficient de corrlation entre ces deux variables. Soit :
1 xih xh xik xk
cos(h, k) = h, k = = corrlation(h, k)
i
I s h s k
Conclusion
Raliser un bilan des coefficients de corrlation entre les variables revient tudier les
angles entre les vecteurs dfinissant le nuage N K . Cette tude directe est impossible du
fait de la dimension de R I . Lintrt de lACP est de fournir des variables synthtiques
Dunod La photocopie non autorise est un dlit
qui constituent un rsum de lensemble des variables initiales et sont la base dune
reprsentation plane approche des variables et de leurs angles.
premiers axes u 1 et u 2 rend maximum linertie projete sur ce plan. Il en est de mme
pour le sous-espace engendr par les trois premiers axes, etc.
RK NI
u1
Hi
G=O
u2
Figure 1.4 Lajustement du nuage des individus. Lindividu i se projette en Hi sur u 1 . On cherche
dabord u 1 qui rend maximum i O Hi2 . Puis on cherche u 2 , orthogonal u 1 , qui satisfait le mme
critre et ainsi de suite. Lorsque les individus sont munis
de poids pi diffrents, le critre consiste
rendre maximum : i pi O Hi2 .
Il est quivalent de rendre maximum i O Hi2 ou de rendre minimum i i Hi2 .
Cette deuxime criture, forme classique du critre des moindres carrs, montre que les
axes factoriels rendent minimum lcart entre le nuage des individus et sa projection.
Du fait du centrage, le critre (inertie maximum par rapport au centre de gravit G)
permet dinterprter les axes factoriels comme des directions dallongement maximum
du nuage N K . On parle aussi de principales dimensions de variabilit, dans la mesure
o ils rendent compte le plus possible de la diversit des individus.
On peut montrer que, toujours du fait
du centrage, rendre maximum i O Hi2
est quivalent rendre maximum i l (O Hi O Hl )2 . Cette dernire forme fait
apparatre les distances entre points projets. La projection ne pouvant que rduire la
distance entre points, les axes factoriels apparaissent comme les directions telles que
les distances entre points projets ressemblent le plus possible aux distances entre les
points homologues de N I (cf. Figure 1.5).
Selon les objectifs dune analyse, on mettra en avant lune ou lautre des interprta-
tions du critre.
RK NI
i l u1
Hl
Hi
G
i O Hl )
2
Figure 1.5 La reprsentation desdistances
2 inter-individuelles. Laxe u 1 rend i l (O H
maximum, cest--dire est tel que i l d (Hi Hl ) est le plus proche possible de i l d2 (i, l).
axes dtermins par les autres individus (dits actifs). Tous les programmes prvoient
cette situation ce qui revient mettre un poids nul certains individus au niveau du
critre dajustement.
Ces individus sont appels individus supplmentaires (ou illustratifs). On introduit
un individu en supplmentaire lorsque lon souhaite quil participe linterprtation
des plans factoriels mais non leur construction. Cest le cas lorsque lon dispose
dindividus prsentant des caractres exceptionnels, ou suspects davoir t lobjet
derreurs de mesures, ou enfin nappartenant pas au champ strict de ltude mais un
domaine voisin.
Pour obtenir une suite de S variables synthtiques {vs ; s = 1, ..., S} et une reprsenta-
tion approche des corrlations entre les variables, lACP applique au nuage N K des
variables la mme dmarche quau nuage des individus (cf. Figure 1.6).
Le critre (inertie projete maximum) satisfait dans le choix des axes est exactement
le mme que pour le nuage dindividus. Mais il prend une signification diffrente du
fait que le nuage nest pas centr (son centre de gravit nest pas lorigine) et que
tous les points sont situs sur la sphre unit : ce sont les angles entre les vecteurs
reprsentant les variables qui sont peu dforms par les projections et non pas les
distances entre les points du nuage. En effet, le plan (v1 , v2 ), en maximisant linertie
lorigine du nuage projet, rend maximum la somme des cosinus carrs des angles
entre les vecteurs et leur projection : il ajuste les vecteurs et dforme donc le moins
possible leurs angles.
16 1 Analyse en Composantes Principales
RI
1
NK
k
v1
Hk
O
v2
1
Figure 1.6 Lajustement du nuage des variables. Hk : projection du point reprsentant la variable
k sur v1 . On cherche dabord v1 qui rend maximum : k O Hk2 . Puis on cherche v2 , orthogonal v1 ,
qui satisfait le mme critre et ainsi de suite.
Composantes principales
Le vecteur v1 qui caractrise la direction dinertie maximum dfinit une nouvelle
variable. Les variables tudies tant centres et rduites, leur projection sur v1 est
gale leur coefficient de corrlation avec cettevariable (cf. section 1.4). De ce
fait, rechercher le vecteur v1 qui rend maximum k O Hk2 quivaut rechercher la
combinaison linaire la plus lie lensemble des variables (au sens du critre : somme
des carrs des corrlations maximum). En ce sens, v1 est la variable qui synthtise
le mieux lensemble des variables initiales. Les axes factoriels tant orthogonaux
deux deux, on met en vidence une suite de variables synthtiques, les composantes
principales, non corrles entre elles, qui rsument au mieux lensemble des variables
initiales.
Leffet taille
Si, dans un jeu de donnes, les variables sont toutes corrles positivement deux
deux, alors le nuage N K est loin de lorigine. Le premier axe factoriel rend alors
surtout compte de la position de N K par rapport lorigine : paralllement, la forme
1.7 Dualit et formules de transition en ACP 17
du nuage N K est mal reprsente en ce sens que les projections des variables sont
proches les unes des autres (cf. Figure 1.7).
RI
NK
v1
O 1
Figure 1.7 Leffet taille dans R I . Les variables, tant corrles positivement deux deux, forment
entre elles des angles aigus. Le nuage N K est concentr sur un petit secteur de la sphre. La
projection des variables sur le premier axe factoriel, dfini par v1 , rend compte principalement de
la position de N K par rapport O.
mme tableau, lune travers ses lignes et lautre travers ses colonnes. Des relations
trs fortes, dites relations de dualit (dmontres en section 5.4) lient ces deux nuages.
1.7.1 Inerties
Tout dabord, leur inertie totale est la mme ; elle est gale au nombre de variables
(lorsque les variables sont rduites) :
2
1 xik xk
Inertie totale de N I (ou de N K ) = =K
I sk
k i
La projection de chacun de ces deux nuages sur une suite daxes orthogonaux
correspond une dcomposition de linertie totale. On peut montrer que les deux
18 1 Analyse en Composantes Principales
dcompositions sont identiques : les inerties des nuages N I et N K projets sur les axes
factoriels de mme rang sont gales (et notes ls ). Soit, pour les axes de rang s :
1.7.2 Facteurs
Lensemble des projections de tous les points du nuage dindividusN I sur le s e axe
factoriel u s , appel s e facteur sur les individus, constitue une nouvelle variable note
Fs . On montre, dans la section 5.4.1, que cette variable se confond, la norme prs,
avec la s e composante principale vs obtenue dans lanalyse du nuage des variables.
Plus prcisment, le carr de la norme du facteur Fs (vecteur de R I ), tant la somme
des carrs de ses coordonnes, vaut ls ; la relation entre le s e facteur sur I et le s e axe
factoriel de R I scrit donc :
1
vs = Fs
ls
Ces rsultats sont illustrs dans la figure 1.8.
Ainsi, les projections planes des individus dans R K sont des reprsentations gra-
phiques des couples de variables synthtiques obtenues dans R I . Les rsultats issus de
ltude de chacun des deux nuages possdent fondamentalement la mme signification,
mme sils sexpriment en termes dindividus pour lun et en termes de variables pour
lautre.
Fs
RK RI
1 1
NI
NK Fs
i
us
vs
i Fs(i) O
Fs(i)
G 1
Figure 1.8 Une des deux formes de la dualit. Les coordonnes de N I sur u s (s e axe factoriel de
N I ) constituent le s e facteur sur les individus (not Fs ). Le vecteur Fs dans R I est colinaire vs
(s e axe factoriel de N K ).
1.7 Dualit et formules de transition en ACP 19
Le rle du nuage des individus et celui du nuage des variables sont, dans une certaine
mesure, symtriques et la dualit se formule de manire analogue en changeant le
rle des deux nuages : la projection des K variables sur le s e axe factoriel vs de leur
nuage N K dfinit une valeur pour chacune des K variables : ces valeurs constituent le
s e facteur sur les variables (not G s ) qui est en quelque sorte un individu nouveau.
Cette notion dindividu type est moins classique que celle de composante principale
(pratiquement, on prend plutt des individus rels comme individus types). Cependant,
dans quelques cas particuliers, comme celui o les individus sont des courbes et les
variables leurs valeurs en K points de discrtisation, ces individus sont reprsentables
et de ce fait utiliss.
On montre que le point reprsentant dans R K cet individu type est situ sur le s e
axe du nuage des individus. Plus prcisment :
1
us = Gs
ls
Cette relation montre que, au coefficient ls prs, les coordonnes des variables
sur vs sont les coefficients de la combinaison linaire des variables que constitue
laxe u s de R K . Ainsi, la coordonne de la variable k sur vs sinterprte la fois
comme le coefficient de corrlation entre k et vs et comme le coefficient de k dans u s ;
cette double interprtation est caractristique des axes principaux et essentielle dans
linterprtation ( linverse, penser aux difficults dinterprtation des coefficients de
la rgression multiple quand ils ne sont pas de mme signe que les coefficients de
corrlation associs). Ce rsultat est illustr dans la figure 1.9.
RI
Gs
Dunod La photocopie non autorise est un dlit
1
NK 1 RK
k NI
vs Gs
Gs(k) us
i Gs(k) var k
Gs(k)
1
I
Figure 1.9 La deuxime forme de la dualit. Les coordonnes de N K sur vs ( s e axe factoriel de
N K ) constituent le s e facteur sur les variables (not G s ). Le vecteur G s dans R K est colinaire au s e
axe factoriel u s de N I .
20 1 Analyse en Composantes Principales
1 xik xk
Fs (i) = G s (k)
ls k sk
1 1 xik xk
G s (k) = Fs (i)
I ls sk
i
La premire relation exprime le fait que la projection Fs (i) dun individu i, est une
combinaison linaire des projections G s (k) de toutes les variables. Dans cette com-
binaison linaire, le coefficient dune variable k est positif si la valeur xik de cette
variable pour lindividu i dpasse la moyenne xk . Dans le cas contraire, ce coefficient
est ngatif. Ainsi, lorsque lon regarde simultanment les deux graphiques, un indi-
vidu est du ct des variables pour lesquelles il a de fortes valeurs et loppos des
variables pour lesquelles il a de faibles valeurs.
Le graphique des individus est une reprsentation approche des distances inter-
individuelles. Celui des variables peut tre considr en tant qulment explicatif
de cette reprsentation : deux individus situs une mme extrmit dun axe sont
proches car ils ont tous deux gnralement de fortes valeurs pour les variables situes
du mme ct queux et de faibles valeurs pour les variables situes loppos.
Rciproquement, le graphique des individus peut intervenir en tant quaide linter-
prtation du graphique des variables : si deux variables sont trs corrles positivement,
elles sont situes du mme ct sur un axe. Sur laxe correspondant du nuage dindivi-
dus, les individus qui ont de fortes valeurs pour ces deux variables se situent du mme
ct quelles et ceux qui ont de faibles valeurs se situent loppos. Les individus
extrmes pour ces variables sont loin de lorigine. Les ventuels individus particuliers
induisant eux seuls des corrlations fortes sont ainsi reprs facilement.
Ainsi, en ACP, le graphique des individus et celui des variables sont la fois
optimaux en eux-mmes (ils reprsentent le mieux possible lun les individus lautre
les variables) et se servent mutuellement daides linterprtation. Cette proprit liant
les reprsentations des lignes et des colonnes vaut pour toutes les analyses factorielles
et leur est spcifique.
rapport ls .
Notre prfrence va la 1e reprsentation superpose, fonde sur les relations de
transition donnes plus haut, car elle permet dinclure les variables supplmentaires.
1 Variables
1 k K
1
individus
i x ik
I
3 2 1 k K 4
1 k K 1 k K
1 1
1
xik xk xik xk
i xik xk i sk i
sk sk
I I I
5 RK RI 6
1
NI
NK h
i k
O individu i
variable k
O=G
xik xk 1
sk xik xk
sk
AF 7 AF 8
11 G2
F2
relations 10
9
de transition
i
k
1
G F1 O r(k,F1) G1
12 G2 F2
i k
1 G1
F1
2. Les donnes centres et rduites. Que lon sintresse aux individus ou aux
variables, le tableau est transform de la mme faon. Le centrage est surtout
technique. La rduction permet de saffranchir de larbitraire des units de
mesure.
3 et 4. Dans ltude des individus, le tableau est considr comme une juxtaposition
de lignes. Dans ltude des variables, le tableau est considr comme une
juxtaposition de colonnes. Cest le mme tableau qui est considr de deux
faons diffrentes.
5. Un individu est une suite de K nombres et peut tre reprsent par un point
de R K . Dans le nuage N I , on sintresse aux distances inter-individuelles qui
sinterprtent comme des ressemblances. Du fait du centrage, lorigine des axes
est confondue avec le centre de gravit de N I . Dans la plupart des cas, on affecte
chaque individu le mme poids : 1/I .
6. Une variable est une suite de I nombres et peut tre reprsente par un vecteur
de R I . Dans le nuage N K , on sintresse surtout aux angles entre variables. Le
cosinus dun angle entre deux variables sinterprte comme le coefficient de
corrlation entre les deux variables. Du fait de la rduction, toutes les variables
sont quidistantes de lorigine et donc situes sur une hypersphre de rayon 1.
7 et 8. LAnalyse Factorielle (AF) dun nuage consiste mettre en vidence une suite
de directions telles que linertie, par rapport O, de la projection du nuage
sur ces directions est maximum. Dans R K , o lorigine O est confondue avec
le centre de gravit G, les axes factoriels sont les directions dallongement
maximum de N I . Dans R I , o la projection dune variable sur une autre sinter-
prte comme un coefficient de corrlation, les axes factoriels sont les variables
synthtiques les plus lies lensemble des variables initiales.
9. Le plan factoriel croisant deux facteurs sur les individus -ici F1 (I ) et F2 (I )-
Dunod La photocopie non autorise est un dlit
1.9.1 Dfinitions
a) Qualit de reprsentation dun lment par un axe
La qualit de reprsentation de llment i (individu ou variable) par laxe s est
mesure par le rapport :
Cest aussi le cosinus carr de langle u entre Oi et laxe s (cf. Figure 1.11).
(O His )2
QLTs (i) = = cos2 u
(Oi)2
us
Hi
s
O
Figure 1.11 Qualit de reprsentation dun lment par un axe. His : projection de i sur laxe de
rang s
1.9 Aides linterprtation 25
F2
G (.07)
Pour F1
QLT1 CTR1
B (.15)
A 0 0
B 0 0
D (.5) F1
C 1 .026
D 1 .263 -1 C (.05) 2 E (.01)
E 1 .047
F .692 .332 A (.15)
G .692 .332
F (.07)
Figure 1.12 Nuage plan pondr reprsent dans ses axes principaux. Les poids figurent entre
parenthses. QLT1 , CTR1 : qualit de reprsentation et contribution (pour le premier axe).
a) Coordonnes sur F1
Les points A, B, et C sont moyens ; D, E, F et G sont extrmes, D tant oppos E, F
et G. Quelle que soit la qualit de reprsentation de ces points et leur contribution
linertie, cette structure traduite par le premier facteur nest pas mettre en doute.
Les points A et B, situs dans une direction orthogonale laxe 1, ont une qualit
de reprsentation sur le premier axe gale 0 : ni leur cart par rapport lorigine, ni
leur distance dans le plan ne sont visibles sur le premier facteur.
Les points F et G, extrmes, ont une qualit de reprsentation moyenne : bien que
trs marqu pour le facteur F1 , leur cart la moyenne nest quen partie traduit par
lui.
Contribution linertie de F 1
Exemple : inertie du nuage (l1 ) : .5(1)2 + .05(1)2 + .01(3)2 + .07(3)2 + .07(3)2 = 1.9
CTR1 (F) = inertie du point F/ inertie du nuage = (.07 32 )/1.9 = .332
Les points A et B ont une coordonne nulle, donc une contribution nulle. Le point
C est proche de O et a un petit poids : sa contribution est extrmement faible. La
suppression de ces trois points ne modifierait pas la direction du premier facteur.
Les points E et F ont la mme coordonne mais E, ayant un poids 7 fois plus faible
que F, a une contribution 7 fois plus faible. La suppression de E risque moins de
modifier le facteur que celle de F, pourtant moins bien reprsent.
Le point D, malgr son poids gal plus de 7 fois celui de F, a une contribution plus
faible car il est situ plus prs de lorigine (dans la contribution linertie, la distance
intervient par son carr alors que le poids intervient tel quel).
des lves, par exemple une opposition entre les lves plutt meilleurs dans les
matires scientifiques et ceux plutt meilleurs dans les matires littraires. On dispose
par ailleurs dinformations sur ces lves sous forme de variables qualitatives, par
exemple leur genre (fille/garon), la catgorie socio-professionnelle des parents, etc. Il
est utile de relier ces variables qualitatives aux axes factoriels, avec en perspective des
questions du type : observe-t-on, sur ces donnes, lide souvent mise selon laquelle
les filles obtiennent des rsultats plutt meilleurs dans les matires littraires et les
garons des rsultats plutt meilleurs dans les matires scientifiques ?
Pour cela, on dispose de deux outils graphiques simples et efficaces :
identification, sur les plans factoriels, des individus par leur modalit laide dun
code, de couleur ou de forme (dans lexemple on pourra identifier les filles par
un point rose et les garons par un point bleu !) ; cela permet dtudier finement
28 1 Analyse en Composantes Principales
Remarque
La taille dune ellipse ainsi obtenue dpend de la variabilit (dans le plan factoriel)
des individus prsentant la modalit tudie mais aussi de son effectif.
Lutilisation pratique des ellipses de confiance sarticule autour de deux questions
relatives aux modalits.
La modalit m est-elle caractrise par le plan factoriel ? Autrement dit, les indi-
vidus possdant la modalit m occupent-ils (dans lensemble) une position excentre
sur le plan ? Pour cela, on examine la position de lorigine des axes, centre de gravit
de lensemble I , par rapport lellipse de confiance de m. Si cette ellipse englobe
lorigine, on dcidera que la modalit m (i.e. les individus possdant cette modalit)
nest pas caractrise par le plan.
Les deux modalits m et m sont-elles diffrencies par le plan ? Autrement dit,
les individus possdant la modalit m occupent-ils, dans lensemble, la mme rgion
du plan que ceux possdant la modalit m ? Pour cela, on examine le recouvrement
entre les deux ellipses associes aux modalits m et m . Une absence de recouvrement
conduit dcider que le plan diffrencie les deux modalits et, linverse, un fort
recouvrement conduit dcider dune non diffrenciation. Un recouvrement faible
laisse la place au doute : pour aider sa dcision, lutilisateur peut calculer la probabilit
critique du test statistique T2 de Hotelling appliqu la comparaison des deux
modalits du point de vue des deux composantes principales tudies considres
simultanment.
Les questions concernant la position des modalits sur un plan peuvent tre poses
pour chaque axe. Pour cela, en projetant les ellipses sur chaque axe, on obtient un
intervalle de confiance que lon peut utiliser comme un intervalle de confiance usuel.
Il existe aussi un indicateur, appel valeur-test et introduit initialement dans le logiciel
SPAD, qui permet de juger, pour un axe factoriel (et, plus gnralement pour nimporte
quelle variable), de lcart entre le centre de gravit dune classe et le centre de gravit
gnral (cf. section 2.4.4 page 54).
Chapitre 2
Le commentaire de lACP dun petit tableau permet dillustrer les rgles et la dmarche
dinterprtation dune ACP (voir aussi chapitre 11). Nous en prsentons un ci-aprs.
En pratique, le dpouillement des rsultats dune analyse factorielle saccompagne
gnralement de celui des rsultats dune classification ascendante hirarchique (CAH)
ralise sur les mmes donnes. Lobjet de ce livre, ddi aux analyses factorielles,
exclut une prsentation gnrale des mthodes de classification. En revanche, il a
paru utile daccorder quelque place lnonc des principes rgissant la mthode
de classification ascendante hirarchique la plus utilise simultanment aux analyses
factorielles (la mthode de Ward) et lillustration du dpouillement conjoint des
rsultats des deux mthodes.
Les donnes utilises pour illustrer lACP serviront introduire ces lments de
classification.
janv fvr mars avri mai juin juil ao sept octo nove dce lati longi moy ampli
Bordeaux 5.6 6.6 10.3 12.8 15.8 19.3 20.9 21.0 18.6 13.8 9.1 6.2 44.50 -0.34 13.33 15.4
Brest 6.1 5.8 7.8 9.2 11.6 14.4 15.6 16.0 14.7 12.0 9.0 7.0 48.24 -4.29 10.77 10.2
Clermont 2.6 3.7 7.5 10.3 13.8 17.3 19.4 19.1 16.2 11.2 6.6 3.6 45.47 3.05 10.94 16.8
Grenoble 1.5 3.2 7.7 10.6 14.5 17.8 20.1 19.5 16.7 11.4 6.5 2.3 45.10 5.43 10.98 18.6
Lille 2.4 2.9 6.0 8.9 12.4 15.3 17.1 17.1 14.7 10.4 6.1 3.5 50.38 3.04 9.73 14.7
Lyon 2.1 3.3 7.7 10.9 14.9 18.5 20.7 20.1 16.9 11.4 6.7 3.1 45.45 4.51 11.36 18.6
Marseille 5.5 6.6 10.0 13.0 16.8 20.8 23.3 22.8 19.9 15.0 10.2 6.9 43.18 5.24 14.23 17.8
Montpellier 5.6 6.7 9.9 12.8 16.2 20.1 22.7 22.3 19.3 14.6 10.0 6.5 43.36 3.53 13.89 17.1
Nantes 5.0 5.3 8.4 10.8 13.9 17.2 18.8 18.6 16.4 12.2 8.2 5.5 47.13 -1.33 11.69 13.8
Nice 7.5 8.5 10.8 13.3 16.7 20.1 22.7 22.5 20.3 16.0 11.5 8.2 43.42 7.15 14.84 15.2
Paris 3.4 4.1 7.6 10.7 14.3 17.5 19.1 18.7 16.0 11.4 7.1 4.3 48.52 2.20 11.18 15.7
Rennes 4.8 5.3 7.9 10.1 13.1 16.2 17.9 17.8 15.7 11.6 7.8 5.4 48.05 -1.41 11.13 13.1
Strasbourg .4 1.5 5.6 9.8 14.0 17.2 19.0 18.3 15.1 9.5 4.9 1.3 48.35 7.45 9.72 18.6
Toulouse 4.7 5.6 9.2 11.6 14.9 18.7 20.9 20.9 18.3 13.3 8.6 5.5 43.36 1.26 12.68 16.2
Vichy 2.4 3.4 7.1 9.9 13.6 17.1 19.3 18.8 16.0 11.0 6.6 3.4 46.08 3.26 10.72 16.9
Moyenne 4.0 4.8 8.2 11.0 14.4 17.8 19.8 19.6 17.0 12.3 7.9 4.9 46.0 2.58 11.8 15.9
Ecart-type 1.94 1.81 1.48 1.37 1.45 1.73 2.06 1.94 1.79 1.77 1.74 1.89 2.22 3.21 1.55 2.25
2.1.2 Problmatique
Le but gnral de ltude est de comparer les tempratures mensuelles des diffrentes
villes. Prcisons quelques questions auxquelles les rsultats de lACP permettent de
rpondre en abordant le tableau successivement travers ses lignes et travers ses
colonnes.
Lorsque les units de mesure diffrent dune variable lautre, le recours la rduction
des variables est systmatique (cf. 1.2 page 10). Ce nest pas le cas ici et la question
mrite dtre pose.
Ne pas rduire revient ici considrer quun cart de 1 degr entre deux villes a
la mme importance quel que soit le mois au cours duquel il est observ, que ce soit
un mois o les carts entre les tempratures des 15 villes sont plutt faibles ou au
contraire importants. Selon ce point de vue, dans les distances entre les villes, un mois
possde alors dautant plus dinfluence que lon y observe de grandes diffrences de
tempratures dune ville lautre (ne pas rduire les variables revient accorder aux
variables rduites un poids gal leur variance). linverse, en rduisant, on accorde
chaque mois de lanne la mme importance a priori dans lanalyse.
34 2 Exemple dACP et de CAH
Sur ce jeu de donnes, les deux points de vue sont galement dfendables. Pour
cet exemple didactique, nous choisissons de rduire les donnes ; lACP est alors dite
norme. Comme les carts-types varient peu dun mois lautre (minimum : 1.37 et
maximum : 2.06), les deux analyses, norme et non norme, conduisent ncessairement
des rsultats trs proches. Ceci a t vrifi : pour les quatre premiers facteurs, les
coefficients de corrlation entre les facteurs de mme rang des deux analyses sont tous
suprieurs 0.99.
Remarque
En pratique, la rduction est loption par dfaut dans les logiciels.
Tableau 2.2 Aides linterprtation des 15 villes pour les 2 premiers facteurs.
janv fvr mars avri mai juin juil aot sept octo nove dce lati longi moy ampl
Facteur 1 .76 .88 .97 .97 .87 .86 .84 .90 .97 .98 .90 .77 -.84 .17 1.00 .10
Facteur 2 -.64 -.47 -.16 .20 .47 .50 .53 .43 .21 -.17 -.41 -.62 -.31 .79 -.02 .99
Tableau 2.3 Coordonnes (=corrlations) des variables actives et supplmentaires pour chacun
des 2 premiers facteurs.
ainsi lies une mme variable, elles sont lies entre elles ; ceci peut tre constat sur
la partie haute de la matrice des corrlations (cf. Tableau 2.4) dont toutes les valeurs
sont positives.
Ce type de facteur est classique et est appel effet taille (cf. 1.6 page 15). Il
exprime que certains individus ont de grandes valeurs pour lensemble des variables
et dautres de petites valeurs pour lensemble des variables. Dans notre exemple, cela
indique que certaines villes sont plus chaudes que dautres tout au long de lanne.
janv fvr mars avri mai juin juil aot sept octo nove dce lati longi moy ampl
Janvier 1
Fvrier .97 1
Mars .84 .93 1
Avril .61 .76 .92 1
Mai .36 .55 .77 .95 1
Juin .34 .52 .76 .94 .99 1
Juillet .30 .49 .72 .91 .98 .99 1
Aot .41 .59 .80 .95 .98 .99 .99 1
Septembre .60 .76 .91 .98 .94 .94 .93 .97 1
Octobre .85 .94 .97 .91 .77 .76 .74 .81 .93 1
Novembre .95 .99 .93 .78 .59 .57 .55 .64 .80 .96 1
Dcembre .99 .97 .83 .62 .38 .36 .32 .43 .62 .87 .96 1
Latitude -.42 -.60 -.81 -.85 -.84 -.87 -.88 -.90 -.90 -.78 -.64 -.44 1
Longitude -.39 -.22 -.04 .29 .54 .53 .59 .50 .35 .07 -.13 -.35 -.31 1
Moyenne .77 .89 .97 .96 .86 .85 .83 .89 .97 .98 .91 .79 -.83 .16 1
Amplitude -.57 -.38 -.06 .28 .55 .58 .62 .52 .31 -.06 -.30 -.54 -.42 .83 .08 1
ct des coordonnes ngatives. Cest bien ce que lon observe, laxe 1 opposant prin-
cipalement Nice, Marseille et Montpellier ( droite) Lille et Strasbourg ( gauche).
Cette opposition se retrouve facilement dans les donnes. Ainsi, quel que soit le mois
de lanne, les tempratures mesures Nice, Marseille et Montpellier se situent au-
dessus de la moyenne (calcule sur les 15 villes) tandis que celles mesures Lille et
Strasbourg se situent au-dessous de cette moyenne. Attention, la premire formule de
transition relie la coordonne dune ville lensemble des coordonnes des variables.
Ainsi, Lille a la plus faible coordonne sur le premier axe, mais il serait faux den
conclure quelle est, quel que soit le mois, la ville la plus froide. La fausset de cette
affirmation se constate immdiatement sur les donnes : bien que toujours plus froide
que la moyenne, Lille nest la ville la plus froide que deux mois sur douze (septembre
et avril).
La position extrme de Lille provient du fait que cette ville est la plus froide sur
lensemble de lanne. Certains mois de lanne, une autre ville, ou mme plusieurs,
sont plus froides quelle mais elles sont sensiblement moins froides que Lille pendant
beaucoup dautres mois. La position des villes proches de lorigine sinterprte dans
le mme esprit. La faible coordonne, sur le premier axe, de Nantes, Lyon ou Paris
indique que, sur lensemble de lanne, la temprature de ces villes est moyenne. Mais
on ne peut en dduire que les tempratures y sont toujours moyennes car elles peuvent
aussi tre tantt leves et tantt basses. Le deuxime facteur est clairant sur ce point.
2.2 Rsultats de lACP 37
F2 : 19.0 %
longitude
juin-juillet
mai-aot
septembre - avril
F1 : 79.9 %
mars - octobre
latitude
novembre
fvrier
janvier-dcembre
Figure 2.1 Projection des 12 variables actives et de 2 variables supplmentaires sur le plan des
deux premiers facteurs. Deux variables trs proches ne sont reprsentes que par un seul vecteur.
soit infrieure 0.70 (la projection ne peut que diminuer les angles).
On prendra garde linterprtation de la forte corrlation entre 2 mois conscutifs.
Dans le calcul du coefficient de corrlation, les variables sont centres : aussi, le
fait que deux mois conscutifs aient des tempratures moyennes proches nintervient
pas directement dans la forte corrlation. Celle-ci dcoule du fait que, pour ces deux
mois, ce sont les mmes villes qui sont les plus chaudes et les mmes villes qui sont
les plus froides (plus prcisment les diffrences de tempratures entre villes sont
proportionnelles dun mois lautre).
F2 : 19.0 %
Strasbourg
Lyon
Grenoble
Marseille
Clermont
Vichy Montpellier
Paris Toulouse
Bordeaux F1
Lille
Nice 79.9 %
Nantes
Rennes
Brest
janvier juin dune part et de juillet (trs proche de juin) dcembre (trs proche de
janvier) dautre part, les mois se rpartissent dans lordre du calendrier : deux mois
proches dans le calendrier sont fortement corrls entre eux (la corrlation entre deux
mois conscutifs nest jamais infrieure 0.92) et dans chacune des deux priodes,
cette liaison dcrot rgulirement avec lloignement. Dautre part, les mois des deux
priodes se superposent quasiment deux deux. Finalement, on constate que deux
mois sont dautant plus corrls quils correspondent la mme dure du jour.
c) Variables synthtiques
Il est clairement apparu que lvolution thermique annuelle de lensemble des 15 villes
peut tre presque parfaitement synthtise par deux variables : la temprature moyenne
annuelle et lamplitude thermique.
Un autre point de vue pour dtecter des individus particuliers consiste calculer leur
inertie, par rapport au point moyen et rapporte linertie totale du nuage. Lorsque les
individus ont le mme poids, ce qui est le cas ici et est dailleurs le cas le plus frquent,
cet indicateur napporte quune nuance la distance (en revanche, si les poids diffrent
dun individu lautre, linformation est clairement diffrente). Dans ces donnes,
on dira que Nice contient 20 % de la variabilit du jeu de donnes, ou que les quatre
villes prcdentes (Nice, Marseille, Brest et Strasbourg) en contiennent 58 %.
2.2.5 Conclusion
Ce cas est typique dune ACP car il met en vidence un effet taille et une autre
structure complmentaire que lon peut appeler, en opposition la premire, effet
forme .
En revanche, il prsente deux particularits. Dabord, le premier plan factoriel
reconstitue presque parfaitement les donnes, ce qui est en pratique dautant plus
rare que le nombre de variables est grand. Ensuite, chacun des deux facteurs est
facilement interprtable, ce qui est prcieux pour un exemple finalit pdagogique,
mais lutilisateur rencontre ordinairement des situations plus complexes.
To Mo Ni B Pa Cle Gr Str
Bo Ma ce Na R
nte enne rest ris V L
rm ichy yon eno Lille
rd eau ulous ntpe rseil s s on ble
asb
o urg
x e llie le t
r
Figure 2.3 Arbre hirarchique issu de lalgorithme de Ward appliqu au tableau 2.1.
Dunod La photocopie non autorise est un dlit
On commence par regrouper les deux lments les plus proches. Dans lexemple,
ce sont Vichy et Clermont, ce qui est cohrent avec la position de ces deux villes sur le
plan factoriel (cf. Figure 2.2). Plus directement, un rapide coup dil sur les donnes
montre que ces deux villes ont des tempratures voisines tout au long de lanne, ce
qui ntonne pas compte tenu de leur proximit gographique. On constitue ainsi le
premier nud de larbre. La hauteur laquelle on relie les lments correspond la
ressemblance entre les lments relis : cest lindice de niveau du nud. La dfinition
de cet indice dans la mthode de Ward est indique plus loin.
lissue de lagrgation de Vichy et Clermont, on ne dispose plus que de 14
lments classifier : 13 villes et un groupe de 2 villes. Dans lexemple, lalgorithme
regroupe ensuite Marseille et Montpellier. Ces deux villes ont des tempratures trs
44 2 Exemple dACP et de CAH
voisines, trs lgrement moins que les 2 villes prcdemment agrges, ainsi que le
montre le calcul de distances ralis partir des donnes initiales centres-rduites.
d(V ichy, Cler mont) = .54 < d(Mar seille, Mont pellier ) = .86
Lindice de niveau du nud correspondant cette deuxime agrgation est donc
plus lev que le prcdent. Et ainsi de suite, on agrge petit petit les villes mais
aussi les groupes de villes. Ce dernier point pose le problme de la dfinition de la
ressemblance entre groupes de villes. Plusieurs possibilits existent, dont les plus
simples sont les suivantes : la distance entre deux groupes A et B peut tre dfinie
comme la plus petite (algorithme dit du saut minimum) ou la plus grande (algorithme
dit du diamtre) des distances entre deux lments appartenant lun A lautre B.
La faon dont la mthode de Ward rsout ce problme est dcrite plus loin.
Si lon classifie I individus, larbre contient I 1 nuds, quil est dusage de
numroter de I +1 2J 1. Les deux lments runis par chaque nud sont quelquefois
appels lun an, lautre benjamin.
Partition en
Inertie 2 classes 3 classes 4 classes
Linertie totale tant fixe par les donnes, il en rsulte quil revient au mme
de rechercher une partition prsentant une inertie inter grande ou une inertie intra
petite. Cette dcomposition suggre de mesurer la qualit globale dune partition par
le rapport inertie inter/inertie totale qui peut se voir comme la part dinertie exprime
par la partition (de faon un peu analogue aux pourcentages dinertie associs aux
axes en ACP). Nous en discutons plus loin lutilisation.
Le tableau 2.5 rcapitule les dcompositions de linertie relatives aux partitions en
2, 3 et 4 classes associes larbre.
Linertie inter-classes peut tre dcompose par classes, en considrant linertie
du centre de gravit de chaque classe (affect du poids gal la somme des poids
des individus de la classe). Ainsi la classe 1 (Nice, ..., Toulouse), prsente dans les
3 partitions, joue un rle essentiel dans les deux analyses (elle ne sagrge dautres
46 2 Exemple dACP et de CAH
classes quau dernier nud de la CAH ; elle est clairement isole par le premier axe
de lACP) du fait quelle exprime, en tant que classe (i.e. en ne considrant que son
centre de gravit), presque la moiti de la variabilit (43,79 %) totale. Remarque : on
ne confondra pas cette inertie avec linertie totale de la classe (43.79 + 7.29 = 51.08)
que lon peut calculer directement partir de la colonne inertie du tableau 2.2.
Linertie intra-classes peut aussi tre dcompose par classes. Ainsi, dans la partition
en 2 classes, la seconde classe (les 10 villes du nord) contribue majoritairement
linertie intra-classe. Cela a deux origines : dabord cette classe contient plus de villes ;
ensuite elle est plus htrogne, ce dont on peut se rendre compte en calculant linertie
intra moyenne (i.e. la variance) par classe (27.03/10 = 2.703 > 7.29/5 = 1.458).
Tel est le critre minimis chaque pas et qui dfinit lindice de niveau des nuds de
la hirarchie. Cette criture fait apparatre que, chaque pas, on regroupe des classes :
2.3 Introduction la mthode de Ward (classification automatique) 47
Figure 2.4 Arbre hirarchique prsentant un effet de chane. Les individus sagrgent un par un
au groupe dj constitu. Les partitions obtenues par coupure dun tel arbre, mettant toutes en
vidence un seul groupe et des individus isols, sont gnralement sans intrt pratique.
i j k
Figure 2.5 Inversion dans un arbre hirarchique. k sagrge au groupe {i, j} un niveau infrieur
celui de lagrgation entre i et j. Ce phnomne est impossible avec les algorithmes usuels.
n=I 1
dn = Inertie totale
n=1
niveau d'agrgation
8
n du
29 28 27 26 25 24 23 22 21 20 19 18 17 16 nud
Figure 2.6 Diagramme des indices de niveau de larbre de la figure 2.3. La ligne horizontale en
pointills matrialise le niveau de coupure en 3 classes.
choisit lcart-type comme unit, ce qui permet de comparer entre elles des valeurs de
variables diffrentes.
Lide de relativiser par leffectif de la classe se situe sur un tout autre plan. Empi-
riquement, on a lintuition que mme pour une variable qui na rien voir avec la
partition (ce serait le cas dune variable supplmentaire trangre aux variables
actives), la diffrence xq x nest jamais (en pratique) exactement nulle et risque,
lcart-type gnral s tant fix, de scarter dautant plus de 0 que leffectif de la
classe est faible.
2.4 Caractrisation directe dune classe dindividus 51
xq x
X
cas 1
X
cas 2
X
cas 3
Figure 2.7 Insuffisance de lcart entre villes moyennes pour caractriser une classe. La grande
ellipse reprsente lensemble des individus ; la petite rassemble les points de la classe q.
des tempratures est plus grande en juillet quen avril. Finalement, selon la valeur-
test qui synthtise ces donnes, cette classe est (lgrement) mieux caractrise
par sa forte temprature en avril que par sa forte temprature en juillet.
2. Cas 2 et 3 : Selon lcart brut, la temprature en juillet caractrise moins la classe
{Nice, ..., Toulouse} (par des valeurs leves) que la classe {Brest, ..., Nantes}
(par des valeurs basses). Mais leffectif de la premire (5) est plus important
que celui de la seconde (3). Finalement, selon la valeur-test qui synthtise ces
donnes, la temprature en juillet caractrise plus solidement la premire classe
que la seconde.
On notera ici que cest la valeur absolue de la valeur-test qui indique le degr de
caractrisation dune classe par une variable ; le signe indique le sens (moyenne de
classe plus basse ou plus leve que la moyenne gnrale) de cette caractrisation.
Tableau 2.7 Caractrisation des 3 classes de villes par lensemble des variables. Pour chaque
classe, les variables sont tries par valeurs-tests dcroissantes.
Classe 1 : Nice, Marseille, Montpellier, Bordeaux, Toulouse
Moyennes Ecarts-types
V. test Proba classe gnrale classe gnral Variable
3.40 0,001 19.28 16.99 0.75 1.79 septembre
3.39 0,001 13.79 11.81 0.74 1.55 moyenne annuelle
3.33 0,001 12.70 10.98 0.58 1.37 avril
3.32 0,001 14.54 12.32 0.94 1.77 octobre
3.24 0,001 10.04 8.23 0.52 1.48 mars
3.18 0,001 21.90 19.57 0.79 1.94 aot
3.00 0,003 19.80 17.83 0.73 1.73 juin
3.00 0,003 16.08 14.43 0.69 1.45 mai
2.97 0,003 9.88 7.93 1.00 1.74 novembre
2.92 0,004 22.10 19.83 1.00 2.06 juillet
2.88 0,004 6.80 4.83 0.94 1.81 fvrier
2.54 0,011 6.66 4.85 0.90 1.89 dcembre
2.46 0,014 5.78 3.97 0.92 1.94 janvier
0.65 0,516 3.37 2.58 2.68 3.21 longitude
0.50 0,617 16.34 15.91 0.99 2.25 amplitude annuelle
-2.95 0,003 43.56 46.04 0.47 2.22 latitude
Classe 2 : Brest, Rennes, Nantes
Moyennes Ecarts-types
V. test Proba classe gnrale classe gnral Variable
1.49 0,136 47.81 46.04 0.48 2.22 latitude
1.28 0,201 5.30 3.97 0.57 1.94 janvier
1.11 0,267 5.97 4.85 0.73 1.89 dcembre
0.66 0,509 5.47 4.83 0.24 1.81 fvrier
0.44 0,660 8.33 7.93 0.50 1.74 novembre
-0.25 0,803 8.03 8.23 0.26 1.48 mars
-0.41 0,682 11.93 12.32 0.25 1.77 octobre
-0.74 0,459 11.20 11.81 0.38 1.55 moyenne annuelle
-1.30 0,194 10.03 10.98 0.65 1.37 avril
-1.45 0,147 15.60 16.99 0.70 1.79 septembre
-2.02 0,043 12.87 14.43 0.95 1.45 mai
-2.02 0,043 17.47 19.57 1.09 1.94 aot
-2.05 0,040 15.93 17.83 1.16 1.73 juin
-2.18 0,029 17.43 19.83 1.35 2.06 juillet
-2.88 0,004 -2.34 2.58 1.38 3.21 longitude
-2.95 0,003 12.37 15.91 1.56 2.25 amplitude annuelle
Classe 3 : Lyon, Grenoble, Strasbourg, Vichy, Clermont, Paris, Lille.
Moyennes Ecarts-types
V. test Proba classe gnrale classe gnral Variable
1.89 0,059 17.13 15.91 1.44 2.25 amplitude annuelle
1.69 0,091 4.13 2.58 1.68 3.21 longitude
1.60 0,110 47.05 46.04 1.88 2.22 latitude
-1.00 0,317 19.24 19.83 1.04 2.06 juillet
-1.19 0,234 17.24 17.83 0.91 1.73 juin
-1.22 0,222 13.93 14.43 0.74 1.45 mai
-1.38 0,168 18.80 19.57 0.88 1.94 aot
-2.05 0,040 15.94 16.99 0.74 1.79 septembre
-2.11 0,035 10.16 10.98 0.64 1.37 avril
-2.60 0,009 10.66 11.81 0.62 1.55 moyenne annuelle
-2.81 0,005 10.90 12.32 0.66 1.77 octobre
-2.85 0,004 7.03 8.23 0.81 1.48 mars
-3.15 0,002 6.36 7.93 0.65 1.74 novembre
-3.25 0,001 3.16 4.83 0.76 1.81 fvrier
-3.28 0,001 3.07 4.85 0.91 1.89 dcembre
-3.36 0,001 2.11 3.97 0.88 1.94 janvier
54 2 Exemple dACP et de CAH
P[X |valeur-test|]
-|vt| 0 |vt|
Figure 2.8 Valeur-test et probabilit associe. Laire hachure matrialise la probabilit associe
la valeur-test vt.
2.5.2 Indicateurs
Le tableau 2.5 met en vidence la dcomposition de linertie associe une partition
dans lespace entier (R K ). Chaque terme de cette dcomposition peut lui-mme tre
dcompos axe par axe. Cette nouvelle dcomposition, applique la partition en
2.5 Interprtation simultane dun plan factoriel et dun arbre hirarchique 57
F2
St. Lyon
Ct Gr. Marseille
Vichy
Paris To Mt
Lille Bordeaux F1
Nantes Nice
Rennes
Brest
Figure 2.9 Reprsentation simultane dun arbre hirarchique (cf. Figure 2.3) et dun plan
factoriel (cf. Figure 2.2).
Dunod La photocopie non autorise est un dlit
trois classes, est donne tableau 2.8, dans lequel chaque inertie est exprime en
pourcentages, par rapport :
1. la somme de sa colonne, cest--dire linertie associe laxe correspondant ;
ce pourcentage sinterprte comme une contribution laxe ; par exemple, la
spcificit de la classe 1 (i.e. ce qui distingue son centre de gravit du centre
gravit gnral) contribue pour 54.80 % linertie du premier axe ;
2. la somme de sa ligne (dans cette somme, tous les axes sont pris en compte mme
si seuls les deux premiers apparaissent dans le tableau), cest--dire linertie de
la ligne exprime dans lespace complet ; ce pourcentage sinterprte comme une
qualit de reprsentation (au sens du rapport [inertie projete / inertie totale]) ;
par exemple, la spcificit de la classe 1 est exprime presque parfaitement (
99.93 %) par le premier axe.
58 2 Exemple dACP et de CAH
Tableau 2.8 Inerties associes la partition en 3 classes, dcomposes selon les deux premiers
axes factoriels. Contributions : inerties exprimes en % de linertie totale de laxe. Qualits de
reprsentation : inerties exprimes en % de linertie dans lespace complet.
Tableau 2.9 Trois indicateurs importants dans lanalyse dune partition. La distance et les
coordonnes sont celles des centres de gravit des classes. La valeur-test, qui prend en compte la
coordonne, leffectif de la classe et linertie de laxe, est comparable dun axe lautre et dune
classe lautre.
1. La distance (ou son carr) dans lespace complet entre le centre de gravit de
la classe et le centre de gravit gnral. En ce sens, la classe 1 est celle qui se
diffrencie le plus, rsultat en harmonie avec le tableau 2.5 (linertie de cette
classe ramene son centre de gravit reprsente 43.79 % de linertie totale) et
le premier axe de lACP.
2. La valeur-test, dfinie propos dune variable initiale, sapplique aux axes facto-
riels. Ainsi, daprs les coordonnes, la classe 3 se caractrise surtout par laxe1.
Daprs sa valeur-test pour laxe 2, qui prend en compte la beaucoup plus faible
variabilit des 15 villes selon cet axe, la classe 3 peut aussi tre caractrise par
sa coordonne pour laxe 2.
Remarque : pour initialiser lalgorithme, plutt que de tirer une partition au hasard,
on tire au hasard les centres de gravit des classes. Ces centres sont choisis parmi les
individus partitionner.
Malgr une apparence assez fruste, cet algorithme fournit en pratique des partitions
acceptables en un nombre ditrations faible. Une illustration sommaire en est donne
Figure 2.10.
Remarque : une partition ainsi amliore nest plus compatible avec larbre hi-
rarchique dont elle est issue. Si lon souhaite un arbre hirarchique reprsentant les
classes dune telle partition, il faut reprendre lalgorithme de Ward partir de ses
classes.
2.6 Construction et amlioration dune partition 61
Classe 1 Classe 2
Pas 1 Pas 2
Figure 2.10 Illustration de lalgorithme dagrgation autour des centres mobiles. Donnes : 8
individus situs aux sommets de 2 carrs. Initialisation : le tirage au hasard a conduit aux
barycentres G01 et G02 ; la mdiatrice du segment G01 G02 permet de dfinir laffectation des individus
aux classes : chaque individu est affect la classe correspondant au barycentre dont il est le plus
proche. Pas 1 : on calcule les barycentres G11 et G12 des classes du pas prcdent ; la mdiatrice du
segment G11 G12 permet de dfinir une nouvelle affectation des individus aux classes. Pas 2 : on
calcule les barycentres G21 et G22 des classes du pas prcdent ; laffectation aux classes 1 et 2
induite par la mdiatrice de G21 G22 est identique celle du pas prcdent. Lalgorithme a converg.
fixer les ides), la construction dun arbre hirarchique peut ne pas tre ralisable pour
des raisons de capacit machine. Une pratique commode consiste alors construire,
laide de lalgorithme des centres mobiles, une partition en un grand nombre de classes
(disons une centaine pour fixer les ides) et construire ensuite, partir de ces classes,
un arbre hirarchique. Larbre obtenu par cette procdure (dite de classification mixte)
sutilise exactement comme le haut dun arbre issu de lalgorithme usuel.
Chapitre 3
Analyse Factorielle
des Correspondances
premire variable
modalits de la i kij
I
n
Figure 3.1 Tableau des donnes brutes. I : ensemble des lignes et nombre de lignes (8 niveaux
de diplme). J : ensemble des colonnes et nombre de colonnes (9 catgories demploi). ki j :
nombre dindividus possdant la fois la modalit i de la premire variable et la modalit j de la
seconde (i.e. qui ont le niveau
de diplme i et qui occupent un emploi de la catgorie j).
i j ki j = n (nombre total dindividus).
1 j J marge
1
fi j = ki j /n
f i. = fi j
j
i fij fi.
f. j = fi j
i
f i. = f. j = fi j = 1
I i j i j
marge f.j 1
f i j = f i. f . j
Il y a liaison entre les deux variables ds que certaines cases du tableau f i j diffrent
du produit f i. f . j . Si f i j est suprieur ce produit, les modalits i et j sassocient plus
quelles ne le font dans lhypothse dindpendance : on dit que i et j sattirent. Au
contraire, si f i j est infrieur au produit des marges, i et j sassocient moins que dans
lhypothse dindpendance : on dit quil y a rpulsion entre ces deux modalits.
Lindpendance sexprime aussi en considrant le tableau comme un ensemble de
lignes. En effet, lgalit ci-dessus est quivalente lgalit :
fi j
= f. j
f i.
= f i.
f. j
Il y a indpendance lorsque tous les pourcentages en colonnes sont gaux la marge
f i. cest--dire lorsque les colonnes sont proportionnelles. Il y a liaison lorsquelles
ne le sont pas.
3.2 OBJECTIFS
Bien que le tableau tudi soit de nature trs diffrente de celui tudi en ACP, les
objectifs de lAFC peuvent sexprimer de manire analogue ceux de lACP : on
cherche obtenir une typologie des lignes, une typologie des colonnes et relier ces
deux typologies entre elles ; mais la notion de ressemblance entre deux lignes, ou entre
deux colonnes, est diffrente de celle de lACP.
66 3 Analyse Factorielle des Correspondances
Cette transformation dcoule de lobjectif qui vise tudier la liaison entre les deux
variables au travers de lcart entre les pourcentages en lignes. Elle se justifie aussi
de faon directe puisque la comparaison de deux lignes du tableau brut risque dtre
influence principalement par leurs effectifs marginaux. Ainsi, dans le tableau croisant
emplois et diplmes, la diffrence entre les lignes brutes Bac technique et Bac gnral
traduit essentiellement une diffrence entre les effectifs globaux de ces deux diplmes.
1 j J 1 j J GJ
1 1
I I
GI f.j 1 1 1
1 fi j fl j
2
2
dx (profil-ligne i, profil-ligne l) =
f . j f i. fl.
j
1 2
fi j f ik
2
dx (profil-colonne j, profil-colonne k) =
f i. f . j f .k
i
Dans ces relations, la distance entre deux lignes dpend essentiellement des dif-
frences terme terme entre les deux profils dont elle fait une somme des carrs
pondrs. La pondration 1/ f . j quilibre linfluence des colonnes sur la distance entre
les lignes : elle augmente les termes, a priori plus faibles, concernant les modalits
rares ; elle joue, jusqu un certain point, un rle analogue celui de la division par
lcart-type dans le cas des variables numriques.
La distance du x2 jouit dune proprit fondamentale appele quivalence distri-
butionnelle. Selon cette proprit, si deux colonnes proportionnelles dun tableau
sont cumules en une seule, la distance entre les profils-lignes est inchange. Le cas
dune proportionnalit parfaite entre deux colonnes ne se rencontre gure en pra-
tique mais constitue une situation limite dont on peut tre assez proche. La proprit
mathmatique est alors utilise sous la forme dune rgle pragmatique : remplacer,
par leur somme, deux colonnes ou deux lignes presque proportionnelles ne modifie
pas sensiblement les rsultats dune AFC. On se rfre surtout cette rgle lorsque
plusieurs ensembles de modalits sont possibles pour dfinir une mme variable. Ainsi,
la variable catgorie demploi peut tre plus ou moins dtaille : par exemple, on peut
se demander si les catgories ouvrier qualifi et ouvrier non qualifi peuvent tre
regroupes en une seule catgorie. Du fait de lquivalence distributionnelle, si ces
deux catgories ont des profils voisins, le choix entre les deux solutions nest pas
fondamental puisque les AFC des deux tableaux aboutissent des rsultats analogues.
RJ
profil-ligne l
NI hyperplan HI
GI
profil-ligne i
colonne j
f ij /f i.
f .j
Figure 3.4 Le nuage N I des profils-lignes dans R J . Le point i a pour coordonne sur laxe
j : f i j / f i. ; son poids est f i. ; la distance entre deux profils est la distance du x2 ; Le barycentre G I
du nuage N I a pour coordonne sur laxe j la frquence marginale f . j ; le nuage N I appartient
un hyperplan not HI .
En AFC, les poids affects chaque point du nuage sont imposs. Le point i a un
Dunod La photocopie non autorise est un dlit
Il sinterprte comme un profil moyen. Dans lexemple du tableau qui croise les
niveaux de diplme et les catgories demploi, G I est le profil demplois de lensemble
de la population, tous les diplmes tant cumuls. Il sert constamment de rfrence
dans ltude des lignes du tableau ; ainsi, tudier dans quelle mesure et de quelle faon
une classe dindividus i diffre de lensemble de la population revient tudier lcart
entre le profil de cette classe i et le profil moyen. tudier la dispersion du nuage
70 3 Analyse Factorielle des Correspondances
autour de son barycentre revient tudier lcart entre les profils des lignes et le profil
marginal, et donc la liaison entre les deux variables (cf. section 3.1).
RI
profil-colonne k
NJ hyperplan HJ
GJ
profil-colonne j
ligne i
f ij /f .j
f i.
Figure 3.5 Le nuage N J des profils-colonnes dans R I . Le point j a pour coordonne sur laxe
i : f i j / f . j ; son poids est f . j ; la distance entre deux profils est la distance du x2 ; le barycentre G J
du nuage N J a pour coordonne sur laxe i la frquence marginale f i. ; le nuage N J appartient
un hyperplan not H J .
RJ
i (de masse fi.)
u1
Dunod La photocopie non autorise est un dlit
Hi
GI=O
Figure 3.6 Ajustement dans R J du nuage des profils-lignes. i : point associ au profil-ligne
i. u 1 :
vecteur unitaire du premier axe factoriel. Hi : projection de i sur u 1 . u 1 rend maximum i f i. OHi2 .
une fraction importante de la population totale. Selon un autre point de vue, les
modalits deffectif faible, pour lesquelles les profils risquent dtre moins fiables,
interviennent moins dans la construction des axes.
En rsum, lajustement du nuage N I en AFC est analogue celui du nuage des
individus en ACP. Il en diffre par trois points :
1. les lignes interviennent au travers de leur profil ;
2. la distance entre les profils est celle du x2 ;
3. chaque ligne i est affecte du poids f i. .
RJ
1 NI
hyperplan HI
GI
i
O
1
Figure 3.7 Le premier axe factoriel du nuage N I non centr est le facteur trivial OG I orthogonal
HI . Linertie projete de N I sur OG I vaut 1.
RJ
1
w1
Dunod La photocopie non autorise est un dlit
GI
O i
1
u1
1 w2
Figure 3.8 Analyse par rapport au barycentre et par rapport lorigine. w1 : premier axe factoriel
du nuage N I lorsque lorigine des axes est en O. w2 : deuxime axe factoriel du nuage N I lorsque
lorigine des axes est en O (orthogonal u 1 ). u 1 : premier axe factoriel du nuage N I lorsque
lorigine des axes est en G I . Les projections de N I sur w2 et u 1 sont identiques.
74 3 Analyse Factorielle des Correspondances
3.7 LA DUALIT
Les deux nuages N I et N J constituent deux reprsentations dun mme tableau, lune
travers ses profils-lignes, lautre travers ses profils-colonnes. Il sensuit que les
analyses de ces deux nuages ne sont pas indpendantes : les relations entre ces deux
analyses sont communment regroupes sous le terme de dualit.
Cette dualit est plus fondamentale et plus riche en AFC quen ACP car les lignes
et les colonnes reprsentent des objets de mme nature, ce qui nest pas le cas en ACP.
La statistique x2 est gale, au coefficient n prs, linertie totale par rapport leur
barycentre de lun ou lautre des nuages N I et N J . En effet, dans R I , linertie totale
de N I par rapport G I scrit :
1 fi j 2
Inertie(N I ) = Inertie(i) = 2
f i. d (i, G I ) = f i. f. j
f . j f i.
i i i j
Soit :
x2 = n[Inertie(N I )] = n[Inertie(N J )]
Cette double galit montre que linertie totale de chacun des deux nuages N I et
N J reprsente, sous deux formes diffrentes, la liaison entre les deux variables.
a) Relations de transition
Les formules de transition prcisent les relations entre les points reprsentant dune
part les lignes et dautre part les colonnes. Avec les notations suivantes :
1. Fs (i) : projection de la ligne i sur laxe de rang s de N I ,
2. G s ( j) : projection de la colonne j sur laxe de rang s de N J ,
3. ls : valeur commune de linertie associe chacun de ces deux axes,
les deux relations de transition scrivent :
1 fi j
Fs (i) = G s ( j)
Dunod La photocopie non autorise est un dlit
ls j f i.
1 fi j
G s ( j) = Fs (i)
ls i f . j
Ces deux proprits, qui expriment les rsultats de lanalyse dun nuage en fonction
des rsultats de lanalyse de lautre nuage, conduisent une conomie de calcul.
Mais surtout, elles donnent un sens une reprsentation simultane des lignes et des
colonnes.
les deux nuages. Sur les graphiques ainsi obtenus, les rapports entre la position des
points lignes et des pointscolonnes dus aux relations de transition peuvent tre dcrits
ainsi : au coefficient 1/ ls prs, la projection, note Fs (i), de la ligne i sur laxe
de rang s (dans R J ) est le barycentre des projections, notes G s ( j), des colonnes
j sur laxe de rang s (dans R I ), chaque colonne j tant affecte du poids f i j / f i.
(cette expression dune formule de transition est appele proprit barycentrique).
Les lments lourds attirant le barycentre, une colonne j attire dautant plus une
ligne i que la valeur de f i j / f i. est leve. Sur les plans factoriels, les points loigns
de lorigine retiennent particulirement lattention car ce sont les profils les plus
diffrents du profil moyen. On trouve donc, pour un facteur, du mme ct quune
ligne i les colonnes j auxquelles elle sassocie le plus et, loppos, celles auxquelles
elle sassocie le moins. Il est ainsi possible dinterprter la position dune ligne par
rapport lensemble des colonnes, ce qui justifie lintrt pratique de la reprsentation
simultane.
La formulation symtrique vaut, en inversant les rles jous par les lignes et les
colonnes. Do le nom de double proprit barycentrique donne ce qui est la
principale rgle dinterprtation des graphiques de lAFC. Cette double proprit
est non seulement spcifique de lAFC, mais la caractrise : on dmontre que lon
retrouve les facteurs de lAFC en cherchant construire des fonctions dfinies sur
les lignes et les colonnes dun tableau de contingence telles que la double proprit
barycentrique soit vrifie.
La reprsentation simultane en AFC est universellement adopte, ce qui nest pas
le cas de celle de lACP. On peut citer deux arguments importants en faveur de cette
superposition.
1. Alors quen ACP les lignes et les colonnes reprsentent des objets de nature bien
diffrentes (individus et variables), les lignes et les colonnes, dans lAFC dun
tableau de contingence, sont de mme nature, savoir des classes dindividus.
Selon ce simple point de vue, cela ne pose aucun problme de figurer toutes ces
classes sur un mme graphique.
2. Il existe dautres prsentations de lAFC dans lesquelles les classes dindividus
que constituent les lignes et les colonnes dun tableau de contingence sont situes
dans un mme espace : leur reprsentation simultane est alors naturelle.
En rsum, sur les graphiques de la reprsentation simultane des lignes et des
colonnes, la position relative de deux points dun mme ensemble (lignes ou colonnes)
sinterprte en tant que distance tandis que la position dun point dun ensemble par
rapport celle de tous les points de lautre ensemble sinterprte en tant que bary-
centre. Toute association entre une ligne et une colonne suggre par une proximit
sur le graphique doit tre contrle sur le tableau de donnes.
3.7 La dualit 77
rciproquement) selon le schma de la figure 3.9. Dans ce cas, les facteurs dfinis par
ces axes ont la mme valeur pour chaque lment dun mme groupe de lignes ainsi
que pour chaque lment du groupe de colonnes qui sy associe. Une inertie proche de
1 indique que la structure du tableau est proche de cette situation limite : il existe une
partition de I et de J telle que chaque classe de I sassocie presque exclusivement
une classe de J et rciproquement.
Lorsque deux axes factoriels ont une inertie gale 1, les lignes dune part et les
colonnes dautre part peuvent tre divises en au moins trois groupes qui ne sassocient
qu un seul groupe de lautre ensemble, etc. La situation de plus extrme dpendance
entre deux variables qualitatives prsentant le mme nombre de modalits est celle
o chaque modalit de lune des variables ne sassocie qu lune des modalits de
lautre. En ce cas, le tableau de contingence ne possde des effectifs non nuls que sur
78 3 Analyse Factorielle des Correspondances
J1 J2
1 J
1
I1 T11 T12= 0
I1 I2 F1
J1 0 J2 1=1
I2 T21= 0 T22
Figure 3.9 Cas dune inertie associe un axe gale 1. Partitions, des lignes dune part et des
colonnes dautre part, mises en vidence par un axe factoriel associ une inertie gale 1. Tous
les effectifs des sous-tableaux T12 et T21 sont nuls.
la diagonale. Il rsulte de ce qui prcde que, dans ce cas, chaque axe de lAFC est
associ une inertie de 1.
Cette formule, appele formule de reconstitution des donnes, permet de recalculer les
valeurs du tableau initial en fonction des marges et des facteurs. Lorsque lon dpouille
les rsultats dune AFC, on limite gnralement linterprtation aux premiers facteurs.
Cela revient considrer non pas le tableau des donnes mais son approximation
obtenue laide des premiers termes de la somme ci-dessus.
Cette relation met en vidence une dcomposition de lcart du tableau relativement
lhypothse dindpendance en une somme de tableaux dont chacun ne dpend que
dun couple de facteurs (Fs , G s ) de mme rang. Elle formalise laspect de lobjectif
annonc : dcomposition de la liaison en lments simples. En effet, chaque tableau
de terme gnral f i. f . j Fs (i)G s ( j) exprime une liaison simple puisque le terme de la
case (i, j) ne dpend que de la ligne i et de la colonne j. Si les valeurs de Fs (i) et de
G s ( j) sont de mme signe, cette case exprime une attirance entre i et j ; dans le cas
contraire, il exprime une rpulsion dautant plus importante que Fs (i) et G s ( j) sont
grands en valeur absolue.
3.8 Nombre daxes et inertie totale 79
Nous illustrons cette dcomposition dans la section 10.3.1.a, page 231, propos
dun exemple.
lments supplmentaires, qui consiste projeter sur les axes factoriels des profils
de lignes ou de colonnes qui ninterviennent pas dans le calcul de ces axes. Une
ligne supplmentaire est relie aux colonnes actives par la formule barycentrique.
De mme, une colonne supplmentaire est relie aux lignes actives par la formule
barycentrique. Ces lments servent trs souvent, eux aussi, daides linterprtation ;
dans les tableaux de grande dimension, par exemple, il est trs pratique de connatre
la position et la qualit de reprsentation du barycentre de plusieurs lignes ou de
plusieurs colonnes.
1 1 j J
1
f ij / f i . k ij
i
I
n
3 tude des profils-lignes 4 tude des profils-colonnes
1 j J 2 1 j J marge 1 j J GJ
1 1 1
RJ RI
6
5
profil-ligne l profil-colonne k
hyperplan HI
hyperplan H J
GI GJ
profil-ligne i profil-colonne j
f
f.j f /f i. fij /f.j
ij i.
colonne j ligne i
11
AF 7 AF 8
relations
de transition
9
10
F2 G2
i k
l GI j
12 G1
F1 GJ
G2 F2
k i
l GI j
G1
GJ F1
1. Les donnes brutes. Lignes et colonnes jouent des rles symtriques : ce sont des
modalits de variables. La somme de tous les termes ki j du tableau est n.
2. Ce tableau intermdiaire fait apparatre les donnes sous forme de loi de probabi-
lit : f i j = ki j /n. Les probabilits marginales sont { f i. |i I } et { f . j | j J }.
3. et 4. Pour tudier les lignes du tableau, on les transforme en profils-lignes. Pour
tudier les colonnes, on les transforme en profils-colonnes. On dispose donc de deux
tableaux. Un profil sinterprte comme une probabilit conditionnelle. Les profils
moyens G I et G J sont les distributions marginales associes au tableau 2.
5. Un profil-ligne est une suite de J nombres et peut tre reprsent par un point
de R J . Le nuage N I des profils-lignes appartient lhyperplan HI des vecteurs dont
la somme des coordonnes vaut 1. Chaque profil-ligne i est affect du poids f i. ; le
nuage N I ainsi pondr a pour barycentre le profil moyen G I . Dans le nuage N I , on
sintresse la ressemblance entre les profils mesure au travers de la distance du x2 .
6. La reprsentation des profils-colonnes dans R I appelle des commentaires stricte-
ment symtriques ceux de la reprsentation des profils-lignes dans R J .
7. LAnalyse Factorielle (AF) dun nuage consiste mettre en vidence une suite de
directions orthogonales telles que linertie, par rapport O, de la projection du nuage
sur ces directions est maximum. Applique N I , lAF fournit une premire direction
dite triviale reliant O G I et orthogonale HI . Pour les directions suivantes, G I se
projette lorigine des axes : ces directions suivantes sont les directions dallongement
maximum de N I . Il est donc quivalent de raliser lanalyse par rapport O ou par
rapport G I .
8. On peut reprendre point par point le commentaire de 7 en le transposant aux
colonnes.
9. et 10. Les plans factoriels, croisant deux facteurs, sur les lignes ou sur les
colonnes, fournissent des images approches des nuages N I et N J . Sur ces plans,
la distance entre deux points sinterprte comme une ressemblance entre les profils de
Dunod La photocopie non autorise est un dlit
ces points. Lorigine des axes est confondue avec le profil moyen.
11. Les relations de transition expriment les rsultats dune AF (par exemple dans
R ) en fonction des rsultats de lautre (par exemple dans R J ).
I
12. Du fait des relations de transition, les interprtations des plans factoriels repr-
sentant N I et N J doivent tre menes simultanment. Il est commode de superposer
ces reprsentations. Linterprtation de cette reprsentation simultane est rgie par la
double proprit barycentrique.
82 3 Analyse Factorielle des Correspondances
3.11 CONCLUSION
Dans ce chapitre, lAFC est introduite comme une mthode particulirement bien
adapte ltude dun tableau de contingence. Dun point de vue historique, elle a
dailleurs t imagine pour traiter ce type de tableau. Toutefois, les remarquables
proprits de cette mthode ont trs tt incit lappliquer dautres tableaux :
aujourdhui, la pratique courante de lAFC dpasse largement le cadre des tableaux de
contingence.
Ds linstant que lon tudie un tableau qui nest pas un tableau de contingence,
lobjectif de lAFC ne peut plus tre formul en terme de liaison entre deux variables
qualitatives. En revanche, il existe des tableaux dont ltude ncessite une typologie
des lignes dune part et des colonnes dautre part, travers leur profil.
Pour tablir lintrt de lAFC dans la ralisation de telles typologies, il convient de
sassurer que les diffrentes notions mises en jeu par cette mthode (transformation en
profils, distance du x2 , poids des lments) sont en accord avec le point de vue que
lon veut avoir sur les donnes tudies. Les formules barycentriques, qui relient les
projections des lignes et des colonnes et qui permettent elles seules de caractriser
les facteurs, peuvent aussi justifier lapplication de lAFC.
Nous illustrons ces situations laide de deux exemples.
Premier exemple : Dans ltude de la liaison entre le diplme obtenu et lemploi
occup, on peut sintresser deux tableaux de mme structure tablis lun en se
limitant aux hommes et lautre en se limitant aux femmes. Le chapitre 10 propose une
srie danalyses pour ce couple de tableaux. Ds maintenant, on peut se rendre compte
de lintrt de lAFC sur une juxtaposition en ligne de plusieurs tableaux. En
ralit, ce tableau est encore un tableau de contingence dont lune des deux variables
est obtenue par croisement des deux variables emploi et sexe.
Second exemple : Les lignes sont les entreprises dun secteur conomique. Les
colonnes sont les postes dactif du bilan. lintersection de la ligne i et de la colonne
j, se trouve la valeur du poste j pour lentreprise i. Un tel tableau peut tre analys
laide dune ACP. En ce cas, les postes sont des variables centres et rduites ;
chaque poste est affect du mme poids ainsi que chaque entreprise. Gnralement,
les entreprises diffrent assez sensiblement par leur total dactif, ce qui induit presque
toujours un effet taille en tant que premier facteur (cf. section 1.6).
Mais ce tableau peut aussi tre analys laide dune AFC. Tout dabord, ses marges
(qui servent de rfrence) ont une signification claire : la somme des termes de la i e
ligne est le total des actifs de lentreprise i ; la somme des termes de la j e colonne
est la valeur du poste j pour lentreprise fictive que constitue lensemble du secteur.
Sans entrer dans les dtails, les principales caractristiques impliques par lAFC de
ce tableau sont les suivantes.
3.11 Conclusion 83
1. Chaque entreprise est analyse au travers de son profil : chacun de ses postes est
exprim par rapport au total des actifs. Un ventuel effet taille est limin.
2. Chaque entreprise a un poids proportionnel son total dactif.
3. Chaque poste de bilan a un poids proportionnel son importance pour lensemble
du secteur.
4. Les postes du bilan sont transforms en profil ; cette harmonisation des donnes
nest pas trs diffrente du couple centrage-rduction en ACP. la diffrence de
lACP, le nuage des postes est analys partir de son barycentre : on tudie les
diffrences entre postes. Ce qui est commun lensemble des postes est limin :
on ne peut observer deffet taille.
Ce second exemple montre que certains tableaux peuvent tre analyss par ACP ou
AFC. Ces deux analyses ne sont pas quivalentes et peuvent fournir des clairages
assez diffrents. On examinera les pondrations induites par lAFC aussi bien pour
choisir entre les deux mthodes que pour interprter conjointement leurs rsultats.
Chapitre 4
possde par i mais beaucoup de logiciels acceptent pour xi j une chane de caractres
dsignant la modalit (codage dit alphabtique ).
Naturellement, mme lorsque ce sont des nombres, les valeurs xi j sont des codifi-
cations qui ne possdent pas de proprits numriques. Si la variable j est la couleur
des individus, cette couleur peut tre codifie ainsi : bleu = 1, blanc = 2, rouge = 3.
Il est clair que la moyenne entre bleu et rouge na pas grand sens et ne peut tre
considre comme tant blanc ! Il nest donc pas possible de traiter directement ce
tableau par ACP (ou AFC) : les tableaux IndividusVariables qualitatives possdent
des spcificits et leur analyse factorielle ncessite une mthode spcifique.
variables qualitatives
1 j J
1
individus
i xij
Figure 4.1 Tableau des donnes sous forme de codage condens. I : nombre et ensemble des
individus. J : nombre et ensemble des variables qualitatives. xi j : codage condens de la valeur de
lindividu i pour la variable j (numro ou chane de caractre).
1 J
individus
I J
marge I1 Ik IK IJ
Figure 4.2 Tableau des donnes sous forme disjonctive complte. K j = nombre et ensemble des
modalits de la variable j. K = jj =J=1 K j = nombre et ensemble des modalits toutes variables
k=K
confondues. xik = 1 si lindividu i possde la modalit k et 0 sinon k=1 j xik = 1 pour tout (i, j)
k=K i=I k=K j
k=1 x ik = J pour tout i ; i=1 x ik = Ik pour tout k ; k=1 Ik = I pour tout j
bleau est bien quivalent aux donnes initiales. Nanmoins, son nombre de cases crot
si rapidement avec J que, dans la plupart des situations concrtes, presque toutes les
cases ont un effectif nul (si lon mesure sur 1 000 plantes 10 variables 5 modalits,
lhypertableau associ possde environ 107 cases dont au plus une sur 10 000 sera
deffectif non nul). Le dveloppement de mthodes gnrales danalyse de cet hyper-
tableau est sans intrt pratique immdiat. En revanche, le cas o J = 3 conduit un
hypertableau de dimension raisonnable et mrite une attention particulire : nous lui
consacrons le chapitre 10.
88 4 Analyse des Correspondances Multiples
K3
q
Iklq K2
1 l
k
K1
variable j variable l
1 k q K
1
variable j
0
k Ik Iqk
0
variable l
0
q Iqk Iq
0
K
marge JIk
Figure 4.4 Tableau de Burt. Le tableau est symtrique. Les tableaux J situs sur la diagonale sont
diagonaux. Iqk : nombre dindividus possdant la fois la modalit q (de la variable l) et la
modalit k (de la variable j). Ik : nombre dindividus possdant la modalit k (de la variable j).
4.2 Objectifs 89
Ce tableau est analogue une matrice des corrlations en ce sens quil rcapitule
lensemble des liaisons entre les variables prises 2 2. Il contient beaucoup moins
dinformation que lhypertableau et ne permet pas de reconstruire le TDC.
4.2 OBJECTIFS
La problmatique de lACM est apparente celle de lACP (tude dun tableau Indivi-
dusVariables) mais peut tre considre aussi comme une gnralisation de celle de
lAFC (tude de la liaison entre plusieurs variables qualitatives). Ces deux aspects sont
toujours plus ou moins explicitement prsents dans les objectifs de lACM, prsents
ici partir des trois familles dobjets qui interviennent en ACM : les individus, les
variables et les modalits des variables.
tudies. Ainsi, une variable ne pourra tre considre comme un indicateur de statut
social que si elle est lie la fois la catgorie socio-professionnelle, au type de
diplme, etc.
Remarque. Par rapport lACP, on cherche, selon ce second point de vue, une
variable quantitative pour synthtiser un ensemble de variables qualitatives (et non
quantitatives) ce qui implique, dune faon ou dune autre, daffecter un coefficient
chaque modalit de chaque variable ; pour un individu, la valeur de la variable
synthtique est alors la somme des coefficients des modalits quil possde.
Les objectifs indiqus dans ltude des variables et des individus sexpriment ainsi
en grande partie laide des modalits.
2. les colonnes peuvent tre regroupes par paquets (qui correspondent chacun
une variable) dont la somme est une colonne compose de 1 ;
3. la somme des nombres dune mme ligne est constante et gale J , nombre total
de variables.
Les sections suivantes montrent que les distances, les poids et les facteurs de lAFC
dun TDC correspondent aux objectifs pralablement fixs.
modalits dune mme variable sont obligatoirement assez loignes lune de lautre
dans lespace. Deux modalits possdes par les mmes individus sont confondues.
Les modalits rares sont loignes de toutes les autres. Cette distance traduit bien le
premier des deux points de vue sur la ressemblance entre modalits indiqus dans les
objectifs.
En appliquant ce calcul la distance entre une modalit k et le centre de gravit
G K du nuage des modalits (correspondant une modalit possde par tous les
individus), on trouve : d2 (k, G K ) = (I /Ik ) 1 ; cela spcifie linfluence de leffectif
dune modalit sur sa distance au point moyen.
Le poids de la modalit k vaut Ik /I J ; il est proportionnel leffectif Ik .
Remarques
Un lment (ligne ou colonne) influence la construction des axes par lintermdiaire
de son inertie par rapport au centre de gravit. Un calcul simple donne :
1 Ik
Inertie de k par rapport G K = (1 )
J I
Ce rsultat montre que, dans linfluence dune modalit rare, le faible poids ne
suffit pas compenser leur loignement. Par exemple, une modalit prsente dans 1 %
seulement de la population possde une inertie (cest--dire une influence) presque
deux fois plus grande quune modalit prsente dans 50 % de la population. Concr-
tement, il est courant de voir les premiers facteurs dune ACM dtermins presque
exclusivement par quelques modalits trs rares partages par les mmes individus.
Comme il est souvent beaucoup plus intressant de dgager des phnomnes gnraux
plutt que ces phnomnes ponctuels, on cherche, en pratique, viter les modalits
trop rares (en effectuant des regroupements).
En sommant les inerties des modalits, on montre facilement que linertie totale du
Dunod La photocopie non autorise est un dlit
1 xik
Fs (i) = G s (k)
ls kK J
1 xik
G s (k) = Fs (i)
ls iI Ik
Du fait que xik ne prend que les valeurs 0 ou 1, ces relations de transition sinterprtent
simplement. En projection sur laxe s, lindividu i est plac, au coefficient 1/ ls prs,
au barycentre des modalits quil possde. Paralllement, la modalit k est place, au
coefficient 1/ ls prs, au barycentre des individus qui la possdent. Il en rsulte que,
sur un axe, une modalit (colonne du TDC) reprsente une dilatation prs la moyenne
des individus qui la possdent (lignes du TDC). Aussi, dans ltude de sa projection,
on peut considrer une modalit aussi bien comme barycentre dune classe dindividus
(i.e. une ligne du tableau de Burt = somme des lignes du TDC correspondant aux
individus possdant la modalit concerne) que comme indicatrice dune variable (i.e.
une colonne du TDC). Le coefficient de dilatation varie avec les axes, ce qui nest
pas gnant lorsque linterprtation des rsultats se fait facteur par facteur et milite
pour examiner conjointement de prfrence des axes dinerties comparables (principe
commun toute les analyses factorielles).
Cette quivalence entre facteurs ne doit pas faire oublier que les modalits, dune
part en tant quindicatrices et dautre part en tant que barycentres, sont situes dans
des espaces diffrents. Il en rsulte que les qualits de reprsentation dune mme
modalit selon chacun des points de vue ne sont pas lies. En outre, les notions de
proximit entre ces deux types dobjets diffrent.
En effet, la proximit entre indicatrices mesure leur association mutuelle (cf. sec-
tion 4.3.3). Dautre part, la proximit des moyennes de classes dindividus dcoule
des distances dfinies entre les individus : deux classes dindividus k et h sont dautant
plus proches quelles possdent des caractristiques identiques quant lensemble des
variables, cest--dire que les modalits k et h sassocient de la mme manire aux
modalits de toutes les variables. Cette notion de proximit correspond au second point
de vue sur les ressemblances entre modalits dgag dans les objectifs. Il est remar-
quable de constater, qu des dilatations axiales prs, les deux notions de proximit
fondes sur des principes diffrents conduisent aux mmes graphiques dans lanalyse
du TDC.
En pratique, les deux notions de proximit sutilisent conjointement ; en particulier,
on interprte souvent la proximit entre modalits de variables diffrentes en tant
quassociation de modalits et la proximit entre modalits dune mme variable en
4.3 AFC applique un Tableau Disjonctif Complet 95
tant que ressemblance entre deux classes dindividus. Par exemple, en dcrivant un plan
factoriel sur lequel apparaissent diffrents repres sociaux, on interprte la proximit
entre les modalits retraits et plus de 65 ans en terme dassociation (ce sont presque
les mmes individus qui possdent ces deux modalits) et la proximit entre 60 65 ans
et plus de 65 ans en terme de ressemblance (ces deux classes dindividus possdent
des caractristiques identiques quant aux autres variables). Ainsi, les relations de
transition, mme si elles ne sont pas utilises dans le cadre strict dune reprsentation
simultane, confrent la reprsentation des modalits les proprits souhaitables
dgages dans lexpos des objectifs.
La projection conserve cette proprit. Lensemble des modalits dune mme variable
est donc centr sur lorigine pour tous les graphiques ; les facteurs opposent entre elles
Dunod La photocopie non autorise est un dlit
2 1
2 0
Figure 4.5 Illustration des deux valeurs extrmes du rapport de corrlation. 8 individus,
reprsents par un symbole diffrent selon leur modalit pour une variable qualitative, figurent
sur un axe reprsentant une variable numrique.
h2 (Fs , j) = J (inertie de la modalit k, projete sur laxe dordre s)
kK j
priori de chaque variable est la mme mais le nombre daxes sur lesquels une
variable peut influer est directement li au nombre de ses modalits. Cela implique
notamment que, si quelques variables trs riches en modalits sont lies entre elles,
les premiers facteurs peuvent nexprimer que ces liaisons et il faudra alors chercher
trs loin dans la suite des facteurs pour percevoir dautres liaisons.
Ft
1
j'
j
2(j,Ft)
2(j,Fs) 1 Fs
Figure 4.6 Reprsentation des variables en ACM (carr des liaisons). h2 ( j, Fs ) : rapport de
corrlation entre la variable qualitative j et le facteur Fs . Par construction, pour tout j et tout s :
0 h2 ( j, Fs ) 1. Ce graphique montre que les variables j et j sont trs lies au facteur Fs et
que seule j est lie Ft .
4.4 Analyse des Correspondances dun tableau de Burt 99
confondus. Il en dcoule que, pour obtenir simultanment les projections optimales des
uns et des autres, il suffit dappliquer une AFC au tableau juxtaposant en colonne le
TDC et le tableau de Burt, en mettant indiffremment lun ou lautre des deux tableaux
en supplmentaire . Cette quivalence prsente un intrt thorique important :
loptimalit simultane des reprsentations des individus et des barycentres des classes.
Elle prsente aussi un intrt pratique : la possibilit danalyser le tableau de Burt la
place du TDC, le premier tant en gnral bien plus petit.
Attention : dans lanalyse du TDC, il faut bien distinguer la reprsentation des
modalits en tant que colonnes (ou variables indicatrices) et la reprsentation des
barycentres (ou moyennes de lignes). Selon les relations
de transition, les deux repr-
sentations sont homothtiques dans le rapport ls pour laxe dordre s. Cest la
deuxime reprsentation qui est confondue avec celle des lignes du tableau de Burt
(dans lanalyse de ce dernier, lignes et colonnes ont dailleurs la mme reprsentation
100 4 Analyse des Correspondances Multiples
du fait de la symtrie). Il en dcoule que les facteurs dfinis sur le mme ensemble de
colonnes
K des deux tableaux ne sont pas gaux, mais homothtiques dans le rapport
ls . Les inerties (dans lesquelles les distances interviennent par leur carr) associes
aux facteurs du tableau de Burt sont les carrs de leurs homologues dans le TDC.
On peut aussi avoir intrt raliser un codage qualitatif mme lorsque lon dispose
dun ensemble de variables numriques sur lequel une ACP peut tout fait sappli-
quer. En effet, une ACM sur ces mmes variables codes en classes donne une autre
approche des donnes. En reprsentant chaque variable par autant de points quelle
possde de classes, lACM peut mettre en vidence, si elles existent, des liaisons non
linaires entre les variables. Ce type de liaison est assez frquent car beaucoup de
phnomnes prsentent des effets de seuil : un tat pathologique peut tre caractris
par une valeur trop faible ou trop leve ; un fromage sera dautant plus apprci
quil est sal mais jusqu un certain point (de ce point de vue, les deux extrmits
de lintervalle de variation du caractre sal sont plus proches entre elles quelles
ne le sont des valeurs moyennes). Concrtement, sur les graphiques, la proximit de
modalits extrmes dmontre laptitude de lACM mettre en vidence des liaisons
non linaires.
102 4 Analyse des Correspondances Multiples
De tels phnomnes sont naturellement invisibles dans les rsultats dune ACP qui
ne tient compte que des liaisons linaires. Paradoxalement, en rduisant linformation
traite (lappartenance une classe ou un intervalle est moins prcise quune valeur
numrique), on augmente la richesse du rsultat ! Notons par exemple que la moyenne
dune classe dindividus comprenant des individus trs grands et des individus trs
petits correspond un individu moyen pour une variable numrique alors quelle
correspond une rpartition dans les deux extrmes pour cette mme variable code
en qualitative.
LACM de variables numriques codes en variables qualitatives est une approxi-
mation dune analyse non linaire dans le sens suivant : on cherche des variables
synthtiques qui soient des combinaisons linaires de fonctions quelconques des
variables tudies et non, comme en ACP, des variables elles-mmes. Ce problme
na de sens que dans le cadre dun modle o la population est infinie. En pratique, en
ACM sur une population finie, au lieu de considrer lensemble des fonctions dune
variable, on divise lintervalle des valeurs de la variable en sous-intervalles et lon
considre lensemble des fonctions constantes sur chaque sous-intervalle. En effet,
quand on traite par lACM une variable qualitative j, cette variable est reprsente
dans R I par le sous-espace E j engendr par les indicatrices de ses classes ; E j nest
autre que lensemble des variables ayant une mme valeur pour tous les lments
dune mme classe. Le premier facteur est la combinaison linaire des lments de ces
J sous-espaces E j (chaque lment est une fonction constante sur les classes dune
variable) la plus proche possible de tous ces sous-espaces.
Ce codage permet aussi dtudier des variables dont les distributions sont trs
irrgulires et pour lesquelles le coefficient de corrlation est une mesure de liaison
inadapte. Par exemple, si un lment a une valeur trs loigne des valeurs des autres
lments, il influe de manire prpondrante sur les coefficients de corrlation et un
codage qualitatif le neutralise.
En ACM, elle scrit (en notant h2 le carr du rapport de corrlation ; cf. section 4.3.6) :
h2 ( j, Fs )
j
4.7 Conclusion 105
Ce critre quilibre le rle de chacune des variables quel que soit son type ; cet
quilibre implique que les variables quantitatives soient centres et rduites.
3. Pour raliser pratiquement une AFDM (en labsence dun logiciel ad hoc), on
juxtapose le tableau des variables quantitatives centres rduites et le tableau disjonctif
complet dans lequel les valeurs 1 pour la modalit k sont remplaces par Ik . Ce
tableau est ensuite soumis une ACP non norme.
4. Les trois graphiques de base de lAFMD reprsentent :
les individus comme en ACP ou en ACM ;
les variables quantitatives comme en ACP (cercle des corrlations) ;
les modalits des variables qualitatives comme en ACP cest--dire lexact
barycentre des individus qui les possdent (et non pas au coefficient ls prs
comme en ACM).
ces graphiques, on ajoute celui des variables des deux types construit de la faon
suivante : la coordonne de la variable quantitative k sur laxe de rang s est r 2 (k, Fs ) ;
celle de la variable qualitative j vaut h2 ( j, Fs ). Ce graphique a dj t introduit
pour lACM (Figure 4.6) ; il montre simultanment les liaisons entre les variables
des deux types et les facteurs (do sa dnomination carr des liaisons ) mais
sinterprte aussi, pour les variables actives, en terme de contributions au critre (une
autre interprtation, gomtrique, sera donne en 8.4 propos de lAFM). Le carr des
liaisons peut-tre construit partir de nimporte quelle analyse factorielle applique
un tableau dont les lignes sont des individus (ACP, ACM, AFDM, AFM).
4.7 CONCLUSION
Dunod La photocopie non autorise est un dlit
LACM est une mthode dtude de plusieurs variables qualitatives dfinies sur un
ensemble dindividus. Sa problmatique est trs riche et va bien au-del dune simple
mise en uvre de lAFC sur un tableau particulier.
Cest l un des aspects de lquivalence entre lAFC sur le TDC et sur le tableau
de Burt. Il existe dailleurs dautres quivalences que celles dj cites ; des points
de vue trs diffrents sur ltude de variables qualitatives ont induit la conception de
mthodes qui conduisent, au moins partiellement, aux mmes rsultats que lAFC sur
le TDC (cf. section 8.6).
Outre quelles permettent de considrer lACM comme une mthode part entire,
ces convergences la renforcent. Les mcanismes de lACM, supportant plusieurs
interprtations, sont dune part adapts une vaste palette de problmes concrets et
dautre part fournissent des rsultats en accord avec plusieurs points de vue.
Chapitre 5
Calculs et dualit
en Analyse Factorielle
5.1 INTRODUCTION
Les mthodes danalyse factorielle prsentes dans les premiers chapitres sont fondes
sur des principes communs : partir dun tableau de donnes, on construit deux nuages
de points reprsentant respectivement les lignes et les colonnes ; ces deux nuages sont
projets chacun sur une suite daxes orthogonaux maximisant linertie projete ; sur
chacun de ces axes, les deux nuages ont la mme inertie projete et les projections des
points sont lies dun nuage lautre par les relations dites de transition.
Dans ce chapitre, nous indiquons comment calculer ces facteurs, montrons la dualit
des deux nuages et donnons des dmonstrations des formules de transition. Le cadre
dans lequel nous nous plaons est assez gnral. Non seulement il recouvre lACP et
lAFC, mais il permet dintroduire et de calculer les facteurs danalyses factorielles
fondes sur dautres distances et dautres poids.
obtenir les facteurs et leur inertie, nous utilisons des techniques simples de calcul
matriciel.
Les coefficients m j pondrent linfluence de chaque colonne j dans les distances entre
lments ; cette proprit justifie leur nom de poids des colonnes . Or, lorsque M
nest pas diagonale, ses termes apparaissent comme des poids associs des couples
de colonnes, ce qui na pas de rsonance concrte.
Le produit scalaire (associ d M ) entre deux vecteurs u et v scrit :
u, v M = u Mv = v Mu
i
Fu (i) = xi , u M = xi Mu
Fu = X Mu
pi [Fu (i)]2 = Fu D Fu
O u Fu(i) i
Figure 5.1 Projection Fu (i) du point i sur laxe dfini par le vecteur unitaire u.
u = u s es avec u 2s = 1
s s
X DXu = X DX u s es = ls u s es
s s
110 5 Calculs et dualit en Analyse Factorielle
u X D X u = ls u 2s l1 u 2s = l1
s s
Ainsi, avec la contrainte s u 2s = 1, cette inertie est majore par l1 . Ce maximum
est atteint lorsque la premire composante u 1 de u vaut 1 ou 1 et que les autres sont
nulles cest--dire lorsque u = e1 . Linertie du nuage projet sur un axe est donc
maximum lorsque cet axe est colinaire aux vecteurs propres de X D X associs sa
plus grande valeur propre l1 . Elle vaut alors l1 .
Les vecteurs propres de la matrice symtrique X D X tant orthogonaux deux
deux, le mme raisonnement montre que la direction orthogonale u 1 qui maximise
linertie du nuage projet est celle dun vecteur propre associ la deuxime valeur
propre l2 de X D X ; cette inertie vaut alors l2 . La suite daxes orthogonaux maxi-
misant linertie projete est donc dfinie par une suite de vecteurs propres de X D X
rangs par valeurs propres dcroissantes (les valeurs propres sont supposes distinctes
ce qui toujours le cas en pratique).
5.2.5 Calcul des axes dinertie maximum pour une mtrique quelconque
Si la mtrique M nest pas la mtrique identit, le raisonnement ci-dessus sapplique
sans changement majeur. En effet, X D X M dfinit un endormophisme de R J sym-
trique pour la mtrique M. Rappelons que la M-symtrie dun endomorphisme A est
dfinie par lgalit, pour tout couple de vecteurs u et v, des deux expressions :
X D X Mu s = ls u s
(X M)(X D X Mu s ) = ls (X M)u s
X M X D Fs = ls Fs
Linertie du nuage N I projete sur u s est la somme des carrs des termes de Fs
pondrs par les poids des lments i soit :
pi Fs (i)2 = Fs D Fs = ls
i
Tout dabord, il est logique daffecter chaque colonne j le poids m j (terme gnral de
la matrice M dj interprt comme un poids de colonne : cf. section 5.2.1 ; rappelons
que nous nous sommes limits aux mtriques associes une matrice diagonale).
Ainsi, le choix des poids des lments du nuage N J et le choix de la mtrique dans
R J sont lis.
En outre, la construction symtrique des deux nuages implique que le poids des
individus du nuage N I induise la mtrique dont R I est muni. De faon directe, on peut
remarquer quil revient au mme de dupliquer un lment i ou de doubler son poids.
Dans R I , la distance entre deux points est la mme dans ces deux cas condition
dadopter la mtrique D.
Le tableau 5.1 page suivante rsume les poids et les mtriques mis en jeu. Les
nuages N I et N J ainsi construits sont dits duaux en ce sens quils reprsentent tous
deux les mmes donnes {X , M, D}.
112 5 Calculs et dualit en Analyse Factorielle
travers de cette matrice, il apparat clairement ici que ces axes ne dpendent que des
liaisons linaires entre variables.
u (R J , M)
1
M
M
Mu (R J , M 1 )
Or le nuage des profils-lignes dans R J , not ici N I , est limage, par cet isomor-
phisme M, du nuage N I dfini en 5.3.2. En effet, si lon applique M au point i de N I ,
sa j e coordonne devient :
f i j f i. f . j M f i j f i. f . j fi j
xi j = xi j = = f. j
f i. f . j f i. f i.
On retrouve la coordonne, aprs centrage, du point i dans le nuage des lignes de
lAFC du chapitre 3. LAFC prsente dans ce chapitre est lanalyse factorielle de N I
dans (R J , M). LAFC prsente au chapitre 3 est celle de N I dans (R J , M 1 ).
Lisomorphisme entre ces deux nuages assure la mme dcomposition sur les axes
dinertie, donc lgalit des facteurs de rangs homologues. Notons que les axes diner-
tie sont situs dans des espaces diffrents et, par consquent, sont diffrents.
Paralllement, les colonnes de X (dfini en a) peuvent tre reprsentes par un
nuage N J situ dans un espace de dimension I (not R I ) muni de la mtrique D.
Lapplication D associe ce nuage N J le nuage N J situ dans le dual de R I muni de
la mtrique D 1 . Le nuage N J nest rien dautre que le nuage des profils-colonnes
analys au chapitre 3. Les nuages N J et N J sont isomorphes et les facteurs sur J de
lAFC peuvent tre obtenus par lanalyse factorielle de lun ou lautre de ces nuages.
5.4 DUALIT
5.4.1 Relations entre les axes dinertie et les facteurs des deux nuages
Le calcul des axes dinertie et des facteurs du nuage des colonnes est absolument
identique celui du nuage des lignes. Tous les rsultats concernant le nuage des
colonnes se dduisent de ceux obtenus pour le nuage des lignes, en remplaant X par
sa transpose X et en changeant les matrices M et D.
Ainsi, dans lespace R I , on cherche une suite de vecteurs {vs ; s = 1, ..., I }, chacun
rendant maximum la quantit vs X M X Dvs sous la double contrainte dtre unitaire
(vs Dvs = 1) et orthogonal aux vecteurs dj trouvs (vs Dvt = 0 pour tout t < s). La
solution est donne par lquation :
X M X Dvs = ms vs
Dunod La photocopie non autorise est un dlit
qui exprime que vs est vecteur propre unitaire de X M X D associ la valeur propre
ms de rang s. La comparaison de cette quation avec lquation aux facteurs de la
section 5.2.6 (X M X D Fs = ls Fs ) conduit aux deux rsultats suivants.
1. ms = ls : les inerties projetes des nuages N I et N J sur leurs axes principaux de
mme rang sont identiques. Ces valeurs propres
tant positives ou nulles, les iner-
ties totales des deux nuages sont gales s ls . Lorsque les matrices X D X M
et X M X D ne sont pas de mme dimension et admettent des nombres diffrents
de valeurs propres, les valeurs propres non communes aux deux matrices sont
nulles.
2. Les facteurs Fs et les axes vs sont vecteurs propres, de la mme matrice X M X D,
associs la mme valeur propre. Or, les quations aux vecteurs propres carac-
trisent ces vecteurs la norme prs (sauf en cas dgalit de plusieurs valeurs
116 5 Calculs et dualit en Analyse Factorielle
Tableau 5.2 Les deux nuages, leurs axes dinertie et leurs facteurs.
Nuage N I Nuage N J
Espace RJ RI
Mtrique M D
Coordonnes X X
Poids D M
Axe dinertie us vs
Equation X D X Mu s = ls u s X M X Dvs = ls vs
Norme u s M = 1 vs D = 1
Orthogonalit u s , u t M = 0 si s = t vs , vt D = 0 si s = t
Facteur Fs = X Mu s G s = X Dvs
Equation X M X D Fs = ls Fs
X D X M Gs = ls G s
Norme Fs D = ls G s M = ls
Orthogonalit s Fs (i)F t (i) pi = 0 si s = t s G s ( j)G t ( j)m j = 0 si s = t
Inertie sur laxe s ls 2
ls 2
Inertie totale s ls = i j pi p j x i j s ls = i j pi p j x i j
Fs
1
i Fs(i) RI
RJ
i j
Gs Fs
I
us vs
Fs(i) Gs(j)
Gs
1
j Gs(j)
Figure 5.3 Relations entre les axes dinertie dun nuage et les facteurs de lautre nuage.
M M
RJ , M RJ*, M -1 Gs = s us u*s
X' X X' X
Figure 5.4 Le schma de dualit. M, D, X et X dsignent ici les applications associes aux
matrices de mme nom. gauche, les espaces en jeu et leur mtrique ; droite, les rsultats de
lanalyse factorielle dans ces espaces.
yj
yjx j = mj xj
mj
j j
En ACP, o les colonnes de X sont les variables initiales, nous avions propos deux
objectifs : la recherche de projections du nuage des individus et la recherche de
variables synthtiques, combinaisons linaires des variables initiales. Les critres
dajustement choisis, inertie projete maximum du nuage dindividus et variable maxi-
misant la somme des carrs des corrlations avec les autres variables (= inertie projete
du nuage des variables), aboutissent au mme rsultat. Lidentit entre projection du
nuage dindividus et combinaison linaire des variables montre que ces deux objectifs
sont deux expressions dun mme problme exprim travers les individus dune part
et travers les variables dautre part.
5.4 Dualit 119
1
us = Gs
ls
1
vs = Fs
ls
Elles indiquent que, dans lespace R I , la reprsentation des colonnes (G s ) sert de base
(u s ) la reprsentation des lignes et rciproquement. La liaison entre les facteurs des
deux nuages est donc une liaison fondamentale et il est ncessaire de les interprter
conjointement.
Les formules de transition permettent de calculer les projections de lun des deux
nuages en fonction des facteurs sur lautre nuage. Elles drivent directement des
relations entre axes et facteurs et scrivent :
1
Fs = X M Gs
ls
1
Gs = X D Fs
ls
1
Fs (i) = xi j m j G s ( j)
ls j
1
G s ( j) = xi j pi Fs (i)
Dunod La photocopie non autorise est un dlit
ls i
Ces formules montrent comment, de faon concrte, les facteurs des deux nuages
doivent sinterprter conjointement, cest--dire comment chacun des ensembles peut
servir de support et daide linterprtation des facteurs de lautre ensemble. Dans une
reprsentation superposant les projections des lignes et des colonnes (pour les facteurs
de mme rang), la relation entre la position dun lment dun ensemble et celles de
tous les lments de lautre ensemble peut sexprimer ainsi : si xi j est positif, il y a
attirance entre i et j, si xi j est ngatif il y a rpulsion. Les poids m j et pi pondrent
cette influence. Un lment i (resp. j) est donc situ du ct des lments j (resp. i)
pour lesquels les valeurs de xi j sont les plus grandes.
Applique lACP norme, la seconde formule de transition montre que la coor-
donne de la variable centre-rduite j sur laxe de rang s est gale au coefficient de
120 5 Calculs et dualit en Analyse Factorielle
1 2
i, l = d (i, .) + d 2 (., l) d 2 (i, l) d 2 (., .)
2
Cette relation est dite formule de Torgerson . On appelle Analyse Factorielle sur
Tableau de Distances (AFTD) la technique qui, partir dun tableau de distances entre
individus, calcule la matrice W associe et construit la reprsentation des individus
dduite des premiers vecteurs propres de WD (cette ide drive de la proprit selon
laquelle Fs est vecteur propre de WD ; cf. tableau 5.2).
On peut montrer que si la distance d est une distance euclidienne, W correspond
au produit scalaire dont drive d. Si d nest pas une distance euclidienne, les valeurs
5.5 Mise en uvre des calculs 121
propres de W D ne sont pas toutes positives. Dans ce cas, on se limite aux vecteurs
propres associs aux valeurs propres positives, cest--dire une approximation eucli-
dienne des donnes.
Si les donnes ne sont pas des distances mais des similarits, on se ramne au cas
prcdent en les transformant en distances. Par exemple, on peut dfinir la distance
par la diffrence entre la borne suprieure des similarits et chaque similarit.
propre nulle et que les autres vecteurs propres et valeurs propres sont exactement ceux
de X D X M.
Indiquons le principe de ce calcul. Les deux matrices dfinies par les deux lments
du terme gnral de X D X M admettent, comme vecteur propre associ la mme
valeur propre 1, le vecteur dont toutes les coordonnes sont gales 1 :
fi j fi j
= f. j = 1
i
f i. f . j
j j
La seconde matrice est de rang 1. Elle annule donc tous les vecteurs orthogonaux ce
premier vecteur et notamment tous les autres vecteurs propres de la premire matrice.
X D X Mu = lu
M 1/2 X D X M 1/2 M 1/2 u = lM 1/2 u
La matrice X est ainsi dcompose en une somme de matrices de rang 1 (le rang dune
matrice est la dimension de lepace vectoriel engendr par ses colonnes ou par ses
lignes).
Considrons lespace des matrices de dimension IJ, not R I J , muni de la mtrique
diagonale des produits m j pi . Dans cet espace, les matrices vs u s (de rang 1) forment
124 5 Calculs et dualit en Analyse Factorielle
v2u'2
2
1 v1u'1
Figure 5.5 Dans lespace R I J , la reconstitution dordre 2 de X est une projection de X sur un plan.
un systme orthonorm et ls vs u s est la projection de X sur vs u s :
vs u s , vt u t m j pi = vs (i)u s ( j)vt (i)u t ( j)m j pi
i j
= vs (i) vt (i) pi u s ( j) u t ( j) m j
i j
0 si s = t
=
1 si s = t
X , vs u s m j pi = xi j vs (i)u s ( j)m j pi = pi vs (i)Fs (i) = ls
i j i
Quelques calculs, en procdant par itration sur s, permettent de vrifier que la solution
unique est donne par les premiers facteurs de lanalyse factorielle.
X = I Y E 1 et M = E/(I Q)
X D X M = E 1 Y Y /Q
Notons B le tableau de Burt. Dans une AFC sur ce tableau, les matrices X et M
ont pour terme gnral respectivement : (I I jk )/(I j Ik ) et (I j /I Q). Le tableau de Burt
tant symtrique, les matrices M et D sont identiques. En remarquant que le tableau
de Burt est li au TDC (B = Y Y ), ces matrices peuvent scrire :
Dunod La photocopie non autorise est un dlit
X = I E 1 Y Y E 1
M = D = E/(I Q)
(1/Q)E 1 Y Y u s = ls u s
(1/Q)2 E 1 Y Y E 1 Y Y u s = l2s u s
Compte tenu de la relation entre axes et facteurs (u s = Fs / ls ), les deux analyses
conduisent aux mmes axes dans R J et aux mmes facteurs sur les modalits. Toute-
fois, la valeur propre de rang s issue de lanalyse du tableau de Burt est gale au carr
de son homologue de lanalyse du TDC.
Chapitre 6
Il existe aussi des tableaux mixtes qui prsentent des groupes de variables
numriques et des groupes de variables qualitatives.
Dunod La photocopie non autorise est un dlit
1. Traitement des questionnaires avec non-rponse, Analyse des correspondances avec marge modifie
et analyse multicanonique avec contrainte. Publication ISUP XXXII fasc.3 1987 B.Escofier.
132 6 Exemple de traitement de tableau multiple par ACM et AFC
lorsquil ny a que deux modalits, comme cest le cas ici, lorigine est situe sur le
segment qui les joint. Certaines modalits, comme les informations conomiques par
exemple, ont des positions peu prs symtriques car les effectifs des lecteurs et des
non-lecteurs de cette rubrique sont presque gaux (167 et 173). Lorsque ces effectifs
ne sont pas du tout quilibrs (cas des informations maritimes qui nintressent que
17 personnes sur 340), la modalit lourde (non-lue) est prs de lorigine tandis que la
modalit lgre (lue) est excentre. En termes de mcanique, on retrouve le principe
du bras de levier.
une structure plus stable que chacun des facteurs pris sparment et on a tendance
ltudier globalement. Nous pouvons cependant interprter sparment chacun de ces
facteurs.
Groupes de rubriques
Sur le plan des deux premiers facteurs, certains regroupements sont visibles, notam-
ment celui des informations trangres, conomiques, politiques et sociales avec les
articles de fond de la page 1 et de la page 2 ainsi que la rubrique jeunesse et ducation.
Les modalits lue de ces rubriques sont toutes situes en haut du graphique (coordon-
ne positive sur le deuxime facteur) et les modalits non-lue sont toutes situes en bas
du graphique (coordonne ngative sur le deuxime facteur). Le point commun entre
ces diffrentes rubriques est leur aspect relativement intellectuel. Cela explique sans
doute quelles intressent (ou nintressent pas) les mmes sous-populations. Notons
134 6 Exemple de traitement de tableau multiple par ACM et AFC
F2
2 = 12.5 %
2 = .125 info maritimes
info trangres
info conomiques
info politiques page 2
dcs
page 1 ducation
accidents
info sociales
spectacles
faits divers annonces emploi
sports
tl
pour vous Madame
info dpartementales petites annonces
lariflette
info locales au jour le jour feuilleton courrier consommateurs
crmonies agriculture agriculture
courrier consommateurs courrier lecteurs info maritimes info locales courrier lecteurs
petites annonces tl crmonies F1
faits divers 1 = 15.5 %
annonces emploi
lariflette au jour le jour 1 = .155
info dpartementales sports accidents
ducation
spectacles dcs
page 1 feuilleton
page 2
pour vous Madame
info conomiques
LEGENDE
info sociales
Minuscules : rubrique non lue
info trangres Minuscules italiques : rubrique lue
info politiques
Figure 6.1 Les deux premiers facteurs de lanalyse des rubriques : les rubriques. En haut
gauche, lallure du nuage des individus.
que les proximits entre ces rubriques prises deux deux ne sont pas forcment trs
fortes ; par contre, elles sont globalement assez proches entre elles (la lecture de lune
de ces rubriques est associe frquemment la lecture de deux ou trois autres rubriques
du groupe). Lintrt dune analyse multidimensionnelle est de mettre en vidence de
tels phnomnes.
Le premier facteur
Les rubriques dont la contribution linertie du premier facteur est la plus importante
(en cumulant celle des deux modalits) sont : le courrier des lecteurs, le courrier des
consommateurs, les dcs et les autres rubriques dinformation plutt anecdotiques.
Les modalits lue sont toutes situes lextrme-droite et les non-lue sont situes
lextrme-gauche. Ce facteur oppose donc les lecteurs et les non-lecteurs de plusieurs
6.4 Premire analyse : ACM des rubriques 135
de ces rubriques. On peut aussi suivre lordre des rubriques lues et non-lues qui
apparat sur le premier axe et qui donne un classement des enquts : depuis les
lecteurs assidus des rubriques trs anecdotiques (courrier des lecteurs, feuilleton,
crmonies officielles, etc.) jusqu ceux qui non seulement ne sintressent pas ces
rubriques mais ne lisent mme pas les informations locales qui ont pourtant un large
public (276 sur les 340 enquts).
Schmatiquement, ce facteur classe les lecteurs suivant lintrt quils portent aux
rubriques anecdotiques.
Le deuxime facteur
Le deuxime facteur oppose les lecteurs des rubriques intellectuelles aux non-
lecteurs de ces mmes rubriques. Les premiers nprouvent gure dintrt pour les
rubriques dcs et accidents dont les modalits non-lue ont des coordonnes positives
sur le deuxime axe.
Les rubriques mal reprsentes sur le premier plan
La modalit lue de la rubrique sports est assez proche de celles des rubriques intellec-
tuelles . Mais la qualit de reprsentation des deux modalits des sports (identiques
car elles sont alignes avec lorigine) est faible sur les deux premiers axes (0.010 et
0.068) ; cela indique que sa position dans lensemble des rubriques est mal exprime
sur ce plan. Le rapprochement avec les rubriques intellectuelles existe, mais ce nest
pas ce qui caractrise le plus la lecture des sports : on en conclut aussi que lattitude
vis--vis de cette rubrique est assez indpendante de la dispersion gnrale des profils
de lecture reflte par le premier plan. Pour prciser la situation des sports dans la lec-
ture du journal, il faut tudier plutt le troisime facteur o sa qualit de reprsentation
est la plus forte (0.279).
Nous nattachons gure dimportance la rubrique informations maritimes dont
la position trs excentre est due son faible effectif. Elle est en ralit peu lie
Dunod La photocopie non autorise est un dlit
aux deux premiers facteurs, comme lindiquent ses qualits de reprsentation et ses
contributions linertie (sa qualit de reprsentation sur ces facteurs vaut 0.002 et
0.041 et les contributions cumules de ses deux modalits valent 0.005 et 0.013).
b) Les individus
Les observations prcdentes ne rpondent pas la question qui lit quoi ? . Lanalyse
factorielle permet aussi dy rpondre. En effet, la reprsentation des rubriques, on
peut superposer une reprsentation des individus, ici les 340 enquts (pour des raisons
de lisibilit, nous navons pas reproduit cette superposition). Dans ce nouveau nuage de
points, deux aspects sont retenir : dune part, deux individus sont proches sils lisent
(et ne lisent pas) les mmes rubriques ; dautre part, un individu est situ, une homo-
thtie prs, au centre de gravit des modalits lue ou non-lue des rubriques quil lit ou
ne lit pas. Concrtement, cela signifie quun individu situ au bas droite du graphique
136 6 Exemple de traitement de tableau multiple par ACM et AFC
est un lecteur assidu dun ensemble de rubriques assez peu intellectuelles (courrier
des lecteurs, feuilleton, crmonies officielles, etc.) dont les coordonnes sur laxe
horizontal sont fortement positives comme la sienne. Mais les informations politiques,
trangres, sociales ou conomiques ne lattirent gure car, pour ces rubriques, ce sont
les modalits non-lue qui ont, comme lui, une coordonne ngative sur laxe vertical.
Mais la position de tel ou tel point ne nous intresse gure : le seul intrt de ce
graphique est de voir que les enquts se rpartissent assez uniformment sur le plan
et quil ny a donc pas de classes de profils de lecture trs marques. Par contre, la
position des enquts nous intresse pour reprsenter les tendances du qui ? dans la
question qui lit quoi ? . Cest l quintervient le signaltique des enquts puisque
lon connat pour chaque individu son sexe, son niveau dinstruction (cod en cinq
niveaux), sa CSP, etc. Pour mieux voir comment ces catgories sont lies aux modes
de lecture, il est possible de reprsenter les deux barycentres des hommes et des
femmes, les cinq barycentres du niveau dinstruction, les huit barycentres des CSP,
etc. Ce point de vue sur lanalyse des individus se confond avec ltude des modalits
supplmentaires.
F2 : 12.5 %
TUDIANT 2 : .125
info maritimes
TUDES SUPRIEURES
crmonies
TUDES TECHNIQUES
VEUF
faut pas oublier que nous disposons de rponses et non de comportements de lecture ;
mais cest un autre problme. Le respect de lordre des niveaux dinstruction montre
que plus on est instruit, plus on est intellectuel dans la lecture de Ouest-France .
Que les cinq points reprsentant les niveaux dinstruction soient tous sur une mme
ligne montre que, dans la dispersion du nuage des profils de lecture, il existe une autre
dimension indpendante du niveau dinstruction. Cette dimension, figure sur le plan
par la premire bissectrice des deux axes, oppose les individus qui lisent un grand
nombre de rubriques ceux qui en lisent peu.
Nous ne commentons pas compltement lensemble des rsultats concernant les
variables. Nous laissons au lecteur le plaisir dapprofondir les interprtations. Notons
seulement que la graduation obtenue pour le niveau dinstruction se retrouve dans la
variable ge dont les modalits schelonnent aussi le long de la deuxime bissectrice :
les enquts les plus gs sont situs vers le bas et la droite du graphique.
138 6 Exemple de traitement de tableau multiple par ACM et AFC
Cette structure se retrouve aussi dans ltude de la CSP : les tudiants et les cadres
suprieurs sont des lecteurs intellectuels ; les retraits, agriculteurs, commerants et
ouvriers sont des lecteurs plus anecdotiques . Une seule variable, la zone dhabitat,
traduit une dispersion en partie orthogonale la premire bissectrice : les habitants de
la ZUP, situs en moyenne en bas gauche du ct des modalits non-lue, lisent peu
de rubriques dans le journal, beaucoup moins en tout cas que ceux du centre ville.
F4 info maritimes
4 = 6.3 %
4 = .063
annonces emploi
petites annonces
16-26 ANS
TUDIANT-SCOLAIRE sports
EMPLOY
lariflette OUVRIER
CLIBATAIRE
info locales pour vous Madame
spectacles HOMME
feuilleton GROS COMMER-INDUS
spectacles F3
3 = 7.0 %
3 = .070
FEMME
pour vous Madame
sports AGRICULTEUR
agriculture
Figure 6.3 Le plan 3-4 de lanalyse des rubriques. En italiques : rubriques lues ; en haut droite,
lallure du nuage des individus.
6.5 Deuxime analyse : ACM du signaltique 139
6.4.2 Facteurs 3 et 4
La figure 6.3 donne la projection des points les plus caractristiques du plan 3-4 ainsi
que lallure du nuage des individus.
Le troisime facteur met en vidence une diffrence entre les profils de lecture,
indpendante de celle traduite sur le premier plan. Trois rubriques contribuent elles
seules la moiti de linertie du facteur : sports, pour vous Madame et spectacles. Ce
facteur montre une opposition entre la premire de ces rubriques et les deux autres :
les lecteurs des sports ne sont pas lecteurs de pour vous Madame et des spectacles et
rciproquement.
Les premiers sont plutt des hommes et les seconds plutt des femmes (le sexe est
la variable du signaltique la plus lie ce facteur : son rapport de corrlation atteint
0.318 !).
Le quatrime facteur particularise les lecteurs des petites annonces et annonces
pour lemploi, ces deux variables contribuant 48 % de linertie de cet axe. Ce facteur
est peu li aux variables du signaltique.
3. avec les lments supplmentaires, une tude de la liaison entre les principaux
facteurs de variabilit du signaltique et la lecture de chaque rubrique considre
sparment.
La figure 6.4 donne les projections des modalits actives et des modalits supplmen-
taires les plus loignes du barycentre sur le plan 1-2. En outre, lallure du nuage des
individus est figure.
agriculteur feuilleton
au jour le jour
sans enfant
primaire
56-80 ans
retrait-inactif 2 = .295
F2
veuf
2 = 6.73%
Figure 6.4 Le plan 1-2 de lanalyse du signaltique. En italiques : rubriques lues ; en bas droite,
lallure du nuage des individus.
entre les variables. Lexamen de chacune des variables du signaltique montre que
toutes, sauf une, le sexe, sont trs lies ce facteur et donc trs lies entre elles.
Linterprtation gnrale de ce facteur est simple : il met en vidence les plus jeunes,
qui cumulent beaucoup de modalits qui les caractrisent bien : dans lensemble, ils
sont tudiants, de niveau dinstruction lev, clibataires, sans enfant et habitent une
zone rsidentielle ; toutes ces modalits, comme celles des CSP assez leves dans la
hirarchie sociale, sont situes du mme ct.
Le deuxime facteur
Il dtache trs nettement des autres un groupe de trois modalits souvent partages :
g, veuf, et retrait. Ces trois modalits contribuent un peu plus de la moiti de
linertie de ce deuxime facteur. Ce deuxime axe met donc en vidence les plus gs.
6.5 Deuxime analyse : ACM du signaltique 141
Finalement, on peut dire que ce plan est trs structur autour le la variable ge avec
laquelle varient la plupart des autres variables du signaltique. Notons au passage la
mise en vidence dune liaison non linaire entre lge et le nombre denfants : la
modalits pas denfants ( charge) est associe la fois aux plus jeunes et aux plus
gs.
Description de lchantillon
Cette analyse permet de dcrire lchantillon, ou plus exactement les liaisons entre les
variables dans lchantillon. Les rsultats ne sont pas trs originaux (que les jeunes
soient plutt clibataires et les veufs plutt gs nest pas une dcouverte !). Mais
cette banalit est un bon signe : une incohrence avec la ralit (bien connue) de la
population gnrale signalerait un biais de lchantillon par rapport la population
quil est cens reprsenter. Cette analyse attire aussi lattention sur la liaison entre
certaines variables : par exemple ici, le niveau dinstruction est trs li lge de
lenqut (il varie en sens inverse). Il faut prendre garde dans linterprtation des
rsultats ce lien sous-jacent : linflchissement avec lge des profils de lecture vers
des rubriques de moins en moins intellectuelles (mis en vidence dans la premire
analyse) traduit peut-tre essentiellement le moindre niveau dinstruction des enquts
gs.
La plupart des rubriques tant trs proches de lorigine, on en conclut que le signal-
tique est trs peu li la lecture dune rubrique particulire. Et pourtant nous avons vu
dans la premire analyse que profil de lecture et signaltique sont trs lis !
Ces rsultats ne sont pas contradictoires. Chacune des deux analyses focalise lat-
tention sur un aspect des donnes et ces points de vue se compltent mutuellement.
Dans la premire analyse, la typologie des individus traduit le comportement de lec-
ture devant lensemble des rubriques. Ce comportement gnral est trs li plusieurs
variables du signaltique, notamment le niveau dinstruction. Dans cette deuxime ana-
lyse o les rubriques sont en lments supplmentaires, elles apparaissent sparment.
On en conclut que le signaltique est trs li au profil gnral de lecture mais peu la
lecture dune rubrique particulire (un niveau social lev implique trs frquemment
une lecture intellectuelle du journal qui privilgie ce type de rubriques, mais non
systmatiquement lune dentre elles).
142 6 Exemple de traitement de tableau multiple par ACM et AFC
En conclusion, que ce soit pour ltude des individus ou pour celle des variables,
dans une analyse o plusieurs groupes de variables htrognes interviennent simulta-
nment en actifs, il est ncessaire dquilibrer leur influence.
variables des deux groupes (cf. Figure 6.5). Cette quatrime analyse est assez diff-
rente des autres en ce sens quelle est focalise sur la liaison entre les variables du
signaltique et la lecture des rubriques.
Ce tableau est structur, en ligne et en colonne, par les variables. La marge de chaque
sous-tableau dfini par lensemble des modalits dune variable du signaltique (ou
dune rubrique) est proportionnelle celle du tableau entier. Ceci implique que le
barycentre des modalits dune mme variable est, comme en ACM, situ lorigine
des axes.
Signaltique Rubriques
Signaltique
Rubriques
Figure 6.5 Le tableau croisant signaltique et rubriques est un sous-tableau du tableau de Burt.
d) Le deuxime facteur
Le deuxime facteur extrait 15 % de linertie. Beaucoup moins important que le
premier, il peut encore sinterprter clairement.
Pour le signaltique, plus de la moiti de linertie de ce facteur est fournie par les
deux modalits de la variable sexe. Pour les rubriques, la lecture du feuilleton et de
pour vous Madame soppose celle des informations agricoles et des sports.
Ce deuxime facteur montre quun deuxime lment important dans le lien entre
le signaltique et la lecture des rubriques est lopposition entre :
1. les hommes, lecteurs des informations agricoles et des sports ;
2. les femmes, lectrices de pour vous Madame et du feuilleton.
Cette liaison a dj t en partie dcele sur le troisime facteur de la premire analyse,
lACM des rubriques.
Dunod La photocopie non autorise est un dlit
crmonies
TUDIANT TUDES TECHNIQUES VEUF
TUDES SECONDAIRES
CLIBATAIRE
dcs TUDES PRIMAIRES
accidents
PRIMAIRES SUPRIEURES courrier lecteurs
F1 : 58.5 % faits divers 38-55 ANS accidents
dcs
1 : .025 au jour le jour
26-36 ANS OUVRIER
info trangres RETRAIT-INACTIF + de 55 ANS
TUDES SUPRIEURES
AGRICULTEUR
info conomiques
CAD. SUP. PROF. LIB.
HOMME spectacles
sports
LEGENDE
Majuscules : Signaltique
Minuscules : rubrique non lue
Minuscules italiques : rubrique lue agriculture
6 Exemple de traitement de tableau multiple par ACM et AFC
6.8 Conclusion 147
6.8 CONCLUSION
Ces trois analyses ont permis dtudier plusieurs aspects de ces donnes.
Mais nous avons mis en vidence les limites des techniques classiques qui ne
permettent ni la comparaison globale de plusieurs groupes de variables (structures
communes et spcifiques) ni la construction des typologies des lignes et des colonnes
dans laquelle les groupes sont quilibrs.
LAFM, prsente dans le chapitre suivant, est conue spcialement pour lanalyse
de tableaux comportant plusieurs groupes de variables. Elle ne prsente pas ces limites
et permet une comparaison systmatique des groupes travers lensemble de points
de vue trs divers que la richesse de la structure de groupes de variables suggre.
Chapitre 7
Ce chapitre prsente une mthode factorielle adapte au traitement de tableaux dans les-
quels un ensemble dindividus est dcrit par plusieurs groupes de variables : lAnalyse
Factorielle Multiple (AFM). Cette prsentation sarticule autour de deux exemples.
Le premier rassemble des apprciations sensorielles fournies par un ensemble
de dgustateurs sur un ensemble de vins. Les diffrents rsultats de lAFM sont
comments de faon mettre en vidence les problmes auxquels ils apportent
des solutions. Les premiers rsultats prsents sont trs proches de ceux des
mthodes classiques ; les rsultats sans quivalents dans lACP ou lACM sont
introduits progressivement.
Le second est lenqute Ouest-France tudie par les mthodes classiques dans
le chapitre prcdent.
variables
1 k 29 31
1
vins
i xik
21
Figure 7.1 Tableau analys. Pour les 29 premires variables, xik est la moyenne des apprciations
des 36 juges sur le vin i propos de la variable k. Pour les deux dernires variables, xik est le
numro de la modalit du vin i pour la variable k.
partir de ces donnes, un fichier plus petit a t construit (cf. Figure 7.1) : pour
chaque vin et chaque variable de la fiche, on a calcul la moyenne des apprciations
de lensemble des juges. Lorsquune donne est manquante, elle nintervient pas dans
la moyenne.
ce fichier de 29 variables numriques, on ajoute deux variables qualitatives qui
caractrisent lorigine des vins : laire dappellation (Saumur, Bourgueil, Chinon) et
le type de sol (squence de rfrence, milieu 2, milieu 3 et milieu 4 ; la squence
de rfrence est, selon lhypothse des chercheurs, le type de sol qui possde les
meilleures potentialits viticoles).
Le tableau obtenu nest pas homogne puisquil prsente la fois des variables
quantitatives et qualitatives. Dans la suite, les variables qualitatives apparaissent au tra-
vers de leurs modalits : lors de linterprtation, on parle peu de la variable appellation
mais surtout de la modalit Saumur, de la modalit Bourgueil, etc.
dimensions. Dans cette optique, une ACP semble bien adapte au tableau. Dans cette
ACP, comme dans lAFM par la suite, les variables sont normes pour quelles aient
la mme influence a priori.
Toutefois, lexamen de la fiche de dgustation montre que les variables sont structu-
res en groupes. Tout dabord, les variables qui caractrisent lorigine des vins jouent
un rle bien part : elles ne doivent pas participer la construction des principaux
facteurs de variabilit mais simplement intervenir titre illustratif. Cela tant, mme
parmi les variables sensorielles, on distingue :
5 variables relatives lolfaction au repos ; intensit olfactive, qualit aroma-
tique, note fruite, note florale, note pice ;
3 variables relatives la vision ; intensit visuelle, nuance (orang/violet), impres-
sion de surface (larmes) ;
10 variables relatives lolfaction aprs agitation : intensit olfactive, qualit
olfactive, note fruite, note florale, note pice, note vgtale, note phnolique,
intensit aromatique de bouche, persistance aromatique de bouche, qualit aro-
matique de bouche ;
9 variables relatives la gustation : intensit dattaque, acidit, astringence,
alcool, quilibre acidit-astringence-alcool, velout, amertume, intensit de fin
de bouche, harmonie ;
2 variables relatives un jugement densemble ; qualit densemble, typicit.
Le dernier groupe comporte deux variables synthtiques : nous dcidons de leur faire
jouer un rle illustratif.
Les variables sur lesquelles nous appuyons principalement lanalyse sont donc
structures en quatre groupes : olfaction au repos, vision, olfaction aprs agitation,
gustation. Lexistence de cette structure pose dabord un problme technique : une
ACP globale ne risque-t-elle pas dtre influence de faon prpondrante par un seul
Dunod La photocopie non autorise est un dlit
groupe ? Auquel cas, la prise en compte simultane des quatre groupes serait illusoire.
Ainsi, le premier problme pos par le traitement simultan de plusieurs groupes de
variables est la pondration de ces groupes. Dans un premier temps, lAFM peut tre
vue comme une analyse factorielle (ici une ACP) dans laquelle linfluence des groupes
de variables est quilibre. Cest dans cet esprit que nous effectuons une premire
prsentation des rsultats de lexemple dans la section 1.4. Laspect technique de la
pondration est prsent dans la section 1.3.
En outre, la prise en compte de la structure en groupes dun ensemble de variables
enrichit la problmatique de ltude. De mme que lon cherche comparer des
vins (en termes de ressemblances) ou des variables (en termes de liaisons), on peut
chercher comparer globalement les groupes de variables. On dira que deux groupes
de variables se ressemblent si deux vins proches pour lun des deux groupes (par
exemple, laspect visuel) sont aussi proches pour lautre (par exemple, le got). On
152 7 LAnalyse Factorielle Multiple partir de deux applications
tente donc de mettre en vidence une typologie des groupes, cest--dire, dans notre
exemple, des aspects sensoriels mis en jeu dans la dgustation. LAFM fournit une
telle typologie : son application lexemple est dcrite aux sections 1.6 et 1.7.
Lexistence de groupes de variables conduit vouloir dcrire les vins, non seulement
au travers de lensemble des variables mais aussi au travers de chacun des groupes.
Pour cela, il est toujours possible de raliser des analyses spares des groupes. Tou-
tefois leurs rsultats, tant obtenus indpendamment, sont difficilement comparables
entre eux : par exemple, une ressemblance, mme forte, entre sous-espaces facto-
riels peut tre masque par des rotations. Pour comparer les reprsentations des vins
vus par chacun des groupes, il est ncessaire de les situer dans un rfrentiel com-
mun. LAFM rpond ce problme en fournissant une reprsentation factorielle
dans laquelle figurent les reprsentations des vins dcrits par chacun des groupes de
variables considr sparment. Son application lexemple est dcrite section 1.5.
En rsum, la prise en compte dune structure en groupes dun ensemble de
variables pose un problme technique (la pondration des groupes) et enrichit la
problmatique dune tude (comparaison des groupes ; comparaison des typologies
des vins dfinies par chaque groupe). LAFM propose une solution technique (la pon-
dration dcrite dans la section suivante) au problme technique (quilibrer linfluence
des groupes) et fournit des reprsentations adaptes aux diffrents aspects de lobjectif.
Tableau 7.1 Inerties des ACP spares des quatre groupes actifs.
Inerties Pourcentages
Groupe
totale axe 1 axe 2 axe 3 axe 1 axe 2 axe 3
1 olfaction au repos 5 2,24 1,52 0,82 44,84 30,33 16,31
2 vision 3 2,83 0,15 0,01 94,49 5,03 0,48
3 olfaction aprs agitation 10 4,70 2,48 1,05 47,01 24,83 10,46
4 gustation 9 5,64 1,79 0,67 62,69 19,90 7,49
Tableau 7.2 Dcomposition de linertie des trois premires composantes principales de lAFM
selon les quatre groupes.
F1 : 49.4 %
0.6
olfaction au repos
vision
arme vgtal olfaction aprs agitation
0.4 gustation
jugement d'ensemble
0.2
F2 : 19.5 %
0
-1 -0.8 -0.6 -0.4 -0.2 0.2 0.4 0.6
arme pic
-0.2 floral
arme pic
amertume floral
-0.4
impression de surface
intensit de fin de bouche
Dunod La photocopie non autorise est un dlit
Figure 7.2 Reprsentation des variables (par leur corrlation avec les axes) sur le premier plan
factoriel.
F1 :
Bmi2
49.4 % (2ING)
Cmi3
(1VAU)
Smi2
Smi3 Bmi2
milieu 2
milieu 3 Chinon
Cmi3
Bourgueil
Cmi2
Bmi2
Smi3 Cref
Bref
Squence de rfrence
Sref Sref
(1POY)
Sref (1DAM)
Figure 7.3 Reprsentation du nuage des vins vus par lensemble des variables. Lemplacement
dun vin est repr par linitiale de lappellation [S = Saumur ; B = Bourgueil ; C = Chinon] suivi de
sa modalit de milieu [ref = squence de rfrence, mi2 = milieu 2, etc.]. Quatre vins, comments
en dtail par la suite, ont un nom particulier [1DAM, 1POY, 1VAU et 2ING]. En outre, le point
moyen de chaque modalit est reprsent.
158 7 LAnalyse Factorielle Multiple partir de deux applications
variables des
autres groupes
R 27
1DAM-g
1DAM-m
1DAM-1 R5
variables du
premier groupe
Figure 7.4 Individu global, partiel et moyen. La reprsentation du vin 1DAM du point de vue du
seul groupe 1 (individu partiel 1DAM-1) est obtenue en projetant le point global (1DAM-g R 27
engendr par toutes les variables) sur le sous-espace (not R 5 ) engendr par les 5 variables du
groupe 1. Le point moyen 1DAM-m est obtenu partir de 1DAM-g par une homothtie de rapport
1/J = 1/4.
des points plus ou moins forts. Cette question peut tre pose, non plus en termes de
variables mais de groupes de variables : la puissance du vin sexprime-t-elle de faon
gale ou ingale dans son aspect visuel, ses parfums, son got ?
La perception de chaque aspect nest pas lisible facilement sur les donnes puisque
chacun est mesur par un groupe de variables. Il est donc utile de disposer dun outil
qui synthtise la perception des vins non plus du point de vue de lensemble des
variables mais du point de vue de chacun des groupes de variables. Pour cela, en AFM,
on sappuie sur la reprsentation gomtrique suivante.
Remarquons tout dabord que, dans lACP dun seul groupe de variables, on dfinit
un nuage qui reprsente lensemble des vins peru laide de ce seul groupe. On
dispose ainsi de quatre nuages des vins, dits nuages partiels, correspondant chacun
un groupe actif (lexpos thorique de lAFM, chapitre 8, montre pourquoi on se
limite ici aux groupes actifs).
Ces quatre nuages partiels peuvent tre construits dans lespace de dimension 27
(not R 27 ) engendr par toutes les variables actives. Le nuage olfaction au repos est
obtenu en projetant le nuage global des vins sur le sous-espace de dimension 5
(not R 5 ) engendr par les cinq premires variables, cest--dire, puisque les variables
sont centres, en annulant toutes les coordonnes qui ne concernent pas cet aspect (cf.
Figure 7.4).
En AFM, on traite comme des lignes supplmentaires les quatre tableaux obtenus
en annulant les valeurs des variables (centres) de trois groupes sur 4. Ainsi, les
quatre nuages des vins dfinis sparment par chacun des quatre aspects mesurs,
sont projets sur les axes factoriels du nuage regroupant ces diffrents aspects. On
7.1 Lexemple des vins 159
Tableau 7.3 Quelques valeurs pour les trois variables du groupe olfaction au repos les plus
corrles au premier facteur.
obtient ainsi une reprsentation superposant ces quatre nuages partiels au nuage
global. En AFM, une homothtie (qui ne modifie strictement pas la forme du nuage)
est applique au nuage global pour obtenir un nuage moyen ; elle met chaque
point de ce nuage (par exemple 1DAM) au barycentre des 4 points (1DAM1, 1DAM2,
1DAM3 et 1DAM4) dcrivant ce mme vin dans ses diffrents aspects. La lecture
des graphiques en est grandement facilite : il est beaucoup plus rapide de comparer
chaque point au barycentre que de comparer les quatre points deux deux. Le chapitre
suivant montre plusieurs proprits de ces graphiques.
La figure 7.5 est un extrait de cette reprsentation superpose applique lexemple.
Elle est limite, pour des raisons de clart, 6 vins extrmes (cf. Figure 7.3) :
1DAM et 1POY, jugs globalement les plus puissants et harmonieux ;
1VAU et 2ING, jugs globalement les moins puissants et harmonieux ;
le vin Smi4, prsent en double, bien individualis sur le deuxime axe.
Daprs la figure 7.5, le vin 1DAM a t peru comme le plus puissant et harmo-
nieux du point de vue de lolfaction au repos (cf. la position extrme de 1DAM1).
Par contre, pour ce mme groupe de variables, le vin 1POY a t peru seulement
Dunod La photocopie non autorise est un dlit
comme un peu plus que moyen (cf. la position relativement centrale de 1POY1). Ces
informations se retrouvent facilement dans les donnes (cf. Tableau 7.3).
La situation est diffrente du point de vue de la gustation pour laquelle cest 1POY
qui a t peru comme le plus puissant et harmonieux . Lcart est, selon ce sens,
moins important que pour lolfaction. Ces informations se lisent aussi dans les donnes
(cf. Tableau 7.4).
F1
4
3
2
4
3 1VAU 2ING
2
1
3
4
3
F2
1 Smi4 4 1
Smi4 2 3
2
1 2 1POY
4
4
2
1DAM 3
Figure 7.5 Reprsentation superpose limite 6 vins extrmes. Chaque vin est caractris par
chacun des quatre groupes de variables et par lensemble des groupes.
Tableau 7.4 Quelques valeurs pour les quatre variables du groupe gustation les plus corrles au
premier facteur.
Tableau 7.5 Corrlations, pour les sept premiers axes de lAFM, entre la projection du nuage
global et celle de chacun des quatre nuages partiels (i.e. associs un seul groupe).
ment de rfrence, raison pour laquelle ils sont donns pour les sept premiers axes.
Ces corrlations permettent donc de juger de lexistence dun facteur commun
tous les groupes ou certains dentre eux. Lorsque cette direction de dispersion
commune existe, il est intressant de mesurer et de comparer son importance dans les
diffrents groupes. Limportance dun facteur dans un groupe est mesure par linertie
cumule des variables du groupe sur ce facteur (cf. Tableau 7.2).
F2
1
terroir
0.8 Qualit de reprsentation des groupes (inertie
projete / inertie totale)
6 1 1 olfaction au repos : 0.617
0.6
2 vision : 0.729
3
0.4 3 olfaction aprs agitation : 0.784
4 gustation : 0.772
5 4
0.2 5 apprciation densemble : 0.444
appellation 6 origine : 0.189
2
0
0 0.2 0.4 0.6 0.8 1 F1
importante. Il apparat ici que ce facteur commun est, pour ces quatre groupes, proche
de leur principale direction de dispersion.
La deuxime composante principale de lAFM (cas particulier du vin Smi4) est
trs lie la deuxime composante principale des trois groupes : olfaction au repos,
olfaction aprs agitation, et gustation. Nous avons dj conclu lexistence dun
second facteur commun ces trois groupes. Ce nouveau rsultat prcise limportance
relative de ce facteur dans les groupes concerns.
F1
G4F1
G3F1
G2F1
G5F1
G3F2
G2F2 G5F2
G4F2
-.5 F2
G1F2
G1F1
-1
Figure 7.7 Reprsentation des deux premires composantes principales de chaque groupe par
leur corrlation avec les deux premires composantes de lAFM. G1 F2 = deuxime composante du
groupe 1.
R2 R1
F2
S2
F1 : 9.1 % 0 F1
S1
F2 :
5.8 %
Figure 7.8 Reprsentation des deux premiers facteurs des analyses spares de chaque groupe
sur le cercle des corrlations du premier plan de lAFM. R1 : premier facteur de lanalyse des
Rubriques. S1 : premier facteur de lanalyse du Signaltique. gauche, allure du nuage des
individus.
du premier facteur du tableau crois qui permet danalyser leur liaison (cf. section 6.7
page 143).
quau plan. Rappelons que ces deux axes ne sont pas confondus avec ceux de lACM
des rubriques mais avec leurs bissectrices.
Les variables les plus lies au premier facteur, et donc lies entre elles, sont dune
part le niveau dinstruction et lge et, dautre part, les rubriques les plus anecdotiques
ainsi que les plus intellectuelles. La dispersion des profils de lecture mise en vidence
par le deuxime facteur, donc spcifique de la lecture, est lopposition entre rubrique-
lue et rubrique non-lue.
premier facteur. La plupart des individus sont reprsents par deux points trs proches
ainsi que lindique le rapport [inertieinter/inertietotale] dont la valeur pour ce facteur
est 0.837. Ce rapport se rfre au nuage des individus vu par chacun des deux groupes
(680 = 340 2 points), partitionn en 340 groupes (1 groupe = 1 enqut) de 2
points chacun (le mme enqut caractris par chacun des deux groupes) : il vaut 1
si les 2 images de chaque enqut concident entre elles et donc avec leur centre de
gravit. Comme nous ne nous intressons pas chaque individu mais plutt ce quil
reprsente, nous tudions seulement les reprsentations superposes des barycentres
des classes dfinies par les modalits de toutes les variables. La figure 7.9 donne un
extrait de cette reprsentation superpose en rappelant linterprtation gnrale de ce
facteur et la projection des 5 niveaux dinstruction. De cette interprtation on dduit
deux cas de figure.
F2 : 5.8 %
Un individu dont le profil de lecture est situ sensiblement plus droite que son
signaltique a un profil de lecture plus intellectuel que ne le laisse prsager
son signaltique ou, ce qui est quivalent, un statut social moins lev que ne le
laisse prsager sa lecture du journal.
Inversement, un individu dont le profil de lecture est situ sensiblement plus
gauche que son signaltique a un profil de lecture moins intellectuel que ne
le laisse prsager son signaltique ou, ce qui est quivalent, un statut social plus
lev que ne le laisse prsager sa lecture du journal.
Pour les barycentres linterprtation est analogue. De la grande proximit entre les deux
points reprsentant un mme individu, dcoule une grande proximit entre les deux
7.2 AFM applique aux donnes de lenqute Ouest-France 169
laide de deux exemples, le chapitre prcdent dcrit les grandes lignes de la pro-
blmatique de ltude des tableaux multiples ainsi que les principaux rsultats de
lAFM. Dans cette premire prsentation, les considrations thoriques et techniques
sont rduites au minimum. Nous reprenons ici lexpos de lAFM en faisant toujours
rfrence lexemple des vins pour illustrer les objectifs mais en dtaillant les calculs
ainsi que leurs justifications.
Dans un premier temps, nous adoptons successivement comme cadre les trois
espaces dans lesquels lAFM peut tre prsente :
R K , dans lequel sont situs les nuages des individus ;
R I , dans lequel est situ le nuage des variables ;
2
R I , dans lequel est situ le nuage des groupes de variables.
Dans un second temps, nous fournissons des complments qui concernent :
une autre prsentation de la mthode : lestimation des paramtres du modle
INDSCAL ;
le cas des variables qualitatives ;
la mise en uvre.
172 8 Aspects thoriques et techniques de lAnalyse Factorielle Multiple
K1 Kj KJ
1
individus
X1 Xj XJ
Dans lanalyse densemble, ainsi que cela a t prsent dans lexemple des vins,
les poids initiaux des variables sont modifis. Le poids initial de chaque variable
du groupe j est divis par l1j (en notant l1j la premire valeur propre de lanalyse
factorielle spare du groupe j).
Nous gardons la mme notation m k pour le poids de la variable k quel que soit le
stade de lanalyse : pratiquement, du fait du contexte, il nen rsulte aucune ambigut.
De mme, nous gardons une seule notation lsj pour la valeur propre de rang s associe
lACP de X j avant ou aprs la pondration (l1j vaut 1 aprs la pondration).
Cette pondration a pour but dquilibrer le rle des groupes dans tous les aspects de
lanalyse. Elle est interprte dans tous les espaces dans lesquels lAFM est prsente.
Dans la distance entre deux lments du nuage N I , linfluence des diffrents groupes
nest quilibre que si les distances dans les diffrents nuages N Ij sont du mme ordre
de grandeur. Multiplier les poids initiaux des variables du groupe j par un coefficient
a j est un moyen dquilibrer linfluence des groupes puisque la distance scrit alors :
d 2 (i, l) = a j d 2 (i j , l j )
jJ
j
8.2.3 Reprsentation des J nuages NI dans RK et nuage moyen
Pour reprsenter simultanment les J nuages N Ij dans lespace R K , il suffit de remar-
quer que R K peut se dcomposer en somme directe de J sous-espaces orthogonaux
deux deux et isomorphes aux espaces R K j . Soit :
R K = R K j
Sur chacun de ces sous-espaces, la mtrique induite par M est la mtrique M j; il
sagit donc dun isomorphisme despaces euclidiens. Les coordonnes des points du
nuage N Ij sont contenues dans le tableau X j . Les coordonnes de ces points dans
lespace R K sont contenues dans un tableau de dimensions I et K , dans lequel X j est
complt par des zros (cf. Figure 8.2) ; ce tableau est not X j .
Les nuages N Ij tant situs dans des sous-espaces orthogonaux, cette reprsentation
simultane est artificielle et inutilisable directement mais sert de base une vritable
reprsentation simultane obtenue par projection sur des sous-espaces de R K .
Soit N I le nuage des centres de gravit, nots i , des J points i j reprsentant le
mme individu i dans les N Ij . Ce nuage se dduit de N I par une homothtie de rapport
1/J . Le nuage N I est un nuage moyen pour les N Ij .
8.2 LAFM dans lespace des individus R K 175
Kj
1 K RK R
Kj
j
NI
~
Xj = 0 Xj 0
Figure 8.2 Les nuages N Ij dans R K . N Ij appartient au sous-espace R K j (de R K ) engendr par les
variables du seul groupe j.
K K Kj
R Kj R
Kh R R
R
Kh J
ij R Ni
ij
ih
i i*
j
NI j
NI
NI
h
ih
h
NI *
NI
NI
K
R N I = {i, i I } nuage des individus
associ X .
i N Ij = {i j , i I } nuage dans R K j asso-
ci X j = projection de N I sur R K j.
{NiJ = i j , j J } images du mme indi-
i* vidu i.
{N I = i , i I } nuage des barycentres
NI
des nuages NiJ , homothtique de N I (rap-
N I* port 1/J ).
N IJ = j N Ij = i NiJ
Kj
K R
R
ij u sj
u s : axe principal (de rang s) de N I .
u sj : composante de u s dans R K j .
sj us Projeter i j sur u s est quivalent projeter i
dabord sur u sj puis sur u s .
d) Aides linterprtation
Qualit de reprsentation de chaque nuage N Ij
Elle se mesure de manire classique par le rapport entre linertie projete et linertie
totale du nuage. Cette qualit de reprsentation est toujours trs faible puisque le
vecteur u s de R K , sur lequel N Ij est projet, nappartient pas au sous-espace R K j dans
lequel ce nuage est situ. Ce vecteur u s fait, avec sa projection u sj sur ce sous-espace
R K j , un angle dj not usj . Do :
Les termes cos2 usj sont en gnral petits : ils sont en nombre J et leur somme
vaut 1. Cette mesure de la qualit de reprsentation de N Ij est donc systmatiquement
beaucoup plus faible que celle que lon obtient dans lACP du seul nuage N Ij , mme
si u sj est une composante principale de N Ij .
En dautres termes, lindicateur [inertie projete / inertie totale] appliqu N Ij rend
compte de faon pessimiste de la qualit de reprsentation en ce sens que la forme
du nuage peut tre bien respecte mme si ce rapport est faible. Pour cette raison, cet
indicateur nest pas utilis en pratique ; pour valuer la qualit de reprsentation dun
groupe, on utilise plutt le nuage des variables (cf. section 8.3.5).
RI Ej
Chaque groupe de variables K j est reprsent par un nuage N Kj (cf. Figure 8.5).
La pondration des groupes, divisant le poids de chaque variable du groupe j par
l1j , rend gale 1 linertie de la premire composante principale de chaque nuage N Kj .
La figure 8.6 illustre cette pondration dans un cas simple.
En AFM, la pondration des variables dun groupe tient compte la fois du nombre
de variables et de leurs liaisons. Remarquons quune pondration qui ne tiendrait pas
compte des liaisons entre les variables (par exemple, en galisant les inerties totales
(1)
(1/4) (1/4)
Figure 8.6 Illustration de la pondration de lAFM dans un cas simple. Les vecteurs reprsentent
les variables dans R I . Les nombres entre parenthses sont les poids associs aux variables dans
lAFM. Les variables du premier groupe sont pratiquement identiques : chacune est affecte dun
poids tel que lensemble du groupe a un poids pratiquement gal 1. Les variables du second
groupe sont non corrles : chacune est affecte dun poids gal 1.
8.3 LAFM dans lespace des variables R I 181
des N Kj ) rendrait faible (relativement) linertie, dans chaque direction, dun groupe
compos de beaucoup de variables indpendantes. En revanche, une telle pondration
rendrait forte (relativement) linertie dans une direction dun groupe compos dune
seule variable.
Dans lexemple des vins, la premire composante de lAFM (de lensemble des
variables) tait trs corrle avec la premire composante de chaque groupe. Une
tude systmatique des corrlations entre les premires composantes de chaque groupe
apporte des lments intressants pour la comparaison de ces groupes.
Une telle tude peut tre ralise par une ACP des composantes principales de tous
les groupes. Les composantes principales du tableau X j tant les projections du nuage
dindividus sur une base orthonorme, les nuages dindividus dfinis dans lACP
de X j et dans celle du tableau des composantes de X j sont identiques. Mais ceci
condition de conserver les valeurs brutes de ces composantes. Une ACP non norme
des composantes principales des groupes aboutit donc aux mmes composantes quune
ACP de lensemble des variables. Une autre faon de respecter linertie lsj de la
composante de rang s du groupe j consiste normer cette composante et lui affecter
le poids lsj .
182 8 Aspects thoriques et techniques de lAnalyse Factorielle Multiple
Ainsi, pour comparer les composantes principales des groupes, il suffit de les
introduire en lments supplmentaires dans lanalyse du tableau complet. On peut
calculer en outre, situation paradoxale pour un lment supplmentaire, la contribution
(via lindicateur usuel) dune composante dun groupe la construction des axes.
On peut aussi adopter la dmarche inverse : ACP des composantes principales avec
les variables en supplmentaire.
E j engendr par les variables du groupe j (cf. Figure 8.7). Ainsi, le coefficient de
corrlation multiple est le cosinus de langle u j entre z et sa projection sur E j .
Si z est une variable norme, on a (en notant u, v le produit scalaire entre les
vecteurs u et v) :
suite de vecteurs propres norms de cet oprateur, ordonne par les valeurs propres,
dfinit donc les variables gnrales (cf. section 5.2.4).
La variable canonique du groupe j, associe une variable gnrale z s , est sa
projection P j (z s ) sur le sous-espace E j .
Cette analyse multicanonique est intressante sur le plan thorique car elle donne
un cadre commun plusieurs mthodes danalyse.
1. LACP est une analyse multicanonique de groupes de variables rduits chacun
un lment. Les composantes principales sont les variables gnrales et les
variables canoniques sont confondues avec les variables initiales.
2. LACM est une analyse multicanonique dans laquelle les groupes de variables
sont composs chacun par les indicatrices des classes dune mme variable
qualitative.
184 8 Aspects thoriques et techniques de lAnalyse Factorielle Multiple
Mais la mesure de liaison utilise, le coefficient de corrlation multiple, nest pas sans
inconvnient dans le cas o les variables du groupe sont corrles entre elles. Lorsque
les variables du groupe K j sont lies, le sous-espace E j est instable (cest--dire
sensible de petites variations des variables) et lon peut se trouver confront des
situations paradoxales (cf. Figure 8.8).
z Ej
Pj(z)
v1
v2
Figure 8.8 Inadaptation du coefficient de corrlation multiple dans le cas de variables lies. La
variable z est presque orthogonale chacune des variables v1 et v2 du groupe K j . Or, son
coefficient de corrlation multiple avec E j vaut presque 1.
Toutes ces proprits font que cette inertie projete est une bonne mesure de liaison
entre une variable et un groupe de variables. Elle prsente des avantages sur le coeffi-
cient de corrlation multiple lorsque les variables du groupe K j sont corrles entre
elles. Elle a la mme valeur que le carr de ce dernier lorsque les variables (normes
et de poids 1) ne sont pas corrles entre elles ; en effet, dans le cas o les variables de
K j sont orthogonales deux deux, linertie de la projection de N Kj vaut 1 dans toutes
les directions de E j .
8.3 LAFM dans lespace des variables R I 185
Cette criture met en vidence le fait que la mesure Lg prend en compte le groupe
K j au travers de loprateur W j D et non pas P j comme le fait le coefficient de
corrlation multiple (cf. section b). Cet oprateur caractrise bien le groupe K j (sa dia-
gonalisation permet de reconstituer la forme du nuage N Ij , cf. section 5.4.5 page 120) ;
il est moins sensible que P j de petites variations des donnes.
Variables gnrales
Il est souhaitable que les variables gnrales expriment des directions communes
significatives , cest--dire soient proches de directions dinertie importante des
Dunod La photocopie non autorise est un dlit
nuages de variables N Kj . Nous cherchons donc une premire variable gnrale z 1 telle
que la somme des liaisons (au sens du paragraphe prcdent) entre z 1 et les J groupes
K j soit maximum. Cette expression scrit :
Lg (z 1 , K j ) = inertie de la projection de vk sur z 1
jJ kK
Variables canoniques
Les variables canoniques expriment dans chaque groupe la direction commune
quest la variable gnrale. En Analyse Canonique classique, un groupe de variables
j est reprsent par le sous-espace E j quil engendre et par loprateur de projection
associ P j ; la variable canonique associe une variable z est son image par P j . En
Analyse Factorielle Multiple, un groupe est caractris par W j D (cf. fin de la section c)
et la variable canonique associe une variable z est son image par W j D. Montrons
que W j D(z) extrait du groupe j une part dinertie plus importante que la projection
P j (z).
De lcriture matricielle de W j D et de P j (applications de R I dans R I ) :
W j D = X j M X j D
Pj = X j (X j D X j ) 1 X j D
alors :
W j D(z) = W j D P j (z) = lr xr lr
r
8.3 LAFM dans lespace des variables R I 187
2
8.4 LAFM DANS LESPACE DES GROUPES DE VARIABLES RI
Dans ltude de plusieurs groupes de variables, lun des objectifs est de comparer
globalement les groupes. Dans lexemple des vins, la parent entre les deux olfactions a
pu tre mise en vidence laide dun graphique sur lequel les groupes sont reprsents
chacun par un point.
2
Nous introduisons ici lespace R I , base de cette reprsentation qui peut apparatre
comme une aide linterprtation de lACP du tableau complet X (cest ainsi quelle
a t introduite dans lexemple des vins) mais qui possde sa propre optimalit.
tudions dabord le cas le plus simple o les deux groupes sont composs dune
seule variable, puis le cas o un seul des deux groupes est unidimensionnel et enfin le
cas o les deux groupes sont multidimensionnels.
Cette quantit vaut 0 lorsque toutes les variables dun groupe sont orthogonales
toutes les variables de lautre groupe. Elle est dautant plus grande que chacune des
variables dun groupe est plus lie lensemble des variables de lautre groupe. Elle
constitue un indice de liaison gnral entre groupes de variables, qui exprime en
quelque sorte le nombre de dimensions communes (aux deux groupes) dinertie
comparable linertie axiale maximum dun groupe . Do lide de gnraliser la
2
8.4 LAFM dans lespace des groupes de variables R I 191
W1 D W2 D
Lg (K 1 , K 2 ) = , 2
l11 l1
d) Lg et RV
Lindicateur classique de liaison entre deux groupes de variables est le coefficient RV ;
il peut tre dfini par :
W1 D W2 D
RV(K 1 , K 2 ) = ,
W1 D W2 D
Cette dfinition fait bien apparatre les W j D norms au sens usuel (de longueur 1) : le
2
coefficient RV sinterprte dans R I comme un cosinus. Etant toujours positif, il varie
entre 0 et 1, valeur atteinte lorsque les nuages dindividus associs aux deux groupes
sont homothtiques (en comparaison, la mesure Lg entre deux nuages homothtiques
est dautant plus grande que ces groupes ont une dimensionalit leve). Un exemple
dinterprtation conjointe de RV et Lg se trouve en section 9.2.1 page 211.
dun axe est gale linertie projete (calcule dans R I ) des variables du groupe
K j le long de laxe correspondant.
2
Lespace R I fournit une interprtation gomtrique ce graphique (cf. Figure 8.9).
En effet, considrons le groupe form par la variable dfinie par laxe z de R I : sa
reprsentation dans R I est loprateur de rang 1 : Wz D = zz D. Linertie projete
2
j
NK
Wj D
z zz'D
coordonne
inertie projete
Espace RI Espace RI
2
Figure 8.9 La reprsentation des groupes vue comme une aide linterprtation de lACP
2
pondre. Au groupe de variables j, on associe le nuage N Kj dans R I et le vecteur W j D de R I . Au
I I2 j I
vecteur z de R , on associe dans R le vecteur zz D. Linertie projete de N K sur z dans R est
gale la longueur de la projection de W j D sur zz D.
Ce critre est plus facile mettre en uvre que celui des moindres carrs (souvent
choisi pour les facilits de calcul quil implique) et possde une signification puisque
les coordonnes des W j D sur des lments de type z s z s D sont toujours positives. En
effet, la somme des projections des W j D sur z s z s D, qui scrit :
W j D, z s z s D
j
est gale linertie dans R I des variables (de tous les groupes) projetes sur z s .
La suite orthonorme dlments symtriques de rang 1 qui maximisent cette somme
est celle qui est associe aux composantes principales du tableau X , lorthonormalit
des z s dans R I tant quivalente celle des z s z s D dans R I . Les calculs ncessits
2
2
par lanalyse dans R I se dduisent directement des rsultats de lACP de X : les z s
sont les composantes principales normes de X et la coordonne de W j D sur z s z s D
est la contribution du groupe j linertie de la composante z s .
repre (lments symtriques de rang 1), la qualit de reprsentation des W j D par ces
axes (mesure au travers du critre usuel : inertie projete/inertie totale) natteint en
gnral pas 1, mme si lon augmente le nombre daxes (qui atteint au plus I alors
que la dimension de lespace est I 2 .
AFM et mthode Statis. Le cur de la mthode Statis est une analyse factorielle
du nuage N J , les W j D tant pralablement norms au sens usuel. Elle fournit une
reprsentation (gnralement) plane des W j D, optimale du point de vue de linertie
projete mais dont les dimensions, ntant pas des lments de rang 1, ne sont pas
interprtables.
Enfin, la reprsentation de N J fournie par lAFM peut aussi tre interprte dans le
cadre du modle INDSCAL (cf. 8.6).
Fsj = qsj Fs
Dunod La photocopie non autorise est un dlit
2
8.5.3 Interprtation du modle INDSCAL dans RI
la dcomposition des distances dans le modle INDSCAL
d 2j (i, l) = qsj [z s (i) z s (l)]2
s
RI Wj
z2 z'2
q2j
q1j
z1 z'1
2
Figure 8.10 Interprtation gomtrique du modle INDSCAL dans R I . Selon ce modle, la
matrice W j des produits scalaires entre individus induite par le groupe j est une somme dlments
symtriques de rang 1.
Soit, matriciellement :
Wj = qsj z s z s
s
2
Cette formule, traduite dans R I , exprime que les W j sont dcomposs sur un mme
repre form dlments symtriques de rang 1. Le poids qsj est la coordonne de
W j sur llment z s z s de ce repre. Chercher des paramtres z s et qsj qui ajustent le
2
modle revient chercher dans R I une suite orthogonale de vecteurs, reprsentant
chacun une matrice symtrique de rang 1, qui ajuste le nuage des W j (cf. Figure 8.10).
Cette mthodologie, AFTD par tableau de distances puis AFM sur les facteurs
associs aux valeurs propres positives des AFTD, est appele AFM sur tableaux de
distances (AFMTD).
2
Ik xik 1
Inertie de k par rapport O = I =
IJ i Ik J
8.6 Cas des variables qualitatives et des tableaux mixtes 199
I Ik 1 Ik (I Ik )
Inertie de k par rapport O = xik / =1
I i I I2
En conclusion, une ACP norme des indicatrices pondres conduit aux mmes
facteurs sur I quune ACM (les inerties des facteurs des deux analyses sont gales, au
coefficient J prs).
avec l11 , la premire valeur propre de lACP du groupe 1, l21 la premire valeur propre
de lACM du groupe 2.
Lcriture des inerties via les coefficients et rapports de corrlation montre, comme
en AFDM, lquilibre entre les deux types de variables ; les valeurs propres des
analyses spares assurent lquilibre entre les groupes (comme dans toute AFM). Il
est clair que si chaque groupe est rduit une seule variable, quantitative ou qualitative,
lAFM est quivalente une AFDM. Cette nouvelle quivalence suggre son tour la
possibilit de traiter des groupes de variables mixtes, dont lanalyse spare est une
AFDM. LAFM permet ainsi de traiter simultanment en actif des groupes quantitatifs,
qualitatifs ou mixtes.
mais aussi par chacun des groupes (cf. Figure 7.9 page 168).
Cette dernire reprsentation est trs importante car elle permet lAFM dabor-
der des fichiers denqute assez volumineux dans lesquels les individus ne sont pas
intressants en eux-mmes mais uniquement au travers des modalits quils possdent.
La projection de ces centres de gravit est accompagne des aides linterprtation
usuelles en particulier la contribution linertie de chaque facteur. La somme de ces
contributions, pour les modalits dune mme variable, est gale au carr du rapport
de corrlation entre la variable et le facteur Fs .
rsultats de lanalyse. La plupart des calculs (mais pas tous) effectus sur les groupes
principaux sappliquent un groupe supplmentaire :
1. normalisation du nuage N Kj : pour comparer aux autres nuages le nuage associ
un groupe supplmentaire, il faut le normaliser de la mme faon en surpon-
drant les variables du groupe par linverse de la premire valeur propre de son
analyse spare ;
2. projection des composantes principales du groupe : elle permet de comparer la
forme gnrale du nuage N Kj avec celle du nuage moyen N K et celles des nuages
associs aux autres groupes de variables ;
3. projection des W j D : la prsence dlments supplmentaires dans lanalyse
2
du nuage N J dans R I ne pose pas de problme particulier. La coordonne dun
lment supplmentaire W j D sur laxe de rang s concide avec la mesure de
liaison entre le s e facteur et le groupe j, le poids affect ce facteur par le groupe
j dans le modle INDSCAL et linertie des variables du groupe j le long de la
direction s (qui ne sinterprte plus comme une contribution).
Par contre, il nest pas possible dobtenir une reprsentation superpose des nuages
dindividus associs des groupes de variables supplmentaires : cela reviendrait
projeter un nuageN Ij sur un axe de R K orthogonal au sous-espace qui contient ce
nuage.
Si lon tudie les raisons qui conduisent introduire un groupe en supplmentaire,
on peut voir que cette limite nest pas trs gnante. Si lon craint quil perturbe les
rsultats, car prsentant a priori de grandes diffrences avec les autres groupes, les
indices globaux, projections des composantes principales, etc., permettent de mesurer
et prciser ces diffrences, mais superposer le nuage N Ij des nuages qui ne lui
ressemblent pas assez na pas dintrt. Sil intervient uniquement en tant qulment
explicatif lors de linterprtation, on sintresse alors aux liaisons entre les variables
Dunod La photocopie non autorise est un dlit
La seconde tape est une ACP de lensemble des variables de tous les groupes pon-
drs ; en pratique, on ralise cette analyse partir des facteurs des analyses spares.
En effet, il est quivalent de considrer un tableau du point de vue de ses donnes
brutes ou du point de vue de ses facteurs. On se limite aux facteurs associs une
valeur propre non nulle, ce qui rduit la dimension de la matrice diagonaliser. Dans
la perspective du traitement de trs grands tableaux, on peut aussi ne pas prendre en
compte les facteurs associs des petites valeurs propres, ce qui conduit une analyse
approche, la qualit de lapproximation tant lie au seuil en dessous duquel on carte
les valeurs propres.
Chapitre 9
Mthodologie de lAFM
Ce chapitre regroupe dabord plusieurs aspects utiles dans la mise en uvre de lAFM.
Ils sarticulent autour de deux thmes : tactique mthodologique et aides linterpr-
tation. Le chapitre se termine par une prsentation synthtique dune extension de
lAFM, lAFM hirarchique (AFMH), ddie aux tableaux dans lesquels les variables
sont structures selon plusieurs partitions embotes.
1 Kg 1 Kg 1 Kg 1 Kg
1
Xm X1 Xj XJ
I
1
X1
I A
1
Xj B
I
1
XJ
I
Figure 9.1 Les deux juxtapositions dun ensemble de tableaux doublement apparis. La
juxtaposition A (resp. B) en ligne (resp. colonne) est possible du fait de lhomologie entre les lignes
(resp. colonnes) des tableaux. K g : nombre de variables par groupe ; X m : tableau moyen.
LACP des J tableaux juxtaposs en ligne (A) fournit une reprsentation des indi-
vidus, chacun considr du point de vue de lensemble des J dates. Elle fournit une
reprsentation des variables dans laquelle chacune donne lieu un point par date.
Elle permet ainsi de suivre lvolution des K g variables au cours du temps. Dans
cette approche, lhomologie entre les variables nest pas utilise dans les calculs mais
seulement lors de linterprtation (en reliant sur les plans factoriels, par exemple, les
points relatifs une mme variable). En revanche, lobservation des mmes individus
au cours du temps est ici essentielle.
LACP des J tableaux juxtaposs en colonne (B) permet de suivre lvolution des
individus au cours du temps puisquune ligne correspond un individu une date
donne. On peut centrer chaque tableau avant la juxtaposition si lon souhaite ne pas
faire apparatre lvolution globale des individus. Dans cette analyse, lhomologie
entre les variables est utilise. En revanche, le fait que ce sont toujours les mmes
individus qui ont t observs au cours du temps nest pas ncessaire dans cette ACP.
9.1 Tactique mthodologique 207
LACP usuelle offre ainsi la possibilit dtudier lvolution des individus et celle
des variables. Chaque volution est dcrite dans un cadre diffrent puisque issu dun
traitement diffrent. Cette mthodologie est, juste titre, trs utilise (on retrouve cette
dmarche, pour les tableaux de frquence, au chapitre 10). Par rapport cette mthodo-
logie, lAFM des J tableaux juxtaposs en ligne (dans laquelle chaque ensemble des
mesures une date donne constitue un groupe de variables) offre les caractristiques
intressantes suivantes :
1. les groupes de variables tant pondrs, linfluence des diffrentes dates de
mesure est quilibre ;
2. grce la reprsentation superpose, on dispose dune visualisation de lvolu-
tion des individus et des variables au sein dune mme analyse ;
3. du fait de la pondration et de la prise en compte explicite de la structure en
groupes des variables, on dispose dun large ventail daides linterprtation
(reprsentation des groupes, des facteurs des analyses spares, etc.).
Tableau 9.1 Deux cas de donnes choisies. Le premier (resp. second) groupe de variables se
limite la variable V1 (resp. V2 ). Vm : moyenne entre V1 et V2 .
Cas 1 Cas 2
Individu
Vm V1 V2 Vm V1 V2
A 4 4 4 0 4 -4
B -2 -1 -3 1 -1 3
C -2 -3 -1 -1 -3 1
Le cas de deux groupes rduits chacun une seule variable quantitative centre
est commode pour illustrer la comparaison entre AFM de groupes de variables homo-
logues et ACP du tableau moyen (cf. Tableau 9.1 et Figure 9.2). Notons V1 et V2 ces
208 9 Mthodologie de lAFM
B B
C A C A
C1 B1 0 A1 C1 B1 0 1 A1
B2 C2 A2 B2 C2 A2
V2
V1 V2 Vm V1
0 1
-1 0 1
Vm
Cas 1 : "ACP" de Vm ou AFM de {V1 ; V2} Cas 2 : AFM de {V1 ; V2}
C A B
ACP : seul le sous-tableau Vm est actif ;
C1 B1 0 A1
A2 C2 B2 V1 et V2 sont introduits comme lignes et
comme colonnes supplmentaires.
V2 AFM : V1 et V2 constituent chacune un
V1 Vm groupe actif et Vm un groupe supplmen-
0 1 taire.
A1 : individu A vu par V1
Cas 2 : "ACP" de Vm
Figure 9.2 Axe unique de lACP du tableau moyen ou premier axe de lAFM du tableau 9.1. Pour
chaque cas, reprsentation des individus (en haut) et des variables.
deux variables et r12 leur coefficient de corrlation. Le cur de lAFM de {V1 ; V2 } est
une ACP norme des deux variables. On vrifie aisment que V1 + V2 et V1 V2 sont
vecteurs propres de la matrice des corrlations (cf. section 5.3.1 page 112) et donc que
cette ACP admet comme composantes principales la somme V1 + V2 (inertie associe :
1 + r12 ) et la diffrence V1 V2 (inertie associe : 1 r12 ).
Le signe de r12 dtermine lordre de ces deux composantes.
1. r12 > 0 : la structure commune respecte lhomologie entre les variables.
Exemple : cas 1 du tableau 9.1, dans lequel les variables V1 et V2 mettent
toutes deux en vidence la forte valeur de A. LAFM de {V1 , V2 } et lACP du
tableau moyen (i.e. de Vm ) conduisent aux mmes reprsentations. Exemple : cf.
Figure 9.2 cas 1.
2. r12 < 0 : la structure commune ne respecte pas lhomologie entre les variables.
Exemple : cas 2 du tableau 9.1, dans lequel les variables V1 et V2 mettent toutes
deux en vidence lloignement de A mais chacune dans un sens diffrent. LACP
du tableau moyen ne peut dceler cette structure : elle place le point A lorigine
9.1 Tactique mthodologique 209
des axes (cf. Figure 9.2 cas 2). LAFM de {V1 , V2 }, pour son premier axe, prend
en quelque sorte loppose de lune des variables avant de les superposer.
Dans lACP de Vm , qui se rduit bien sr la reprsentation de Vm , V1 et V2 tant
introduits la fois en lignes et colonnes supplmentaires, on prend en compte lhomo-
logie entre les variables, ce qui inclut le sens de variation des V1 et V2 : ainsi, dans
le cas 2, la structure commune se limite alors des valeurs de B gnralement plus
leves que celles de C. Cest bien ce que met en vidence laxe unique de l ACP
de Vm (cf. Figure 9.2 cas 2). La reprsentation des variables initiales (V1 et V2 ), qui
dans cette mthodologie ne peuvent apparatre quen fonction de leur liaison avec la
structure commune, est ici proche de lorigine.
Dans lAFM de {V1 , V2 }, Vm tant introduite en supplmentaire, on ne prend pas
en compte lhomologie entre les variables ; la structure commune majeure est alors le
particularisme de lindividu A, ce que met bien en vidence le premier axe de lAFM
(cf. Figure 9.2). Les points partiels restituent bien les donnes : A est extrme du point
de vue des 2 groupes ; C est extrme du point de vue du groupe 1 et non du point de
vue du groupe 2. La variable moyenne Vm est non corrle laxe 1. En revanche, elle
est parfaitement corrle laxe 2 de lAFM qui correspond donc laxe 1 de lACP.
En conclusion, on rservera lACP du tableau moyen en actif au cas o lon sint-
resse aux seules structures communes respectant lhomologie des variables. Autrement,
lorsque toutes les structures communes sont dignes dintrt, on ralisera une AFM,
en introduisant le tableau moyen en tant que groupe supplmentaire.
Les variables appellation et terroir ont t introduites au sein dun mme groupe,
origine des vins, mais peuvent aussi tre considres sparment. La reprsentation
de ces deux nouveaux groupes (cf. Figure 7.6 page 162) a montr que la liaison entre
lorigine des vins et les deux premiers facteurs est due au terroir et non lappellation.
Un autre exemple dans lequel plusieurs dfinitions des groupes sont possibles
est fourni par les observations rptes dun mme ensemble de variables, cas dj
voqu section 9.1.2. On peut, dans ce cas, regrouper les variables de deux faons et
la formulation de lAFM en tant que mthode de recherche de facteurs communs aide
choisir entre les deux partitions des variables.
1. Partition 1 : un groupe rassemble les variables dune mme date (cas envisag
section 9.1.2). LAFM cherche alors les facteurs communs aux structures sur les
individus dfinies par les diffrentes dates (question : quy a-t-il de commun aux
diffrentes dates ?).
2. Partition 2 : un groupe rassemble les variables de mme nature, toutes dates
confondues ; il reprsente lvolution de la variable tout au long de la priode
tudie. LAFM cherche alors les facteurs communs ces volutions (question :
quy a-t-il de commun aux volutions des diffrentes variables ?).
communs aux trois groupes. Aussi peut-on prfrer se limiter introduire seulement
deux groupes en actif. Ce qui revient chercher des facteurs communs :
1. soit la physico-chimie des vendanges et celle des vins ;
2. soit la physico-chimie des vins et la description sensorielle des vins.
Ces deux dernires problmatiques sont moins ambitieuses mais plus faciles conce-
voir. Aussi, pour de telles donnes, une dmarche empirique mais raisonnable consiste
commencer par une AFM avec les trois groupes actifs en sattendant conserver
comme analyse(s) finale(s) celle(s) avec deux groupes actifs.
2. les contributions des groupes de variables linertie des axes (cf. tableau 7.1 et
section 7.1.7 page 161) ;
3. le rapport [inertie inter / inertie intra] associ la reprsentation superpose (cf.
section 7.2.4 page 167).
Enfin certaines aides nont pas t illustres. Elles font lobjet des sections suivantes.
Lg RV
Groupe
1 2 3 4 1 2 3 4
1 : olfaction au repos 1.61 1 1
2 : vision .55 1.00 .44 1
3 : olfaction aprs agitation 1.05 .70 1.37 .71 .60 1
4 : gustation
.68 .80 .94 1.12 .51 .75 .76 1
= {1, 2, 3, 4} 1.13 .88 1.17 1.02 1.22 .81 .80 .91 .88 1
2
Tableau 9.3 Exemple des vins : distance d(0, j) des groupes lorigine dans R I . d2 (0, j) = N2g
mesure le nombre de directions dinertie comparable celle de la premire direction .
d2 (0, j) mesure, en quelque sorte, le nombre de directions dont linertie est proche
de linertie axiale maximum . Ainsi, selon ce critre, le groupe olfaction au repos est
de dimensionalit plus importante que olfaction aprs agitation du fait du deuxime
axe, dinertie plus proche de celle du premier axe dans le cas de lolfaction au repos.
Le tableau 9.4 illustre ce phnomne dans deux cas de rfrence. Le sous-espace
engendr dans le cas 1 est 3 dimensions (3 valeurs propres non nulles). Dans le cas
2, il est 6 dimensions. Malgr cela, lindicateur de dimensionalit est plus important
dans le cas 1 car il accorde une importance trs faible aux dimensions de faible inertie.
Dunod La photocopie non autorise est un dlit
Tableau 9.4 Distance dun groupe j lorigine dans 2 cas de rfrence dcrits par leurs
pourcentages dinertie.
% dinertie
F1 F2 F3 F4 F5 F6 d2 (0, j)
Cas 1 .5 .4 .1 0 0 0 1.68
Cas 2 .5 .1 .1 .1 .1 .1 1.20
Plus prcisment :
1. la valeur 1.68 (proche de 2) traduit la prsence de 2 dimensions prpond-
rantes dinerties comparables ;
2. la valeur 1.20 (proche de 1) traduit la prsence dune seule dimension prpond-
rante.
214 9 Mthodologie de lAFM
Tableau 9.5 Exemple des vins : contribution des groupes de variables la construction de chacun
des trois premiers axes de lAFM.
Cet indicateur peut aussi tre calcul pour les groupes supplmentaires, auquel cas
il ne sinterprte pas comme une contribution mais sert simplement situer les groupes
supplmentaires par rapport lensemble des groupes actifs.
Tableau 9.6 Exemple des vins : qualits de reprsentation cumules des nuages des variables de
chaque groupe, dans lAFM et dans les analyses spares.
Groupe F1 F2 F3 F1 F2 F3
1 : olfaction au repos 35.1 62.9 79.6 44.8 75.2 91.5
2 : vision 80.8 84.6 86.0 94.5 99.5 100.0
3 : olfaction aprs agitation 43.5 65.5 74.0 47.0 71.8 82.3
4 : gustation 56.4 71.3 74.3 62.7 82.6 90.1
5 : jugement densemble 57.2 80.1 81.6 92.5 100.0 -
diminution de qualit de reprsentation par un plan varie entre 6.3 % et 14.9 %. Elle
quantifie le prix payer en contrepartie de la reprsentation simultane de tous les
N Kj . Dans lexemple, on peut considrer que ce prix payer nest pas exagr.
Cet indicateur peut aussi tre calcul pour les variables qualitatives auquel cas, pour
tre comparable celui dune ACM (vue comme une AFC du Tableau Disjonctif
Complet), il doit prendre en compte les modalits au travers de leurs indicatrices
(et non de leurs centres de gravit). Le tableau 9.7 rassemble ces indicateurs pour
lenqute Ouest-France.
Tableau 9.7 Enqute Ouest-France : qualits de reprsentation cumules des nuages des
variables de chaque groupe.
Tableau 9.8 Exemple des vins : aides linterprtation relatives aux facteurs partiels.
composantes principales du groupe j est bien reprsent. Ainsi, dans lAFM sur
les donnes Ouest-France, le premier plan reprsente 86 % des deux premires
composantes des rubriques, ce qui est une faon de quantifier la ressemblance
entre les premiers plans de ces deux analyses.
Ces deux indicateurs peuvent enfin tre calculs pour lensemble des composantes
principales tous groupes confondus.
1. La contribution montre dans quelle mesure les premiers axes de lAFM peuvent
tre reconstitus avec les seules premires composantes principales des diff-
rents groupes. Ainsi, dans lexemple des vins, les 4 premiers axes partiels (i.e.
le premier de chaque groupe) contribuent globalement 99 % de linertie du
premier axe de lAFM, ce qui quantifie le rle majeur de ces axes dans lanalyse
(remarque : si lon conserve toutes les composantes principales de chaque groupe
actif, cet indicateur vaut 100).
218 9 Mthodologie de lAFM
Tableau 9.9 Exemple des vins : rapports [inertie inter / inertie totale] relatifs la reprsentation
superpose.
Axe F1 F2 F3 F4 F5 F6 F7
[inertie inter / inertie totale] .87 .58 .38 .14 .17 .14 .17
Cette inertie intra peut son tour tre dcompose par individu ; ainsi, dans
lexemple des vins, les contributions (en %) des vins 1DAM et 1POY linertie intra
pour laxe 1 valent respectivement 11,4 % et 8,1 %, valeurs qui quantifient la plus
grande variabilit des coordonnes des points reprsentant 1DAM (cf. Figure 7.5
page 160).
En pratique, on trie les individus par inertie intra croissante. Les premiers individus
prsentent les ensembles dimages partielles les plus homognes du point de vue de
9.3 Analyse factorielle multiple hirarchique 219
laxe : ils illustrent bien le caractre commun (aux groupes de variables) du facteur.
loppos, les derniers individus prsentent les ensembles dimages partielles les plus
htrognes du point de vue de laxe. Ainsi, dans lexemple, ce tri selon le premier
axe fait apparatre 1VAU (respectivement 2ING) comme lindividu ayant une des plus
faibles (respectivement fortes) inertie intra. On retrouve bien ce phnomne sur la
figure 7.5.
La quantification de la variabilit axe par axe des points partiels relatifs un mme
individu prsente un intrt en soi. Mais son apport le plus important rside dans le tri
qui permet, lorsque les individus sont nombreux, de slectionner les individus les plus
remarquables selon ce critre sans les examiner tous.
La part dinertie intra de chaque individu peut son tour tre dcompose selon
ses points partiels. Ainsi, la part de 1DAM1 vaut 6.5 %, ce qui montre bien le rle
important de lolfaction au repos dans lhtrognit des perceptions de 1DAM.
En pratique, on slectionne les individus partiels ayant les plus fortes inerties intra.
Cela permet de mettre en vidence des points partiels non concordants avec les
autres images associes ces mmes points.
nud sommital
nud n
partition associe au nud n
(ici 7 variables en 3 groupes)
variables
olf. repos
gustation gustation
vision
i olf. agit.
1982 1984
olf. agit.
olf. repos
vision
Figure 9.4 Exemple de reprsentations de points partiels en AFMH. Pour chaque vin i, on
distingue son image pour chaque millsime et pour chaque phase de dgustation au sein dun
millsime.
produits des Jl associs aux L n nuds englobant le nud n, ce qui peut scrire :
n
l=L
Jl
l=1
Dans lexemple des vins, les points partiels relatifs un millsime sont dilats avec le
coefficient 2 (cas 2 millsimes) ; les points partiels relatifs une phase de dgustation
(dans un millsime) sont dilats avec le coefficient 2 4 = 8 (car 2 millsimes4
phases).
Chapitre 10
Comparaison de tableaux de
frquence binaire
10.1.1 Notations
Notons I , J , T les ensembles des modalits des trois variables (la notation T fait
rfrence au temps).
224 10 Comparaison de tableaux de frquence binaire
1 j J
T
t f.jt f..t
f i jt = 1
i jt
1 f i j. = t f i jt
f.j. f i.t = j f i jt
1
fi.t
fijt f . jt = i f i jt
f i.. = jt f i jt
i fij. fi.. f . j. = it f i jt
f ..t = i j f i jt
Les donnes peuvent tre prsentes sous forme dun paralllpipde (cf.
Figure 10.1) de terme gnral not f i jt . Les f i jt , obtenus en divisant les effectifs par
leur total, peuvent tre considrs comme une mesure de probabilit sur le produit des
trois ensembles I , J et T .
Les marges binaires de ce paralllpipde sont les trois tableaux de contingence
binaire, obtenus en sommant sur lun des trois indices. Leur terme gnral est not
respectivement f i j. , f . jt et f i.t . Chacune peut tre reprsente par une face du parall-
lpipde. On parlera aussi des trois marges unaires, vecteurs obtenus en sommant sur
deux indices et nots f i.. , f . j. et f ..t : chacune peut tre reprsente par une arte du
paralllpipde. Larte f i.. (resp. f . j. ou f ..t ) est dite souvent marge sur I (resp. sur
J ou T ) .
On peut prsenter aussi les donnes comme une suite de tableaux binaires (cf.
Figure 10.2). Cest dailleurs ainsi quelles se prsentent concrtement. Lune des
dimensions, T par exemple, joue alors un rle diffrent des deux autres. Les T tableaux
binaires croisant I et J sont des tranches du paralllpipde. Leur somme nest
autre que la marge binaire sur ce mme produit.
10.1.2 Exemples
Dans ce chapitre, nous appliquons la plupart des mthodes exposes un tableau de
trs petite dimension issu de donnes de lINSEE ( Bilan formation-emploi 1973 ,
10.1 Donnes et problmes 225
1 j J 1 j J
1 1
I I
t=1 t=T
Tableau 10.1 lves scolariss en 1972-1973, sortis du systme ducatif en 1973 et ayant trouv
un emploi : sexe masculin.
Niveaux de diplme
Emploi occup sans BEPC BEP/ CAP BAC BAC DEUG/ DUT/ SUP Total
diplme gnral technique ENT BTS
Agriculteur 15068 2701 5709 297 1242 - 322 - 25339
Ingnieur - 337 309 917 - 308 - 4383 6254
Technicien 302 1697 2242 1969 1399 357 1943 381 10290
Ouvrier qualifi 10143 3702 30926 314 1861 - - 337 47283
Ouvrier non qualifi 59394 8087 17862 2887 1696 - - 323 90249
Cadre suprieur 596 298 892 1227 298 2362 318 6781 12772
Cadre moyen 2142 2801 672 6495 924 2807 2301 4030 22172
Employ qualifi 5445 7348 4719 4353 1280 614 982 - 24741
Employ non qualifi 4879 4987 1514 3478 886 1326 - 661 17731
Total 97969 31958 64845 21937 9586 7774 5866 16896 256831
Tableau 10.2 lves scolariss en 1972-1973, sortis du systme ducatif en 1973 et ayant trouv
un emploi : sexe fminin.
Niveaux de diplme
Emploi occup sans BEPC BEP/ CAP BAC BAC DEUG/ DUT/ SUP Total
diplme gnral technique ENT BTS
Agriculteur 5089 1212 1166 - - - - - 7467
Ingnieur - - - 316 - - 304 1033 1653
Technicien 281 - 320 320 283 - 683 - 1887
Ouvrier qualifi 7470 1859 4017 1752 657 - 285 - 16040
Ouvrier non qualifi 29997 4334 4538 1882 - - - - 40751
Cadre suprieur - - - 2236 595 911 569 6788 11099
Cadre moyen 1577 1806 4549 17063 875 4152 15731 3991 49744
Employ qualifi 21616 19915 32452 16137 5865 1256 3332 1286 101859
Employ non qualifi 19849 7325 6484 5111 898 294 635 - 40596
Total 85879 36451 53526 44817 9173 6613 21539 13098 271096
anne, pour 40 entreprises, le nombre total demplois dans chacune des 10 catgories
demplois qui apparaissent dans ces entreprises.
Cette comparaison elle-mme recouvre des objectifs trs divers dcrits dans la
section suivante en rfrence aux exemples cits.
de mortalit sont trs lies lge. Une comparaison brute de ces causes dans tous
les cantons ne fait ressortir que la diffrence entre leur structure dge. Il faut tudier
la liaison entre deux variables (canton et cause de mortalit) en neutralisant (en un
certain sens) linfluence de la troisime (classe dge). Une solution couramment
utilise consiste redresser les pourcentages de mortalit de chaque canton en tenant
compte des diffrences entre les rpartitions en classes dge. Mais cette technique
limine toutes les informations concernant ces rpartitions. Pour conserver la richesse
initiale des donnes, nous posons le problme diffremment, en cherchant mettre en
vidence des disparits gographiques valables pour lensemble des classes dge.
Le problme de lvolution de lemploi dans un ensemble dentreprises est ana-
logue : il faut liminer linfluence dune variable. Sachant que la rpartition des
diffrentes catgories demplois varie beaucoup dune entreprise lautre, comment
comparer les volutions de ces rpartitions ?
228 10 Comparaison de tableaux de frquence binaire
10.1.5 Conclusion
En passant du binaire au ternaire, le niveau de complexit crot considrablement.
Ltude dune liaison ternaire est vaste et il ne peut tre question, mme pour un
tableau de trs petite taille, den tudier tous les aspects. Aussi, nous navons la
prtention dans ce chapitre, ni de donner des rponses toutes les questions poses,
ni de faire un bilan exhaustif des traitements. Notre but est dorienter la rflexion
sur ce type de donnes et de proposer quelques outils que chacun peut adapter ses
problmes.
Nous voquons dabord lanalyse des marges binaires dun tableau ternaire. Puis
nous proposons trois mthodes illustres par le mme exemple. La faible dimension
de ces donnes permet de fournir les rsultats complets de chaque analyse. Lintrt de
cette tude systmatique est essentiellement pdagogique. Pour prciser ce quapporte
chacune des techniques proposes, nous mettons laccent sur les diffrences entre
leurs rsultats.
1. La premire analyse est une AFC de la somme des tableaux, avec les diffrents
tableaux en lments supplmentaires.
2. La seconde analyse est une AFC de tableaux juxtaposs complte par de mul-
tiples indices.
3. La troisime analyse, baptise analyse intra , permet dtudier des liaisons
conditionnelles.
Nous allons de la plus simple la plus complexe et il est raisonnable de respecter cet
ordre dans les applications. Pour chaque mthode, nous indiquons les grandes lignes
des techniques dinterprtation ; puis nous valuons leur efficacit pour rpondre
chacune des questions souleves concernant la comparaison des tableaux binaires.
tudie) des catgories demplois dans chaque entreprise. Son analyse met en vidence
les diffrences de rpartition des emplois suivant les entreprises dans la priode consi-
dre et de comparer les entreprises suivant ce critre. La deuxime marge, qui cumule
les entreprises, permet dtudier lvolution de la rpartition des emplois dans len-
semble du secteur auquel appartiennent les entreprises. La troisime marge croise les
annes et les entreprises en cumulant les catgories demplois ; elle donne lvolution
du nombre total demplois dans chacune des entreprises.
Cette mthodologie permet de dgager dabord les grandes tendances des donnes,
avant de sattaquer la description prcise de phnomnes plus fins. Les nuances que
lanalyse du paralllpipde complet permet de dgager nont en effet de sens qu
lintrieur de structures plus grossires, mais plus fortes, impliques par les marges.
Cette dmarche correspond la philosophie gnrale de lanalyse des donnes.
De plus, on ne le rptera jamais trop, une tude nest pas faite par une seule
squence danalyses. Chaque rsultat remet en question le tableau trait, notamment
le codage et les lments pris en compte. Si des valeurs excentres, appeles couram-
ment aberrantes, qui apparaissent dj au niveau de lanalyse des marges ne sont pas
limines ou recodes avant une analyse fine, les rsultats de cette dernire risquent
de ne prsenter aucun intrt ou dtre mal interprts. Lanalyse de tableaux binaires
se matrise bien, les phnomnes perturbateurs se reprent aisment et on peut les
neutraliser beaucoup plus facilement que lors de lanalyse dun tableau ternaire.
Lanalyse de la somme des T tableaux est donc lanalyse dun nuage moyen : celui
des barycentres des profils des colonnes homologues des T tableaux. Les facteurs
230 10 Comparaison de tableaux de frquence binaire
J J J
RI
bacheliers (hommes)
bacheliers
bacheliers (femmes)
Figure 10.4 Le profil de la colonne j de la marge tudie est au barycentre des T profils des
colonnes [j,t] des T tableaux. Le profil demplois de la classe des bacheliers, hommes et femmes
cumuls, est au barycentre des profils demplois des bacheliers hommes et des bachelires.
mettront donc en vidence des tendances communes aux T tableaux (si elles existent).
Dans lexemple, les oppositions entre diplmes qui se retrouvent la fois chez les
hommes et chez les femmes apparaissent clairement ; par contre, les diffrences entre
les profils demplois des deux sexes, diplme gal, sont limines.
Mettre les T tableaux en colonnes supplmentaires dans lAFC de leur somme
consiste projeter les profils de leurs colonnes sur les axes dinertie de leurs bary-
centres. Ceci permet dtudier, sur chaque facteur, lcart entre le profil de la colonne j
de chaque tableau t et le profil moyen de ces colonnes j. Si ces carts sont tous faibles,
le facteur reprsente une tendance commune tous les tableaux. Cette projection des
profils des colonnes des diffrents tableaux sur un rfrentiel commun permet de les
comparer, au moins dans ce qui apparat dans ce rfrentiel. Mais attention, les diff-
rences entre profils homologues ne sont pas forcment visibles sur cette projection, soit
parce que les carts entre ces profils sont orthogonaux aux structures moyennes, soit
10.3 Premire analyse : les tableaux en supplmentaire dans lAFC de leur somme 231
Figure 10.5 Exemples dans lesquels la dispersion intra-tableaux nest pas visible dans ltude de
la dispersion inter-tableaux.
parce que ces carts sont trs faibles par rapport aux carts entre les profils diffrents
(cf. Figure 10.5). La situation est exactement identique pour les lignes.
Les deux paragraphes suivants illustrent cette technique par un commentaire dtaill
des rsultats de lanalyse des donnes croisant emplois, diplmes et sexes.
10.3.2 Interprtation
Le dpouillement des rsultats commence par ltude des lments actifs, les lignes et
les colonnes de la somme des T tableaux ; ce tableau croise 9 catgories demplois et
8 niveaux de diplme.
ment effet Guttman . Il apparat lorsquil existe une structure dordre la fois sur
lensemble des lignes et sur celui des colonnes et que ces structures sont associes.
Plus prcisment, si lon rordonne les lignes et les colonnes dans lordre du premier
facteur, on obtient un tableau dont les lments proches de la diagonale ont de fortes
valeurs tandis que les lments loigns sont nuls ou presque nuls. Nous profitons de
cet exemple pour prsenter quelques rsultats gnraux concernant cette structure.
F2 F3
00
00 F1
F1
Donnes
Figure 10.6 Leffet Guttman : donnes et premiers plans de lAFC. Le tableau des donnes
comporte la mme valeur sur la bande (en gris) autour de la diagonale et 0 ailleurs. Ce tableau
est appel scalogramme . Sur le plan (F1 ,Fs ) de lAFC dun tel tableau, les points (lignes et
colonnes) sont rpartis sur une courbe de degr s.
points sont situs sur une courbe qui coupe trois fois laxe 1 (cf. Figure 10.6). Plus
gnralement, le facteur de rang s est un polynme de degr s du premier.
Dans ce cas, la liaison entre les deux variables peut se rsumer la double structure
dordre mise en vidence par le premier plan. Les facteurs suivants continuent
traduire ce mme phnomne. Notons que les pourcentages dinertie extraite des
nuages par les premiers facteurs sont, dans ce cas, faibles alors que linformation sur
la structure des donnes est complte (ce nest pas le seul exemple qui illustre le fait
que, dans le choix du nombre de facteurs considrer, ces pourcentages nont quune
valeur indicative).
Lorsque lon observe ainsi une rpartition parabolique sur un plan, on interprte
globalement le plan qui traduit lassociation ordonne des lignes et des colonnes.
Deux questions se posent assez naturellement concernant lapport du deuxime fac-
teur, puisque la double structure dordre est dj visible sur le premier facteur. La
premire est relativement thorique : pourquoi observe-t-on une rpartition parabo-
lique et pourquoi plus gnralement y a-t-il dautres facteurs que le premier, suffisant
pour traduire lordre ? La deuxime question est plus pratique : le deuxime facteur
peut-il apporter des rsultats complmentaires concernant les donnes tudies ? Pour
rpondre la premire question, nous ne donnons pas de dmonstration1 , mais remar-
quons simplement quun facteur unique ne peut traduire correctement les distances
entre profils dans le cas dun effet Guttman.
En effet, sur une droite les distances sajoutent et, sur laxe 1, la distance de la
premire ligne la dernire est plus importante que sa distance nimporte quelle
ligne intermdiaire. Or, dans le nuage des profils, ceci est faux car les deux lignes
extrmes sont rapproches par un caractre commun : les zros qui apparaissent en leur
1. Lanalyse des donnes. J.-P. Benzcri et collaborateurs, Dunod, 1973, Tome 2 p.192.
10.3 Premire analyse : les tableaux en supplmentaire dans lAFC de leur somme 233
milieu. Le premier facteur donne une bonne reprsentation de lensemble des distances
entre tous les couples de points et traduit bien ainsi la structure gnrale les distances
entre lignes successives sont faibles mais traduit mal la distance entre les extrmes.
Le deuxime facteur corrige donc et affine lapproximation relativement grossire des
distances traduite par le premier facteur. Lintrt pratique du deuxime facteur est
avant tout de caractriser par la forme parabolique une situation type laquelle on
peut se rfrer pour dcrire les donnes. En outre, il permet de voir si certains points
scartent de la parabole, ce qui se produit ds que les donnes scartent un tant
soit peu du modle. Nous verrons dans le commentaire de lexemple, au niveau de la
projection des points supplmentaires, linterprtation de ces carts.
la marge du tableau.
Le tableau dfini de la mme faon par le deuxime facteur a des termes positifs
au centre et aux quatre coins, et des termes ngatifs ailleurs. Le cumul de ces deux
tableaux sapproche de la structure en bande diagonale, caractristique de leffet
Guttman.
+++
+
+
0 ++ 0 + +
fij
= fi . f . j + 0 0 0 + + + ...
0 0 ++ + +
Figure 10.7 Reconstitution des donnes, partir des premiers facteurs de lAFC, dans le cas dun
effet Guttman.
ingnieur F2 : 23.8%
2 : .224
TUDES SUPRIEURES
cadre suprieur
ouvrier
non qualifi
SANS DIPLME
H D-H
E-H agriculteur
F1 : 57.4 % ouvrier qualifi
employ
non
1 : .539 H qualifi BEP-CAP
D-F
DEUG BEPC
E-F
BAC TECHNIQUE employ qualifi
BAC
GNRAL
cadre moyen
LEGENDE technicien
F
Figure 10.8 Plan des deux premiers facteurs de lanalyse du tableau somme.
double ordre et que dautres phnomnes sy ajoutent. Leur importance est moindre
Dunod La photocopie non autorise est un dlit
puisque linertie de ces facteurs est beaucoup plus faible. Le plan 1-2 donne une image
globale de la liaison tandis que les facteurs 3 et 4 montrent des phnomnes beaucoup
plus ponctuels, i.e. concernant peu dlments.
Le troisime facteur (cf. Figure 10.9) traduit la forte association entre les ouvriers
qualifis et le CAP/BEP. Ces deux points, chacun dans leur nuage, ont une contribu-
tion linertie du troisime facteur trs importante (40 % et 51 % respectivement cf.
Tableau 10.3). Ils dterminent donc en grande partie la direction de laxe dinertie ; le
fait quils soient situs du mme ct signifie quils sassocient trop .
Ce troisime facteur diffrencie entre eux les diplmes (resp. les emplois) de faible
qualification trs proches sur le premier plan. Il montre une nuance trs nette entre les
sans diplme et les titulaires dun diplme de faible niveau (CAP/BEP) : par rapport
lensemble de la population tudie, les premiers aboutissent beaucoup plus des
236 10 Comparaison de tableaux de frquence binaire
F
F4 : 4.5 %
3 : .042
BEPC
employ qualifi
BAC TECHNIQUE
BAC GNRAL
ingnieur
cadre suprieur
SANS E-F
TUDES
DIPLME DEUG E-H
SUPRIEURES F3 : 12.6 %
agriculteur 3 : .119
ouvrier non technicien
qualifi
cadre moyen
BEP-CAP
LEGENDE
emplois douvrier ou demploy non qualifi tandis que les seconds mnent beaucoup
plus frquemment des emplois douvrier qualifi.
Le quatrime facteur, schmatiquement, oppose les employs (qualifis et non
qualifis) aux ouvriers qualifis. Par rapport lensemble de la population tudie, les
premiers sont plus souvent titulaires dun BEPC et les seconds dun CAP/BEP.
10.3 Premire analyse : les tableaux en supplmentaire dans lAFC de leur somme 237
Le dpouillement des rsultats se poursuit par ltude des deux tableaux mis en sup-
plmentaire dans lAFC de leur somme.
a) Profils demplois de chaque diplme, pour les hommes et pour les femmes
Les deux tableaux ont t mis deux fois en supplmentaire, en colonne et en ligne (cf.
Figure 10.3 page 230). Etudions dabord la projection sur le plan 1-2 des colonnes
supplmentaires, cest--dire des profils demplois des hommes et des femmes pour
chacun des diplmes. Pour tous les diplmes, sur le premier axe, les deux points
reprsentant les hommes et les femmes sont presque confondus. Sur le deuxime axe, la
plupart dentre eux sont aussi trs proches de leur barycentre ; pour des raisons de clart
seuls les DEUG, qui font exception cette rgle, sont reprsents sur le graphique de
238 10 Comparaison de tableaux de frquence binaire
Tableau 10.4 Profils demplois des hommes et des femmes titulaires dun DEUG, rordonns
suivant le premier facteur.
DEUG
Hommes Femmes
Agriculteur 0 0
Ouvrier non qualifi 0 0
Ouvrier qualifi 0 0
Employ non qualifi 17 4
Employ qualifi 9 19
Technicien 5 0
Cadre moyen 35 63
Cadre suprieur 30 14
Ingnieur 4 0
Total 100 100
la figure 10.8. Lgalit des coordonnes des deux points DEUG-Hommes et DEUG-
Femmes sur le premier axe implique que, en moyenne, le niveau des emplois des
hommes et des femmes qui ont un DEUG est le mme (en loccurrence un niveau
moyen). Sur le deuxime axe, la diffrence est trs importante : la coordonne du point
DEUG-Femmes est trs fortement ngative tandis que celle du point DEUG-Hommes
est trs fortement positive. Les proprits barycentriques indiquent que les femmes
occupent plus que les hommes les emplois de coordonnes ngatives, donc les emplois
moyens. Rciproquement, les hommes occupent plus que les femmes les emplois de
coordonnes positives, cest--dire les emplois extrmes. Cette proprit, dcele sur
le graphique se retrouve dans les donnes initiales (cf. Tableau 10.4).
b) Profils de diplmes de chaque emploi, pour les hommes et pour les femmes
Ltude des projections des lignes supplmentaires permet de comparer les profils
de diplmes des hommes et des femmes emploi gal. Sur le plan 1-2, la situation
est tout fait analogue celle des profils demplois : les coordonnes des couples
de points reprsentant le mme emploi sont presque identiques sur le premier axe
et, pour la plupart dentre eux, trs proches sur le deuxime axe ; cadre moyen, qui
fait exception, est reprsent sur le graphique. En moyenne, le niveau de diplme
des cadres moyens diffre peu entre hommes et femmes, puisque leur coordonne
sur le premier axe est quasiment la mme. Par contre, dans cet emploi, la proportion
dhommes qui possdent des diplmes extrmes (sans-diplme, tudes suprieures)
est suprieure celle des femmes qui ont gnralement des diplmes moyens (cf.
Tableau 10.5).
10.3 Premire analyse : les tableaux en supplmentaire dans lAFC de leur somme 239
Tableau 10.5 Profils de diplmes des cadres moyens, rordonns suivant le premier facteur.
Cadres moyens
Hommes Femmes
Sans diplme 10 3
CAP/BEP 3 9
BEPC 13 4
BAC technique 4 2
BAC gnral 29 34
DUT/BTS/Sant DEUG 10 32
tudes suprieures 13 8
Total 100 100
se dirigent plus vers des emplois demploys que douvriers tandis que les hommes
sont plutt ouvriers. Cela est particulirement marqu pour les titulaires de CAP/BEP
et seuls les diplmes les plus qualifis font exception cette rgle. Les hommes et les
femmes (tous diplmes cumuls) diffrent beaucoup de par leur profil demplois alors
que, tous emplois confondus, ils ont des profils de diplmes analogues : autrement
dit, la tendance moyenne des hommes tre plus souvent ouvriers et moins souvent
employs que les femmes nest pas lie une diffrence de diplmes.
10.3.4 Bilan
Rcapitulons dans quelle mesure cette premire analyse, lAFC de la somme des
tableaux avec ces tableaux en supplmentaires, rpond aux questions poses par la
comparaison des tableaux binaires.
240 10 Comparaison de tableaux de frquence binaire
t = 1 (hommes) t = 2 (femmes)
1 j J 1 j J 1 j J H F
I = catgories d'emplois
1
J = niveaux de diplme
i k ij1 k ij2 k ij. k i.1 k i.2 T= sexes (H, F)
En gris, tableaux mis
I en supplmentaire
Figure 10.10 Structure des donnes dans lAFC des tableaux juxtaposs.
Le tableau actif est de dimensions I et JT.
ingnieur
F2 : 24.3%
H 2 : .321
TUDES SUPRIEURES
cadre suprieur
H
H
H
H F1 : 42.1%
H 1 : .558
F
BAC TECHNIQUE
cadre moyen
F
BAC empl. BEPC
GNRAL
DUT/BTS non
F qualifi
F
empl. F
F qualifi F
Figure 10.11 Le plan des deux premiers facteurs de lAFC des tableaux juxtaposs.
Ainsi, que ce soit dans le nuage des lignes ou celui des colonnes, linertie se dcompose
en deux parts : la part inter-diplmes qui est celle de la premire analyse (celle de la
somme) et la part intra-diplme qui sy ajoute. dintra j est spcifi en 10.5.4.
Dunod La photocopie non autorise est un dlit
Le graphique des deux premiers facteurs (cf. Figure 10.11) est assez semblable
celui obtenu dans lanalyse de la marge. Ceci na rien pour nous tonner car la double
structure dordre, qui est une structure inter-diplmes, est trs forte. Les paragraphes
suivants permettent de comparer plus prcisment les rsultats de ces deux analyses.
Notons seulement ici que, si linertie de ce premier facteur est lgrement suprieure
celle du premier facteur de la somme, le pourcentage dinertie extrait est beaucoup
plus faible, linertie totale tant plus leve.
244 10 Comparaison de tableaux de frquence binaire
Espace entier F1 F2 F3 F4
Inertie totale 1.326 .558 .321 .170 .140
I. inter (en %) .709 .944 .513 .660 .811
I. intra (en %) .291 .056 .487 .340 .189
Sans diplme .057 .013 .105 .050 .070
BEPC .018 .001 .040 .045 .004
CAP/BEP .122 .037 .288 .184 .091
BAC gnral .013 .000 .013 .000 .001
Bac technique .015 .003 .021 .036 .001
DEUG .008 .000 .010 .020 .003
DUT/BTS .032 .002 .002 .001 .017
Suprieur .027 .000 .008 .005 .001
Dans notre exemple o le jeu de donnes est de dimension trs faible, on dcle trs
rapidement cette structure sur les graphiques. Lintrt de cet indice est de la quantifier.
Dans ltude de donnes de dimension plus importante, un tel indice peut apporter un
gain de temps prcieux : une inertie inter aussi importante montre que linterprtation
de laxe doit sappuyer uniquement sur les barycentres.
Le deuxime facteur est mixte : son inertie est pour moiti inter et pour moiti intra.
Son interprtation est plus complexe car elle ncessite de prendre en compte les deux
dispersions. Lcart entre les hommes et les femmes joue un rle important sur cet axe,
surtout au niveau des CAP/BEP et des sans-diplme. La parabole traduisant leffet
Guttman est moins rgulire que dans lAFC de la somme. Le troisime facteur est
encore mixte tandis que le quatrime est plutt inter-diplmes.
Dunod La photocopie non autorise est un dlit
Tableau 10.7 Linertie totale et sa dcomposition inter-sexes et intra-sexe dans lanalyse des
profils demplois.
Espace entier F1 F2 F3 F4
Inertie totale 1.326 .558 .321 .170 .140
I. inter (en %) .172 .070 .506 .092 .001
I. intra (en %) .828 .930 .494 .907 .999
Hommes .465 .544 .244 .313 .824
Femmes .363 .386 .267 .594 .175
La diffrence entre les profils demplois des hommes et des femmes, tous diplmes
cumuls, reprsentent 17 % de linertie du nuage. Elle ninflue que sur le deuxime fac-
teur. Le premier facteur, comme les facteurs 3 et 4, est d exclusivement lcart entre
profils demplois correspondant des diplmes diffrents, tant chez les hommes que
chez les femmes. Notons que le facteur 4 montre une dispersion beaucoup plus impor-
tante chez les hommes que chez les femmes. Sur les autres facteurs, ces dispersions
sont plus quilibres.
Figure 10.12 Deux exemples trs simples de dcomposition de linertie totale en inerties
inter-diplmes, intra-diplmes et inter-sexes. D1 H : diplme 1 pour les hommes.
Tableau 10.8 Qualit de reprsentation du nuage des 8 barycentres des profils demplois et de
deux des 8 sous-nuages.
F1 F2 F3 F4
Barycentres 0.560 0.175 0.119 0.121
CAP/BEP 0.127 0.571 0.193 0.079
Suprieur 0.002 0.074 0.024 0.005
les qualits de reprsentation des nuages dfinis par les sous-tableaux : linertie de ces
sous-nuages est calcule par rapport leur barycentre, comme dans la dcomposition
inter et intra de linertie. Les indices concernant le nuage des barycentres et chacun
des sous-nuages sutilisent de la mme manire que la qualit de reprsentation dun
Dunod La photocopie non autorise est un dlit
point : ils permettent de reprer le ou les facteurs sur lesquels ces nuages sont bien
reprsents et, inversement, de reprer le ou les nuages qui caractrisent un facteur.
Les tableaux 10.8 et 10.9 donnent les qualits de reprsentation du nuage des
barycentres dans les deux dcompositions du nuage des 16 profils demplois et la
qualit de reprsentation de quelques sous-nuages.
Commentons dabord le tableau 10.8.
Cest sur le premier facteur que le nuage des 8 barycentres est le mieux reprsent ;
nous avons dj indiqu que ce facteur est un facteur inter-diplmes.
Par contre, cest sur le deuxime facteur que le petit sous-nuage de deux points
dfini par le niveau de diplme CAP/BEP est le mieux reprsent. Si nous voulons
prciser la diffrence entre les profils demplois des hommes et des femmes titulaires
de ce diplme, cest donc sur le deuxime facteur quil faut surtout se pencher.
248 10 Comparaison de tableaux de frquence binaire
Tableau 10.9 Qualit de reprsentation du nuage des deux barycentres hommes et femmes et
des deux sous-nuages.
F1 F2 F3 F4
Barycentres .174 .724 .069 0
Hommes .500 .120 .087 .190
Femmes .455 .181 .212 .052
1 t T marge t marge
1
On peut songer affecter un poids identique toutes les lignes i. Dans ce cas,
les facteurs sont recentrs lisobarycentre des points, et les barycentres pondrs,
rfrences fondamentales de la situation dindpendance, ne jouent pas leur rle ce
qui diminue considrablement lintrt des rsultats.
Il est plus logique daffecter aux lignes i les poids f i. dfinis par la population
entire. Ceci rsout le problme de la comparaison des facteurs du tableau juxtapos
et de ceux des deux tableaux somme f i j. et f i.t puisque ces tableaux ont tous deux
pour marge f i.. .
Il ne reste alors que le problme de la comparaison des facteurs des sous-tableaux.
Prenons par exemple le tableau dfini en fixant t. Sa marge sur I vaut f i.t (cf.
Figure 10.13). Pour comparer ses facteurs sur I nots Fst (i) aux facteurs dfinis
sur la population entire o la ligne i a le poids f i.. , nous allons les redresser en les
multipliant par le rapport f i.t / f i.. . Cette transformation sappuie sur trois arguments :
250 10 Comparaison de tableaux de frquence binaire
a) Ce redressement permet dobtenir des fonctions centres pour les poids f i.. :
f i.t t
f i.. F (i) = f i.t Fst (i) = 0
f i.. s
i i
b) Le facteur redress apparat comme une mise en perspective du facteur Fst (i), en
tant que terme dcart lindpendance, dans le cadre du tableau juxtapos. En effet, la
formule de reconstitution des donnes applique au tableau t de terme gnral f i jt / f ..t
fait apparatre le modle de rfrence dfini par lindpendance des deux caractres
sur la sous-population t :
f i jt f i.t f . jt 1
= 1+ Fst (i)G ts ( j)
f ..t f ..t f ..t s
ls
Dans cette formule, Fst (i) apparat comme un terme de lcart au modle dindpen-
dance. Une transformation simple de cette formule fait apparatre dune part le modle
de rfrence dfini par lindpendance sur la population entire ( f i.. f . jt ) et, dautre
part, le facteur redress :
f i jt f i.. f . jt f i.t 1 f i.t t
= + t
F (i) G s ( j)
f ..t f ..t f ..t f i.. s
ls f i.. s
c) On peut montrer2 que les facteurs sur I du tableau juxtapos sont les composantes
principales de lensemble des variables suivantes :
1. les facteurs redresss des T sous-tableaux ;
2. les facteurs du tableau somme f i.t .
Dans cette ACP non norme, les facteurs du sous-tableau t ont un poids gal f ..t ,
ceux du tableau somme un poids gal 1 et les individus ont un poids gal f i.. .
Lquivalence entre cette ACP et lAFC est importante. Outre le fait que les facteurs
redresss sintroduisent naturellement dans cette ACP, elle montre que les facteurs
sur I du tableau juxtapos forment le rfrentiel commun adapt la comparaison de
tous ces facteurs. Elle offre aussi une possibilit de calcul exploite dans lanalyse par
sous-tableaux (cf. Section 10.4.6 page 252).
La reprsentation des facteurs norms des sous-tableaux et du tableau somme sur le
cercle des corrlations sobtient facilement partir des rsultats de lAFC du tableau
juxtapos par de simples calculs de corrlation.
2. Cluster Analysis and Data Analysis. M. Jambu and M.O. Lebeaux, NorthHolland, 1983, p.481.
10.4 Deuxime analyse : AFC de variables croises ou de tableaux juxtaposs 251
Tableau 10.10 Corrlations entre les facteurs de lanalyse du tableau juxtapos et ceux des autres
analyses.
b) Rsultats
Pour les facteurs, comme pour les autres indices, on peut dcomposer le mme tableau,
soit en 8 tableaux de 2 colonnes, soit en 2 tableaux de 8 colonnes. Dans la premire
dcomposition, seuls les facteurs de la marge prsentent un intrt puisque les sous-
tableaux nont que deux colonnes et un unique facteur. Inversement, dans la deuxime
dcomposition, nous nous intressons aux facteurs des deux tableaux hommes et
femmes et ngligeons celui du tableau marge qui ne comprend que 2 colonnes.
Commentons le tableau 10.10 qui contient les corrlations entre :
Dunod La photocopie non autorise est un dlit
F3 F4
s3
f2 h3
s2 f3
h2 h4
F2 F3
s4
f4
Figure 10.14 Reprsentation des facteurs des tableaux somme (s), hommes (h) et femmes (f) sur
les plans 2-3 et 3-4 de lAFC du tableau juxtapos.
Le cercle des corrlations du plan 3-4 montre que les facteurs dordre 3 et dordre 4
des tableaux hommes et femmes ne se correspondent pas.
En conclusion, la dimension principale traduite par le premier plan (double structure
dordre) est commune aux deux tableaux. Les dimensions suivantes diffrent.
des tableaux de contingence juxtaposs que si les marges de ces tableaux sont
identiques dun groupe de colonnes lautre. Cette contrainte peut sembler restreindre
fortement le champ des applications : ainsi, on ne peut raliser lAFM du tableau de
la figure 10.10, les sous-tableaux hommes et femmes constituant chacun un groupe
actif. En fait, cette contrainte met en exergue la difficult comparer des tableaux de
contingence ayant des marges diffrentes. Dans ce paragraphe, nous considrons donc
des sous-tableaux ayant la mme marge sur les lignes.
Dans loptique de lAFM sur tableaux de frquence, les classes dindividus sont
dcrites par la rpartition des leurs individus selon plusieurs variables qualitatives. En
rfrence lAFC, la ressemblance entre classes doit tre mesure, au sein de chaque
sous-tableau, par la distance du x2 applique aux profils. Ce point de vue de lAFC se
transpose directement lAFM.
254 10 Comparaison de tableaux de frquence binaire
Remarques
Les Tableaux Disjonctifs Complets peuvent techniquement tre traits soit par lAFM
soit par une analyse par sous-tableaux qui drive de lAFC. Comme il sagit fondamen-
talement de tableaux de variables, la premire solution est prfrable. Notons dailleurs
10.4 Deuxime analyse : AFC de variables croises ou de tableaux juxtaposs 255
que les commentaires concernant les diffrences entre les marges des sous-tableaux
(qui induisent la part inter de linertie) ne concernent pas les TDC qui ont une marge
constante sur I pour chaque variable.
Au sein dune AFM, on peut faire intervenir simultanment des groupes de variables
de type frquence, quantitatif et qualitatif. Les groupes de type frquence doivent
videmment avoir la mme marge sur I et cette marge impose les poids des indivi-
dus pour toute lanalyse, mme si les groupes de type frquence sont introduits en
illustratifs.
prcisment, linertie intra-emploi est quatre fois plus faible que linertie intra-diplme.
Autrement dit, si la rpartition des emplois diplme gal varie beaucoup dun sexe
lautre, celle des diplmes emploi gal est bien moins diffrencie.
Diplmes
Diplmes Diplmes
Emplois Hommes
Emplois Femmes
mme rsultat que lAFC de leur somme et la structure commune est analyse (cas du
tableau croisant, par canton, les causes de mortalits I avec les classes dge J : la
diffrence entre les causes de mortalit dune classe dge lautre est beaucoup plus
importante que dun canton lautre pour une mme classe dge). Si, au contraire,
ce sont les carts qui prdominent, cette AFC reprsente bien les diffrences et mal la
structure commune. Par son caractre mixte, cette analyse nest pas la mieux adapte,
ni ltude de la structure commune, ni celle des carts.
dans lAFC du tableau juxtapos, en recentrant lorigine tous les sous-nuages com-
poss des T colonnes homologues. Toute la dispersion inter du nuage initial tant
ainsi supprime, il ne reste que la part intra qui peut tre analyse quelle que soit son
importance relative. Ce qui rsout le problme, par exemple, de la comparaison des
causes de mortalit dans les diffrents cantons classe dge gale.
Cette question est la duale de la prcdente. En effet (cf. section b page 242),
linertie du nuage des lignes (emplois) construit dans lAFC des tableaux juxtaposs
se dcompose, comme celle du nuage des colonnes, en une part inter-diplmes et
une part intra-diplmes. Pour un emploi donn, caractris par les pourcentages des
diplms des deux sexes, le carr de sa distance un autre emploi est donn par la
diffrence entre leurs profils de diplmes les deux sexes tant cumuls (part inter)
et la diffrence entre les pourcentages dhommes et de femmes diplme fix (part
intra). De mme, dans lexemple du tableau croisant des entreprises (I ), des catgories
demplois (J ) et des annes (T ), les distances entre entreprises induites par la variable
croise J T se dcomposent en une part inter (induite par J , toutes annes cumules)
et une part intra (volution de la rpartition des emplois). Pour analyser les volutions,
il faut une analyse dans laquelle ne subsiste que la part intra.
La solution gomtrique consiste construire un nuage dans lequel les distances
sont ces distances intra.
de ces nuages ont pour coordonnes les diffrences entre les profils des lignes (resp.
colonnes) du tableau de donnes et du tableau modle. Les mtriques et les poids sont
identiques ceux de lAFC.
Techniquement, il est possible dobtenir les rsultats de la gnralisation de lAFC
en appliquant un programme classique dAFC aux donnes pralablement transfor-
mes : comme le programme dAFC se rfre au modle produit des marges, il faut
introduire le nouveau modle et supprimer le modle ancien. Le tableau trait
scrit alors :
f i j m i j + f i. f . j
Lorsque le modle nest autre que le produit des marges, on obtient lAFC classique.
Ce tableau peut comporter des termes ngatifs mais ses deux marges, tant gales aux
marges communes des donnes et du modle, sont positives et les programmes dAFC
peuvent sappliquer. Une ligne i (resp. une colonne j), dans le nuage centr dfini
dans lAFC de ce tableau (obtenu en prenant comme origine le barycentre f . j - resp.
f i. -), reprsente bien la diffrence entre son profil dans les donnes et dans le modle
puisque son terme gnral vaut :
fi j mi j
+ f. j f. j
f i. m i.
Dunod La photocopie non autorise est un dlit
Les marges du tableau analys tant gales celles du modle, les poids et les
mtriques sont identiques ceux de lAFC du tableau f i j .
Contrairement lAFC classique, la formule de transition comprend des termes
ngatifs.
1 fi j m i j
Fs (i) = G s ( j)
ls f i.
j
Dans la reprsentation superpose des lignes et des colonnes, une ligne i est du ct
des colonnes auxquelles elle sassocie plus dans les donnes que dans le modle et
loppos de celles auxquelles elle sassocie moins que dans le modle. En effet, dans
le premier cas, le coefficient de la formule de transition est positif tandis que dans le
second cas il est ngatif. Le mme raisonnement vaut pour les colonnes.
260 10 Comparaison de tableaux de frquence binaire
i fijt fi..
f
ij.
I m = f
ijt f . jt
. j.
m = f
(1,1) ( j,t) (J,T) marge i.. i..
m = f
1 . jt . jt
m =f
i m ijt fi.. ij. ij .
marge f.jt
Il est possible de gnraliser lAFC un modle dont les marges sont diffrentes
de celles du tableau des donnes. Dans ce cas, un programme spcial est ncessaire et
linterprtation est plus dlicate. Nous nexposerons pas la technique gnrale3 .
f i j.
m i jt = f . jt
f . j.
m i j. = f i j. et m . jt = f . jt
m i jt f i j. m i j.
= =
m . jt f . j. m . j.
m i jt m i j. m . jt
=
m . j. m . j. m . j.
f i j. f . jt
ri jt = f i jt + f i.. f . jt
f . j.
262 10 Comparaison de tableaux de frquence binaire
bacheliers (hommes)
RI
bacheliers
bacheliers (femmes)
Figure 10.17 Dans lanalyse intra, les sousnuages de colonnes homologues sont translats pour
faire concider leur barycentre avec lorigine.
f i jt fl jt
2
1 f i j. fl j.
2
1
2
d (i, l) =
f i.. fl.. f . jt f i.. fl.. f . j.
jt j
Dans la seconde criture, le premier terme correspond la distance (entre les profils i
et l) dans lAFC du tableau juxtapos. Le second correspond la distance dans lAFC
du tableau somme. Confronte aux quations de la section b page 242, cette quation
exprime nouveau le rle exclusif des diffrences intra-diplme dans le calcul des
distances dans cette variante de lAFC. Autrement dit, la distance entre deux emplois
ne dpend pas de la rpartition des diplmes, mais seulement des diffrences entre les
pourcentages dhommes et de femmes pour chaque niveau de diplme.
Formules de transition
Dans notre exemple, le modle traduit lhypothse suivante : pour chaque diplme j,
il y a indpendance entre lemploi et le sexe. Les emplois loin de lorigine dans lAFC
de ri jt sont donc ceux qui, pour certains diplmes au moins, nattirent pas de la mme
faon les deux sexes. Par exemple, sur un axe, un emploi est situ du mme ct quun
diplme-homme si, parmi les titulaires de ce diplme, cet emploi attire trop les
hommes.
Inertie
Linertie totale du nuage des lignes et du nuage des colonnes est linertie intra-diplme.
Cette inertie est assez importante : nous avons vu (cf. Tableau 10.6) quelle reprsente
Dunod La photocopie non autorise est un dlit
Premier facteur
Le premier facteur extrait 61 % de linertie. Le diplme qui contribue le plus ce
facteur est le CAP/BEP dont la contribution linertie est de 29 % pour le CAP/BEP-
Hommes et de 35 % pour le CAP/BEP-Femmes (donc 64 % en tout). Les deux points
reprsentant le mme diplme sont opposs sur le graphique, puisque le barycentre
de chaque sous-nuage (ici de deux points) est situ lorigine. La prpondrance
du CAP/BEP ne nous tonne pas puisque nous avons vu (cf. Tableau 10.6) que le
sous-nuage quil dfinit a une inertie intra trs suprieure aux sous-nuages dfinis par
les autres diplmes : cest le diplme pour lequel la rpartition des emplois est la plus
diffrente entre les hommes et les femmes. Cette diffrence est entirement explique
par le premier facteur puisque la qualit de reprsentation de chacun des deux points
264 10 Comparaison de tableaux de frquence binaire
F2 : 15.4 % H DUT-BTS
2 : .060
technicien
Diplme homme
Diplme femme
Emploi
ingnieur
H BAC GNRAL
H DEUG
vaut 0.92 (elles sont forcment identiques puisque les deux points sont aligns avec O).
Ce facteur explique bien aussi la diffrence entre les profils demplois du BEPC et des
Bacs techniques qui sont aussi des diplmes de niveau moyen. On peut remarquer que
tous les diplmes-hommes sont situs droite tandis que tous les diplmes-femmes
sont gauche. Le premier facteur traduit donc une tendance gnrale de lcart entre
les profils demplois des hommes et des femmes, valable pour chaque diplme et
particulirement marque pour les CAP/BEP et les Bacs Techniques.
La projection des emplois permet dexpliquer cette diffrence. Du ct des femmes,
on trouve les employs qualifis (dont la contribution laxe est de 0.44) et du ct
des hommes, les techniciens, les ouvriers qualifis et dune faon gnrale les emplois
techniques : diplme gal, les hommes occupent plutt des emplois techniques. Cette
diffrence entre les profils demplois des deux sexes apparat en partie au niveau du
10.5 Troisime analyse : analyse intra 265
Deuxime facteur
Le deuxime facteur reprsente 15 % de linertie. Il est dtermin essentiellement par
lemploi de technicien qui attire les hommes et repousse les femmes titulaires dun
DUT/BTS/Sant beaucoup plus quil ne le ferait dans lhypothse dindpendance
conditionnelle. Contrairement au premier facteur, les diplmes des hommes et des
femmes ne sont pas ici systmatiquement opposs.
10.5.6 Bilan
Facilit de linterprtation
On pourrait craindre que linterprtation de lanalyse intra soit complexe car elle
utilise des notions de conditionnement qui aboutissent des concepts difficiles. Or,
lexprience montre que linterprtation de ses rsultats ne pose aucun problme
particulier un utilisateur ayant une pratique de lAFC. Elle sappuie, comme elle,
sur les formules de transition et sur les indices classiques daide linterprtation : la
qualit de reprsentation et la contribution linertie des lignes et des colonnes. La
diffrence essentielle avec lAFC classique, la situation modle laquelle on se rfre,
sintgre sans difficult.
lanalyse de chacun des sous-tableaux, les nuages des cantons sont centrs alors
que, dans lanalyse du tableau juxtapos [dcs(cantonsclasses dge)], les sous-
nuages dfinis par une classe dge ne le sont pas. Dans lanalyse intra, le nuage
classes dgecantons est lunion de ces T nuages centrs ; et dualement, le nuage
des causes de mortalit est un nuage dans lequel les distances au carr sont les sommes
des carrs des distances dfinies par chaque classe dge. Ainsi, une diffrence de
mortalit entre deux cantons pour une certaine cause j, peu significative lorsque lon
tudie les classes dge sparment (du fait des faibles effectifs), peut devenir notable
dans lanalyse intra si elle apparat dans lensemble des classes dge.
Classification intra
Il est possible dappliquer un programme classique de classification aux facteurs
obtenus par une analyse intra. On obtient ainsi des partitions des lignes ou des colonnes
266 10 Comparaison de tableaux de frquence binaire
suivant les proximits dfinies dans lanalyse intra ; ce rsultat est quelquefois le
principal objectif dune telle analyse.
10.6 CONCLUSION
Il est assez tonnant de voir le nombre de traitements diffrents, et par-l mme de
regards diffrents, que lon peut porter sur ces deux petits tableaux.
10.6 Conclusion 267
des liaisons binaires entre Emplois et Diplmes, entre Emplois et Sexes et entre
Diplmes et Sexes ne prsente gure dintrt.
Pour clore ce chapitre, voquons le caractre spcifique de la dimension temporelle.
Les tableaux ternaires sont souvent dfinis par une suite de tableaux binaires indics par
le temps. Le problme pos au statisticien sexprime alors trs souvent sous la forme
du souhait de faire entrer la notion de temps dans lanalyse . Aucune technique ne
permet dintgrer rellement cette notion ; on considre tout au plus lordre induit par
cette dimension. Cet ordre nintervient mme pas dans les calculs fondamentaux des
techniques prsentes. Il est possible cependant de le faire apparatre au moment de
linterprtation des rsultats. Pour le matrialiser sur les graphiques de projection des
nuages, on relie dans lordre les points qui reprsentent le mme objet.
Chapitre 11
11.1 PROLGOMNES
Depuis toujours, ou presque, le terme interprter est utilis propos de ltude
de rsultats statistiques. LAnalyse Factorielle nchappe pas cette rgle : les plans
factoriels ne sont pas tudis, ils sont interprts. Ce terme recouvre plusieurs sens
et, avant de proposer une dmarche dinterprtation, il est utile au pralable den
dlimiter le champ. Pour cela, nous postulons que ce nest pas par hasard si le terme
interprter a t dabord choisi puis surtout consacr par lusage. Nous avons donc
utilis un bon dictionnaire (le Robert !) pour explorer le champ smantique de ce terme
si employ. lissue de cette exploration, nous indiquons dans quelle mesure on peut
proposer une dmarche gnrale dinterprtation.
Une interprtation est aussi personnalise du fait de certains choix caractre plus
ou moins technique. On peut jouer, par exemple, sur le ressort de la dualit : dans
une ACP par exemple, il peut tre plus clair de parler des principales dimensions
de variabilit (on privilgie alors les variables) ou de tendances reprsentes par
des classes dindividus que lon dcrit. Une autre alternative importante est : faut-il
commenter les axes ou les plans ? On est souvent tent dorienter un commentaire de
plan selon dautres directions pas forcment orthogonales que les axes factoriels
(cas dune bissectrice dans un plan issu de lenqute Ouest-France du chapitre 6
page 127).
Les rsultats issus dune Analyse Factorielle posent le problme de la dmarche
dinterprtation, cest--dire de lordre chronologique dans lequel ces diffrents rsul-
tats doivent tre examins. Dans les sections suivantes, nous proposons une dmarche
dinterprtation pour chacune des mthodes factorielles tudies dans cet ouvrage.
La premire prsentation se rfre lACP : elle est la plus dtaille en ce sens
quelle introduit les aspects gnraux communs toutes les mthodes.
Les autres prsentations sappuient sur ce premier schma, en dveloppant uni-
quement les points sur lesquels la dmarche dinterprtation diffre, entre la
mthode examine et lACP.
Enfin, en guise de conclusion, une dernire section rcapitule quelques types de
facteurs auxquels peut conduire linterprtation.
a) Valeurs propres
Rappelons que la premire valeur propre est toujours comprise entre 1 et le nombre
de variables K . Elle vaut 1 lorsque les variables sont toutes non corrles deux deux.
Elle est gale K lorsquil existe une liaison linaire parfaite entre toutes les variables.
Dans le cas limite dune premire valeur propre proche de 1, on est conduit deux
attitudes diffrentes selon lobjectif de lanalyse :
considrer lensemble des dimensions si lon cherche un rsum des donnes ;
ne considrer aucune dimension si lon sintresse aux liaisons entre variables.
Plus la valeur propre est grande, plus elle rsume de variables et plus le facteur
risque dtre intressant en terme de synthse. La situation est claire pour la premire
valeur propre puisque lon connat ses valeurs extrmes. Pour les valeurs propres
suivantes, la valeur 1 reste un point de repre : une composante principale est une
variable synthtique, et une valeur propre associe infrieure 1 indique que cette
variable synthtise moins de donnes quune variable isole. Il convient donc de
redoubler de prudence dans linterprtation dun facteur associ une valeur propre
proche ou infrieure 1. La valeur 1 ne peut toutefois tre utilise comme seuil
absolu : lexprience fournit, loccasion, des facteurs clairement interprtables dont
limportance trs faible relativement aux autres conduit une valeur propre infrieure
1.
Enfin, il est quelquefois utile de considrer le nombre de valeurs propres pratique-
ment nulles , ce qui permet de calculer la dimension relle des donnes analyses.
Le diagramme des valeurs propres, appel souvent abusivement histogramme,
est utilis surtout pour tudier lallure de la dcroissance de ces valeurs. Le principe
de lecture de ce diagramme est le suivant : si deux facteurs sont associs des valeurs
propres presque gales, ils reprsentent la mme part de variabilit et il ny a pas
lieu a priori de retenir lun et non lautre dans linterprtation. Rciproquement,
Dunod La photocopie non autorise est un dlit
une forte dcroissance entre deux valeurs propres successives incite retenir dans
linterprtation les facteurs prcdant cette dcroissance.
Dans la pratique, on observe souvent le phnomne suivant : les S premires valeurs
propres prsentent une dcroissance assez irrgulire ; puis, au del du rang S, la
dcroissance est lente et rgulire. Cette allure indique que les S premiers facteurs
correspondent chacun des irrgularits dans la forme du nuage de points tudi qui
demandent tre interprtes et suggre que les facteurs suivants ne reprsentent que
linvitable bruit qui accompagne toute observation de nature statistique.
Cas extrme, une dcroissance lente et rgulire ds la premire valeur propre
traduit un nuage peu prs sphrique et donc des donnes peu structures dont les
facteurs sont peu synthtiques. Un diagramme de ce type prsage un intrt limit des
facteurs.
274 11 Interprtation des rsultats dune analyse factorielle
Si ce facteur est lun des premiers, lindividu concern est ncessairement trs
diffrent des autres. Un tel cas particulier est dune part facilement mis en vi-
dence sans lanalyse et, dautre part, gne ltude du reste de la population. Il faut
alors envisager de refaire une analyse en supprimant cet individu des lments
actifs, ce qui modifie le champ de ltude. Cette nouvelle analyse peut ne diffrer
que de trs peu de la premire. En effet, on peut montrer que si linertie sur
laxe s de lindividu supprim est infrieure la diffrence entre ls et ls+1 , les
facteurs de la nouvelle analyse sont trs corrls ceux de lancienne ; lindividu
est certes trs diffrent des autres, mais comme cette diffrence sinscrit dans une
tendance gnrale il ne perturbe pas les rsultats.
276 11 Interprtation des rsultats dune analyse factorielle
Si lon observe un tel facteur aprs quelques facteurs gnraux prenant en compte
beaucoup dindividus, lanalyse nest pas ncessairement remise en cause : il
est naturel, aprs avoir extrait des tendances gnrales, que des phnomnes
ponctuels apparaissent.
Attention : il ne peut tre question dexclure des individus dune analyse en se fondant
uniquement sur des critres dinertie car cette exclusion implique une modification
des objectifs. Un exemple fictif illustrera cette situation. Supposons que ltude porte
sur les 120 exploitations agricoles orientes vers llevage laitier dune rgion et
que le premier axe mette en vidence le caractre exceptionnel de lexploitation 27.
Renseignements pris, on saperoit que cette exploitation est rattache une Ecole
dAgronomie bien connue, alors que les autres sont de structure familiale classique.
Exclure cette exploitation revient modifier le thme de ltude qui devient ltude
des exploitations familiales orientes vers llevage laitier.
Remarquons enfin quen ACP norme, ce problme dlments exceptionnels ne
concerne que les individus. En effet, les variables possdent chacune la mme inertie.
Les variables trs lies au facteur prsentent une coordonne positive pour les
unes et ngative pour les autres. Il faut alors rechercher un dnominateur commun
qui, la fois, relie les variables situes du mme ct et oppose les variables
situes de part et dautre de lorigine. Par exemple, supposons que les variables
soient des notes dans diffrentes matires : un facteur peut traduire lopposi-
tion entre matires scientifiques et matires littraires. Cette phase permet dj
dobtenir la signification gnrale de certains axes.
et/ou peut suggrer de rexaminer un facteur dlaiss sur la seule vue des variables
actives. Ce dernier point, qui donne une certaine prminence aux variables supplmen-
taires, est important. Lexistence de variables supplmentaires trs lies un facteur,
en tant que validation a posteriori, fournit une forte prsomption selon laquelle ce
facteur est charg de sens.
Valeurs propres
Linertie de chaque variable ne vaut pas systmatiquement 1. Les valeurs propres ne
sont donc pas comparables dune analyse lautre. Le seuil de 1 na plus de signifi-
cation. On sappuie plutt sur les pourcentages dinertie pour apprcier limportance
Dunod La photocopie non autorise est un dlit
dun facteur.
Pourcentages dinertie
Une variable r modalits est reprsente par un sous-espace de dimension r 1
(cf. section 4.3.5 page 95). Lorsquun facteur est trs li cette variable (cest--
dire si le rapport de corrlation entre la variable et le facteur vaut 1), le pourcentage
dinertie extrait de cette variable est 100/(r 1). Il en rsulte que, lorsque les variables
possdent un grand nombre de modalits, mme les pourcentages dinertie associs
aux premiers facteurs sont, du fait de la nature du tableau, trs faibles.
il peut tre intressant de raliser des graphiques dans lesquels les variables ont
pour coordonne sur laxe s leur contribution au facteur de rang s (cf. figure 4.6
page 98). Ce graphique facilite la slection prcdemment cite et fournit une
visualisation des proximits entre variables.
Linterprtation de linertie projete des variables en tant que rapport de corrlation fait
quil est intressant de calculer cette quantit aussi pour les variables supplmentaires.
ne peut rien en dire (sinon que lon nest pas dans le cas prcdent). Les valeurs propres
suivantes ne peuvent tre interprtes de la mme faon puisque leur valeur maximum
dpend de la structure de chacun des groupes : du fait de la pondration, si chacun
des groupes prsente un facteur prpondrant, la seconde valeur propre de lanalyse
globale est ncessairement faible, mme si elle correspond au deuxime facteur de
chaque groupe. En revanche, le diagramme des valeurs propres et des pourcentages
dinertie se lit comme dans les autres mthodes factorielles.
compltes de chaque groupe, de les faire aprs lAFM. Nous proposons dtudier les
indices concernant les liens entre les groupes et les facteurs dans lordre suivant.
Corrlations entre les facteurs communs et leurs reprsentants dans les
groupes
Lorsque les corrlations entre un facteur de lensemble des groupes et ses reprsentants
dans tous les groupes sont proches de 1, il sagit dun facteur commun aux groupes (cf.
section 8.3.5 page 187). Comme les groupes que lon tudie simultanment sont gn-
ralement lis entre eux (ce qui est conforme lintuition de lanalyste qui les tudie
simultanment), il y a au moins un facteur pour lequel plusieurs de ces corrlations
sont assez leves.
On dit quun facteur est commun aux groupes pour lesquels ces corrlations sont
fortes (cest--dire que la tendance quil traduit apparat dans ces groupes) et quun
facteur nexiste pas dans les groupes pour lesquels ces corrlations sont faibles.
Il peut arriver quun seul groupe ait une corrlation importante avec un facteur
donn. Le facteur est alors une dimension spcifique du groupe.
Il peut arriver aussi quun groupe nait de corrlations leves quavec des facteurs
qui lui sont spcifiques. On en dduit alors labsence de liaisons linaires entre ce
groupe et les autres. Il est gnralement judicieux de recommencer alors lanalyse en
supprimant (des groupes actifs tout au moins) ce groupe.
Pour dcider si une corrlation est faible ou leve, il ny a pas de limite bien
dfinie. Cela dpend du nombre dindividus et du nombre de groupes. Lorsquelles ne
sont trs proches ni de 1 ni de 0, on raisonne -comme toujours dailleurs- en termes
de comparaison. On regarde pour un facteur donn si les corrlations associes
chaque groupe sont, ou non, du mme ordre de grandeur ; on ordonne les groupes
par corrlation dcroissante. Inversement, pour un groupe donn, on examine et on
ordonne les corrlations associes aux diffrents facteurs pour reprer les facteurs
proches de directions de dispersion de ce groupe. On regarde aussi de quels autres
groupes ces facteurs sont proches.
Rapport [inertie inter / inertie totale]
Cet indice concerne lensemble des groupes. Proche de 1, il confirme le caractre
commun dun facteur, ce que des corrlations leves ont dj pu faire pressentir.
Dans ce cas, les points reprsentant le mme individu travers les diffrents groupes
sont globalement proches. La reprsentation superpose est alors utilisable pour un tel
facteur.
Coordonnes et aides linterprtation des groupes
Rappelons que la coordonne du groupe j le long de laxe de rang s sinterprte aussi
comme la contribution absolue des variables du groupe j au facteur s, cest--dire en
tant que mesure de liaison entre le groupe j et le facteur s.
11.5 Interprtation dune AFM 287
de relier lanalyse globale aux analyses spares en rpondant aux questions suivantes :
le facteur global dordre s est-il proche dun des facteurs de chaque groupe ? Sur quels
facteurs globaux les premiers facteurs des groupes sont-ils bien reprsents ?
Conclusion
ce niveau, on peut dcider de continuer le dpouillement des rsultats ou de refaire
une analyse en modifiant le nombre de groupes actifs et/ou la rpartition des variables
dans les groupes, etc. Une telle dcision peut intervenir lorsque lon a trouv soit
un groupe indpendant des autres, soit une anomalie dans la structure des groupes,
soit plusieurs ensembles de groupes assez distincts entre eux pour justifier des tudes
spares, soit des facteurs trop peu communs. Lattitude vis--vis des groupes est
analogue celle que lon peut avoir vis--vis des variables en ACP ou en ACM. On
peut les considrer en quelque sorte comme des supervariables .
288 11 Interprtation des rsultats dune analyse factorielle
individus caractriss par chacun des groupes, les variables sont centres sur cet
ensemble rpt dindividus, alors quen AFM elles le sont sur chaque groupe (comme
dans lACP juxtaposant les variables).
lments aberrants nont fait que mettre en vidence un facteur non-rponse qui
serait peut-tre pass inaperu sans eux, car alors affect dun rang lev.
sur des individus : avec ce type de donnes, le facteur prcit classe les individus
depuis ceux qui prsentent les plus faibles valeurs pour lensemble des variables (cest-
-dire les petits) jusqu ceux qui prsentent les plus fortes valeurs pour lensemble
des variables (cest--dire les grands).
En revanche, cela conduit ngliger les facteurs suivants qui sont des fonctions poly-
nmes du premier. Leffet Guttman est plus ou moins net selon lintensit, dans les
donnes, du phnomne quil met en vidence. Si le premier plan factoriel fait appa-
ratre un nuage de points dont la forme parabolique est floue, il est possible que
linfluence du premier facteur ne se fasse sentir que sur quelques axes seulement : il
est alors possible de trouver des facteurs de rang moyennement lev (e.g. 3, 4 ou 5)
sinterprtant indpendamment du premier (cf. section b page 234). Il est donc prudent
de sassurer dun effet Guttman au del des deux premiers facteurs.
En ACM, on observe ce phnomne surtout lorsque les modalits de chacune des
variables sont ordonnes a priori. Par exemple, si des variables qualitatives proviennent
du recodage dun ensemble de variables quantitatives dont lACP produit comme
premier facteur un effet taille, lACM de ces variables qualitatives conduit presque
automatiquement un effet Guttman, le premier axe supportant la mme interprtation
globale dans les deux analyses. En ce sens, lACM est susceptible de mettre en
vidence un effet taille ; cet effet se traduit par plusieurs facteurs (au maximum r 1
si les variables possdent chacune r modalits), alors quil se traduit par un facteur
unique en ACP.
Fiches techniques
a) Moyenne et barycentre
Si limportance des individus est la mme pour tous, la moyenne de la variable x,
note x, est gale :
1
x = xi
I
i
b) Variance et inertie
Si limportance des individus est la mme pour tous, la variance dune variable x,
note sx2 , est gale :
1
sx2 = (xi x)2
I
i
Si lindividu i a un poids pi elle scrit :
sx2 = pi (xi x)2 / pi
i i
Lorsque les poids sont tels que i pi = 1 on a : = i pi (xi x)2 .
sx2
La variance mesure la dispersion des valeurs autour de la moyenne. Le fait de
considrer les carrs des carts et non les valeurs absolues des carts facilite les calculs
et permet des dcompositions suivant le thorme de Pythagore et celui de Huygens
rappel plus loin. Lcart-type sx est la racine carre de la variance.
La notion statistique de variance correspond la notion mcanique dinertie
dun nuage de points par rapport son barycentre.
En effet, linertie dun point i de poids pi par rapport un point A de coordonne
xa est, par dfinition, le produit du poids de i par le carr de sa distance A soit :
pi (xi xa )2 .
Linertie dun nuage de points est la somme des inerties des points du nuage.
Linertie dun nuage de points reprsent sur un axe, par rapport
au point G dabscisse
x, est gale i pi (xi x) ; on retrouve la variance lorsque i pi = 1.
2
c) Thorme de Huygens
La forme la plus simple du thorme de Huygens est la relation entre linertie dun
nuage par rapport un point quelconque Z dabscisse z et son inertie par rapport
G. La premire est gale la seconde augmente de linertie, par rapport Z, de G
affect du poids total du nuage :
pi (xi z) =
2
pi (xi x) +
2
pi ( x z)2
i i i
12.1 Fiche 1 : moyenne et barycentre, variance et inertie 297
Inertie totale
xj x xl
Inertie inter
Figure 12.1 Thorme de Huygens pour une variable. 8 points sont rpartis en 2 sous-nuages de
4 points : I j (carrs) et Il (disques).
Dunod La photocopie non autorise est un dlit
a) Centrage et rduction
Le point G de coordonnes ( x , y) est le barycentre des points du nuage munis des
poids pi . Quand on retire chaque valeur xi la moyenne x et chaque valeur yi la
moyenne y, on obtient un tableau centr. La transformation gomtrique qui permet
298 12 Fiches techniques
de passer du nuage associ au tableau initial au nuage associ au tableau centr est
une translation qui fait concider lorigine O et le barycentre G.
Quand on divise les valeurs xi x par sx et les valeurs yi y par s y , on obtient un
tableau centr-rduit. La transformation gomtrique qui permet de passer du nuage
centr au nuage centr-rduit est la composition de deux homothties de centre G (la
premire, de rapport 1/sx dans la direction de x, la seconde, de rapport 1/s y dans la
direction de y). Une autre faon de voir cette transformation est de considrer que lon
adopte sx et s y comme units de mesure (cf. Figure 12.2).
Un nuage centr-rduit possde, en projection sur chaque axe, une inertie gale 1.
y y y
G
O x G x G x
A B C
Figure 12.2 Nuage associ aux mmes 2 variables x et y brutes (A), centres (B) et
centres-rduites (C).
b) Thorme de Huygens
2
Le carr de la distance dun point i lorigine vaut : Oi = xi2 + yi2 . On en dduit
que :
2
inertie de i = pi Oi = pi xi2 + pi yi2
Do, pour le nuage des points i :
2
inertie totale = pi Oi = pi xi2 + pi yi2
i i i
Linertie du nuage se dcompose donc suivant les deux axes : elle est la somme
des inerties de ses deux projections suivant les deux directions orthogonales. Si les
variables sont centres, elle est donc gale la somme des variances des deux variables.
Si les variables sont centres-rduites, linertie du nuage vaut 1 dans chaque direction
et vaut donc 2 dans le plan.
Le thorme de Huygens se gnralise sans difficult au cas de deux variables
puisque linertie dun nuage se dcompose sur chaque axe suivant le thorme de
Pythagore (cf. Figure 12.3).
12.2 Fiche 2 : reprsentation des variables dans R I 299
G G G
G2 G1 G2 G1
Une variable x dfinie sur un ensemble I dindividus est reprsente par un vecteur
de R I dont les I composantes sont gales aux valeurs xi prises par la variable x pour
lindividu i.
x = (x1 , . . . , xi , . . . , x I )
Sur lespace R I est dfini un produit scalaire (cf. Fiche 3). Si les poids des indivi-
dus sont tous gaux, le produit scalaire entre deux vecteurs x et y scrit :
1
x, y = xi yi
I i
300 12 Fiches techniques
Plus gnralement, si les individus ont des poids pi tels que i pi = 1 :
x, y = pi xi yi
i
Soit u le vecteur colinaire la premire bissectrice dont toutes les composantes sont
gales 1. Ce vecteur a pour norme 1 :
u = (u 1 , . . . , u i , . . . , u I ) = (1, . . . , 1, . . . , 1)
2
u = u, u = pi u i2 = pi = 1
i i
12.2.2 Centrage
La moyenne x dune variable x est gale la coordonne de la projection de x sur u :
x = pi xi = pi xi u i = x, u
i i
xu = projection orthogonale de x sur u
x xu = (x1 x, . . . , xi x, . . . , x I x)
= x [projection orthogonale de x sur u]
12.2.3 Rduction
La variance dune variable x est gale au carr de la norme du vecteur reprsentant la
variable centre ; son cart-type sx est gal la norme de ce vecteur :
2
variance de x = pi (xi x)2 = x xu = sx2
i
12.3 Fiche 3 : distance, norme et produit scalaire 301
RI u
xu
x
u
x xu
pi (xi
x )(yi
y)
i xx u,y
y u
corrlation(x, y) = r(x, y) = sx s y = xx uyy u
x,y
= xy si x et y sont centres
= x, y si x et y sont centres et rduites
Plus la corrlation entre les variables est leve, plus langle entre les vecteurs est
faible. Si la corrlation entre x et y est nulle, les vecteurs sont orthogonaux ; si elle est
gale 1 ou -1, les vecteurs sont colinaires.
y
RI
1 y/sy
x et y sont deux variables centres.
x Leurs normes sont gales leurs carts-
types sx et s y . Le produit scalaire entre
x/sx les deux variables normes est gal leur
r(x, y)
O coefficient de corrlation r(x, y).
1
Figure 12.6 Distance, norme et produit scalaire dans le plan. Les vecteurs x et y se dcomposent
sur la base e1 , e2 .
La notion la plus gnrale est la notion de distance qui peut tre dfinie sur un
ensemble quelconque. Sur un espace vectoriel, une distance peut driver dune norme,
on parle alors despace norm. Une norme peut elle-mme driver dun produit scalaire.
Une norme qui drive dun produit scalaire est une norme euclidienne et la distance
qui en dcoule est une distance euclidienne. On appelle espace euclidien un espace
12.3 Fiche 3 : distance, norme et produit scalaire 303
vectoriel rel de dimension finie sur lequel est dfini un produit scalaire. Dans la suite,
nous parlerons uniquement de lespace R n , seul espace utilis en analyse factorielle (n
dsigne la dimension de lespace). Nous parlons aussi de mtrique euclidienne pour
dsigner la structure dfinie sur R n par un produit scalaire.
12.3.2 Distance
Une distance sur un ensemble E est une application du produit de E par lui-mme
dans R + : tout couple de points (x, y) est associ un nombre positif, la distance entre
x et y note d(x, y).
Cette application vrifie certaines proprits quels que soient x et y appartenant
E:
d(x, y) = 0 si et seulement si x = y
d(x, y) = d(y, x)
d(x, y) d(x, z) + d(z, y) (ingalit triangulaire)
12.3.3 Norme
Une norme sur R n est une application de R n dans R + : tout vecteur x est associ un
nombre positif, la norme de x, note x.
Cette application vrifie certaines proprits (O = origine des axes) :
x = 0 si et seulement si x = O
ax = |a| x pour tout x de R n et tout a de R
x + y x + y pour tous x et y de R n
Toute norme induit une distance par la relation : d(x, y) = x y. Ainsi, lors-
quune distance drive dune norme :
304 12 Fiches techniques
1. la distance dun point lorigine O des axes est la norme (ou longueur) du
vecteur qui le joint O ;
2. la distance entre deux points x et y est la longueur du vecteur qui joint ces deux
points (cf. Figure 12.3).
Une distance qui drive dune norme a des proprits spcifiques.
2
La distance usuelle de R 2 drive de la norme : x = x12 + x22
Plus gnralement, la distance usuelle de R n drive de la norme :
2
n
x = (xi )2
i=1
x, x = 0 si et seulement si x = 0
x, y = y, x(symtrie)
ax + by, z = ax, z + by, z (bilinarit)
z, ax + by = az, x + bz, y (bilinarit)
x, y = x1 y1 + x2 y2
n
x, y = xi yi
i=1
12.3.5 Angles
Un produit scalaire induit, en plus de la notion de norme, la notion dangle. Langle
u entre deux vecteurs x et y est dfini par son cosinus qui, par dfinition, est gal au
produit scalaire de ces deux vecteurs divis par le produit de leurs normes :
x, y
cos u =
x y
Le cosinus est compris entre -1 et 1. Sil vaut 1, les vecteurs sont colinaires et de
mme sens ; sil vaut -1, ils sont colinaires de sens oppos.
x = x, x = x M x
2
306 12 Fiches techniques
La structure de la matrice M est souvent utilise pour qualifier une mtrique. Ainsi,
on parle de mtrique diagonale si M est diagonale. De mme, la distance euclidienne
usuelle tant associe la matrice identit, on la nomme souvent mtrique identit .
Si le produit scalaire nest pas le produit scalaire usuel, la distance induite ne cor-
respond pas la vision habituelle. Pour obtenir une reprsentation des distances
directement perceptible loeil, il faut se ramener au produit usuel. Pour cela il suffit
dexprimer et de reprsenter les points dans une base orthonorme pour le produit
scalaire considr. Cest ce qui est fait en analyse factorielle.
Dans le cas dune mtrique diagonale, une base orthonorme se dduit de la base
canonique en divisant les vecteurs de base par leur norme, ce qui revient multiplier
les coordonnes correspondantes par cette norme.
Prcisons cela en prenant lexemple de R 2 muni de la mtrique diagonale valant 4
pour le premier vecteur de base et 1/9 pour le second. Pour travailler avec la mtrique
habituelle, il suffit de faire la transformation qui tout point x de coordonnes (x1 , x2 )
associe le point de coordonnes (2x1 , x2 /3). Le poids de la premire coordonne tant
suprieur 1, cette coordonne est dilate tandis que la seconde est contracte.
Soit {A, B, C, D} un nuage de 4 points reprsents dans R 2 muni de la base
{u 1 , u 2 } et de la mtrique diagonale {4, 1/9} (cf. Figure 12.7.A). La matrice des
distances inter-individuelles est donne figure 12.7. Dans cet espace, la base {e1 , e2 }
est orthonorme.
12.3 Fiche 3 : distance, norme et produit scalaire 307
A R2 e B C
2
Mtrique
2
u1 u2
u1 4 0 Distances inter-points
u2 0 1/9 u2 A B C D
A 0
e 1 u1 B 1 0
A D
B R2
C 5 2 0
D 2 5 1 0
Mtrique
e1 e2
e1 1 0 B C
e2
e2 0 1
e1 2 3 A D
Figure 12.7 Nuage de 4 points {A, B, C, D} reprsent dans le plan R 2 muni dune mtrique
diagonale (A) et dans une base orthonorme de ce mme plan (B).
axe dinertie ou axe factoriel : en analyse factorielle, les nuages sont projets sur
des axes : en ACP (1.5 et 1.6), en AFC (3.6), en gnral (5.2) ; ces axes sont les
axes dinertie dun nuage : ils sont orthogonaux entre eux ; linertie du nuage
projet est maximum sur le premier axe, puis le second, etc. ; ils sont vecteurs
propres dune matrice (5.2.4 et 5.2.5) ; axe principal dinertie dun nuage = axe
dinertie calcul en prenant comme origine le barycentre ; relation entre les
axes et les facteurs (5.4.1).
Burt : tableau de Burt (4.1.5).
barycentre ou centre de gravit : dfinition voir 12.1 ; lorigine des axes est au
barycentre du nuage dindividus en ACP (1.3), des deux nuages en AFC (3.5 et
3.6.3) ; en ACM, le barycentre des modalits dune mme variable est lorigine
des axes (4.3.5.1) et (6.4.1.1) ; en AFC, le profil de la somme de plusieurs lignes
(ou colonnes) est au barycentre des profils de ces lignes (ou de ces colonnes)
(10.3.1) ; proprit barycentrique : cf. relations de transition.
CAH : Classification Ascendante Hirarchique. Mthode de construction dun arbre
hirarchique. Les algorithmes ascendants (partir de la partition la plus fine
et agrger petit petit ses lments) sont plus utiliss que les algorithmes
descendants (partir de la partition la plus grossire que lon subdivise de plus
en plus finement).
canonique : analyse canonique et multicanonique (8.3.4.1 et 8.3.4.2).
centr : variable centre = variable numrique de moyenne nulle (1.2) ; centrer une
variable = considrer la variable numrique centre dduite dune variable en
soustrayant sa moyenne ; centrer un tableau = considrer le tableau des variables
centres ; nuage centr = nuage de points dont le barycentre est lorigine
des axes (1.3) ; centrer un nuage = dplacer lorigine des axes au barycentre
du nuage (12.1) ; en ACP, centrer les variables centre le nuage des individus
et projette le nuage des variables sur lhyperplan orthogonal la premire
bissectrice (12.2) ; gnralisation de lACP un tableau non centr (5.3.1) ; en
AFC, il y a quivalence entre lanalyse du nuage centr et du nuage non centr
(3.6.3 et 5.5).
centre de gravit cf. barycentre.
chane ; effet de chane en CAH (2.3.4).
classe cf. modalit cf. indicatrice ; choix des classes pour un codage de variable
numrique en variable qualitative (4.5.2).
classification : (introduction, 2.2) les deux grands types de mthodes en analyse
des donnes sont les mthodes factorielles et les mthodes de classification.
Lobjectif gnral de ces dernires est dobtenir des partitions dun ensemble
Index systmatique 311
sentation du nuage sur laxe (1.9) = pourcentage dinertie extrait par laxe.
corrlation = coefficient de corrlation linaire. Dfinition (1.1) ; limite dinterpr-
tation (4.5.1) ; reprsentation des corrlations par des cosinus (1.4 et 12.2.4) ;
en ACP norme, les coordonnes des projections des variables sur les axes sont
gales leur corrlation avec les composantes principales (1.6) ; coefficient de
corrlation multiple (8.3.4.2) ; rapport de corrlation (4.3.6).
dimension, dimensionalit : la dimension dun espace est le nombre de vecteurs
orthogonaux 2 2 que peut contenir cet espace ; la dimension ou dimensiona-
lit dun nuage est la plus petite dimension dun espace dans lequel on peut
reprsenter ce nuage ; si lon souhaite tenir compte du fait que linertie dun
nuage est trs ingalement rpartie selon les dimensions, on peut calculer un
indicateur de dimensionalit (8.4.2).
312 Index systmatique
disjonctif cf.TDC.
distance euclidienne (12.3) ; distance entre individus en ACP (1.1) ; entre individus et
entre modalits en ACM (4.3.2 et 4.3.3) ; distance du khi2 (x2 ) en AFC (3.4) ;
entre groupes de variables en AFM (7.1.7 et 8.4.4) ; tableau de distances (5.5.5
et 8.5.5).
dualit en analyse factorielle = relations entre ltude des lignes et des colonnes dun
mme tableau ; en ACP (1.7), en AFC (3.7), en gnral (5.4) ; le schma de
dualit (5.4.2) synthtise lensemble de ces relations.
effet Guttman en AFC (10.3.2.1), en ACM (11.6.7).
effet taille en ACP (dfinition en 1.6 et 9.6.6 ; exemple en 2.2).
quivalence distributionnelle : proprit de la distance du khi2 (x2 ) (3.4).
euclidien : espace euclidien, distance euclidienne (12.3).
facteur = ensemble des coordonnes des projections dun nuage de points sur un axe
dinertie de ce nuage ; cf. axe, cf. inertie ; relations entre les facteurs dfinis
sur les lignes et les facteurs dfinis sur les colonnes, cf. relations de transition ;
interprtation des facteurs : voir les exemples comments aux chapitres 2, 7
et 10 et le chapitre 11 ; facteurs communs ( plusieurs groupes de variables
en AFM) (7.1.6 et 8.3.4) ; facteurs partiels en AFM = facteurs des analyses
spares des groupes de variables (proprits en 8.3.3 ; exemples en 7.1.8, 7.2.1
et 9.2.4).
Huygens : thorme ou principe de Huygens, cf. inertie (12.1).
illustratif cf. supplmentaire.
indpendance entre deux variables qualitatives (3.1) ; cf. modle et liaison.
indicatrice = variable indicatrice dune classe ou dune modalit (4.1.3) ; les
colonnes dun TDC sont des indicatrices (4.1.3) ; inertie des indicatrices en
ACM (4.3.3 et 8.6.1).
INDSCAL : modle pour lanalyse de plusieurs matrices de distances entre les
mmes individus (8.5).
inertie dun lment M de poids p par rapport un point O = produit du poids p par
le carr de la distance entre M et O ; inertie dun nuage de points = somme des
inerties des lments qui le composent ; quivalence entre inertie et variance
(12.1) ; en ACP norme, linertie des nuages est gale au nombre de variables
(1.7.1) ; en AFC, elle est proportionnelle au khi2 (3.7.1) ; en ACM, elle est
gale au nombre moyen de modalits par variable diminu de 1 (4.3.3) ; en
analyse factorielle, linertie du nuage des lignes est gale linertie du nuage
des colonnes, dans lespace complet et le long de chaque axe factoriel : en ACP
Index systmatique 313
(1.7), en AFC (3.7.1), dmonstration gnrale (5.4) ; inertie dun lment sur un
axe = inertie de la projection de llment sur cet axe ; inertie dun axe ou dun
facteur = inertie du nuage projet sur laxe (cf. valeur propre) ; interprtation
de linertie dun axe : en AFC (3.7.3 et 11.3.1), en ACP (11.2.1), en ACM
(11.4.1) ; dcomposition de linertie sur des axes orthogonaux en AFC (3.7.3) ;
inertie inter et inertie intra (dcomposition de linertie suivant le principe de
Huygens) : principe (12.1), en ACM (4.3.6), en AFM (7.2.4), en AFC (10.4.2.1
et 10.4.2.2), en CAH (2.2.3 et 2.5.2) ; dcomposition de linertie point par
point (cf. contribution linertie) ; pourcentage dinertie extrait (cf. qualit
de reprsentation) ; axe dinertie ou axe factoriel (cf. axe).
inter et intra cf. inertie, Huygens, rapport de corrlation.
inversion en CAH (2.3.4).
khi2 = x2 : distance en AFC (3.4) ; statistique ou indice du khi2 (3.7.1) ; lAFC
dcompose le khi2 (11.3.1).
liaison entre deux variables numriques (1.1 ; cf. corrlation) ; entre deux variables
qualitatives (3.1), cf. khi2 ; entre une variable numrique et une variable quali-
tative (4.3.6) ; entre une variable numrique et un groupe de variables (8.3.4.2
et 8.3.4.3) ; entre deux groupes de variables (8.4.3 ; exemples en 9.2.1) ; lACP
est une tude des liaisons linaires entre plusieurs variables numriques (5.3.1),
lAFC une tude de la liaison entre deux variables qualitatives, lACM une
tude des liaisons entre plusieurs variables qualitatives. Pour trois variables
qualitatives, voir chapitre 10. LAFM est une tude des liaisons entre plusieurs
groupes de variables numriques et (ou) qualitatives.
manquante : donnes manquantes, rponses manquantes en ACM (6.3 et 8.6.2.3).
marge dun tableau binaire (3.1) ; marges binaires dun tableau ternaire (10.1.1).
Dunod La photocopie non autorise est un dlit
modalit dune variable qualitative (3.1 et 4.1.1) ; relation entre classe, modalit et
indicatrice (4.1.1 et 4.2.3).
modle : modle correspondant lhypothse dindpendance (3.1) ; lAFC est une
analyse de lcart entre un tableau de donnes et ce modle ; elle se gnralise
dautres modles (10.5.2) ; le modle de lanalyse intra correspond lhypothse
dindpendance conditionnelle (10.5.3) ; modle de leffet Guttman (10.3.2.1) ;
modle INDSCAL (8.5).
nuage de points = ensemble de points munis de poids dans un espace euclidien ; on
tudie un nuage dindividus en ACP (1.3), en ACM (4.3.2) et en AFM (8.2),
un nuage de variables en ACP (1.4) et en AFM (8.3), un nuage de modalits
en ACM (4.3.3) et en AFM (8.6.2.2), de profils-lignes et de profils-colonnes en
314 Index systmatique
linertie dun axe (ou dun facteur) cause de la proprit qui sert les calcu-
ler (5.2.6) ; histogramme ou diagramme des valeurs propres = reprsentation
graphique de la dcroissance des inerties de la suite des facteurs ; interprtation
(11.2.1.1).
valeur-test ; indicateur de caractrisation dune classe dindividus (2.4.2).
variable v. continue = v. numrique = v. quantitative (1.1) ; v. qualitative = v. nominale
(4.1.1) ; v. indicatrice (cf. modalit) ; v. illustrative = v. supplmentaire) ; v.
canonique (8.4.3.1).
Ward ; algorithme de CAH (2.3).
Bibliographie
[1] BENZECRI J.-P. et coll. (1973) Lanalyse des donnes. Tome 1 : La taxinomie.
Tome2 : Lanalyse des correspondances. Dunod.
[2] BENZECRI J.-P. et F. (1980) Pratique de lanalyse des donnes. Tome 1 : analyse
des correspondances, expos lmentaire. Dunod.
[3] BENZECRI J.-P, BASTIN Ch., BOURGARIT Ch., CAZES P. (1980) Pratique de
lanalyse des donnes. Tome 2 : Abrg thorique, tude de cas modles. Dunod.
[4] BENZECRI J.-P. et coll. (1984) Pratique de lanalyse des donnes. Tome 3 :
Linguistique et Lexicologie. Dunod.
[6] BENZECRI J.-P.et coll. (1984) Pratique de lanalyse des donnes en conomie.
Dunod.
[7] BOUROCHE J.-M. et SAPORTA G. (1980) Lanalyse des donnes. PUF Collec-
tion Que Sais-je ?
Dunod La photocopie non autorise est un dlit
[8] CAILLEZ F. et PAGES J.-P. (1976) Introduction lanalyse des donnes. Smash.
[13] FENELON J.-P. (1982) Quest-ce que lanalyse des donnes ? Lefonen.
318 Bibliographie
LOGICIEL
Toutes les mthodes dcrites dans ce livre sont intgres dans FactoMineR, logiciel
libre (en R) danalyse des donnes. FactoMineR est dvelopp par le laboratoire de
Mathmatiques appliques dAgroCampus.
sciences sup
Brigitte Escofier
Jrme Pags 4e dition
Analyses factorielles
simples et multiples
Objectifs, mthodes et interprtation
Cet ouvrage est destin aux tudiants en Masters de mathmatiques Brigitte Escofier
a t professeur
appliques, dconomie ou dconomtrie, ainsi quaux lves lUniversit de Rennes
ingnieurs. Il aborde les mthodes danalyse des donnes qui ont et lIUT de Vannes.
Elle tait lune des
dmontr leur efficacit dans ltude des grandes masses complexes fondatrices de lcole
dinformations. Ces mthodes sont maintenant appliques dans tous franaise danalyse
des donnes.
les domaines o lon accumule dimportants fichiers de donnes,
et sont largement utilises hors de leurs champs traditionnels.
Jrme Pags
Pour cette quatrime dition, le texte a t rvis et augment
est ingnieur
notamment sur deux points qui correspondent une demande agronome, professeur
croissante des utilisateurs : lAgrocampus de Rennes.
chimie
sciences de lingnieur
informatique
sciences de la vie
sciences de la terre
1 2 3 4 5 6 7 8