Vous êtes sur la page 1sur 328

sciences sup

Cours et tudes de cas


Masters et coles dingnieurs

Analyses factorielles
simples et multiples
Objectifs, mthodes et interprtation
4e dition

Brigitte Escofier
Jrme Pags

Algeria-Educ.com

ANALYSES FACTORIELLES
SIMPLES ET MULTIPLES
Objectifs, mthodes et interprtation

ANALYSES FACTORIELLES
SIMPLES ET MULTIPLES
Objectifs, mthodes et interprtation

Brigitte Escoffier
Ancien professeur lUniversit de Rennes et lIUT de Vannes

Jrme Pags
Ingnieur agronome, professeur lAgrocampus de Rennes

4e dition

Illustration de couverture : Digitalvision

Dunod, Paris, 2008


ISBN 978-2-10-053809-6

Dunod La photocopie non autorise est un dlit

Table des matires

Introduction

Analyse en Composantes Principales . . . . . . . . . . . . . . . . . . . . . . . . . . .

1.1 Donnes et objectifs de ltude . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

1.2 Transformation des donnes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

10

1.3 Nuage des individus . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

11

1.4 Nuage des variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

12

1.5 Ajustement du nuage des individus . . . . . . . . . . . . . . . . . . . . . . . . . . .

13

1.6 Ajustement du nuage des variables . . . . . . . . . . . . . . . . . . . . . . . . . . .

15

1.7 Dualit et formules de transition en ACP . . . . . . . . . . . . . . . . . . . . . .

17

1.8 Schma gnral de lACP . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

21

1.9 Aides linterprtation. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

24

1.10 variables qualitatives illustratives en ACP . . . . . . . . . . . . . . . . . . . . . .

27

Exemple dACP et de CAH . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

31

2.1 Donnes et problmatique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

31

2.2 Rsultats de lACP . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

34

2.3 Introduction la mthode de Ward (classification automatique)

42

2.4 Caractrisation directe dune classe dindividus . . . . . . . . . . . . . . . .

49

2.5 Interprtation simultane dun plan factoriel et dun arbre


hirarchique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

55

2.6 Construction et amlioration dune partition . . . . . . . . . . . . . . . . . .

60

vi

Table des matires

Analyse Factorielle des Correspondances . . . . . . . . . . . . . . . . . . . . . . .

63

3.1 Donnes, notations, hypothse dindpendance . . . . . . . . . . . . . .

63

3.2 Objectifs . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

65

3.3 Transformations des donnes en profils . . . . . . . . . . . . . . . . . . . . . . .

66

3.4 Ressemblance entre profils : distance du x2 . . . . . . . . . . . . . . . . . . .

68

3.5 Les deux nuages . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

68

3.6 Ajustement des deux nuages . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

71

3.7 La dualit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

74

3.8 Nombre daxes et inertie totale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

79

3.9 Aides linterprtation et lments supplmentaires . . . . . . . . . .

79

3.10 Schma gnral de lAFC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

79

3.11 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

82

Analyse des Correspondances Multiples . . . . . . . . . . . . . . . . . . . . . . . .

85

4.1 Donnes et notations . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

85

4.2 Objectifs . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

89

4.3 AFC applique un Tableau Disjonctif Complet . . . . . . . . . . . . . . .

91

4.4 Analyse des Correspondances dun tableau de Burt . . . . . . . . . . .

99

4.5 Codage en classes des variables quantitatives . . . . . . . . . . . . . . . . .

101

4.6 Analyse Factorielle de Donnes Mixtes (AFDM) . . . . . . . . . . . . . . . .

104

4.7 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

105

Calculs et dualit en Analyse Factorielle . . . . . . . . . . . . . . . . . . . . . . . .

107

5.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

107

5.2 Calcul des axes dinertie et des facteurs dun nuage de points .

107

5.3 Nuages des lignes et des colonnes en ACP et en AFC . . . . . . . . . .

112

5.4 Dualit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

115

5.5 Mise en uvre des calculs . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

121

5.6 Reconstitution des donnes et approximation de X . . . . . . . . . . . .

123

Table des matires

Dunod La photocopie non autorise est un dlit

vii

5.7 Une quivalence en ACM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

125

Exemple de traitement de tableau multiple par ACM et AFC. . .

127

6.1 Lenqute Ouest-France . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

127

6.2 Analyse simultane de plusieurs groupes de variables. . . . . . . . . .

128

6.3 Le problme des rponses manquantes . . . . . . . . . . . . . . . . . . . . . . .

130

6.4 Premire analyse : ACM des rubriques . . . . . . . . . . . . . . . . . . . . . . . .

132

6.5 Deuxime analyse : ACM du signaltique . . . . . . . . . . . . . . . . . . . . .

139

6.6 Une analyse non satisfaisante : ACM des rubriques et du


signaltique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

142

6.7 Troisime analyse : AFC du tableau croisant signaltique et


rubriques. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

143

6.8 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

147

LAnalyse Factorielle Multiple partir de deux applications . . .

149

7.1 Lexemple des vins . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

149

7.2 AFM applique aux donnes de lenqute Ouest-France . . . . . . .

164

Aspects thoriques et techniques de lAnalyse Factorielle


Multiple . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

171

8.1 Donnes et notations . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

172

8.2 LAFM dans lespace des individus RK . . . . . . . . . . . . . . . . . . . . . . . . .

173

8.3 LAFM dans lespace des variables RI . . . . . . . . . . . . . . . . . . . . . . . . . .

179

8.4 LAFM dans lespace des groupes de variables RI . . . . . . . . . . . . . .

188

8.5 AFM et modle INDSCAL . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

194

8.6 Cas des variables qualitatives et des tableaux mixtes . . . . . . . . . . .

197

8.7 Elments supplmentaires. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

202

8.8 Mise en uvre de lAnalyse Factorielle Multiple . . . . . . . . . . . . . . .

203

Mthodologie de lAFM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

205

9.1 Tactique mthodologique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

205

viii

Table des matires

9.2 Aides linterprtation. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

211

9.3 Analyse factorielle multiple hirarchique . . . . . . . . . . . . . . . . . . . . . .

219

10 Comparaison de tableaux de frquence binaire . . . . . . . . . . . . . . .

223

10.1 Donnes et problmes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

223

10.2 tude des marges binaires . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

228

10.3 Premire analyse : les tableaux en supplmentaire dans lAFC de


leur somme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 229
10.4 Deuxime analyse : AFC de variables croises ou de tableaux
juxtaposs. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

240

10.5 Troisime analyse : analyse intra . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

257

10.6 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

266

11 Interprtation des rsultats dune analyse factorielle . . . . . . . . . .

269

11.1 Prolgomnes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

269

11.2 Interprtation dune ACP . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

272

11.3 Interprtation dune AFC. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

280

11.4 Interprtation dune ACM. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

282

11.5 Interprtation dune AFM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

284

11.6 Quelques types de facteurs . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

289

12 Fiches techniques . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

295

12.1 Fiche 1 : moyenne et barycentre, variance et inertie . . . . . . . . . . .

295

12.2 Fiche 2 : reprsentation des variables dans RI . . . . . . . . . . . . . . . . . .

299

12.3 Fiche 3 : distance, norme et produit scalaire. . . . . . . . . . . . . . . . . . .

301

Index systmatique

309

Bibliographie

317

Introduction

Dunod La photocopie non autorise est un dlit

Lanalyse des donnes : outil de connaissance dans les domaines les plus divers

Depuis une trentaine dannes, les mthodes danalyse des donnes ont largement
dmontr leur efficacit dans ltude de grandes masses complexes dinformations.
Ce sont des mthodes dites multidimensionnelles en opposition aux mthodes de la
statistique descriptive qui ne traitent quune ou deux variables la fois. Elles permettent donc la confrontation entre de nombreuses informations, ce qui est infiniment
plus riche que leur examen spar. Les reprsentations simplifies de grands tableaux
de donnes que ces mthodes permettent dobtenir savrent un outil de synthse
remarquable. De donnes trop nombreuses pour tre apprhendes directement, elles
extraient les tendances les plus marquantes, les hirarchisent et liminent les effets
marginaux ou ponctuels qui perturbent la perception globale des faits.
Nes luniversit, elles ont dabord t connues essentiellement des chercheurs et
appliques des domaines scientifiques comme lcologie, la linguistique, lconomie,
etc. Elles ont permis daborder des tudes nouvelles plus riches et plus complexes.
Mais leur domaine dapplication dborde depuis longtemps ce cadre universitaire,
surtout depuis que lacquisition et le stockage des informations sont facilits par
le dveloppement de linformatique. Dans tous les domaines (marketing, assurance,
banque, etc.), dimportants fichiers de donnes sont accumuls. Le premier objectif est
de conserver les informations et de pouvoir les consulter facilement. Mais on saperoit
vite que pour exploiter lensemble de linformation contenue dans ces fichiers, dont le
recueil est souvent coteux, il est ncessaire de disposer doutils statistiques adapts.
Puissance des reprsentations gomtriques de lanalyse factorielle

Parmi les mthodes de lanalyse des donnes, lanalyse factorielle tient une place
primordiale. Elle est utilise soit seule, soit conjointement avec des mthodes de
classification (alors que ces dernires sont rarement appliques seules). Cette place de
choix tient en partie aux reprsentations gomtriques des donnes, qui transforment
en distances euclidiennes des proximits statistiques entre lments.
Elles permettent dutiliser les facults de perception dont nous usons quotidiennement : sur les graphiques de lanalyse factorielle, on voit, au sens propre du terme

Introduction

(avec les yeux et lanalyse assez mystrieuse que notre cerveau fait dune image), des
regroupements, des oppositions, des tendances, impossibles discerner directement
sur un grand tableau de nombres, mme aprs un examen prolong.
Ces reprsentations graphiques sont aussi un moyen de communication remarquable
car point nest besoin dtre statisticien pour comprendre que la proximit entre deux
points traduit la ressemblance entre les objets quils reprsentent.
Lanalyse factorielle ou les analyses factorielles ?

Les deux expressions se justifient.


1. Il existe plusieurs mthodes adaptes diffrents types de donnes : ainsi, pour
citer les plus connues, lanalyse en composantes principales (ACP) traite des
tableaux croisant des individus et des variables quantitatives, lanalyse factorielle
des correspondances (AFC) traite des tableaux de frquence et lanalyse des correspondances multiples (ACM) sapplique des tableaux croisant des individus
et des variables qualitatives.
2. Le principe de ces mthodes est unique. Deux nuages de points, reprsentant
respectivement les lignes et les colonnes du tableau tudi, sont construits et
reprsents sur des graphiques. Les reprsentations des lignes et des colonnes
sont fortement lies entre elles.
Rigueur et souplesse des mthodes danalyse factorielle

Le fait que lanalyse factorielle ne sapplique qu des tableaux rectangulaires peut


paratre au premier abord une limitation importante la fois sur le type de donnes et
sur la manire de les aborder. En ralit, la plupart des tudes de donnes peuvent tre
formalises comme une analyse de tableaux rectangulaires. Dautre part, un mme
fichier de donnes peut conduire un grand nombre de tableaux diffrents et donc
des analyses diffrentes qui permettent chacune dtudier un des aspects du problme.
La construction de tableaux partir dun fichier initial est appele codage. Ce
terme de codage inclut la transformation de donnes brutes en variables quantitatives
ou qualitatives, le choix des lignes et des colonnes du tableau, celui des lments
traiter en actif, etc. Dans cette tape de codage, la marge de manuvre est presque
infinie. Le rsultat dune analyse factorielle est unique, ce qui en assure la rigueur,
mais les analyses possibles sont nombreuses, ce qui en assure la souplesse et la facult
dadaptation.
Les tableaux multiples

Les analyses factorielles ont t conues pour tudier un tableau de donnes unique. Or,
les personnes qui analysent des donnes sont de plus en plus frquemment confrontes
ltude simultane de plusieurs tableaux rectangulaires. Il sagit le plus souvent :

Introduction

1. dune suite de tableaux indics par le temps ;


2. dun ensemble de tableaux rectangulaires provenant dun unique tableau de
dimension trois ;
3. dun tableau initialement unique mais dans lequel on distingue des soustableaux
(ce cas gnral inclut le cas particulier dans lequel un ensemble dindividus est
dcrit la fois par des variables quantitatives et des variables qualitatives).
Au fil des ans, des mthodologies ont t mises au point. On se ramne gnralement
lanalyse dun tableau complexe form par la juxtaposition des diffrents tableaux.
Ces mthodes fondes sur les mthodes danalyse classique, elles-mmes conues
pour ltude dun tableau simple, utilisent largement la technique dite des lments
supplmentaires . Mais ces techniques ont leurs limites et les objectifs spcifiques
de lanalyse des tableaux multiples ne sont pas tous atteints. Aussi, de nouvelles
mthodes, utilisant les mmes principes fondamentaux que les analyses factorielles
classiques mais prenant en compte le caractre multiple des tableaux, ont t
mises au point.

Dunod La photocopie non autorise est un dlit

Esprit du livre

Cet ouvrage est destin avant tout aux utilisateurs danalyse des donnes. Cest pourquoi il prsente des mthodes danalyse factorielle en tentant de dgager leurs objectifs
et les interprtations de leurs rsultats. Pour en faciliter la lecture aux non-spcialistes,
nous avons pris le parti de sparer le plus possible les aspects intuitifs des mthodes
(objectifs, principe gnral et reprsentations gomtriques), des aspects mathmatiques et thoriques. Les aspects intuitifs ne ncessitent quun trs faible bagage
statistique et mathmatique et sont donc abordables par beaucoup. Ils sont largement
comments sur quatre exemples.
Les aspects thoriques sont regroups essentiellement dans deux chapitres. Leur
but est de fournir les justifications des mthodes en prcisant les critres optimiss
et les algorithmes de calcul. La bibliographie est restreinte au minimum : lorsquune
dmonstration risque dalourdir trop le texte, une note en bas de page renvoie une
rfrence plus complte.
Les objectifs. Devant un jeu de donnes analyser, se pose le problme du choix du
traitement statistique, cest--dire du choix du couple indissociable codage-mthode.
Pour bien choisir, il est ncessaire de connatre les moyens dont on dispose, donc
les possibilits des mthodes qui peuvent rpondre chacune un certain nombre
dobjectifs prcis. La rflexion sur les objectifs dune tude est fondamentale. Elle est
plus efficace si elle se fait dans le cadre des possibilits techniques. Cette rflexion doit
toujours intervenir le plus tt possible car elle influe non seulement sur le traitement
statistique mais aussi sur le recueil mme des donnes.

Introduction

Linterprtation. Lanalyse effectue, le travail du statisticien nest pas termin : il


faut interprter les rsultats. Cette phase, qui peut sembler dlicate au nophyte, fait
intervenir la fois la connaissance du problme et celle des mthodes.
Contenu du livre

Ce livre contient la fois un rappel des mthodes classiques, des exposs des mthodologies danalyse des tableaux multiples bases sur ces dernires et une introduction aux
mthodes danalyse spcifiques de ces tableaux. Ces dernires ont t conues par les
auteurs et exposes dans le cadre de leurs recherches, mais cet ouvrage est le premier
qui en contient une prsentation gnrale destine aux utilisateurs. Linterprtation
des rsultats dune analyse factorielle, qui est avec le codage la phase la plus dlicate
de ltude, est illustre par quatre exemples tout le long du texte ; elle fait aussi lobjet
dune rflexion gnrale.
La premire partie du livre, qui comprend cinq chapitres, prsente les mthodes
classiques danalyse factorielle : lACP, lAFC et lACM. Le traitement dun exemple
par ACP donne loccasion de prsenter une mthode de classification et son dpouillement conjointement avec celui dune analyse factorielle. Une prsentation formalise
de lACP, de lAFC et de lACM, incluant les dmonstrations essentielles, est faite
dans un cadre commun ces trois mthodes.
La deuxime partie est consacre aux tableaux multiples. Les chapitres 6, 7, 8 et 9
concernent ltude simultane de plusieurs tableaux croisant les mmes individus et
diffrents groupes de variables numriques ou qualitatives. Le chapitre 6 commente
plusieurs traitements de la mme enqute par les mthodes classiques. Cest la fois
une illustration des mthodes prsentes dans les premiers chapitres, une rflexion
sur les objectifs gnraux de ltude de tableaux comprenant plusieurs groupes de
variables, et un bilan sur lintrt et les limites des mthodologies bases sur ces
mthodes. Lanalyse factorielle multiple (AFM), conue pour ce type de donnes,
est introduite dans le chapitre 7 partir des rsultats issus de son application un
second exemple ; sa prsentation complte constitue le chapitre 8 ; une rflexion sur
son utilisation constitue le chapitre 9. Le chapitre 10 traite des tableaux de frquence
ternaires et plus gnralement de ltude simultane de plusieurs tableaux de frquence
binaires. Bien quil sagisse comme dans les quatre chapitres prcdents de tableaux
multiples, la nature des donnes (frquences au lieu de variables) implique des objectifs
fondamentalement diffrents. Ce chapitre tente den dgager les principaux et illustre
sur un mme exemple les mthodologies drives de lAFC et une technique nouvelle,
baptise analyse intra, qui permet dtudier un aspect spcifique des tableaux de
frquence ternaire : les liaisons conditionnelles.
La dernire partie, rduite un chapitre, est entirement consacre linterprtation
des rsultats en analyse factorielle. Elle est issue en partie des rflexions dun groupe de

Introduction

travail1 runi par lADDAD2 dans le cadre dun contrat avec la Socit THOMSON.
A partir des expriences confrontes et du regroupement de commentaires pars
dapplications danalyse factorielle, nous avons construit un guide. Ce guide propose
une dmarche gnrale dinterprtation en analyse factorielle en diffrenciant ACP,
AFC, ACM et AFM.
Il est conseill aux lecteurs novices en analyse des donnes de commencer la lecture
de cet ouvrage par les deux premires fiches techniques incluses dans le chapitre 12.
Ces deux fiches dtaillent les reprsentations gomtriques des nuages dindividus
et de variables utilises systmatiquement en analyse factorielle. La troisime fiche,
plus technique, est destine plutt aux lecteurs qui souhaitent approfondir les aspects
mathmatiques et thoriques dvelopps dans les chapitres 5 et 8.
Lindex systmatique reprend lensemble des notions essentielles.
Note sur la quatrime dition

Pour cette quatrime dition, le texte a t rvis et augment notamment sur deux
points qui correspondent une demande croissante des utilisateurs :
1. lanalyse simultane de variables quantitatives et qualitatives, sans transformer
les variables quantitatives ; pour cela, une prsentation de lanalyse factorielle
sur donnes mixtes (AFDM) a t incluse ;

Dunod La photocopie non autorise est un dlit

2. la prise en compte dune structure hirarchique sur les variables dans un tableau
individusvariables ; lexemple classique est celui dun questionnaire dont les
questions sont structures en thmes et sous-thmes ; ce livre contient maintenant une prsentation de lAnalyse Factorielle Multiple Hirarchique (AFMH),
prolongement naturel de lAFM adapt ce type de donnes.
Ces mthodes, ainsi que toutes celles dcrites dans ce livre, sont dsormais disponibles
dans FactoMineR, logiciel libre danalyse des donnes dvelopp par le laboratoire de
mathmatiques appliques dAgrocampus.
Au terme de ce travail, il est agrable de remercier Radwan JALAM, ingnieur
informaticien Agrocampus, qui a assur la mise en forme de cette nouvelle dition.

1. Ch. Bastin, Ch. Bourgarit, J. Confais, B. Escofier, B. Gomel, J.P. Fnelon, J.Pags.
2. LAssociation pour le Dveloppement et la Diffusion de lAnalyse des Donnes diffuse aussi les
logiciels correspondants toutes les mthodes dcrites

Chapitre 1

Analyse en Composantes Principales

1.1 DONNES ET OBJECTIFS DE LTUDE


LAnalyse en Composantes Principales (ACP) sapplique des tableaux croisant
des individus et des variables quantitatives, appels de faon concise tableaux
IndividusVariables quantitatives.
Selon un usage bien tabli, les lignes du tableau reprsentent les individus et les
colonnes reprsentent les variables. A lintersection de la ligne i et de la colonne k se
trouve la valeur de la variable k pour lindividu i. La figure 1.1 illustre ces notions et
complte les notations. Le tableau 2.1 page 32 en est un exemple.

Variables
k

Individus

xik

I
Figure 1.1 Tableau des donnes en ACP. xik : valeur de la variable k pour lindividu i. I : nombre
dindividus et ensemble des individus. K : nombre de variables et ensemble des variables.

1 Analyse en Composantes Principales

Les termes individu et variable recouvrent des notions diffrentes. Par exemple,
dans le tableau tudi au chapitre 6, les individus sont des vins et les variables sont
des critres dcrivant ces vins (acidit, astringence, etc.). Les questions que lon se
pose sur les individus et celles que lon se pose sur les variables ne sont pas de mme
nature.
propos de deux individus, on essaie dvaluer leur ressemblance : deux individus
se ressemblent dautant plus quils possdent des valeurs proches pour lensemble des
variables. En ACP, la distance d(i,l) entre deux individus i et l est dfinie par :

d2 (i, l) =
(xik xlk )2
kK

propos de deux variables, on essaie dvaluer leur liaison. En ACP, la liaison entre
deux variables est mesure par le coefficient de corrlation linaire (dans de rares
situations, on utilise la covariance), not usuellement r . Soit :
r (k, h) =
=

covariance(k, h)

variance(k) variance(h)




1
xik xk
xih xh
I
sk
sh
iI

avec xk et sk la moyenne et lcart-type de la variable k.


Applique un tel tableau, lobjectif gnral de lACP est une tude exploratoire.
Les deux voies principales de cette exploration sont :
Un bilan des ressemblances entre individus. On cherche alors rpondre des
questions du type suivant : quels sont les individus qui se ressemblent ? Quels sont
ceux qui diffrent ? Plus gnralement, on souhaite dcrire la variabilit des individus.
Pour cela, on cherche mettre en vidence des groupes homognes dindividus dans
le cadre dune typologie des individus. Selon un autre point de vue, on cherche les
principales dimensions de variablit des individus.
Un bilan des liaisons entre variables. Les questions sont alors : quelles variables
sont corrles positivement entre elles ? Quelles sont celles qui sopposent (corrles
ngativement) ? Existe-t-il des groupes de variables corrles entre elles ? Peut-on
mettre en vidence une typologie des variables ?
Un autre aspect de ltude des liaisons entre variables consiste rsumer lensemble
des variables par un petit nombre de variables synthtiques appeles ici composantes
principales. Ce point de vue est trs li au prcdent : une composante principale peut
tre considre comme le reprsentant (la synthse) dun groupe de variables lies
entre elles.
Naturellement, ces deux voies ne sont pas indpendantes du fait de la dualit inhrente ltude dun tableau rectangulaire : la structure du tableau peut tre analyse

1.1 Donnes et objectifs de ltude

la fois par lintermdiaire de la typologie des individus et de la typologie des variables.


Aussi, cherche-t-on en gnral relier ces deux typologies. Pour cela, on caractrise les
classes dindividus par des variables (on slectionne ainsi les variables pour lesquelles
lensemble des individus dune classe possde des valeurs particulirement grandes
ou particulirement petites). De mme, on caractrise un groupe de variables lies
entre elles par des individus types (on slectionne ainsi les individus qui possdent
des valeurs particulirement grandes ou des valeurs particulirement petites pour un
ensemble de variables lies positivement entre elles). Enfin, dans la situation idale, les
deux typologies peuvent tre superposes : chaque groupe de variables caractrise
un groupe dindividus et chaque groupe dindividus rassemble les individus types dun
groupe de variables. Ajoutons enfin que la notion de principale dimension de variablit
des individus rejoint celle de variable synthtique.

Dunod La photocopie non autorise est un dlit

a) Poids des individus

Dans la plupart des cas, les individus jouent le mme rle. Nous nous sommes situs
implicitement dans cette situation jusquici, en affectant le mme poids chaque
individu. Par commodit, on choisit ces poids tels que la masse totale de ces individus
soit gale 1 : chaque individu on associe alors le poids 1/I . Toutefois, dans certains
cas, on peut souhaiter attribuer des poids diffrents aux individus. Cette situation se
prsente notamment lorsque les individus reprsentent chacun une sous-population ;
on affecte alors un individu un poids proportionnel leffectif de la sous-population
quil reprsente. Ce poids intervient dans le calcul de la moyenne de chaque variable
(cest--dire dans la dfinition dun individu thorique moyen), dans le calcul de la
variance de chaque variable et dans celui de la mesure de liaison (le coefficient de
corrlation)
entre les variables. Soit, en appelant pi le poids affect lindividu i

( i pi = 1) :


xk =
pi xik sk2 =
pi (xik xk )2
i

r (k, h) =


i


pi

xik xk
sk



xih xh
sh

Les programmes complets dACP permettent tous dintroduire des poids dindividus.
b) Poids des variables

Nous avons accord jusquici la mme importance a priori aux diffrentes variables.
On est trs rarement conduit, dans la pratique, souhaiter leur affecter des importances
diffrentes. tel point que les programmes courants dACP ne le permettent pas. Cette
importance peut tre module laide dun coefficient appel poids de la variable. En
appelant m k le poids de la variable k, la distance entre deux individus i et l est dfinie
par :

1 Analyse en Composantes Principales

10

d2 (i, l) =

m k (xik xlk )2

kK

Toutefois, comme nous le verrons dans le chapitre 5 qui contient lensemble des
rsultats techniques concernant les analyses factorielles, ces poids ne modifient en rien
les principes gnraux de lanalyse. Afin de ne pas alourdir lexpos de ce chapitre,
nous considrons dans la suite que les individus possdent le mme poids ( pi = 1/I
quel que soit i I ) ainsi que les variables (m k = 1 quel que soit k K ).

1.2 TRANSFORMATION DES DONNES


En ACP, le tableau des donnes est toujours centr (en pratique, le centrage est inclus
dans les programmes dACP). A chaque valeur numrique, on soustrait la moyenne
de la variable en cause. Le tableau obtenu est alors de terme gnral :
xik xk
Cette transformation na aucune incidence sur les dfinitions de la ressemblance entre
individus et de la liaison entre variables. ce niveau, elle peut tre considre comme
un intermdiaire technique qui prsente dintressantes proprits mais qui ne change
fondamentalement rien la problmatique.
LACP peut tre ralise sur des donnes seulement centres. Toutefois, ses rsultats
sont alors trs sensibles au choix des units de mesure. Gnralement, ce choix est
arbitraire : ainsi, dans lexemple classique de mensurations danimaux, la variable
hauteur peut tre exprime en mtres ou en centimtres. Or ce choix a une grande
influence sur la mesure de ressemblance entre individus. Le passage du mtre au
centimtre multiplie par 1002 linfluence de la variable hauteur dans le calcul du carr
de la distance entre deux individus.
La faon classique de saffranchir de larbitraire des units de mesure est de rduire
les donnes. Le tableau obtenu a pour terme gnral (xik xk )/sk . Ce faisant, on utilise
comme unit de mesure pour la variable k, son cart-type sk . Toutes les variables
prsentent alors la mme variabilit et de ce fait la mme influence dans le calcul des
distances entre individus.
Dans les tudes o toutes les variables sexpriment dans la mme unit, on peut
souhaiter ne pas rduire les variables. En procdant ainsi, on accorde chaque variable
rduite un poids gal sa variance (cf. dfinition de la distance entre individus). Selon
un autre point de vue, la dfinition de d(i, l) montre que la variance de la variable k est
gale la contribution moyenne de la variable k au carr de la distance entre individus.
Cela se dduit de lcriture suivante de la variance :
1 
sk2 = 2
(xik xlk )2
2I
i,l

1.3 Nuage des individus

11

Un exemple de discussion de lopportunit de la rduction est donn section 2.1.2


page 32. Dans la suite, sauf mention explicite du contraire, les variables sont toujours
supposes centres et rduites.

1.3 NUAGE DES INDIVIDUS


Sintresser aux individus revient envisager le tableau en tant que juxtaposition
de lignes. chaque individu est associe une suite de K nombres. Selon ce point
de vue, un individu peut tre reprsent comme un point de lespace vectoriel K
dimensions, not R K , dont chaque dimension reprsente une variable. Lensemble des
individus constitue le nuage N I dont le centre de gravit G est confondu avec lorigine
O des axes du fait du centrage ; G reprsente lindividu moyen prcdemment cit.
Ces notations sont rassembles figure 1.2.
Variables
1

RK

NI

Individus

i
i

xik xk
sk

O=G

xik xk
sk

variable k

Dunod La photocopie non autorise est un dlit

Figure 1.2 Tableau des donnes et nuage des individus associ dans lespace R K . Du fait du
centrage, lorigine des axes est confondue avec le centre de gravit du nuage.

Dans lespace R K , la notion de ressemblance entre deux individus introduite section


1.1 nest autre que la distance euclidienne usuelle. Cette interprtation gomtrique
constitue une justification a posteriori dcisive du choix de la mesure de ressemblance :
le fait quelle soit une distance euclidienne lui confre un grand nombre de proprits
mathmatiques indispensables pour la suite.
Lensemble des distances inter-individuelles constitue ce que lon appelle la forme
du nuage N I . Raliser un bilan de ces distances revient tudier la forme du nuage
N I , cest--dire y dceler une partition des points (la typologie mentionne dans les
objectifs) ou des directions dallongement remarquables (les principales dimensions
de variabilit).
Ds que K est suprieur 3, ltude directe du nuage N I est impossible du fait
de la limitation trois dimensions de notre sens visuel. Do lintrt des mthodes

1 Analyse en Composantes Principales

12

factorielles en gnral, et dans ce cas particulier de lACP, qui fournissent des images
planes approchant le mieux possible (au sens dun critre dfini et discut section 1.5)
un nuage de points situ dans un espace de grande dimension.

1.4 NUAGE DES VARIABLES


Sintresser aux variables revient envisager le tableau en tant que juxtaposition de
colonnes. chaque variable, est associe une suite de I nombres. Selon ce point de
vue, une variable peut tre reprsente comme un vecteur de lespace vectoriel I
dimensions, not R I , dont chaque dimension reprsente un individu : par exemple,
la variable k est reprsente par le vecteur not lui aussi k et dont la i e composante
est (xik xk )/sk . Lensemble des extrmits des vecteurs reprsentant les variables
constitue le nuage N K . Ces notations sont regroupes dans la figure 1.3.
RI

Variables
1

Individus

NK

h
k

xik xk
sk

individu i

xik xk
sk

Figure 1.3 Tableau des donnes et nuage des variables associ dans lespace R I .

cos( Oh, Ok) = r (h, k)

Le choix de la distance dans R I consiste affecter chaque dimension un coefficient


gal au poids de chaque individu dans le nuage N I de R K (on peut avoir lintuition de
ce choix en considrant deux individus absolument identiques que lon peut remplacer
par un seul ayant un poids double). Dans le cas gnral o ces poids sont identiques, la
distance utilise est, au coefficient 1/I prs, la distance euclidienne usuelle. Avec cette
distance, les vecteurs reprsentant les variables centres ont les proprits suivantes :
1. La norme de chaque vecteur reprsentant une variable est gale son cart-type.
Soit :
I
2

1
2
variable k =
(xik xk )
I
i=1

1.5 Ajustement du nuage des individus

13

Ainsi, lorsque les variables sont centres rduites, chaque variable a pour longueur 1 : le nuage N K est alors situ sur une sphre de rayon 1 (on dit aussi
hypersphre pour rappeler que R I est de dimension suprieure 3). Pour cette
raison, lACP sur donnes centres-rduites est dite ACP norme. Lorsque les
variables sont seulement centres, leur longueur est gale leur cart-type et on
parle alors dACP non norme.
2. Le cosinus de langle form par les vecteurs reprsentant les deux variables h
et k, obtenu en calculant le produit scalaire not h, k entre ces deux vecteurs
norms, est gal au coefficient de corrlation entre ces deux variables. Soit :
 1  xih xh   xik xk 
cos(h, k) = h, k =
= corrlation(h, k)
I
s
s
h
k
i
Linterprtation dun coefficient de corrlation comme un cosinus est une proprit
trs importante puisquelle donne un support gomtrique, donc visuel, au coefficient
de corrlation. Cette proprit ncessite le centrage, ce qui justifie cette transformation
prsente section 1.1 comme un intermdiaire technique. Elle justifie aussi le choix de
la distance (on dit aussi mtrique) dans R I et implique que, dans la reprsentation des
variables, on sintresse surtout aux directions dtermines par les variables, cest-dire aux vecteurs plutt qu leurs extrmits.
La longueur des vecteurs reprsentant les variables tant gale 1, la coordonne
de la projection dune variable sur une autre sinterprte comme un coefficient de
corrlation.

Dunod La photocopie non autorise est un dlit

Conclusion

Raliser un bilan des coefficients de corrlation entre les variables revient tudier les
angles entre les vecteurs dfinissant le nuage N K . Cette tude directe est impossible du
fait de la dimension de R I . Lintrt de lACP est de fournir des variables synthtiques
qui constituent un rsum de lensemble des variables initiales et sont la base dune
reprsentation plane approche des variables et de leurs angles.

1.5 AJUSTEMENT DU NUAGE DES INDIVIDUS


Lobjectif est de fournir des images planes approches du nuage N I situ dans lespace
R K (cf. section 1.3). Pratiquement, on recherche une suite {u s ; s = 1, ..., S} de
S directions privilgies de R K appeles axes factoriels qui, prises deux deux,
dfinissent des plans factoriels sur lesquels on projette le nuage N I . Chaque direction
u s est choisie de faon rendre maximum linertie par rapport lorigine O (confondue
avec le centre de gravit G, du fait du centrage) de la projection de N I sur u s . Dans la
recherche dune suite, on impose chaque direction dtre orthogonale aux directions
dj trouves (cf. Figure 1.4). On peut montrer que le plan engendr par les deux

1 Analyse en Composantes Principales

14

premiers axes u 1 et u 2 rend maximum linertie projete sur ce plan. Il en est de mme
pour le sous-espace engendr par les trois premiers axes, etc.

NI

RK
i
u1
Hi
G=O

u2

Figure 1.4 Lajustement du nuage


 des individus. Lindividu i se projette en Hi sur u 1 . On cherche
dabord u 1 qui rend maximum i O Hi2 . Puis on cherche u 2 , orthogonal u 1 , qui satisfait le mme
critre et ainsi de suite. Lorsque les individus sont munis
 de poids pi diffrents, le critre consiste
rendre maximum : i pi O Hi2 .



Il est quivalent de rendre maximum i O Hi2 ou de rendre minimum i i Hi2 .
Cette deuxime criture, forme classique du critre des moindres carrs, montre que les
axes factoriels rendent minimum lcart entre le nuage des individus et sa projection.
Du fait du centrage, le critre (inertie maximum par rapport au centre de gravit G)
permet dinterprter les axes factoriels comme des directions dallongement maximum
du nuage N K . On parle aussi de principales dimensions de variabilit, dans la mesure
o ils rendent compte le plus possible de la diversit des individus.

On peut montrer que, toujours 
du fait
maximum i O Hi2
 du centrage, rendre
est quivalent rendre maximum i l (O Hi O Hl )2 . Cette dernire forme fait
apparatre les distances entre points projets. La projection ne pouvant que rduire la
distance entre points, les axes factoriels apparaissent comme les directions telles que
les distances entre points projets ressemblent le plus possible aux distances entre les
points homologues de N I (cf. Figure 1.5).
Selon les objectifs dune analyse, on mettra en avant lune ou lautre des interprtations du critre.
Individus supplmentaires (= illustratifs)

Frquemment, on souhaite que certains individus ninterviennent pas dans la dtermination des axes ; par contre, on souhaite connatre la position de leur projection sur les

1.6 Ajustement du nuage des variables

15

RK

NI
i

u1

l
Hi

Hl

 
2
Figure 1.5 La reprsentation des
distances
(O H
 2 inter-individuelles. Laxe u 1 rend i l
i O Hl )
maximum, cest--dire est tel que i l d (Hi Hl ) est le plus proche possible de i l d2 (i, l).

Dunod La photocopie non autorise est un dlit

axes dtermins par les autres individus (dits actifs). Tous les programmes prvoient
cette situation ce qui revient mettre un poids nul certains individus au niveau du
critre dajustement.
Ces individus sont appels individus supplmentaires (ou illustratifs). On introduit
un individu en supplmentaire lorsque lon souhaite quil participe linterprtation
des plans factoriels mais non leur construction. Cest le cas lorsque lon dispose
dindividus prsentant des caractres exceptionnels, ou suspects davoir t lobjet
derreurs de mesures, ou enfin nappartenant pas au champ strict de ltude mais un
domaine voisin.

1.6 AJUSTEMENT DU NUAGE DES VARIABLES


Pour obtenir une suite de S variables synthtiques {vs ; s = 1, ..., S} et une reprsentation approche des corrlations entre les variables, lACP applique au nuage N K des
variables la mme dmarche quau nuage des individus (cf. Figure 1.6).
Le critre (inertie projete maximum) satisfait dans le choix des axes est exactement
le mme que pour le nuage dindividus. Mais il prend une signification diffrente du
fait que le nuage nest pas centr (son centre de gravit nest pas lorigine) et que
tous les points sont situs sur la sphre unit : ce sont les angles entre les vecteurs
reprsentant les variables qui sont peu dforms par les projections et non pas les
distances entre les points du nuage. En effet, le plan (v1 , v2 ), en maximisant linertie
lorigine du nuage projet, rend maximum la somme des cosinus carrs des angles
entre les vecteurs et leur projection : il ajuste les vecteurs et dforme donc le moins
possible leurs angles.

1 Analyse en Composantes Principales

16

RI
1
NK
k

Hk

v1

v2
1

Figure 1.6 Lajustement du nuage des variables. Hk 


: projection du point reprsentant la variable
k sur v1 . On cherche dabord v1 qui rend maximum : k O Hk2 . Puis on cherche v2 , orthogonal v1 ,
qui satisfait le mme critre et ainsi de suite.

Composantes principales

Le vecteur v1 qui caractrise la direction dinertie maximum dfinit une nouvelle


variable. Les variables tudies tant centres et rduites, leur projection sur v1 est
gale leur coefficient de corrlation avec cettevariable (cf. section 1.4). De ce
fait, rechercher le vecteur v1 qui rend maximum k O Hk2 quivaut rechercher la
combinaison linaire la plus lie lensemble des variables (au sens du critre : somme
des carrs des corrlations maximum). En ce sens, v1 est la variable qui synthtise
le mieux lensemble des variables initiales. Les axes factoriels tant orthogonaux
deux deux, on met en vidence une suite de variables synthtiques, les composantes
principales, non corrles entre elles, qui rsument au mieux lensemble des variables
initiales.
Variables supplmentaires (= illustratives)

Les variables, comme les individus, peuvent tre traites en lments supplmentaires.
Les variables supplmentaires sont simplement projetes sur les axes dtermins par
les autres variables, dites actives. Cela permet de visualiser les corrlations entre
nimporte quelle variable, mme extrieure au domaine tudi, et les composantes
principales.
Leffet taille

Si, dans un jeu de donnes, les variables sont toutes corrles positivement deux
deux, alors le nuage N K est loin de lorigine. Le premier axe factoriel rend alors
surtout compte de la position de N K par rapport lorigine : paralllement, la forme

1.7 Dualit et formules de transition en ACP

17

du nuage N K est mal reprsente en ce sens que les projections des variables sont
proches les unes des autres (cf. Figure 1.7).
RI
NK
v1
1

Figure 1.7 Leffet taille dans R I . Les variables, tant corrles positivement deux deux, forment
entre elles des angles aigus. Le nuage N K est concentr sur un petit secteur de la sphre. La
projection des variables sur le premier axe factoriel, dfini par v1 , rend compte principalement de
la position de N K par rapport O.

Ce cas de figure est couramment appel effet taille : il correspond la situation


dans laquelle certains individus ont des petites valeurs pour lensemble des variables,
dautres de grandes valeurs pour lensemble des variables, les autres occupant une
situation intermdiaire entre ces extrmes. Il existe donc dans ce cas une structure
commune lensemble des variables : cest ce que traduit la premire composante
principale.

Dunod La photocopie non autorise est un dlit

1.7 DUALIT ET FORMULES DE TRANSITION EN ACP


Le nuage N I des individus et le nuage N K des variables sont deux reprsentations du
mme tableau, lune travers ses lignes et lautre travers ses colonnes. Des relations
trs fortes, dites relations de dualit (dmontres en section 5.4) lient ces deux nuages.

1.7.1 Inerties
Tout dabord, leur inertie totale est la mme ; elle est gale au nombre de variables
(lorsque les variables sont rduites) :

2
1   xik xk
Inertie totale de N I (ou de N K ) =
=K
I
sk
k

La projection de chacun de ces deux nuages sur une suite daxes orthogonaux
correspond une dcomposition de linertie totale. On peut montrer que les deux

1 Analyse en Composantes Principales

18

dcompositions sont identiques : les inerties des nuages N I et N K projets sur les axes
factoriels de mme rang sont gales (et notes ls ). Soit, pour les axes de rang s :
Inertie(N I /u s ) = Inertie(N K /vs ) = ls

1.7.2 Facteurs
Lensemble des projections de tous les points du nuage dindividusN I sur le s e axe
factoriel u s , appel s e facteur sur les individus, constitue une nouvelle variable note
Fs . On montre, dans la section 5.4.1, que cette variable se confond, la norme prs,
avec la s e composante principale vs obtenue dans lanalyse du nuage des variables.
Plus prcisment, le carr de la norme du facteur Fs (vecteur de R I ), tant la somme
des carrs de ses coordonnes, vaut ls ; la relation entre le s e facteur sur I et le s e axe
factoriel de R I scrit donc :
1
vs = Fs
ls
Ces rsultats sont illustrs dans la figure 1.8.
Ainsi, les projections planes des individus dans R K sont des reprsentations graphiques des couples de variables synthtiques obtenues dans R I . Les rsultats issus de
ltude de chacun des deux nuages possdent fondamentalement la mme signification,
mme sils sexpriment en termes dindividus pour lun et en termes de variables pour
lautre.

Fs

RK

RI
1

NI
i

NK
us

Fs(i)

i Fs(i)

Fs

vs

1
I

Figure 1.8 Une des deux formes de la dualit. Les coordonnes de N I sur u s (s e axe factoriel de
N I ) constituent le s e facteur sur les individus (not Fs ). Le vecteur Fs dans R I est colinaire vs
(s e axe factoriel de N K ).

1.7 Dualit et formules de transition en ACP

19

Le rle du nuage des individus et celui du nuage des variables sont, dans une certaine
mesure, symtriques et la dualit se formule de manire analogue en changeant le
rle des deux nuages : la projection des K variables sur le s e axe factoriel vs de leur
nuage N K dfinit une valeur pour chacune des K variables : ces valeurs constituent le
s e facteur sur les variables (not G s ) qui est en quelque sorte un individu nouveau.
Cette notion dindividu type est moins classique que celle de composante principale
(pratiquement, on prend plutt des individus rels comme individus types). Cependant,
dans quelques cas particuliers, comme celui o les individus sont des courbes et les
variables leurs valeurs en K points de discrtisation, ces individus sont reprsentables
et de ce fait utiliss.
On montre que le point reprsentant dans R K cet individu type est situ sur le s e
axe du nuage des individus. Plus prcisment :

Dunod La photocopie non autorise est un dlit

1
us = Gs
ls

Cette relation montre que, au coefficient ls prs, les coordonnes des variables
sur vs sont les coefficients de la combinaison linaire des variables que constitue
laxe u s de R K . Ainsi, la coordonne de la variable k sur vs sinterprte la fois
comme le coefficient de corrlation entre k et vs et comme le coefficient de k dans u s ;
cette double interprtation est caractristique des axes principaux et essentielle dans
linterprtation ( linverse, penser aux difficults dinterprtation des coefficients de
la rgression multiple quand ils ne sont pas de mme signe que les coefficients de
corrlation associs). Ce rsultat est illustr dans la figure 1.9.

RI
1

Gs
1

NK
k

RK
NI

vs
Gs(k)

Gs
i Gs(k)

us

var k
Gs(k)

1
I

Figure 1.9 La deuxime forme de la dualit. Les coordonnes de N K sur vs ( s e axe factoriel de
N K ) constituent le s e facteur sur les variables (not G s ). Le vecteur G s dans R K est colinaire au s e
axe factoriel u s de N I .

1 Analyse en Composantes Principales

20

1.7.3 Relations de transition


On appelle relations de transition entre les facteurs de rang s, Fs et G s , lcriture
algbrique des proprits illustres par les figures 1.8 et 1.9. Ces relations scrivent,
en notant ls linertie projete de N I (ou de N K ) sur laxe de rang s :
1  xik xk
Fs (i) =
G s (k)
sk
ls k
G s (k) =

1 1  xik xk

Fs (i)
I ls
sk
i

La premire relation exprime le fait que la projection Fs (i) dun individu i, est une
combinaison linaire des projections G s (k) de toutes les variables. Dans cette combinaison linaire, le coefficient dune variable k est positif si la valeur xik de cette
variable pour lindividu i dpasse la moyenne xk . Dans le cas contraire, ce coefficient
est ngatif. Ainsi, lorsque lon regarde simultanment les deux graphiques, un individu est du ct des variables pour lesquelles il a de fortes valeurs et loppos des
variables pour lesquelles il a de faibles valeurs.
Le graphique des individus est une reprsentation approche des distances interindividuelles. Celui des variables peut tre considr en tant qulment explicatif
de cette reprsentation : deux individus situs une mme extrmit dun axe sont
proches car ils ont tous deux gnralement de fortes valeurs pour les variables situes
du mme ct queux et de faibles valeurs pour les variables situes loppos.
Rciproquement, le graphique des individus peut intervenir en tant quaide linterprtation du graphique des variables : si deux variables sont trs corrles positivement,
elles sont situes du mme ct sur un axe. Sur laxe correspondant du nuage dindividus, les individus qui ont de fortes valeurs pour ces deux variables se situent du mme
ct quelles et ceux qui ont de faibles valeurs se situent loppos. Les individus
extrmes pour ces variables sont loin de lorigine. Les ventuels individus particuliers
induisant eux seuls des corrlations fortes sont ainsi reprs facilement.
Ainsi, en ACP, le graphique des individus et celui des variables sont la fois
optimaux en eux-mmes (ils reprsentent le mieux possible lun les individus lautre
les variables) et se servent mutuellement daides linterprtation. Cette proprit liant
les reprsentations des lignes et des colonnes vaut pour toutes les analyses factorielles
et leur est spcifique.

1.7.4 Reprsentation superpose


La ncessit dune interprtation conjointe des reprsentations des individus et des
variables conduit certains utilisateurs les superposer. Il importe de souligner que la
justification dune telle reprsentation simultane des individus et des variables est

1.8 Schma gnral de lACP

21

essentiellement pragmatique : la reprsentation des variables aide linterprtation de


celle des individus et rciproquement. Elle pose toutefois le problme de la reprsentation sur un mme graphique de points de natures diffrentes, voluant dans des espaces
diffrents. Cette difficult nest pas seulement de principe : la prsence simultane
dindividus et de variables sur un mme plan engendre des proximits entre individus
et variables qui, leur tour, peuvent suggrer des ides qui ne se vrifient pas dans les
donnes. Cest pourquoi cette reprsentation est dconseille. Toutefois, en conservant
lesprit les points de repre suivants, on pourra utiliser sans danger la reprsentation
simultane en ACP.
1. Les formules de transition relient la coordonne sur un axe dun individu avec
lensemble des coordonnes de toutes les variables sur laxe de mme rang. On
ne peut interprter la position dun individu par rapport une seule variable (et
rciproquement).
2. Fondamentalement, les variables sont des vecteurs et non des points. Ce nest
pas la proximit entre un individu et un ensemble de points reprsentant des
variables qui est importante mais lloignement de lindividu dans la direction
de cet ensemble de variables.

Dunod La photocopie non autorise est un dlit

1.7.5 Projection des vecteurs unitaires de la reprsentation des individus


Une autre ide, en vue de la reprsentation superpose des individus et des variables,
consiste projeter les vecteurs unitaires de R K sur les axes u s . On obtient ainsi une
reprsentation superpose plus naturelle que la prcdente, en ce sens que les objets
reprsents proviennent du mme espace.
Du fait de la relation entre u s et G s , et en remarquant que la k e coordonne de u s
est gale la projection sur u s du vecteur unitaire du k e axe de R K , cette nouvelle
reprsentation
des variables est homothtique de la prcdente axe par axe dans le

rapport ls .
Notre prfrence va la 1e reprsentation superpose, fonde sur les relations de
transition donnes plus haut, car elle permet dinclure les variables supplmentaires.

1.8 SCHMA GNRAL DE LACP


Nous rsumons les principaux rsultats de ce chapitre dans un schma gnral (cf.
Figure 1.10). Les numros ci-dessous renvoient ce schma.
1.

Les donnes brutes. Lignes (individus) et colonnes (variables) ne jouent pas des
rles symtriques : les moyennes et les variances nont gnralement de sens
que pour les colonnes.

1 Analyse en Composantes Principales

22

Variables
k
K

individus

x ik

I
3
1

xik xk
sk

xik xk
sk

xik xk
sk

i
I

RK

RI

NI
NK

6
h

k
individu i

O
variable k

O=G

xik xk
sk

AF

xik xk
sk

AF
11

F2

G2

10

relations
de transition

9
i

k
1

F1
12

G2 F2
i

k
1

G1
F1

Figure 1.10 Schma gnral de lACP.

r(k,F1)

G1

1.8 Schma gnral de lACP

2.

23

Les donnes centres et rduites. Que lon sintresse aux individus ou aux
variables, le tableau est transform de la mme faon. Le centrage est surtout
technique. La rduction permet de saffranchir de larbitraire des units de
mesure.

3 et 4. Dans ltude des individus, le tableau est considr comme une juxtaposition
de lignes. Dans ltude des variables, le tableau est considr comme une
juxtaposition de colonnes. Cest le mme tableau qui est considr de deux
faons diffrentes.
5.

Un individu est une suite de K nombres et peut tre reprsent par un point
de R K . Dans le nuage N I , on sintresse aux distances inter-individuelles qui
sinterprtent comme des ressemblances. Du fait du centrage, lorigine des axes
est confondue avec le centre de gravit de N I . Dans la plupart des cas, on affecte
chaque individu le mme poids : 1/I .

6.

Une variable est une suite de I nombres et peut tre reprsente par un vecteur
de R I . Dans le nuage N K , on sintresse surtout aux angles entre variables. Le
cosinus dun angle entre deux variables sinterprte comme le coefficient de
corrlation entre les deux variables. Du fait de la rduction, toutes les variables
sont quidistantes de lorigine et donc situes sur une hypersphre de rayon 1.

Dunod La photocopie non autorise est un dlit

7 et 8. LAnalyse Factorielle (AF) dun nuage consiste mettre en vidence une suite
de directions telles que linertie, par rapport O, de la projection du nuage
sur ces directions est maximum. Dans R K , o lorigine O est confondue avec
le centre de gravit G, les axes factoriels sont les directions dallongement
maximum de N I . Dans R I , o la projection dune variable sur une autre sinterprte comme un coefficient de corrlation, les axes factoriels sont les variables
synthtiques les plus lies lensemble des variables initiales.
9.

Le plan factoriel croisant deux facteurs sur les individus -ici F1 (I ) et F2 (I )fournit une image approche de N I dans R K . La distance entre deux points
sinterprte comme une ressemblance.

10.

Le plan factoriel croisant deux facteurs sur les variables -ici G 1 (K ) et G 2 (K )fournit une image approche de N K dans R I . Les coordonnes dune variable
sinterprtent comme des coefficients de corrlation avec les facteurs sur les
individus.

11.

Les relations de transition expriment les rsultats dune AF (par exemple dans
R I ) en fonction des rsultats de lautre (par exemple dans R K ).

12.

Du fait des relations de transition, les interprtations des axes factoriels doivent
tre menes simultanment. Il peut tre commode de superposer ces deux
reprsentations.

1 Analyse en Composantes Principales

24

1.9 AIDES LINTERPRTATION


Les axes factoriels fournissent des images approches dun nuage de points. Il est
donc ncessaire de mesurer la qualit de lapproximation, tant pour chacun des points
que pour lensemble du nuage. En outre, les plans factoriels reprsentent les coordonnes des points et non les inerties qui ont prsid leur dtermination. Il est souvent
utile de consulter ces inerties. Il en rsulte que ltude dun plan est toujours ralise
conjointement avec la consultation dun ensemble dindicateurs regroups sous le
terme daides linterprtation. Ce paragraphe dfinit les principales aides linterprtation : le chapitre 2 contient le traitement dun exemple se rfrant largement
ces aides ; le chapitre 11 montre comment elles sinsrent dans une dmarche gnrale
dinterprtation.

1.9.1 Dfinitions
a) Qualit de reprsentation dun lment par un axe

La qualit de reprsentation de llment i (individu ou variable) par laxe s est


mesure par le rapport :
QLTs (i) =

[inertie de la projection de llment i sur laxe s]


[inertie totale de i]

Cest aussi le cosinus carr de langle u entre Oi et laxe s (cf. Figure 1.11).
QLTs (i) =

(O His )2
= cos2 u
(Oi)2

i
us
O

s
Hi

Figure 1.11 Qualit de reprsentation dun lment par un axe. His : projection de i sur laxe de
rang s

1.9 Aides linterprtation

25

Cette dfinition se gnralise au cas dun plan. En outre, du fait de lorthogonalit


des axes factoriels, la qualit de reprsentation de llment i par le plan (axe s, axe t)
est la somme des qualits de reprsentation de i par laxe s et par laxe t. Cest aussi
le cosinus carr de langle entre le vecteur Oi et le plan de projection. Si la qualit
de reprsentation dun point sur un axe ou un plan est proche de 1, ce point est trs
proche de laxe ou du plan. Sil sagit dun individu, sa distance au centre de gravit
(qui est le point moyen) est alors bien visible sur la projection. Elle ne lest pas dans
le cas contraire (lorsque sa qualit de reprsentation est proche de 0). De mme, la
distance entre deux points sur un plan ne traduit bien leur distance dans le nuage que
si ces deux points sont bien reprsents. Sil sagit dune variable centre-rduite, le
vecteur a pour norme 1 et sa qualit de reprsentation est le carr de la longueur de
sa projection. Sur un plan, elle sapprcie directement par sa proximit au cercle de
rayon 1, trace de lhypersphre de rayon 1 sur le plan factoriel. Ce cercle est appel
couramment cercle des corrlations.
b) Qualit de reprsentation dun nuage par un axe

La dfinition prcdente se gnralise lensemble dun nuage par le rapport :


inertie de la projection du nuage sur laxe
inertie totale du nuage

Dunod La photocopie non autorise est un dlit

Cet indicateur, appel pourcentage dinertie associ un axe, mesure en outre


limportance relative dun axe factoriel dans la variabilit des donnes.
Comme dans le cas dun seul lment, ces pourcentages peuvent tre cumuls sur
plusieurs axes ; on parle alors du pourcentage dinertie extrait par un plan ou par les S
premiers facteurs. Du fait de la dualit (cf. section 1.7), il est quivalent de calculer
ces pourcentages dinertie partir du nuage des individus ou de celui des variables.
c) Contribution dun lment linertie dun axe

Un axe factoriel rend maximum (sous contrainte dorthogonalit avec les axes prcdents) linertie projete dun nuage. Cette inertie projete du nuage peut tre dcompose point par point. Le quotient de linertie de la projection de llment i (de poids
pi ) sur laxe s [soit pi (O His )2 ] par linertie de la projection de lensemble du nuage
sur laxe s (soit ls ) reprsente la contribution de llment i linertie de laxe s. Soit,
en notant CTRs (i) la contibution de llment i laxe de rang s :

2
pi O His
C T Rs (i) =
ls
Cet indicateur se gnralise un sous-ensemble dlments. La contribution dun
ensemble de points linertie dun axe est la somme des contributions des points

1 Analyse en Composantes Principales

26

qui le composent. Ce rapport est prcieux pour mettre en vidence le sous-ensemble


dlments qui ont contribu principalement la construction de laxe et sur lequel
sappuiera en premier lieu linterprtation.

1.9.2 Exemple numrique


Nous prsentons ici, sur un exemple artificiel, la faon dont les coordonnes des points
et les aides linterprtation interviennent dans lanalyse dun facteur. Sept points du
plan, munis de poids, sont reprsents dans leurs axes principaux (cf. Figure 1.12).
F2

A
B
C
D
E
F
G

Pour F1
QLT1 CTR1
0
0
0
0
1
.026
1
.263
1
.047
.692
.332
.692
.332

G (.07)

B (.15)

D (.5)
-1

F1
C (.05)

E (.01)

A (.15)

F (.07)

Figure 1.12 Nuage plan pondr reprsent dans ses axes principaux. Les poids figurent entre
parenthses. QLT1 , CTR1 : qualit de reprsentation et contribution (pour le premier axe).

a) Coordonnes sur F1

Les points A, B, et C sont moyens ; D, E, F et G sont extrmes, D tant oppos E, F


et G. Quelle que soit la qualit de reprsentation de ces points et leur contribution
linertie, cette structure traduite par le premier facteur nest pas mettre en doute.
b) Qualit de reprsentation sur F1

32
inertie projete de G
Exemple : QLT1 (G) = inertie totale de G = 2
= .692
(3 + 22 )
Les points D, C et E, situs sur laxe, ont une qualit de reprsentation gale 1.
Leurs distances dans le plan ( lorigine et entre eux) sont compltement traduites
dans leur projection sur F1 . Les points D et E, la fois extrmes et bien reprsents,
sont caractristiques de laxe : lexamen de leurs diffrences avec la moyenne et entre
eux permet de prciser lopposition traduite par F1 . Rciproquement, toute valeur de
E et de D qui scarte de la moyenne sinterprte par F1 .

1.10 variables qualitatives illustratives en ACP

27

Les points A et B, situs dans une direction orthogonale laxe 1, ont une qualit
de reprsentation sur le premier axe gale 0 : ni leur cart par rapport lorigine, ni
leur distance dans le plan ne sont visibles sur le premier facteur.
Les points F et G, extrmes, ont une qualit de reprsentation moyenne : bien que
trs marqu pour le facteur F1 , leur cart la moyenne nest quen partie traduit par
lui.
Contribution linertie de F 1

Exemple : inertie du nuage (l1 ) : .5(1)2 + .05(1)2 + .01(3)2 + .07(3)2 + .07(3)2 = 1.9
CTR1 (F) = inertie du point F/ inertie du nuage = (.07 32 )/1.9 = .332
Les points A et B ont une coordonne nulle, donc une contribution nulle. Le point
C est proche de O et a un petit poids : sa contribution est extrmement faible. La
suppression de ces trois points ne modifierait pas la direction du premier facteur.
Les points E et F ont la mme coordonne mais E, ayant un poids 7 fois plus faible
que F, a une contribution 7 fois plus faible. La suppression de E risque moins de
modifier le facteur que celle de F, pourtant moins bien reprsent.
Le point D, malgr son poids gal plus de 7 fois celui de F, a une contribution plus
faible car il est situ plus prs de lorigine (dans la contribution linertie, la distance
intervient par son carr alors que le poids intervient tel quel).

Dunod La photocopie non autorise est un dlit

1.10 VARIABLES QUALITATIVES ILLUSTRATIVES EN ACP


On est souvent conduit vouloir relier les rsultats dune ACP des variables qualitatives dfinis sur les individus.
Exemple : On tudie les notes obtenues diffrentes preuves par un ensemble
dlves. LACP de ce tableau met en vidence les principales dimensions de variabilit
des lves, par exemple une opposition entre les lves plutt meilleurs dans les
matires scientifiques et ceux plutt meilleurs dans les matires littraires. On dispose
par ailleurs dinformations sur ces lves sous forme de variables qualitatives, par
exemple leur genre (fille/garon), la catgorie socio-professionnelle des parents, etc. Il
est utile de relier ces variables qualitatives aux axes factoriels, avec en perspective des
questions du type : observe-t-on, sur ces donnes, lide souvent mise selon laquelle
les filles obtiennent des rsultats plutt meilleurs dans les matires littraires et les
garons des rsultats plutt meilleurs dans les matires scientifiques ?
Pour cela, on dispose de deux outils graphiques simples et efficaces :
identification, sur les plans factoriels, des individus par leur modalit laide dun
code, de couleur ou de forme (dans lexemple on pourra identifier les filles par
un point rose et les garons par un point bleu !) ; cela permet dtudier finement

28

1 Analyse en Composantes Principales

la relation entre une variable qualitative et le plan factoriel mais ncessite un


graphique par variable ;
reprsentation, sur les plans factoriels, des centres de gravit des ensembles dindividus possdant une mme modalit (dans lexemple, le centre de gravit des
filles et celui des garons) ; la diffrence de la technique prcdente, un seul graphique permet dexaminer plusieurs variables qualitatives simultanment, mais,
en revanche, ne donne pas dinformations quant la variabilit des individus
prsentant une mme modalit.
On peut chercher traduire la variabilit des individus autour des centres de gravit
des variables qualitatives en terme de variabilit des centres de gravit eux-mmes.
Pour cela, on construit, autour de chaque centre de gravit, une ellipse de confiance,
analogue bi-dimensionnel de lintervalle de confiance que lon calcule usuellement
autour dune moyenne. Pour produire ces ellipses, on procde de la faon suivante :
1. On considre lensemble I des I individus observs, comme un chantillon dune
population plus vaste, dite de rfrence ; dans cette perspective, la variabilit des
individus se traduit par une variabilit des centres de gravit induite par le fait
que lensemble I observ nest que lun des ensembles possibles de I individus
parmi la population de rfrence.
2. La variabilit des centres de gravit pourrait tre obtenue en extrayant dautres
chantillons de la population de rfrence mais cela est gnralement impossible ;
aussi approxime-t-on la population de rfrence par lensemble I et lon tire,
au hasard avec remise, plusieurs chantillons de I individus dans cet ensemble ;
cette procdure est appele bootstrap .
3. Pour chaque chantillon bootstrap , on calcule les centres de gravit des
diffrentes modalits et lon projette ces centres de gravit (dits bootstrap) en
supplmentaire sur les plans de lACP (initiale) des I .
4. Si lon effectue n tirages bootstrap, on obtient, pour une modalit donne, n
points ; on pourrait se contenter de reprsenter ces n points mais les graphiques
obtenus sont peu lisibles ds lors que le nombre de modalits tudies est un
tant soit peu grand ; pour simplifier les reprsentations, on construit lellipse
centre sur le centre de gravit initial et contenant 95 % des n centres de gravit
bootstrap ; ces ellipses sont dites ellipses de confiance bootstrap . Lexprience
montre que schmatiser la distribution des n points par une ellipse nest pas
gnant (au sens ou, en pratique, lobservation du nuage des n points ne conduit
pas des interprtations plus riches) ds lors que leffectif par modalit est assez
grand (disons une vingtaine dindividus pour fixer les ides).

1.10 variables qualitatives illustratives en ACP

29

Remarque

La taille dune ellipse ainsi obtenue dpend de la variabilit (dans le plan factoriel)
des individus prsentant la modalit tudie mais aussi de son effectif.
Lutilisation pratique des ellipses de confiance sarticule autour de deux questions
relatives aux modalits.
La modalit m est-elle caractrise par le plan factoriel ? Autrement dit, les individus possdant la modalit m occupent-ils (dans lensemble) une position excentre
sur le plan ? Pour cela, on examine la position de lorigine des axes, centre de gravit
de lensemble I , par rapport lellipse de confiance de m. Si cette ellipse englobe
lorigine, on dcidera que la modalit m (i.e. les individus possdant cette modalit)
nest pas caractrise par le plan.
Les deux modalits m et m  sont-elles diffrencies par le plan ? Autrement dit,
les individus possdant la modalit m occupent-ils, dans lensemble, la mme rgion
du plan que ceux possdant la modalit m  ? Pour cela, on examine le recouvrement
entre les deux ellipses associes aux modalits m et m  . Une absence de recouvrement
conduit dcider que le plan diffrencie les deux modalits et, linverse, un fort
recouvrement conduit dcider dune non diffrenciation. Un recouvrement faible
laisse la place au doute : pour aider sa dcision, lutilisateur peut calculer la probabilit
critique du test statistique T2 de Hotelling appliqu la comparaison des deux
modalits du point de vue des deux composantes principales tudies considres
simultanment.
Les questions concernant la position des modalits sur un plan peuvent tre poses
pour chaque axe. Pour cela, en projetant les ellipses sur chaque axe, on obtient un
intervalle de confiance que lon peut utiliser comme un intervalle de confiance usuel.
Il existe aussi un indicateur, appel valeur-test et introduit initialement dans le logiciel
SPAD, qui permet de juger, pour un axe factoriel (et, plus gnralement pour nimporte
quelle variable), de lcart entre le centre de gravit dune classe et le centre de gravit
gnral (cf. section 2.4.4 page 54).

Chapitre 2

Exemple dACP et de CAH

Le commentaire de lACP dun petit tableau permet dillustrer les rgles et la dmarche
dinterprtation dune ACP (voir aussi chapitre 11). Nous en prsentons un ci-aprs.
En pratique, le dpouillement des rsultats dune analyse factorielle saccompagne
gnralement de celui des rsultats dune classification ascendante hirarchique (CAH)
ralise sur les mmes donnes. Lobjet de ce livre, ddi aux analyses factorielles,
exclut une prsentation gnrale des mthodes de classification. En revanche, il a
paru utile daccorder quelque place lnonc des principes rgissant la mthode
de classification ascendante hirarchique la plus utilise simultanment aux analyses
factorielles (la mthode de Ward) et lillustration du dpouillement conjoint des
rsultats des deux mthodes.
Les donnes utilises pour illustrer lACP serviront introduire ces lments de
classification.

2.1 DONNES ET PROBLMATIQUE


2.1.1 Description des donnes
Pour 15 villes de France, on dispose des moyennes des tempratures mensuelles
calcules sur 30 ans (entre 1931 et 1960). Ces donnes sont extraites du Quid 1986,
page 507 (ditions Robert Laffont).
Elles sont rassembles dans le tableau 2.1, qui croise les 15 villes (en lignes)
et les 12 mois de lanne (en colonnes). Les quatre colonnes supplmentaires sont
commentes par la suite. Les deux dernires lignes, la moyenne et lcart-type des
colonnes, ne sont l que pour information ; elles ne sont pas introduites dans lanalyse.

2 Exemple dACP et de CAH

32

janv fvr mars avri mai juin juil ao sept octo nove dce
Bordeaux
Brest
Clermont
Grenoble
Lille
Lyon
Marseille
Montpellier
Nantes
Nice
Paris
Rennes
Strasbourg
Toulouse
Vichy

5.6
6.1
2.6
1.5
2.4
2.1
5.5
5.6
5.0
7.5
3.4
4.8
.4
4.7
2.4

6.6
5.8
3.7
3.2
2.9
3.3
6.6
6.7
5.3
8.5
4.1
5.3
1.5
5.6
3.4

10.3 12.8 15.8 19.3 20.9 21.0 18.6 13.8


7.8 9.2 11.6 14.4 15.6 16.0 14.7 12.0
7.5 10.3 13.8 17.3 19.4 19.1 16.2 11.2
7.7 10.6 14.5 17.8 20.1 19.5 16.7 11.4
6.0 8.9 12.4 15.3 17.1 17.1 14.7 10.4
7.7 10.9 14.9 18.5 20.7 20.1 16.9 11.4
10.0 13.0 16.8 20.8 23.3 22.8 19.9 15.0
9.9 12.8 16.2 20.1 22.7 22.3 19.3 14.6
8.4 10.8 13.9 17.2 18.8 18.6 16.4 12.2
10.8 13.3 16.7 20.1 22.7 22.5 20.3 16.0
7.6 10.7 14.3 17.5 19.1 18.7 16.0 11.4
7.9 10.1 13.1 16.2 17.9 17.8 15.7 11.6
5.6 9.8 14.0 17.2 19.0 18.3 15.1 9.5
9.2 11.6 14.9 18.7 20.9 20.9 18.3 13.3
7.1 9.9 13.6 17.1 19.3 18.8 16.0 11.0

9.1
9.0
6.6
6.5
6.1
6.7
10.2
10.0
8.2
11.5
7.1
7.8
4.9
8.6
6.6

lati longi moy ampli

6.2 44.50 -0.34 13.33


7.0 48.24 -4.29 10.77
3.6 45.47 3.05 10.94
2.3 45.10 5.43 10.98
3.5 50.38 3.04 9.73
3.1 45.45 4.51 11.36
6.9 43.18 5.24 14.23
6.5 43.36 3.53 13.89
5.5 47.13 -1.33 11.69
8.2 43.42 7.15 14.84
4.3 48.52 2.20 11.18
5.4 48.05 -1.41 11.13
1.3 48.35 7.45 9.72
5.5 43.36 1.26 12.68
3.4 46.08 3.26 10.72

15.4
10.2
16.8
18.6
14.7
18.6
17.8
17.1
13.8
15.2
15.7
13.1
18.6
16.2
16.9

Moyenne
4.0 4.8 8.2 11.0 14.4 17.8 19.8 19.6 17.0 12.3 7.9 4.9 46.0 2.58 11.8 15.9
Ecart-type 1.94 1.81 1.48 1.37 1.45 1.73 2.06 1.94 1.79 1.77 1.74 1.89 2.22 3.21 1.55 2.25

Tableau 2.1 Tempratures moyennes mensuelles de 15 villes de France. La latitude et la longitude


(ngative louest du mridien de Greenwich) sont exprimes en degrs. Moy : moyenne des
12 moyennes mensuelles. Ampli : amplitude thermique (moyenne mensuelle maximum-moyenne
mensuelle minimum)

2.1.2 Problmatique
Le but gnral de ltude est de comparer les tempratures mensuelles des diffrentes
villes. Prcisons quelques questions auxquelles les rsultats de lACP permettent de
rpondre en abordant le tableau successivement travers ses lignes et travers ses
colonnes.
a) Point de vue des lignes (ou individus : les villes)

Chaque ville est caractrise par ses 12 tempratures moyennes mensuelles. Quelles
sont, de ce point de vue, les villes qui se ressemblent ? Quelles sont celles qui diffrent ? Plus gnralement, peut-on faire une typologie des villes mettant en vidence
lensemble des ressemblances ainsi dfinies ? En ACP, la dissemblance entre les individus est mesure par une distance (cf. section 1.1 page 7). Ici, le carr de la distance
entre deux villes est la somme des carrs des douze diffrences entre leurs tempratures
moyennes mensuelles. Cela traduit bien la notion souhaite de proximit. Cette typologie faite, on peut se demander si ces ressemblances (ou dissemblances) correspondent
des proximits (ou des loignements) gographiques.
Ltude des individus revient donc analyser leur variabilit. Un point de vue voisin
de celui de typologie consiste mettre en vidence les principales dimensions de cette
variabilit.

2.1 Donnes et problmatique

33

b) Point de vue des colonnes (ou variables : les mois)

Chaque mois est vu au travers des tempratures moyennes mensuelles des 15 villes.
Le problme nest pas de sparer les mois chauds des mois froids pour lensemble
des 15 villes (ce qui arriverait si nous les considrions comme des individus) mais de
comparer la rpartition des 15 villes (des plus chaudes aux plus froides) pour deux
mois diffrents sans tenir compte du fait que dun mois lautre les tempratures sont
globalement plus ou moins leves (llimination de cet effet de moyenne est assure
par le centrage). Les comparaisons entre mois se font au travers de la notion de liaison,
plus prcisment de corrlation, entre variables numriques. Deux mois sont dautant
plus corrls que, pour chacun, on observe la mme rpartition des 15 villes selon leur
temprature. linverse, ils sont peu corrls si ce ne sont pas dans les mmes villes
que lon trouve les tempratures les plus leves (ou les plus basses).
Cela pos, les questions sont les suivantes : quels mois sont corrls entre eux ?
Quels sont ceux qui le sont peu ? Plus gnralement, peut-on faire un bilan des corrlations entre les 12 mois ? Les tempratures mensuelles sont-elles lies la position
gographique ? Dautre part, si les mois sont corrls, linformation donne par les
12 colonnes est, en un certain sens, redondante. Peut-on la rsumer en remplaant les
12 mois par un petit nombre de variables synthtiques ?
c) Ajout de variables supplmentaires (ou illustratives)

Dunod La photocopie non autorise est un dlit

Il apparat dans la problmatique que les tempratures doivent tre analyses en ayant
lesprit la position gographique des villes. On peut formaliser cette position par
la latitude et la longitude, donnes introduites dans lanalyse en tant que variables
supplmentaires. Deux autres variables supplmentaires ont t ajoutes pour des
raisons qui apparaissent au cours de linterprtation.
d) Faut-il rduire les donnes ?

Lorsque les units de mesure diffrent dune variable lautre, le recours la rduction
des variables est systmatique (cf. 1.2 page 10). Ce nest pas le cas ici et la question
mrite dtre pose.
Ne pas rduire revient ici considrer quun cart de 1 degr entre deux villes a
la mme importance quel que soit le mois au cours duquel il est observ, que ce soit
un mois o les carts entre les tempratures des 15 villes sont plutt faibles ou au
contraire importants. Selon ce point de vue, dans les distances entre les villes, un mois
possde alors dautant plus dinfluence que lon y observe de grandes diffrences de
tempratures dune ville lautre (ne pas rduire les variables revient accorder aux
variables rduites un poids gal leur variance). linverse, en rduisant, on accorde
chaque mois de lanne la mme importance a priori dans lanalyse.

34

2 Exemple dACP et de CAH

Sur ce jeu de donnes, les deux points de vue sont galement dfendables. Pour
cet exemple didactique, nous choisissons de rduire les donnes ; lACP est alors dite
norme. Comme les carts-types varient peu dun mois lautre (minimum : 1.37 et
maximum : 2.06), les deux analyses, norme et non norme, conduisent ncessairement
des rsultats trs proches. Ceci a t vrifi : pour les quatre premiers facteurs, les
coefficients de corrlation entre les facteurs de mme rang des deux analyses sont tous
suprieurs 0.99.
Remarque
En pratique, la rduction est loption par dfaut dans les logiciels.

2.2 RSULTATS DE LACP


2.2.1 Indicateurs dinertie
Dans une ACP norme, linertie totale de chacun des nuages (celui des villes et
celui des mois) est gale au nombre de variables actives (ici 12). Avec une inertie de
9.58, qui reprsente 80 % de linertie des nuages dans lespace tout entier, le premier
facteur est largement prpondrant. Linertie du deuxime facteur vaut 2.28 et celle du
troisime 0.07 ; les deux premiers facteurs totalisent 98.8 % de linertie totale. Les deux
nuages de points (individus et variables) sont donc pratiquement bidimensionnels :
leur projection sur le premier plan factoriel en donne une reprsentation quasiment
parfaite. On se limite dans linterprtation ltude de ces deux premiers facteurs et
du plan quils engendrent.
Contribution des individus (cf. Tableau 2.2)

Le premier facteur est d essentiellement 5 villes (Lille, Marseille, Montpellier, Nice


et Strasbourg) qui totalisent 77.4 % de son inertie. Compte tenu du faible nombre de
villes tudies, cette situation est banale et nattire pas dobservation particulire.
Le deuxime facteur est d pour moiti (49.1 %) la ville de Brest, qui est donc
assez particulire du point de vue climatique. Remarquons toutefois que la diffrence
dinertie entre le deuxime et le troisime facteur (2.28 0.07 = 2.20) est beaucoup
plus grande que linertie de Brest le long du deuxime axe (2.280.49 = (4.093)2
(1/15) = 1.12). Mme sans la ville de Brest, ce deuxime facteur serait donc apparu.
Il semble que le cas de Brest est, certes, particulier mais sinscrit dans une tendance
gnrale, ce qui sera confirm lors de linterprtation.

2.2 Rsultats de lACP

Bordeaux
Brest
Clermont
Grenoble
Lille
Lyon
Marseille
Montpellier
Nantes
Nice
Paris
Rennes
Strasbourg
Toulouse
Vichy
Ensemble

Coordonne
F1
F2
3.121 0.109
2.268 4.093
1.726
0.593
1.529
1.688
4.217 0.595
0.835
1.788
4.833
0.829
4.147
0.435
0.281 1.115
6.007 0.789
1.242
0.156
1.439 1.671
4.106
2.172
1.736
0.136
2.201
0.575
0
0

35

Contribution
F1
F2
6.8
0
3.6
49.1
2.1
1
1.6
8.3
12.4
1
0.5
9.4
16.2
2
12
0.6
0.1
3.6
25.1
1.8
1.1
0.1
1.4
8.2
11.7
13.8
2.1
0.1
3.4
1
100
100

Qual. de reprsentation
F1
F2
F1,F2
.947
.001
.948
.234
.763
.998
.88
.104
.984
.429
.523
.952
.972
.019
.991
.178
.817
.995
.964
.028
.993
.986
.011
.997
.056
.886
.943
.98
.017
.997
.889
.014
.903
.42
.567
.986
.776
.217
.993
.953
.006
.958
.922
.063
.984
.7985 .1897
.9882

d(i, O)

Inertie

3.207
4.685
1.840
2.335
4.278
1.978
4.922
4.177
1.184
6.068
1.317
2.220
4.662
1.779
2.293

5.7
12.2
1.9
3
10.2
2.2
13.5
9.7
0.8
20.5
1
2.7
12.1
1.8
2.9
100

Tableau 2.2 Aides linterprtation des 15 villes pour les 2 premiers facteurs.

janv fvr mars avri mai juin juil aot sept octo nove dce lati longi moy ampl
Facteur 1 .76 .88 .97 .97 .87 .86 .84 .90 .97 .98 .90 .77 -.84 .17 1.00 .10
Facteur 2 -.64 -.47 -.16 .20 .47 .50 .53 .43 .21 -.17 -.41 -.62 -.31 .79 -.02 .99
Tableau 2.3 Coordonnes (=corrlations) des variables actives et supplmentaires pour chacun
des 2 premiers facteurs.

2.2.2 Interprtation du premier facteur

Dunod La photocopie non autorise est un dlit

a) Coordonnes des variables actives (cf. Tableau 2.3 et Figure 2.1)

Les 12 variables sont corrles fortement et positivement au premier facteur. Etant


ainsi lies une mme variable, elles sont lies entre elles ; ceci peut tre constat sur
la partie haute de la matrice des corrlations (cf. Tableau 2.4) dont toutes les valeurs
sont positives.
Ce type de facteur est classique et est appel effet taille (cf. 1.6 page 15). Il
exprime que certains individus ont de grandes valeurs pour lensemble des variables
et dautres de petites valeurs pour lensemble des variables. Dans notre exemple, cela
indique que certaines villes sont plus chaudes que dautres tout au long de lanne.
b) Coordonnes des individus (cf. Tableau 2.2 et Figure 2.2)

Compte tenu des relations entre les coordonnes des individus et celles des variables
(cf. relations de transition, section 1.7.3 page 20), on sattend trouver, le long de
laxe 1, les villes chaudes du ct des coordonnes positives et les villes froides du

2 Exemple dACP et de CAH

36

janv fvr mars avri mai juin juil aot sept octo nove dce lati longi moy ampl
Janvier
Fvrier
Mars
Avril
Mai
Juin
Juillet
Aot
Septembre
Octobre
Novembre
Dcembre

1
.97
.84
.61
.36
.34
.30
.41
.60
.85
.95
.99

Latitude
Longitude
Moyenne
Amplitude

-.42
-.39
.77
-.57

1
.93
.76
.55
.52
.49
.59
.76
.94
.99
.97

1
.92
.77
.76
.72
.80
.91
.97
.93
.83

1
.95
.94
.91
.95
.98
.91
.78
.62

1
.99
.98
.98
.94
.77
.59
.38

1
.99
.99
.94
.76
.57
.36

1
.99
.93
.74
.55
.32

-.60 -.81 -.85 -.84 -.87 -.88


-.22 -.04 .29 .54 .53 .59
.89 .97 .96 .86 .85 .83
-.38 -.06 .28 .55 .58 .62

1
.97 1
.81 .93
1
.64 .80 .96
1
.43 .62 .87 .96
-.90
.50
.89
.52

-.90
.35
.97
.31

-.78
.07
.98
-.06

-.64
-.13
.91
-.30

1
-.44 1
-.35 -.31
.79 -.83
-.54 -.42

1
.16
1
.83 .08

Tableau 2.4 Matrice des corrlations entre toutes les variables.

ct des coordonnes ngatives. Cest bien ce que lon observe, laxe 1 opposant principalement Nice, Marseille et Montpellier ( droite) Lille et Strasbourg ( gauche).
Cette opposition se retrouve facilement dans les donnes. Ainsi, quel que soit le mois
de lanne, les tempratures mesures Nice, Marseille et Montpellier se situent audessus de la moyenne (calcule sur les 15 villes) tandis que celles mesures Lille et
Strasbourg se situent au-dessous de cette moyenne. Attention, la premire formule de
transition relie la coordonne dune ville lensemble des coordonnes des variables.
Ainsi, Lille a la plus faible coordonne sur le premier axe, mais il serait faux den
conclure quelle est, quel que soit le mois, la ville la plus froide. La fausset de cette
affirmation se constate immdiatement sur les donnes : bien que toujours plus froide
que la moyenne, Lille nest la ville la plus froide que deux mois sur douze (septembre
et avril).
La position extrme de Lille provient du fait que cette ville est la plus froide sur
lensemble de lanne. Certains mois de lanne, une autre ville, ou mme plusieurs,
sont plus froides quelle mais elles sont sensiblement moins froides que Lille pendant
beaucoup dautres mois. La position des villes proches de lorigine sinterprte dans
le mme esprit. La faible coordonne, sur le premier axe, de Nantes, Lyon ou Paris
indique que, sur lensemble de lanne, la temprature de ces villes est moyenne. Mais
on ne peut en dduire que les tempratures y sont toujours moyennes car elles peuvent
aussi tre tantt leves et tantt basses. Le deuxime facteur est clairant sur ce point.

2.2 Rsultats de lACP

37

c) Coordonnes des variables supplmentaires (cf. Tableau 2.3)

Dunod La photocopie non autorise est un dlit

Ce premier facteur semble correspondre la temprature moyenne annuelle. Pour


sen assurer, on peut faire la moyenne des 12 tempratures mensuelles pour chacune
des 15 villes et calculer le coefficient de corrlation entre cette nouvelle variable et
le premier facteur (dfini sur les villes). En pratique, il suffit de relancer la mme
analyse, la temprature moyenne annuelle tant introduite en variable supplmentaire.
Ce coefficient de corrlation vaut 1.00 (aux erreurs darrondi prs), ce qui achve
de justifier linterprtation du premier facteur comme tant la temprature moyenne
annuelle. Remarquons que, bien que le coefficient de corrlation soit trs proche
de 1, ce premier facteur nest pas exactement la moyenne annuelle. Comme toute
composante principale, ce facteur est une combinaison linaire des variables actives
dont les coefficients sont proportionnels aux coordonnes des variables (cf. Fig. 1.9
page 19). Si ce facteur concidait exactement avec la moyenne, les 12 coefficients de
la combinaison linaire seraient gaux. Or cette combinaison est proportionnelle ici :
0.76 janvier + 0.88 fvrier + . . . + 0.77 dcembre.
Considrer ce premier facteur comme une moyenne annuelle est une interprtation
interne aux donnes traites. On franchit un nouveau pas dans linterprtation en
le reliant des donnes externes comme la position gographique des villes. Le
nombre de villes tant faible, on peut constater directement que, parmi les 15 villes,
les plus chaudes sont aussi les plus mridionales. La latitude et la longitude ayant t
introduites dans lanalyse en tant que variables supplmentaires, on dispose de leur
coefficient de corrlation avec le premier facteur. Celui de la latitude vaut 0.84, ce qui
exprime que la rpartition des 15 villes sur le premier axe correspond peu prs leur
latitude ( peu prs seulement : des villes comme Vichy, Clermont, Grenoble et Lyon
sont plus froides que ne le laisse attendre leur latitude). La longitude, elle, est trs peu
lie au premier facteur (corrlation 0.17).

2.2.3 Interprtation du deuxime facteur


a) Coordonnes des variables actives (cf. Tableau 2.3 et Figure 2.1)

Les mois dautomne et dhiver sont opposs aux mois de printemps et dt. Les
mois qui encadrent les solstices dhiver et dt sont les plus corrls ce facteur.
Cette opposition montre que, temprature moyenne annuelle gale (i.e. premier
facteur fix), certaines villes sont plutt chaudes en t et plutt froides en hiver
alors que dautres, linverse, sont plutt froides en t et plutt chaudes en hiver.
Lamplitude thermique, plus importante pour les premires que pour les secondes,
semble correspondre ce facteur.

38

2 Exemple dACP et de CAH

b) Coordonnes des individus (cf. Tableau 2.2 et Figure 2.2)

Compte tenu des relations de transition, on sait que les coordonnes des villes ayant
une forte amplitude thermique sont positives tandis que celles des villes faible
amplitude sont ngatives. Ainsi, Brest, dont la coordonne sur ce facteur est la plus
leve, prsente des tempratures au-dessus de la moyenne depuis novembre jusqu
fvrier et trs au-dessous de la moyenne depuis avril jusqu septembre. Cette tendance
se retrouve de faon attnue pour la belle ville de Rennes. loppos, Grenoble subit
des tempratures trs en dessous de la moyenne depuis novembre jusqu fvrier et
presque gales la moyenne depuis mai jusqu aot. Brest apparat donc comme la
situation la plus extrme dune tendance gnrale.
c) Coordonnes des variables supplmentaires (cf. Tableau 2.3)

Linterprtation gnrale du deuxime facteur est confirme par sa corrlation avec


la variable supplmentaire amplitude thermique (temprature mensuelle maximum
temprature mensuelle minimum) gale 0.99. Avec un coefficient de corrlation
de 0.79, ce facteur est li aussi la longitude (qui, grossirement, exprime la proximit avec locan Atlantique et, encore plus grossirement, la continentalit). Sur
ce deuxime facteur, les villes sont peu prs places par longitude croissante ; la
seule exception notable est Nice qui, trs lest, a pourtant une amplitude thermique
annuelle lgrement infrieure la moyenne.

2.2.4 Premier plan factoriel


Il est toujours intressant dtudier globalement un plan factoriel, mme si, comme
ici, chaque facteur est clairement interprtable.
a) Remarques sur la reprsentation des variables (cf. Figure 2.1)

La projection sur le premier plan factoriel conservant 98.8 % de linertie du nuage


des mois (construit dans un espace de dimension 15), la dformation des longueurs
et des angles des vecteurs reprsentant ces 12 variables est presque ngligeable. Les
extrmits des flches associes aux 12 mois natteignent pas le cercle de rayon 1
(appel cercle de corrlation) mais il sen faut de trs peu. On peut vrifier sur ce plan
la reprsentation gomtrique du coefficient de corrlation par le cosinus de langle
entre les vecteurs reprsentant les variables. Par exemple, la corrlation entre janvier
et juillet vaut 0.30, ce qui correspond un angle de 72 degrs, angle que lon peut
mesurer sur le plan.
Insistons sur le fait que cette proprit, toujours vraie dans lespace complet, ne se
vrifie sur les plans factoriels que pour les variables parfaitement bien reprsentes.
Ainsi, langle observ dans le plan entre juillet et la variable supplmentaire longitude
vaut 45 degrs, angle dont le cosinus vaut 0.70. Mais la longitude nest pas trs bien

2.2 Rsultats de lACP

39

F2 : 19.0 %
longitude

juin-juillet
mai-aot
septembre - avril
F1 : 79.9 %
mars - octobre
latitude

novembre
fvrier
janvier-dcembre

Dunod La photocopie non autorise est un dlit

Figure 2.1 Projection des 12 variables actives et de 2 variables supplmentaires sur le plan des
deux premiers facteurs. Deux variables trs proches ne sont reprsentes que par un seul vecteur.

reprsente sur ce plan, comme sa distance au cercle de corrlation permet de le


constater. Il nest donc pas tonnant que la corrlation entre juillet et longitude (0.59)
soit infrieure 0.70 (la projection ne peut que diminuer les angles).
On prendra garde linterprtation de la forte corrlation entre 2 mois conscutifs.
Dans le calcul du coefficient de corrlation, les variables sont centres : aussi, le
fait que deux mois conscutifs aient des tempratures moyennes proches nintervient
pas directement dans la forte corrlation. Celle-ci dcoule du fait que, pour ces deux
mois, ce sont les mmes villes qui sont les plus chaudes et les mmes villes qui sont
les plus froides (plus prcisment les diffrences de tempratures entre villes sont
proportionnelles dun mois lautre).
b) Bilan des liaisons entre variables (cf. Figure 2.1)

Tous les angles entre les vecteurs reprsentant les variables tant infrieurs un angle
droit, les douze tempratures mensuelles sont corrles positivement entre elles. En
plus, il apparat une structure qui correspond au cycle annuel avec deux priodes. De

2 Exemple dACP et de CAH

40

F2 : 19.0 %
Strasbourg
Lyon
Grenoble
Vichy

Clermont
Paris

Marseille
Toulouse

Montpellier

Bordeaux

Lille
Nantes

Nice

F1
79.9 %

Rennes

Brest
Figure 2.2 Projection des 15 villes sur le premier plan factoriel.

janvier juin dune part et de juillet (trs proche de juin) dcembre (trs proche de
janvier) dautre part, les mois se rpartissent dans lordre du calendrier : deux mois
proches dans le calendrier sont fortement corrls entre eux (la corrlation entre deux
mois conscutifs nest jamais infrieure 0.92) et dans chacune des deux priodes,
cette liaison dcrot rgulirement avec lloignement. Dautre part, les mois des deux
priodes se superposent quasiment deux deux. Finalement, on constate que deux
mois sont dautant plus corrls quils correspondent la mme dure du jour.
c) Variables synthtiques

Il est clairement apparu que lvolution thermique annuelle de lensemble des 15 villes
peut tre presque parfaitement synthtise par deux variables : la temprature moyenne
annuelle et lamplitude thermique.
d) Typologies des villes (cf. Figure 2.2)

Sur ce plan, les deux axes correspondent aux deux variables synthtiques. Ainsi, plus
une ville est froide, plus elle est situe gauche sur le plan ; plus son amplitude
thermique est grande, plus elle est situe en haut.
Remarquons que les villes chaudes , situes droite, sont proches de laxe
horizontal : le deuxime facteur ne les diffrencie gure. Au contraire, pour les villes
froides , les diffrences damplitude thermique sont importantes.

2.2 Rsultats de lACP

41

La rpartition sur le plan permet, un peu arbitrairement, de distinguer trois groupes


de villes. Linterprtation des deux axes permet de caractriser ces groupes.
1. Les villes climat chaud : Marseille, Montpellier, Nice, Bordeaux et Toulouse.
2. Les villes climat froid et continental (t chaud, hiver trs froid) : Lille, Strasbourg, Lyon, Grenoble, Vichy, Clermont et Paris.
3. Les villes climat froid et ocanique (t froid, hiver doux) : Brest, Rennes et
Nantes.
e) Remarques sur la qualit de reprsentation des villes (cf. Tableau 2.2)

Dunod La photocopie non autorise est un dlit

La qualit de reprsentation dun individu (par un axe, un plan ou un sous-espace) est


une expression raccourcie de qualit de reprsentation de lcart entre un individu et
le point moyen (par un axe, un plan ou un sous-espace). la diffrence de celle des
variables (dont la distance lorigine est constante), la qualit de reprsentation des
individus ne se lit pas directement sur le graphique. Il faut consulter le tableau 2.2 les
indiquant.
Toutes les villes sont trs bien reprsentes sur ce plan (ce qui nest pas tonnant
puisque la qualit de reprsentation de lensemble du nuage est de 98.8). La moins bien
reprsente est Paris avec 0.889+0.014=0.903. La diffrence entre les tempratures
mensuelles de Paris et les tempratures mensuelles moyennes des 15 villes nest pas
totalement explique sur ce plan ; pour cela il faudrait consulter les facteurs suivants,
le quatrime plus que le troisime puisque la qualit de reprsentation sur ces axes est
respectivement de 0.03 et 0.07.
La coordonne dun individu est toujours interprtable, mme si sa qualit de
reprsentation par cet axe est mauvaise. Ainsi, bien que Paris soit mal reprsente par
le deuxime axe, sa coordonne presque nulle indique bien une amplitude thermique
moyenne (vrifiable sur les donnes).
f) Autres aides linterprtation des individus

La distance (d(i, O) dans le tableau 2.2) calcule dans lespace complet (ici
12 dimensions) entre un individu i et le point moyen indique dans quelle mesure
lindividu i est extrme ou particulier du point de vue de lensemble de ses
coordonnes. Ici, on remarque que les villes les plus extrmes du point de vue de
lensemble de leurs tempratures mensuelles sont Nice, Marseille, Brest et Strasbourg.
Cela ntonne pas puisque ces villes sont gographiquement les plus excentres.
Dans cette analyse o les individus sont presque parfaitement reprsents sur le
premier plan, cet indicateur apporte peu par rapport lexamen visuel (ces quatre
villes sont la priphrie du nuage). Lorsque ce nest pas le cas, cet indicateur est
prcieux pour dtecter rapidement des individus particuliers. Remarque : quelques
logiciels fournissent le carr de cette distance.

42

2 Exemple dACP et de CAH

Un autre point de vue pour dtecter des individus particuliers consiste calculer leur
inertie, par rapport au point moyen et rapporte linertie totale du nuage. Lorsque les
individus ont le mme poids, ce qui est le cas ici et est dailleurs le cas le plus frquent,
cet indicateur napporte quune nuance la distance (en revanche, si les poids diffrent
dun individu lautre, linformation est clairement diffrente). Dans ces donnes,
on dira que Nice contient 20 % de la variabilit du jeu de donnes, ou que les quatre
villes prcdentes (Nice, Marseille, Brest et Strasbourg) en contiennent 58 %.

2.2.5 Conclusion
Ce cas est typique dune ACP car il met en vidence un effet taille et une autre
structure complmentaire que lon peut appeler, en opposition la premire, effet
forme .
En revanche, il prsente deux particularits. Dabord, le premier plan factoriel
reconstitue presque parfaitement les donnes, ce qui est en pratique dautant plus
rare que le nombre de variables est grand. Ensuite, chacun des deux facteurs est
facilement interprtable, ce qui est prcieux pour un exemple finalit pdagogique,
mais lutilisateur rencontre ordinairement des situations plus complexes.

2.3 INTRODUCTION LA MTHODE DE WARD


(CLASSIFICATION AUTOMATIQUE)
2.3.1 Construction et description dun arbre
La figure 2.3 reprsente larbre hirarchique obtenu en appliquant lalgorithme de
Ward aux donnes villestempratures mensuelles. La lecture de cet arbre est intuitive
et sapparente celle dun arbre gnalogique : moins il faut monter haut dans larbre
pour relier deux villes, et plus la parent entre ces deux villes est grande (cest-dire que leurs tempratures mensuelles sont proches). Ainsi, larbre met en vidence,
par exemple, une troite parent entre les courbes de temprature de Lyon et de
Grenoble et une grande diffrence entre celles de Lyon et de Bordeaux.
Le principe gnral de construction dun arbre hirarchique par une mthode ascendante est simple.
On dispose initialement de lensemble des I individus classifier (on distingue
usuellement classifier - construire une classification - et classer - mettre dans des
classes prtablies), dits lments terminaux, soit ici les 15 villes, ainsi que dune
relation de ressemblance entre individus, soit ici la distance euclidienne usuelle (cf.
section 2.1 page 31) utilise en ACP (linterprtation conjointe dun arbre hirarchique
et dun plan factoriel implique que la ressemblance entre deux individus soit dfinie
de la mme manire dans les deux mthodes).

2.3 Introduction la mthode de Ward (classification automatique)

Bo
rd

To
Ni
Mo
Ma
ce
eau ulous ntpe rseil
le
llie
e
x
r

B
Na
R
nte enne rest
s
s

Pa
ris

Cle

V
L
rm ichy yon
on
t

Gr
eno Lille
ble

43

Str

asb
o

urg

Dunod La photocopie non autorise est un dlit

Figure 2.3 Arbre hirarchique issu de lalgorithme de Ward appliqu au tableau 2.1.

On commence par regrouper les deux lments les plus proches. Dans lexemple,
ce sont Vichy et Clermont, ce qui est cohrent avec la position de ces deux villes sur le
plan factoriel (cf. Figure 2.2). Plus directement, un rapide coup dil sur les donnes
montre que ces deux villes ont des tempratures voisines tout au long de lanne, ce
qui ntonne pas compte tenu de leur proximit gographique. On constitue ainsi le
premier nud de larbre. La hauteur laquelle on relie les lments correspond la
ressemblance entre les lments relis : cest lindice de niveau du nud. La dfinition
de cet indice dans la mthode de Ward est indique plus loin.
lissue de lagrgation de Vichy et Clermont, on ne dispose plus que de 14
lments classifier : 13 villes et un groupe de 2 villes. Dans lexemple, lalgorithme
regroupe ensuite Marseille et Montpellier. Ces deux villes ont des tempratures trs

2 Exemple dACP et de CAH

44

voisines, trs lgrement moins que les 2 villes prcdemment agrges, ainsi que le
montre le calcul de distances ralis partir des donnes initiales centres-rduites.
d(V ichy, Cler mont) = .54 < d(Mar seille, Mont pellier ) = .86
Lindice de niveau du nud correspondant cette deuxime agrgation est donc
plus lev que le prcdent. Et ainsi de suite, on agrge petit petit les villes mais
aussi les groupes de villes. Ce dernier point pose le problme de la dfinition de la
ressemblance entre groupes de villes. Plusieurs possibilits existent, dont les plus
simples sont les suivantes : la distance entre deux groupes A et B peut tre dfinie
comme la plus petite (algorithme dit du saut minimum) ou la plus grande (algorithme
dit du diamtre) des distances entre deux lments appartenant lun A lautre B.
La faon dont la mthode de Ward rsout ce problme est dcrite plus loin.
Si lon classifie I individus, larbre contient I 1 nuds, quil est dusage de
numroter de I +1 2J 1. Les deux lments runis par chaque nud sont quelquefois
appels lun an, lautre benjamin.

2.3.2 Arbre et partition


Un arbre hirarchique peut tre coup pour faire apparatre une partition. Le
niveau de coupure peut tre matrialis par une ligne horizontale. Ainsi, figure 2.3,
le niveau de coupure (ligne horizontale en pointill) fait apparatre une partition des
villes en 3 classes : les 5 villes mridionales, les 3 villes les plus occidentales et enfin
les 7 autres.
En levant le niveau de coupure, on peut faire apparatre une partition en 2 classes,
les 5 villes mridionales et les 10 autres. En abaissant le niveau de coupure, on fait
apparatre successivement une partition en 4 classes, 5 classes, etc. Ainsi, en levant le
niveau de coupure partir de la valeur 0, on met en vidence une suite de partitions
embotes, depuis la partition la plus fine (dans laquelle chaque individu appartient
une classe distincte) jusqu la partition la plus grossire (dans laquelle tous les
individus appartiennent la mme classe). Du fait de cette suite, un arbre hirarchique
est un outil commode pour raisonner le choix dune partition.

2.3.3 Qualit dune partition


Intuitivement, une partition dun ensemble dindividus est bonne si :
1. lintrieur de chaque classe, la variabilit est faible, autrement dit si la variance
des individus qui composent la classe est faible pour chaque variable ;
2. dune classe lautre, la variabilit est grande, autrement dit si, pour chaque
variable, la moyenne des individus qui composent une classe varie beaucoup
dune classe lautre.

2.3 Introduction la mthode de Ward (classification automatique)

Inertie

2 classes

Partition en
3 classes

45

4 classes

Totale
100.00
100.00
100.00
Inter-classes 65.68
78.70
84.44
dont
classe 1
43.79 (5)
43.79 (5) 43.79 (5)
classe 2
21.89 (10) 11.73 (3) 11.73 (3)
classe 3
23.19 (7)
8.90 (5)
classe 4
20.03 (2)
Intra-classes
dont
classe 1
classe 2
classe 3
classe 4

34.32

21.30

7.29 (5)
27.03 (10)
-

7.29 (5)
3.98 (3)
10.03 (7)
-

15.56
7.29 (5)
3.98 (3)
2.07 (5)
2.21 (2)

Tableau 2.5 Dcompositions de linertie relatives aux trois partitions les moins fines associes
larbre hirarchique de la figure 2.3. Les inerties sont exprimes en % de linertie totale ; entre ( ) :
effectifs des classes.

Dunod La photocopie non autorise est un dlit

Heureusement, ces exigences ne sont pas contradictoires. Le thorme de Huygens


exprime la dcomposition de linertie totale, selon une partition, dun nuage dindividus (cf. Figure 12.1 page 297). Soit :
Inertie totale = Inertie inter-classes + Inertie intra-classes.
Linertie totale tant fixe par les donnes, il en rsulte quil revient au mme
de rechercher une partition prsentant une inertie inter grande ou une inertie intra
petite. Cette dcomposition suggre de mesurer la qualit globale dune partition par
le rapport inertie inter/inertie totale qui peut se voir comme la part dinertie exprime
par la partition (de faon un peu analogue aux pourcentages dinertie associs aux
axes en ACP). Nous en discutons plus loin lutilisation.
Le tableau 2.5 rcapitule les dcompositions de linertie relatives aux partitions en
2, 3 et 4 classes associes larbre.
Linertie inter-classes peut tre dcompose par classes, en considrant linertie
du centre de gravit de chaque classe (affect du poids gal la somme des poids
des individus de la classe). Ainsi la classe 1 (Nice, ..., Toulouse), prsente dans les
3 partitions, joue un rle essentiel dans les deux analyses (elle ne sagrge dautres

2 Exemple dACP et de CAH

46

classes quau dernier nud de la CAH ; elle est clairement isole par le premier axe
de lACP) du fait quelle exprime, en tant que classe (i.e. en ne considrant que son
centre de gravit), presque la moiti de la variabilit (43,79 %) totale. Remarque : on
ne confondra pas cette inertie avec linertie totale de la classe (43.79 + 7.29 = 51.08)
que lon peut calculer directement partir de la colonne inertie du tableau 2.2.
Linertie intra-classes peut aussi tre dcompose par classes. Ainsi, dans la partition
en 2 classes, la seconde classe (les 10 villes du nord) contribue majoritairement
linertie intra-classe. Cela a deux origines : dabord cette classe contient plus de villes ;
ensuite elle est plus htrogne, ce dont on peut se rendre compte en calculant linertie
intra moyenne (i.e. la variance) par classe (27.03/10 = 2.703 > 7.29/5 = 1.458).

2.3.4 Algorithme de Ward


Remarques prliminaires
1. Au pas n, en agrgeant deux lments (individus et/ou groupes dindividus), on
passe dune partition en I n + 1 classes une partition en I n classes.
2. La nouvelle partition (en I n classes), prsente une inertie intra plus grande
(ventuellement gale) que celle de la prcdente (en I n + 1 classes) : en
agrgeant deux classes, on ne peut quaugmenter linertie intra. Cela dcoule
dune autre forme du thorme de Huygens selon laquelle linertie dun nuage
par rapport un point est minimum lorsque ce point est le centre de gravit du
nuage (ce qui fait apparatre aussi que linertie intra naugmente pas dans le seul
cas trs particulier o les deux classes agrges ont le mme centre de gravit).
Lide de Ward consiste choisir chaque pas le regroupement de classes tel que
laugmentation de linertie intra soit minimum. Cet algorithme ne fournit videmment pas des partitions globalement optimales (sauf au premier pas ce qui est sans
intrt pratique) : il faudrait pour cela remettre en cause chaque pas les regroupements du pas prcdent mais cela ferait perdre lembotement des partitions et donc
larbre hirarchique.
Si lon note :
1. gi (resp. g j ) le centre de gravit de la classe i (resp. j),
2. m i (resp. m j ) la somme des poids des lments de la classe i (resp. j),
on montre que laugmentation de linertie intra due au regroupement des classes i et j
scrit :
mi m j 2
d(i, j) =
d (gi , g j )
mi + m j
Tel est le critre minimis chaque pas et qui dfinit lindice de niveau des nuds de
la hirarchie. Cette criture fait apparatre que, chaque pas, on regroupe des classes :

2.3 Introduction la mthode de Ward (classification automatique)

47

1. proches, i.e. telles que d2 (gi , g j ) soit petit ;


2. de faibles poids, i.e. telles que m i m j /(m i + m j ) soit petit.
Ce dernier point montre bien pourquoi lalgorithme de Ward est peu sensible leffet
de chane, frquent par exemple lorsque lon utilise lalgorithme du saut minimum,
qui conduit des arbres difficilement exploitables (cf. Figure 2.4) : lalgorithme de
Ward favorise lagrgation entre eux des lments isols.

Figure 2.4 Arbre hirarchique prsentant un effet de chane. Les individus sagrgent un par un
au groupe dj constitu. Les partitions obtenues par coupure dun tel arbre, mettant toutes en
vidence un seul groupe et des individus isols, sont gnralement sans intrt pratique.

Dunod La photocopie non autorise est un dlit

On peut montrer que, lorsque lalgorithme de Ward agrge la classe k la classe


(constitue une tape antrieure de lalgorithme) runissant les classes i et j, laugmentation de linertie intra est plus grande que celle conscutive lagrgation des
classes i et j. Soit : d(k, {i, j})  d(i, j). Laugmentation dinertie intra tant utilise
comme indice de niveau, cette proprit assure que larbre hirarchique ne prsente
pas dinversion (cf. Figure 2.5).

Figure 2.5 Inversion dans un arbre hirarchique. k sagrge au groupe {i, j} un niveau infrieur
celui de lagrgation entre i et j. Ce phnomne est impossible avec les algorithmes usuels.

2.3.5 Utilisation des indices dagrgation


a) Proprit de la somme des indices de niveau

La somme des indices de niveau, effectue sur lensemble des I 1 nuds, est gale
linertie totale du nuage. Soit, en notant dn laugmentation dinertie intra au pas n :

2 Exemple dACP et de CAH

48

n=I
1


dn = Inertie totale

n=1

Cette proprit est immdiate en remarquant que :


1. la premire partition (la plus fine, i.e. celle dont chaque classe est rduite un
seul lment) a une inertie intra nulle ;
2. la dernire partition (la plus grossire, i.e. celle rduite une seule classe) a une
inertie intra gale linertie totale.
Il en dcoule que les indices peuvent tre exprims en valeur brute mais aussi en
pourcentage de linertie totale : larbre hirarchique propose alors une dcomposition
de linertie totale quil est intressant de confronter la dcomposition de lanalyse
factorielle sur les mmes donnes.
b) Interprtation des plus hauts indices

Dans lexemple, le plus haut indice vaut 7.88 soit 65.68 % de linertie totale (gale
12 ; cf. section 2.2.1). Ainsi, la partition en deux classes (villes chaudes/villes froides)
exprime 65.68 % de la variabilit des donnes. Autrement dit, en ne considrant
que ces deux classes, on a simplifi les donnes dans une grande proportion (on ne
considre plus 15 villes mais 2 points moyens) tout en conservant 65.68 % de la
variabilit.
Ce pourcentage est comparer celui associ au premier axe de lACP : 79.85 %.
Laxe exprime plus de variabilit (il distingue, par exemple, Nice et Toulouse, ce que
ne permet pas la partition en deux classes) mais est moins synthtique.
Toujours dans lexemple, le deuxime indice (en partant du haut de larbre) vaut
1.56 soit 13.02 % de linertie totale. La sparation des 10 villes froides en 3 villes
faible amplitude thermique et 7 villes forte amplitude thermique exprime donc
13.02 % de la variabilit des donnes. La comparaison entre ce pourcentage et celui
associ au deuxime axe de lACP (18.97 %) conduit un commentaire analogue
celui ralis pour le premier axe.
En additionnant les pourcentages associs aux deux nuds les plus levs, on
obtient le rapport inertie inter/inertie totale associ la partition en trois classes :
78.70 % de la variabilit des donnes est exprime par cette partition. Ce pourcentage
est plus faible que celui associ au premier plan de lACP (98.82 %), ce qui correspond
au caractre plus synthtique de la partition.
En abaissant encore le niveau de coupure, on augmente le nombre de classes et
le rapport inertie inter/inertie intra, ce qui montre bien que ce dernier doit toujours
tre examin en rfrence au nombre de classes de la partition et au nombre total
dindividus ( la limite, la valeur la plus leve de ce rapport, 1, est obtenue pour la
partition qui contient un et un seul individu par classe, partition sans intrt pratique).

2.4 Caractrisation directe dune classe dindividus

49

c) Diagramme des indices de niveau

On reprsente classiquement les niveaux des nuds (au moins pour les plus levs
lorsquil y a beaucoup dindividus) par un diagramme en btons (cf. Figure 2.6).
On illustre ainsi ce que lon gagne (en inertie inter cest--dire, en quelque sorte, en
reprsentation des donnes) lorsque lon passe dune partition donne la partition
immdiatement plus fine. Lallure de ce diagramme suggre des niveaux de coupure
privilgis, ceux qui prcdent une dcroissance rapide du gain en inertie inter.
Pour lexemple, le diagramme suggre une coupure en 2, 3 ou 6 classes. Dans
chacun de ces cas, le gain dinertie inter obtenu en passant la partition immdiatement
plus fine est sensiblement plus petit que celui obtenu en considrant cette partition
plutt que celle immdiatement moins fine (comparer avec le cas des partitions en 4 et
5 classes).

2.4 CARACTRISATION DIRECTE DUNE CLASSE DINDIVIDUS

Dunod La photocopie non autorise est un dlit

2.4.1 Problmatique
Larbre permet de dfinir chaque classe par lnumration des individus qui la composent. Cela est tout fait appropri dans lexemple car les individus sont peu nombreux et leurs donnes sont familires. Mais, mme dans ce cas, ce nest pas suffisant
pour connatre avec prcision les caractristiques communes des individus dune
classe.
Lide la plus simple consiste calculer, pour chaque variable X , la moyenne des
individus de chaque classe. Pour une classe q donne, en comparant pour chaque
variable la moyenne de la classe (note xq ) la moyenne gnrale (note x), on
peut caractriser la classe. Mais lindicateur xq x nest pas suffisant car il doit tre
relativis par leffectif de la classe q (not Iq ) et lcart-type de la variable X (not s),
comme lillustre la figure 2.7.
La figure 2.7 reprsente trois cas ayant la mme moyenne gnrale (
x ) et la mme
moyenne pour la classe q(
xq ). La variable X caractrise mieux la classe q :
1. dans le cas 1 que dans le cas 2 ; xq x doit tre apprci en tenant compte de
lcart-type gnral ;
2. dans le cas 3 que dans le cas 2 ; xq x doit tre apprci en tenant compte de
leffectif de la classe q.

2.4.2 Notion de la valeur-test


Lide de relativiser la quantit xq x par lcart-type gnral s apparat dj dans le
centrage et la rduction, transformation des donnes utilise en pralable lACP : on

2 Exemple dACP et de CAH

50

niveau d'agrgation
8

29 28 27 26 25 24 23 22 21 20 19 18 17 16

n du
nud

Figure 2.6 Diagramme des indices de niveau de larbre de la figure 2.3. La ligne horizontale en
pointills matrialise le niveau de coupure en 3 classes.

choisit lcart-type comme unit, ce qui permet de comparer entre elles des valeurs de
variables diffrentes.
Lide de relativiser par leffectif de la classe se situe sur un tout autre plan. Empiriquement, on a lintuition que mme pour une variable qui na rien voir avec la
partition (ce serait le cas dune variable supplmentaire trangre aux variables
actives), la diffrence xq x nest jamais (en pratique) exactement nulle et risque,
lcart-type gnral s tant fix, de scarter dautant plus de 0 que leffectif de la
classe est faible.

2.4 Caractrisation directe dune classe dindividus

xq

51

cas 1

cas 2

cas 3

Dunod La photocopie non autorise est un dlit

Figure 2.7 Insuffisance de lcart entre villes moyennes pour caractriser une classe. La grande
ellipse reprsente lensemble des individus ; la petite rassemble les points de la classe q.

On peut formaliser la locution na rien voir avec la partition par un modle


dans lequel les valeurs de la variable X pour les individus de la classe q sont tires au
hasard parmi les valeurs observes de X sur les I individus. En situant la valeur xq
observe par rapport aux valeurs attendues de cette moyenne dans le cadre du modle
de tirage au hasard, on apprhende dune certaine manire lcart entre les donnes et
le modle, ou, dit autrement, le caractre fortuit (i.e. imputable au hasard) de xq .
On montre facilement que la distribution des valeurs attendues de xq a pour moyenne
x et pour variance :
s 2 I Iq
sx2q =
Iq I 1
On situe xq dans cette distribution en calculant la valeur-test :
(
xq x)
xq x
=
sxq
s


Iq I Iq
I 1

La deuxime expression montre comment lcart xq x est relativis par s et Iq .


Ainsi construite, la valeur-test, linstar des valeurs centres rduites, est comparable
dune variable lautre et dune classe lautre.
Le tableau 2.6 donne quelques exemples de calculs de valeur-test.
1. Cas 1 et 2 : Selon lcart brut xq x, la classe {Nice, ..., Toulouse} est plus
caractrise par une temprature leve en juillet quen avril. Mais la variabilit

2 Exemple dACP et de CAH

52

Tableau 2.6 Calcul de quelques valeurs-tests pour caractriser une classe.

Cas

Classe

Variable xq

xq x s

sxq valeur-test

1 Nice ... Toulouse avril 12.70 10.98 1.72 1.37 .518


2 Nice ... Toulouse juillet 22.10 19.83 2.27 2.06 .779
3 Brest ... Nantes juillet 17.43 19.83 -2.40 2.06 1.101

3.33
2.92
-2.18

des tempratures est plus grande en juillet quen avril. Finalement, selon la valeurtest qui synthtise ces donnes, cette classe est (lgrement) mieux caractrise
par sa forte temprature en avril que par sa forte temprature en juillet.
2. Cas 2 et 3 : Selon lcart brut, la temprature en juillet caractrise moins la classe
{Nice, ..., Toulouse} (par des valeurs leves) que la classe {Brest, ..., Nantes}
(par des valeurs basses). Mais leffectif de la premire (5) est plus important
que celui de la seconde (3). Finalement, selon la valeur-test qui synthtise ces
donnes, la temprature en juillet caractrise plus solidement la premire classe
que la seconde.
On notera ici que cest la valeur absolue de la valeur-test qui indique le degr de
caractrisation dune classe par une variable ; le signe indique le sens (moyenne de
classe plus basse ou plus leve que la moyenne gnrale) de cette caractrisation.

2.4.3 Synthse : le tableau de caractrisation (cf. Tableau 2.7)


Pour chaque classe dindividus, on trie lensemble des variables par valeurs-tests
dcroissantes. On fait ainsi apparatre, en haut et en bas de la liste, les variables
qui caractrisent le mieux une classe donne. ventuellement, lorsque le nombre de
variables est important, on ne fait pas apparatre les variables relatives aux valeurs-tests
les plus faibles en valeur absolue.
Le Tableau 2.7 fournit directement la caractrisation des classes. Nous le rsumons
en 3 points :
1. Les individus de la classe 1 sont caractriss par une temprature leve toute
lanne, particulirement en demi-saison. Ces villes sont mridionales (faible
latitude).
2. loppos , les individus de la classe 3 sont caractriss par une temprature
faible toute lanne, particulirement pendant les moins les plus froids.
3. La classe 2 comporte des villes prsentant une faible amplitude thermique ; elles
sont situes louest (faible longitude).

2.4 Caractrisation directe dune classe dindividus

53

Tableau 2.7 Caractrisation des 3 classes de villes par lensemble des variables. Pour chaque
classe, les variables sont tries par valeurs-tests dcroissantes.

V. test
3.40
3.39
3.33
3.32
3.24
3.18
3.00
3.00
2.97
2.92
2.88
2.54
2.46
0.65
0.50

Classe 1 : Nice, Marseille, Montpellier, Bordeaux, Toulouse


Moyennes
Ecarts-types
Proba
classe
gnrale
classe
gnral
Variable
0,001
19.28
16.99
0.75
1.79
septembre
0,001
13.79
11.81
0.74
1.55
moyenne annuelle
0,001
12.70
10.98
0.58
1.37
avril
0,001
14.54
12.32
0.94
1.77
octobre
0,001
10.04
8.23
0.52
1.48
mars
0,001
21.90
19.57
0.79
1.94
aot
0,003
19.80
17.83
0.73
1.73
juin
0,003
16.08
14.43
0.69
1.45
mai
0,003
9.88
7.93
1.00
1.74
novembre
0,004
22.10
19.83
1.00
2.06
juillet
0,004
6.80
4.83
0.94
1.81
fvrier
0,011
6.66
4.85
0.90
1.89
dcembre
0,014
5.78
3.97
0.92
1.94
janvier
0,516
3.37
2.58
2.68
3.21
longitude
0,617
16.34
15.91
0.99
2.25
amplitude annuelle

-2.95

0,003

43.56

V. test
1.49
1.28
1.11
0.66
0.44

Proba
0,136
0,201
0,267
0,509
0,660

Classe 2 : Brest, Rennes, Nantes


Moyennes
Ecarts-types
classe
gnrale
classe
gnral
47.81
46.04
0.48
2.22
5.30
3.97
0.57
1.94
5.97
4.85
0.73
1.89
5.47
4.83
0.24
1.81
8.33
7.93
0.50
1.74

Variable
latitude
janvier
dcembre
fvrier
novembre

-0.25
-0.41
-0.74
-1.30
-1.45
-2.02
-2.02
-2.05
-2.18
-2.88
-2.95

0,803
0,682
0,459
0,194
0,147
0,043
0,043
0,040
0,029
0,004
0,003

8.03
11.93
11.20
10.03
15.60
12.87
17.47
15.93
17.43
-2.34
12.37

mars
octobre
moyenne annuelle
avril
septembre
mai
aot
juin
juillet
longitude
amplitude annuelle

46.04

8.23
12.32
11.81
10.98
16.99
14.43
19.57
17.83
19.83
2.58
15.91

0.47

0.26
0.25
0.38
0.65
0.70
0.95
1.09
1.16
1.35
1.38
1.56

2.22

1.48
1.77
1.55
1.37
1.79
1.45
1.94
1.73
2.06
3.21
2.25

latitude

Classe 3 : Lyon, Grenoble, Strasbourg, Vichy, Clermont, Paris, Lille.


Moyennes
Ecarts-types
V. test
Proba
classe
gnrale
classe
gnral
Variable
1.89
0,059
17.13
15.91
1.44
2.25
amplitude annuelle
1.69
0,091
4.13
2.58
1.68
3.21
longitude
1.60
0,110
47.05
46.04
1.88
2.22
latitude
-1.00
-1.19
-1.22
-1.38
-2.05
-2.11
-2.60
-2.81
-2.85
-3.15
-3.25
-3.28
-3.36

0,317
0,234
0,222
0,168
0,040
0,035
0,009
0,005
0,004
0,002
0,001
0,001
0,001

19.24
17.24
13.93
18.80
15.94
10.16
10.66
10.90
7.03
6.36
3.16
3.07
2.11

19.83
17.83
14.43
19.57
16.99
10.98
11.81
12.32
8.23
7.93
4.83
4.85
3.97

1.04
0.91
0.74
0.88
0.74
0.64
0.62
0.66
0.81
0.65
0.76
0.91
0.88

2.06
1.73
1.45
1.94
1.79
1.37
1.55
1.77
1.48
1.74
1.81
1.89
1.94

juillet
juin
mai
aot
septembre
avril
moyenne annuelle
octobre
mars
novembre
fvrier
dcembre
janvier

2 Exemple dACP et de CAH

54

2.4.4 Valeur-test et probabilit associe


La distribution des valeurs possibles de xq dans le cadre du modle de tirage au hasard
a t jusquici caractrise par sa moyenne et sa variance. En outre, condition que :
1. Iq soit sensiblement plus petit que I (ce qui rend peu prs indpendants les
Iq tirages dans lensemble des I valeurs de x),
2. Iq soit grand (ce qui assure que xq est la moyenne de nombreuses quantits),
cette distribution peut tre approche par une loi Normale, ce qui permet de calculer
une probabilit associe la valeur observe. Cette probabilit a pour objet de situer
la valeur observe xq dans la distribution des xq possibles : on la dfinit comme la
probabilit dobtenir, dans le cadre du modle de tirage au hasard, une valeur de
xq au moins aussi loigne de xque ne lest la valeur de xq effectivement observe (cf.
Figure 2.8), soit :

P[X  |valeur-test|]
avec X distribue selon une loi normale centre rduite.

-|vt|

|vt|

Figure 2.8 Valeur-test et probabilit associe. Laire hachure matrialise la probabilit associe
la valeur-test vt.

Lintrt de cette probabilit est de fournir un clairage complmentaire celui


de la valeur-test. Ainsi, une valeur-test de 2 peut tre apprcie en disant que lcart
de moyenne correspondant possde environ ( environ rappelle que la distribution
normale nest quune approximation de la distribution relle) 5 chances sur 100 dtre
obtenu ou dpass dans le cadre du modle de tirage au hasard.

2.4.5 Probabilit associe et test dhypothse


Le calcul de probabilit prsent ci-dessus est identique celui que lon ralise dans
une procdure de test dhypothse. Mais le cadre danalyse ainsi que la problmatique
sont diffrents et lon se gardera dinterprter ces probabilits associes en termes

2.5 Interprtation simultane dun plan factoriel et dun arbre hirarchique

55

de tests dhypothse (par exemple on vitera de dire la temprature en septembre


caractrise significativement la classe 1 ).
Ceci est particulirement flagrant dans le cas des variables actives puisque ce sont
elles qui ont servi dfinir les classes : lhypothse dabsence de diffrences entre
les classes nest videmment pas adquate. Mais, cela lest encore pour bon nombre
de variables supplmentaires : dans lexemple, cest bien sr le cas de la moyenne
annuelle et de lamplitude thermique qui toutes deux combinent les variables actives
et ont t calcules parce quelles correspondent aux deux premiers facteurs de lACP,
mais aussi celui de la latitude et de la longitude dont lintroduction en tant que variables
supplmentaires a t suggre par lanalyse du plan factoriel.
Il nen reste pas moins vrai quune classe donne est souvent bien caractrise par
certaines variables, absolument pas par dautres et que, plus ou moins explicitement,
on ressent la ncessit dtablir une limite, ne serait-ce que pour dterminer la liste
des variables retenir dans la caractrisation des classes. Compte tenu de ce qui a t
dit, cette limite ne peut tre choisie quempiriquement, en sappuyant sur les principes
suivants :
1. les valeurs-tests se servant mutuellement de rfrences, on nglige les valeurs
les plus petites ; ainsi on a nglig la longitude et lamplitude pour caractriser
la classe1 ;

Dunod La photocopie non autorise est un dlit

2. on peut conserver, en exprimant une nuance, les variables associes de faibles


valeurs-tests mais dont le contenu est cohrent avec les variables les plus caractristiques ; la classe 3 est mieux dcrite par villes froides tout au long de
lanne, plus particulirement de septembre avril plutt que villes froides
de septembre avril ;
3. on peut conserver, en exprimant une nuance, les variables associes une faible
valeur-test mais dont lcart est jug important (pour les classes de plus faibles
effectifs, dont les valeurs-tests ont tendance tre plus faibles) ; ainsi on dcrira
la classe 2 comme comportant des villes plutt froides davril septembre ,
mois pour lesquels la moyenne de la classe est infrieure la moyenne gnrale
dau moins (environ) 1.

2.5 INTERPRTATION SIMULTANE DUN PLAN FACTORIEL


ET DUN ARBRE HIRARCHIQUE
2.5.1 Graphiques
Le principal outil dexamen simultan des rsultats des deux mthodes consiste faire
apparatre, sur les plans factoriels, des lments de la classification, soit :

2 Exemple dACP et de CAH

56

1. lappartenance des individus aux classes dune partition, en reprsentant chacun


par un symbole ou un numro de classe ; cela est prcieux, lorsque les individus
sont nombreux (ce nest pas le cas dans lexemple, pour lequel il est prfrable de
dlimiter les classes par leur contour, ce qui permet de laisser les identificateurs
en clair), pour faire apparatre les dimensions pour lesquelles les classes se
sparent et celles pour lesquelles elles se recouvrent ;
2. les centres de gravit des classes dfinies par une ou plusieurs partitions ; moins
riche mais plus synthtique que la prcdente, cette reprsentation est utile dans
la confrontation de plusieurs partitions ;
3. le haut de larbre hirarchique, condition de reprsenter le plan factoriel en
perspective.
Lobjectif est dutiliser les rsultats de chaque analyse en tant quaides linterprtation de lautre.
Ainsi,
1. les axes factoriels permettent de caractriser de faon synthtique les classes
quils sparent ; cest ce qui a t fait implicitement jusquici, car nous avions
lesprit lemplacement des villes sur le plan factoriel lors de la description des
classes ;
2. les classes permettent de caractriser les axes sur lesquels elles se sparent ; cest
dans cet esprit que lon a dit que le premier axe oppose les villes froides et les
villes chaudes ; la classification taie de telles interprtations.
Le faible nombre de points de lexemple permet de remplacer ces trois reprsentations
par un seul graphique (cf. Figure 2.9). La visualisation propose est une synthse
commode de lensemble des rsultats.
Sur cet exemple simple, lapport de la classification ne semble pas dcisif : ainsi la
partition en 3 classes, par exemple, aurait sans doute pu tre construite la main ,
sur la seule vue du plan factoriel. La raison en est que ces donnes tant quasiment
bi-dimensionnelles, lalgorithme de classification sappuie essentiellement sur les
coordonnes pour les deux premiers axes, ce que nous savons faire visuellement. En
revanche, lorsque la reprsentation des donnes exige plus de deux dimensions, la
classification (qui sappuie sur toutes les dimensions) est irremplaable : elle assure
que les points que lon regroupe sont proches dans lespace entier et non sur le seul
plan factoriel.

2.5.2 Indicateurs
Le tableau 2.5 met en vidence la dcomposition de linertie associe une partition
dans lespace entier (R K ). Chaque terme de cette dcomposition peut lui-mme tre
dcompos axe par axe. Cette nouvelle dcomposition, applique la partition en

2.5 Interprtation simultane dun plan factoriel et dun arbre hirarchique

57

F2
St.
Vichy

Ct Gr.
Paris

Lyon
Marseille
Mt

To
Bordeaux

Lille

Nantes

Nice

F1

Rennes

Brest

Dunod La photocopie non autorise est un dlit

Figure 2.9 Reprsentation simultane dun arbre hirarchique (cf. Figure 2.3) et dun plan
factoriel (cf. Figure 2.2).

trois classes, est donne tableau 2.8, dans lequel chaque inertie est exprime en
pourcentages, par rapport :
1. la somme de sa colonne, cest--dire linertie associe laxe correspondant ;
ce pourcentage sinterprte comme une contribution laxe ; par exemple, la
spcificit de la classe 1 (i.e. ce qui distingue son centre de gravit du centre
gravit gnral) contribue pour 54.80 % linertie du premier axe ;
2. la somme de sa ligne (dans cette somme, tous les axes sont pris en compte mme
si seuls les deux premiers apparaissent dans le tableau), cest--dire linertie de
la ligne exprime dans lespace complet ; ce pourcentage sinterprte comme une
qualit de reprsentation (au sens du rapport [inertie projete / inertie totale]) ;
par exemple, la spcificit de la classe 1 est exprime presque parfaitement (
99.93 %) par le premier axe.

2 Exemple dACP et de CAH

58

Inertie (effectifs)

Contributions
F1
F2

Qualits de reprsentation

F1
F2
(F1, F2)

Totale (15)

100.00

100.00

79.85

18.97

98.82

Inter classes
dont
classe 1 (5)
classe 2 (3)
classe 3 (7)

83.47

63.36

84.69

15.27

99.96

54.80
3.69
24.99

1.50
46.19
17.02

99.93
25.11
86.06

.06
74.71
13.92

99.99
99.82
99.98

16.53

36.64

61.96

32.64

94.60

7.40
1.39
7.74

4.33
14.69
17.62

81.03
27.79
61.65

11.27
70.01
33.34

92.30
97.80
94.99

Intra classes
dont
classe 1 (5)
classe 2 (3)
classe 3 (7)

Tableau 2.8 Inerties associes la partition en 3 classes, dcomposes selon les deux premiers
axes factoriels. Contributions : inerties exprimes en % de linertie totale de laxe. Qualits de
reprsentation : inerties exprimes en % de linertie dans lespace complet.

Ce tableau permet de quantifier de faon systmatique des faits dj observs, par


exemple limportance, dj signale, de la classe 1 dans linertie de laxe 1 (54.80).
Attention, ce pourcentage nest pas gal la somme des contributions laxe 1 des
lments de la classe 1, calculable partir du tableau 2.2 : cette dernire somme, qui
vaut 62.20 %, est gale la somme des inerties inter et intra de la classe 1. Cette
distinction correspond aux deux points de vue usuels pour prendre en compte une
classe : son centre de gravit et lensemble de ses lments (remarque dj faite
propos du tableau 2.5 dans lespace complet).
Dans lexemple, on remarque que, pour une classe donne, cest le mme axe qui
reprsente bien son inertie inter et son inertie intra. Cela indique que les lments
possdent les caractristiques de leur classe un niveau trs variable. Ainsi, pour
illustrer une classe par un de ses lments, on peut opter, selon les cas, pour :
1. llment le plus proche du centre de gravit de la classe ; en ce sens, Rennes
reprsente bien la classe 2 ;
2. llment le plus loign de lorigine dans la direction du centre de gravit de la
classe ; en ce sens, Brest illustre bien les caractristiques de la classe 2 puisquelle
les possde un niveau extrme.
Deux autres indicateurs, rassembls tableau 2.9 sont trs utiles pour analyser une
partition.

2.5 Interprtation simultane dun plan factoriel et dun arbre hirarchique

59

Tableau 2.9 Trois indicateurs importants dans lanalyse dune partition. La distance et les
coordonnes sont celles des centres de gravit des classes. La valeur-test, qui prend en compte la
coordonne, leffectif de la classe et linertie de laxe, est comparable dun axe lautre et dune
classe lautre.

Classe
1 : Nice, ..., Toulouse
2 : Brest, ..., Nantes
3 : Lyon, ..., Lille

Distance
lorigine
3.97
2.65
2.44

Coordonnes
F1
F2
3.97
.10
-1.33 -2.29
-2.27 . 91

Valeurs-tests
F1
F2
3.39
.18
-.80 -2.84
-2.56 2.11

1. La distance (ou son carr) dans lespace complet entre le centre de gravit de
la classe et le centre de gravit gnral. En ce sens, la classe 1 est celle qui se
diffrencie le plus, rsultat en harmonie avec le tableau 2.5 (linertie de cette
classe ramene son centre de gravit reprsente 43.79 % de linertie totale) et
le premier axe de lACP.
2. La valeur-test, dfinie propos dune variable initiale, sapplique aux axes factoriels. Ainsi, daprs les coordonnes, la classe 3 se caractrise surtout par laxe1.
Daprs sa valeur-test pour laxe 2, qui prend en compte la beaucoup plus faible
variabilit des 15 villes selon cet axe, la classe 3 peut aussi tre caractrise par
sa coordonne pour laxe 2.

Dunod La photocopie non autorise est un dlit

2.5.3 Mise en uvre conjointe dune ACP et dune CAH


Beaucoup de logiciels ralisent dabord une ACP dont ils calculent tous les facteurs
sur I . La CAH est alors mise en uvre partir des facteurs et non des donnes brutes.
Il est clair quil revient au mme de travailler partir de tous les facteurs ou partir
des donnes brutes. Lintrt de cette dmarche est double :
1. en travaillant sur les facteurs dune autre analyse factorielle (e.g. une AFC),
le mme programme permet dobtenir une CAH ralise sur dautres types de
donnes (e.g. les lignes dun tableau de contingence) ;
2. en slectionnant les S premiers facteurs, lanalyse factorielle joue le rle dun
filtre en liminant les dimensions de trs faible inertie assimilables du bruit ;
cela est surtout prcieux dans le cas de variables qualitatives (donc aprs une
ACM).

2 Exemple dACP et de CAH

60

2.6 CONSTRUCTION ET AMLIORATION DUNE PARTITION


2.6.1 Principe
Pour construire directement une partition de I individus en Q classes, plusieurs algorithmes procdent en tirant au hasard une partition initiale et en amliorant pas pas
cette partition. Le plus simple dentre eux, dit agrgation autour des centres mobiles,
amliore chaque pas la partition ainsi :
1. on calcule le centre de gravit de chaque classe q ;
2. on raffecte chaque individu i la classe q dont le centre de gravit est celui qui
est le plus proche de i ;
3. si la composition des classes change, alors les centres de gravit aussi et lon
ritre lopration partir de 1 ; sinon, le calcul est termin.
La justification de cet algorithme tient au fait qu chaque itration on ne peut que
diminuer linertie intra-classe. Naturellement cette proprit nassure pas que lon
obtienne la partition optimale.
Remarque : pour initialiser lalgorithme, plutt que de tirer une partition au hasard,
on tire au hasard les centres de gravit des classes. Ces centres sont choisis parmi les
individus partitionner.
Malgr une apparence assez fruste, cet algorithme fournit en pratique des partitions
acceptables en un nombre ditrations faible. Une illustration sommaire en est donne
Figure 2.10.

2.6.2 Utilisation lissue dune classification hirarchique.


La partition induite par une coupure dun arbre hirarchique nest en gnral pas
optimale. En lutilisant comme point de dpart de lalgorithme des centres mobiles,
on ne peut quamliorer (on dit aussi consolider) cette partition. En pratique, cette
amlioration nest gnralement pas dcisive (le rapport inertie inter/inertie totale
ne progresse que de quelques points). Ainsi, dans lexemple, aucune des partitions
(induites par larbre hirarchique des 15 villes) nest modifie par cette procdure.
Remarque : une partition ainsi amliore nest plus compatible avec larbre hirarchique dont elle est issue. Si lon souhaite un arbre hirarchique reprsentant les
classes dune telle partition, il faut reprendre lalgorithme de Ward partir de ses
classes.

2.6 Construction et amlioration dune partition

61

Initialisation (en 2 temps)


G01

tirage des 2 barycentres


G02

affectation aux classes

Classe 1 Classe 2

Pas 1

G11

Pas 2

G12

Classe 1

Classe 2

G21

G22

Classe 1

Classe 2

Figure 2.10 Illustration de lalgorithme dagrgation autour des centres mobiles. Donnes : 8
individus situs aux sommets de 2 carrs. Initialisation : le tirage au hasard a conduit aux
barycentres G01 et G02 ; la mdiatrice du segment G01 G02 permet de dfinir laffectation des individus
aux classes : chaque individu est affect la classe correspondant au barycentre dont il est le plus
proche. Pas 1 : on calcule les barycentres G11 et G12 des classes du pas prcdent ; la mdiatrice du
segment G11 G12 permet de dfinir une nouvelle affectation des individus aux classes. Pas 2 : on
calcule les barycentres G21 et G22 des classes du pas prcdent ; laffectation aux classes 1 et 2
induite par la mdiatrice de G21 G22 est identique celle du pas prcdent. Lalgorithme a converg.

Dunod La photocopie non autorise est un dlit

2.6.3 Utilisation en amont dune classification hirarchique


Lorsque le nombre dindividus classifier est trs grand, (disons au-del de 1 000 pour
fixer les ides), la construction dun arbre hirarchique peut ne pas tre ralisable pour
des raisons de capacit machine. Une pratique commode consiste alors construire,
laide de lalgorithme des centres mobiles, une partition en un grand nombre de classes
(disons une centaine pour fixer les ides) et construire ensuite, partir de ces classes,
un arbre hirarchique. Larbre obtenu par cette procdure (dite de classification mixte)
sutilise exactement comme le haut dun arbre issu de lalgorithme usuel.

Chapitre 3

Analyse Factorielle
des Correspondances

3.1 DONNES, NOTATIONS, HYPOTHSE DINDPENDANCE


lorigine, lAnalyse Factorielle des Correspondances (AFC) a t conue pour tudier des tableaux appels couramment tableaux de contingence (ou tableaux croiss).
Il sagit de tableaux deffectifs obtenus en croisant les modalits de deux variables
qualitatives dfinies sur une mme population de n individus. Dans lexemple comment au chapitre 10, la population est constitue par lensemble des individus qui
ont quitt le systme scolaire franais en 1972 et qui occupent un emploi en 1973 ;
pour chaque individu, on connat son niveau de diplme et sa catgorie demploi. La
figure 3.1 rsume les principales notations.
On parle indiffremment de la modalit i (par exemple le baccalaurat) ou de la
classe i, cest--dire de la classe des individus qui possdent la modalit i (par exemple
les bacheliers).
Dans ce chapitre, nous nous limitons ltude dun tableau de contingence. Cependant, la plupart des notions introduites et des rsultats prsents peuvent tre gnraliss des tableaux qui ne sont pas strictement de ce type. Le cas trs important du
tableau disjonctif complet fait lobjet dun chapitre particulier : lAnalyse des Correspondances Multiples. La conclusion du prsent chapitre donne quelques points de
repre sur lapplication de lAFC dautres tableaux que les tableaux de contingence.
On considre souvent le tableau des frquences relatives F, obtenu en divisant
chaque effectif ki j par leffectif total n. Ce nouveau tableau dfinit une mesure de
probabilit sur lensemble produit I J . Ses marges, ou probabilits marginales,

3 Analyse Factorielle des Correspondances

64

modalits de la
premire variable

modalits de la seconde variable


1
j
J
1

kij

I
n
Figure 3.1 Tableau des donnes brutes. I : ensemble des lignes et nombre de lignes (8 niveaux
de diplme). J : ensemble des colonnes et nombre de colonnes (9 catgories demploi). ki j :
nombre dindividus possdant la fois la modalit i de la premire variable et la modalit j de la
seconde (i.e. qui ont le niveau
  de diplme i et qui occupent un emploi de la catgorie j).
i
j ki j = n (nombre total dindividus).

J marge

fi j
f i.
i

fij

fi.


I
marge

f.j

f. j
f i.

= ki j /n

=
fi j
j

=
fi j
i
 
=
f. j =
fi j = 1
j

Figure 3.2 Tableau F des frquences relatives et ses marges.

ont pour terme gnral f i. pour la marge-colonne et f . j pour la marge-ligne (cf.


Figure 3.2).
Un tableau de contingence exprime la liaison entre deux variables qualitatives.
Classiquement, pour une mesure de probabilit, on dit quil y a indpendance entre
les deux variables lorsque, pour tout i et pour tout j, on a lgalit :

3.2 Objectifs

65

f i j = f i. f . j
Il y a liaison entre les deux variables ds que certaines cases du tableau f i j diffrent
du produit f i. f . j . Si f i j est suprieur ce produit, les modalits i et j sassocient plus
quelles ne le font dans lhypothse dindpendance : on dit que i et j sattirent. Au
contraire, si f i j est infrieur au produit des marges, i et j sassocient moins que dans
lhypothse dindpendance : on dit quil y a rpulsion entre ces deux modalits.
Lindpendance sexprime aussi en considrant le tableau comme un ensemble de
lignes. En effet, lgalit ci-dessus est quivalente lgalit :

Dunod La photocopie non autorise est un dlit

fi j
= f. j
f i.
La quantit f . j reprsente le pourcentage de la population totale qui possde la modalit j tandis que f i j / f i. reprsente ce mme pourcentage dans la sous-population
possdant la modalit i. Lorsquil y a indpendance, les I sous-populations caractrises par les modalits i de la premire variable se rpartissent selon les J modalits j
de la deuxime variable avec les mmes pourcentages. Toutes les lignes sont alors proportionnelles. La rciproque est vraie : lorsque toutes les lignes sont proportionnelles,
elles sont proportionnelles la marge f . j et les deux variables sont indpendantes. Il y
a donc liaison ds lors que les lignes ne sont pas toutes proportionnelles la marge,
cest--dire lorsquelles ne sont pas identiques du point de vue de leur association avec
lensemble des colonnes.
Remarquons enfin que, dans un tableau de contingence, les lignes et les colonnes
jouent un rle absolument symtrique : lindpendance sexprime de la mme faon
sur lensemble des colonnes. Les deux galits ci-dessus sont en effet quivalentes
la suivante :
fi j
= f i.
f. j
Il y a indpendance lorsque tous les pourcentages en colonnes sont gaux la marge
f i. cest--dire lorsque les colonnes sont proportionnelles. Il y a liaison lorsquelles
ne le sont pas.

3.2 OBJECTIFS
Bien que le tableau tudi soit de nature trs diffrente de celui tudi en ACP, les
objectifs de lAFC peuvent sexprimer de manire analogue ceux de lACP : on
cherche obtenir une typologie des lignes, une typologie des colonnes et relier ces
deux typologies entre elles ; mais la notion de ressemblance entre deux lignes, ou entre
deux colonnes, est diffrente de celle de lACP.

66

3 Analyse Factorielle des Correspondances

Dans un tableau de contingence, la ressemblance, entre deux lignes dune part


et entre deux colonnes dautre part, sexprime de manire totalement symtrique.
Deux lignes sont considres comme proches si elles sassocient de la mme faon
lensemble des colonnes, cest--dire si elles sassocient trop (ou trop peu) aux
mmes colonnes ; les termes trop et trop peu sont pris en rfrence la situation
dindpendance. Symtriquement, deux colonnes sont proches si elles sassocient de
la mme faon lensemble des lignes.
Schmatiquement, ltude de lensemble des lignes revient mettre en vidence
une typologie dans laquelle on cherche les lignes dont la rpartition scarte le plus
de celle de lensemble de la population, celles qui se ressemblent entre elles (dans le
sens prcis ci-dessus) et celles qui sopposent. Pour mettre en relation la typologie
des lignes avec lensemble des colonnes, on caractrise chaque groupe de lignes par
les colonnes auxquelles ce groupe sassocie trop ou trop peu.
Ltude de lensemble des colonnes est absolument analogue.
Cette approche, grce la notion de ressemblance utilise, permet dtudier la
liaison entre les deux variables, cest--dire lcart du tableau lhypothse dindpendance. Lanalyse de cette liaison est lobjectif fondamental de lAFC.
Une approche complmentaire de la prcdente, fait intervenir conjointement lensemble des lignes et celui des colonnes en ne privilgiant ni lun ni lautre. Prenons
lexemple du tableau croisant les catgories demploi et les niveaux de diplme. Lensemble des diplmes est ordonn par la longueur des tudes tandis que celui des
catgories demploi lest par le salaire moyen. La relation entre ces deux ordres (un
salaire lev correspond gnralement un diplme lev) explique clairement une
bonne part de la liaison entre emplois et diplmes. Mais ce lien ne se restreint peuttre pas cet unique aspect ; il peut exister dautres phnomnes comme lassociation
presque exclusive de certains diplmes avec certains emplois. Lobjectif de lAFC est
de dcomposer la liaison entre deux variables en une somme (ou une superposition)
de tendances simples et interprtables comme celles qui viennent dtre voques et
de mesurer leur importance relative afin de les ordonner.
Enfin, bien quil y soit fait peu rfrence par la suite, il faut signaler que lAFC,
comme toute Analyse Factorielle, est utilise aussi dans le but de rduire la dimension
des donnes en conservant le plus dinformation possible. Ceci en vue dun traitement
statistique ultrieur (classification, rgression, analyse discriminante, etc.) ou dune
transmission dinformation.

3.3 TRANSFORMATIONS DES DONNES EN PROFILS


En AFC, le tableau brut nest pas analys directement. Dans ltude des lignes, le
tableau des donnes est transform en divisant chaque terme f i j de la ligne i par la
marge f i. de cette ligne i. La nouvelle ligne est appele profil-ligne (cf. Figure 3.3).

3.3 Transformations des donnes en profils

67

Cette transformation dcoule de lobjectif qui vise tudier la liaison entre les deux
variables au travers de lcart entre les pourcentages en lignes. Elle se justifie aussi
de faon directe puisque la comparaison de deux lignes du tableau brut risque dtre
influence principalement par leurs effectifs marginaux. Ainsi, dans le tableau croisant
emplois et diplmes, la diffrence entre les lignes brutes Bac technique et Bac gnral
traduit essentiellement une diffrence entre les effectifs globaux de ces deux diplmes.

GJ

fij / fi.

I
GI

fij / f.j

fi.

I
f.j

Dunod La photocopie non autorise est un dlit

Figure 3.3 Profil-ligne ( gauche) et profil-colonne ( droite). G I et G J : profils marginaux.

Le nombre f i j / f i. reprsente, dans notre exemple, la probabilit doccuper un


emploi de la catgorie j sachant que lon dtient le niveau de diplme i. Le profilligne i nest rien dautre que la loi de probabilit conditionnelle dfinie par i sur
lensemble des colonnes. Pour analyser lcart lindpendance, on confronte ces
profils au profil ligne marginal (= tabli sur lensemble de la population) de terme
gnral f . j et not G I .
Du fait du rle symtrique jou par les lignes et les colonnes, un raisonnement
analogue peut tre men propos des colonnes. Il conduit la notion de profil-colonne
(cf. Figure 3.3).
Ainsi, en AFC, selon que lon sintresse aux lignes ou aux colonnes, on ne considre pas le mme tableau transform. Toutefois, les deux transformations en profils
possdent la mme signification vis--vis des objets quelles concernent. Ces transformations sont intressantes en elles-mmes indpendamment de tout contexte danalyse
factorielle. Lorsquun tableau crois est comment, il est presque toujours prsent
sous la forme de pourcentages, par rapport aux lignes ou aux colonnes selon les aspects
que lon cherche mettre en vidence.

3 Analyse Factorielle des Correspondances

68

3.4 RESSEMBLANCE ENTRE PROFILS : DISTANCE DU x2


En AFC, la ressemblance entre deux lignes ou entre deux colonnes est dfinie par une
distance entre leurs profils connue sous le nom de distance du x2 . Elle est dfinie de
faon symtrique pour les lignes et pour les colonnes. Soit :
2
 1  fi j
fl j
dx (profil-ligne i, profil-ligne l) =

f . j f i.
fl.
j

2
 1
fi j
f ik
2
dx (profil-colonne j, profil-colonne k) =

f i. f . j
f .k
2

Dans ces relations, la distance entre deux lignes dpend essentiellement des diffrences terme terme entre les deux profils dont elle fait une somme des carrs
pondrs. La pondration 1/ f . j quilibre linfluence des colonnes sur la distance entre
les lignes : elle augmente les termes, a priori plus faibles, concernant les modalits
rares ; elle joue, jusqu un certain point, un rle analogue celui de la division par
lcart-type dans le cas des variables numriques.
La distance du x2 jouit dune proprit fondamentale appele quivalence distributionnelle. Selon cette proprit, si deux colonnes proportionnelles dun tableau
sont cumules en une seule, la distance entre les profils-lignes est inchange. Le cas
dune proportionnalit parfaite entre deux colonnes ne se rencontre gure en pratique mais constitue une situation limite dont on peut tre assez proche. La proprit
mathmatique est alors utilise sous la forme dune rgle pragmatique : remplacer,
par leur somme, deux colonnes ou deux lignes presque proportionnelles ne modifie
pas sensiblement les rsultats dune AFC. On se rfre surtout cette rgle lorsque
plusieurs ensembles de modalits sont possibles pour dfinir une mme variable. Ainsi,
la variable catgorie demploi peut tre plus ou moins dtaille : par exemple, on peut
se demander si les catgories ouvrier qualifi et ouvrier non qualifi peuvent tre
regroupes en une seule catgorie. Du fait de lquivalence distributionnelle, si ces
deux catgories ont des profils voisins, le choix entre les deux solutions nest pas
fondamental puisque les AFC des deux tableaux aboutissent des rsultats analogues.

3.5 LES DEUX NUAGES


3.5.1 Nuage des profils-lignes
Sintresser aux modalits de la premire variable revient considrer les donnes
comme une juxtaposition de profils-lignes. Chaque profil-ligne est une suite de J
valeurs numriques et peut tre reprsent par un point de lespace R J dont chacune
des J dimensions est associe une modalit de la seconde variable. La distance

3.5 Les deux nuages

69

du x2 dfinissant la ressemblance entre profils-lignes (cf. section 3.4) possde les


proprits dune distance euclidienne et confre R J la structure despace euclidien.
Cette distance revient affecter le poids 1/ f . j la j e dimension de R J . La somme des
coordonnes de chaque profil-ligne vaut 1 ; il en rsulte que le nuage N I appartient
un hyperplan, not HI (cf. Figure 3.4).
RJ

NI

profil-ligne l
GI

hyperplan HI

profil-ligne i

colonne j
f .j

f ij /f i.

Dunod La photocopie non autorise est un dlit

Figure 3.4 Le nuage N I des profils-lignes dans R J . Le point i a pour coordonne sur laxe
j : f i j / f i. ; son poids est f i. ; la distance entre deux profils est la distance du x2 ; Le barycentre G I
du nuage N I a pour coordonne sur laxe j la frquence marginale f . j ; le nuage N I appartient
un hyperplan not HI .

En AFC, les poids affects chaque point du nuage sont imposs. Le point i a un
poids gal la frquence marginale f i. (ce poids est proportionnel leffectif de la
classe dindividus reprsente par le point i).
Le barycentre des points de N I munis de ces poids est not G I . Sa j e coordonne
est gale la frquence marginale f . j .
f. j =


i

f i.

fi j
f i.

Il sinterprte comme un profil moyen. Dans lexemple du tableau qui croise les
niveaux de diplme et les catgories demploi, G I est le profil demplois de lensemble
de la population, tous les diplmes tant cumuls. Il sert constamment de rfrence
dans ltude des lignes du tableau ; ainsi, tudier dans quelle mesure et de quelle faon
une classe dindividus i diffre de lensemble de la population revient tudier lcart
entre le profil de cette classe i et le profil moyen. tudier la dispersion du nuage

3 Analyse Factorielle des Correspondances

70

autour de son barycentre revient tudier lcart entre les profils des lignes et le profil
marginal, et donc la liaison entre les deux variables (cf. section 3.1).

3.5.2 Nuage des profils-colonnes


Compte tenu du rle symtrique jou par les lignes et les colonnes en AFC, la construction du nuage des profils-colonnes seffectue selon une dmarche strictement identique
celle du nuage des profils-lignes. Il est toutefois utile de la dcrire, ne serait-ce que
pour fixer les notations.
Sintresser aux modalits de la seconde variable revient considrer les donnes
comme une juxtaposition de profils-colonnes. Chaque profil-colonne est une suite de
I valeurs numriques et peut tre reprsent par un point de lespace R I dont chacune
des dimensions est associe une modalit de la premire variable. R I est muni dune
structure euclidienne par la distance du x2 : la i e dimension on affecte le poids 1/ f i.
(cf. Figure 3.5).
RI

NJ

profil-colonne k
GJ

hyperplan HJ

profil-colonne j

ligne i
f i.

f ij /f .j

Figure 3.5 Le nuage N J des profils-colonnes dans R I . Le point j a pour coordonne sur laxe
i : f i j / f . j ; son poids est f . j ; la distance entre deux profils est la distance du x2 ; le barycentre G J
du nuage N J a pour coordonne sur laxe i la frquence marginale f i. ; le nuage N J appartient
un hyperplan not H J .

Le point G J reprsente la marge { f i. |i = 1, ..., I } ; cest le barycentre de N J


lorsque lon munit chaque profil-colonne j du poids f . j ; en tant que profil moyen, il
sert constamment de rfrence dans ltude de N J .

3.6 Ajustement des deux nuages

71

3.6 AJUSTEMENT DES DEUX NUAGES


3.6.1 Ajustement du nuage des profils-lignes
Dans R J , lajustement vise obtenir une suite dimages planes approches du nuage
N I . De la mme faon que lACP, lAFC procde en recherchant une suite daxes
orthogonaux sur lesquels le nuage N I est projet. Chaque axe possde la proprit de
rendre maximum linertie projete du nuage N I avec la contrainte dtre orthogonal
aux axes dj trouvs.
Les images planes de N I doivent tre telles que les distances entre les points
de limage ressemblent le plus possible aux distances entre les points de N I . Cet
objectif est tout fait analogue celui de lajustement du nuage des individus en
ACP : pratiquement, il implique que le nuage analys soit centr, cest--dire que son
barycentre soit choisi comme origine des axes (cf. section 3.5).
Dans le nuage centr, la classe dfinie par la modalit i est reprsente par un
point dont la coordonne sur le j e axe vaut : f i j / f i. f . j . La position de ce point
exprime la diffrence entre la rpartition, sur lensemble des modalits de la seconde
variable, des individus de la classe i et celle de la population totale. Ainsi, rechercher
les directions dinertie maximum du nuage centr revient mettre en vidence les
classes qui scartent le plus du profil de lensemble de la population.
Chaque profil est muni dun poids gal sa frquence marginale f i. . Ce poids
intervient en premier lieu dans le calcul du barycentre du nuage. Il intervient aussi
dans linertie et donc dans le critre dajustement satisfait par les axes (cf. Figure 3.6).
RJ

Dunod La photocopie non autorise est un dlit

i (de masse fi.)


u1
Hi
GI=O

Figure 3.6 Ajustement dans R J du nuage des profils-lignes. i : point associ au profil-ligne
 i. u 1 :
vecteur unitaire du premier axe factoriel. Hi : projection de i sur u 1 . u 1 rend maximum i f i. OHi2 .

Du fait de lintroduction des poids f i. dans le critre dajustement, chaque modalit


possde un poids proportionnel la population quelle reprsente. Ainsi, disparit de
profil gale, les axes factoriels mettent plutt en vidence des phnomnes concernant

72

3 Analyse Factorielle des Correspondances

une fraction importante de la population totale. Selon un autre point de vue, les
modalits deffectif faible, pour lesquelles les profils risquent dtre moins fiables,
interviennent moins dans la construction des axes.
En rsum, lajustement du nuage N I en AFC est analogue celui du nuage des
individus en ACP. Il en diffre par trois points :
1. les lignes interviennent au travers de leur profil ;
2. la distance entre les profils est celle du x2 ;
3. chaque ligne i est affecte du poids f i. .

3.6.2 Ajustement du nuage des profils-colonnes.


Du fait du rle symtrique jou par les lignes et les colonnes en AFC, lajustement
de N J dans R I se pose dans les mmes termes et possde les mmes proprits que
lajustement de N I dans R J . Nous les rsumons ci-dessous.
1. Les images planes de N J doivent tre telles que les distances entre les profils
projets ressemblent le plus possible aux distances entre les profils dans R I . Il
en rsulte la ncessit danalyser le nuage N J par rapport son barycentre G J .
Linertie totale de N J par rapport G J provient des diffrences entre les profils
des diffrentes classes j et le profil de lensemble de la population.
2. Chaque colonne j est affecte dun poids gal sa frquence marginale f . j . Avec
des notations analogues celles de la figure 3.6, H j tant la projection sur v1
I
(vecteur unitaire du premier axe factoriel dans
j associ au profil R ) du point
colonne j, v1 rend maximum la quantit : j f . j (OH j )2 . La justification de ce
poids f . j est strictement analogue celle dveloppe propos des profils-lignes.

3.6.3 Un aspect technique du centrage en AFC


Du point de vue technique, on peut montrer (cf. section 5.5 page 121) quil nest pas
ncessaire de centrer explicitement le nuage N I avant de lanalyser. En effet, mis
part le premier facteur, lanalyse du nuage par rapport O sans centrage conduit aux
mmes facteurs que lanalyse du nuage centr.
Lorsque lon ralise lAFC du nuage N I non centr (cest--dire par rapport
lorigine O sans centrage), le premier axe factoriel possde les proprits suivantes (cf.
Figure 3.7) :
1. il relie lorigine O au barycentre G I du nuage N I ;
2. cet axe est orthogonal, au sens de la distance utilise (i.e. distance du x2 ),
lhyperplan HI contenant le nuage N I ;
3. linertie projete de N I dans cette direction vaut 1.

3.6 Ajustement des deux nuages

73

RJ
1

NI
hyperplan HI

GI
i

1
Figure 3.7 Le premier axe factoriel du nuage N I non centr est le facteur trivial OG I orthogonal
HI . Linertie projete de N I sur OG I vaut 1.

Naturellement, cet axe ne prsente pas dintrt en lui-mme : la projection sur OG I


de chaque point de N I est confondue avec G I . Cette projection de N I sur laxe OG I
est appele facteur trivial ou facteur constant.
Lorthogonalit du premier axe OG I avec lhyperplan HI prsente une consquence
importante. Les axes suivants tant par dfinition orthogonaux OG I , lanalyse peut
tre poursuivie indiffremment par rapport O ou G I (cf. Figure 3.8).
RJ
1

Dunod La photocopie non autorise est un dlit

w1
GI
i

1
u1

w2

Figure 3.8 Analyse par rapport au barycentre et par rapport lorigine. w1 : premier axe factoriel
du nuage N I lorsque lorigine des axes est en O. w2 : deuxime axe factoriel du nuage N I lorsque
lorigine des axes est en O (orthogonal u 1 ). u 1 : premier axe factoriel du nuage N I lorsque
lorigine des axes est en G I . Les projections de N I sur w2 et u 1 sont identiques.

3 Analyse Factorielle des Correspondances

74

3.7 LA DUALIT
Les deux nuages N I et N J constituent deux reprsentations dun mme tableau, lune
travers ses profils-lignes, lautre travers ses profils-colonnes. Il sensuit que les
analyses de ces deux nuages ne sont pas indpendantes : les relations entre ces deux
analyses sont communment regroupes sous le terme de dualit.
Cette dualit est plus fondamentale et plus riche en AFC quen ACP car les lignes
et les colonnes reprsentent des objets de mme nature, ce qui nest pas le cas en ACP.

3.7.1 Statistique du x2 et inertie des deux nuages NI et NJ


Lorsque lon tudie un tableau de contingence, cest--dire une population de n individus au travers de deux variables qualitatives, il est classique de mesurer la significativit de la liaison entre ces deux variables laide de la statistique x2 . Applique
un tableau deffectifs, cette statistique mesure lcart entre les effectifs observs et
les effectifs thoriques que lon obtiendrait en moyenne si les deux variables taient
indpendantes. Elle scrit :
x2 =

 (effectif observ effectif thorique)2


effectif thorique

ij

 (n f i j n f i. f . j )2
n f i. f . j
ij

La statistique x2 est gale, au coefficient n prs, linertie totale par rapport leur
barycentre de lun ou lautre des nuages N I et N J . En effet, dans R I , linertie totale
de N I par rapport G I scrit :
Inertie(N I ) =


i

Inertie(i) =


i

f i. d (i, G I ) =


i

2
 1  fi j
f i.
f. j
f . j f i.
j

Soit :
x2 = n[Inertie(N I )] = n[Inertie(N J )]
Cette double galit montre que linertie totale de chacun des deux nuages N I et
N J reprsente, sous deux formes diffrentes, la liaison entre les deux variables.
Remarque : La quantit x2 /n , note F2 , mesure lintensit de la liaison entre
deux variables qualitatives (cette liaison est dautant plus intense que les modalits de lune sassocient exclusivement aux modalits de lautre) et non sa significativit (elle ne dpend pas de leffectif total) ; lindicateur x2 , lui, mesure la
significativit (une liaison forte peut ne pas tre significative si elle est observe
sur trs peu dindividus ; une liaison faible peut tre significative si elle est
observe sur beaucoup dindividus).

3.7 La dualit

75

3.7.2 Dualit entre les facteurs sur I et les facteurs sur J


De mme quen ACP, on appelle facteur lensemble des coordonnes des projections
des points dun nuage sur lun de ses axes factoriels ; les facteurs sur les lignes sont les
projections de N I et les facteurs sur les colonnes les projections de N J . Le rang dun
facteur est le rang de laxe factoriel correspondant. Outre leur inertie totale identique,
les nuages N I et N J possdent une proprit remarquable : leur ajustement conduit
deux suites de facteurs duaux . Plus prcisment, nous montrons au chapitre 5 que :
1. les inerties associes aux axes de mme rang dans chacun des nuages sont gales ;
2. les facteurs (de mme rang) sur les lignes et ceux sur les colonnes sont lis par
des relations dites de transition (elles permettent de transiter de R I dans R J et
inversement).
Les deux paragraphes suivants dtaillent cette dualit dont la consquence essentielle
est la suivante : les facteurs sur I et sur J de mme rang doivent tre interprts
conjointement car ils mettent en vidence la mme part de liaison, exprime pour lun
en termes de profils-lignes et pour lautre en termes de profils-colonnes.
a) Relations de transition

Les formules de transition prcisent les relations entre les points reprsentant dune
part les lignes et dautre part les colonnes. Avec les notations suivantes :
1. Fs (i) : projection de la ligne i sur laxe de rang s de N I ,
2. G s ( j) : projection de la colonne j sur laxe de rang s de N J ,

Dunod La photocopie non autorise est un dlit

3. ls : valeur commune de linertie associe chacun de ces deux axes,


les deux relations de transition scrivent :
1  fi j
Fs (i) =
G s ( j)
ls j f i.
1  fi j
G s ( j) =
Fs (i)
ls i f . j
Ces deux proprits, qui expriment les rsultats de lanalyse dun nuage en fonction
des rsultats de lanalyse de lautre nuage, conduisent une conomie de calcul.
Mais surtout, elles donnent un sens une reprsentation simultane des lignes et des
colonnes.
b) Reprsentation simultane des lignes et des colonnes ; relations
barycentriques

La reprsentation simultane sobtient en superposant les projections de chacun des


deux nuages N I et N J sur des plans engendrs par des axes de mme rang pour

76

3 Analyse Factorielle des Correspondances

les deux nuages. Sur les graphiques ainsi obtenus, les rapports entre la position des
points lignes et des pointscolonnes dus aux relations de transition peuvent tre dcrits
ainsi : au coefficient 1/ ls prs, la projection, note Fs (i), de la ligne i sur laxe
de rang s (dans R J ) est le barycentre des projections, notes G s ( j), des colonnes
j sur laxe de rang s (dans R I ), chaque colonne j tant affecte du poids f i j / f i.
(cette expression dune formule de transition est appele proprit barycentrique).
Les lments lourds attirant le barycentre, une colonne j attire dautant plus une
ligne i que la valeur de f i j / f i. est leve. Sur les plans factoriels, les points loigns
de lorigine retiennent particulirement lattention car ce sont les profils les plus
diffrents du profil moyen. On trouve donc, pour un facteur, du mme ct quune
ligne i les colonnes j auxquelles elle sassocie le plus et, loppos, celles auxquelles
elle sassocie le moins. Il est ainsi possible dinterprter la position dune ligne par
rapport lensemble des colonnes, ce qui justifie lintrt pratique de la reprsentation
simultane.
La formulation symtrique vaut, en inversant les rles jous par les lignes et les
colonnes. Do le nom de double proprit barycentrique donne ce qui est la
principale rgle dinterprtation des graphiques de lAFC. Cette double proprit
est non seulement spcifique de lAFC, mais la caractrise : on dmontre que lon
retrouve les facteurs de lAFC en cherchant construire des fonctions dfinies sur
les lignes et les colonnes dun tableau de contingence telles que la double proprit
barycentrique soit vrifie.
La reprsentation simultane en AFC est universellement adopte, ce qui nest pas
le cas de celle de lACP. On peut citer deux arguments importants en faveur de cette
superposition.
1. Alors quen ACP les lignes et les colonnes reprsentent des objets de nature bien
diffrentes (individus et variables), les lignes et les colonnes, dans lAFC dun
tableau de contingence, sont de mme nature, savoir des classes dindividus.
Selon ce simple point de vue, cela ne pose aucun problme de figurer toutes ces
classes sur un mme graphique.
2. Il existe dautres prsentations de lAFC dans lesquelles les classes dindividus
que constituent les lignes et les colonnes dun tableau de contingence sont situes
dans un mme espace : leur reprsentation simultane est alors naturelle.
En rsum, sur les graphiques de la reprsentation simultane des lignes et des
colonnes, la position relative de deux points dun mme ensemble (lignes ou colonnes)
sinterprte en tant que distance tandis que la position dun point dun ensemble par
rapport celle de tous les points de lautre ensemble sinterprte en tant que barycentre. Toute association entre une ligne et une colonne suggre par une proximit
sur le graphique doit tre contrle sur le tableau de donnes.

3.7 La dualit

77

Dunod La photocopie non autorise est un dlit

3.7.3 Interprtation de linertie des axes


Linertie dun point (ou dun nuage de points) dans un espace euclidien se dcompose
sur toute base orthogonale : cest la somme de ses inerties sur chacun des axes de cette
base.
Lajustement des nuages N I et N J dcompose leur inertie selon des directions
privilgies : du fait de lorthogonalit des axes, la somme des inerties dun nuage sur
chacun des axes est gale linertie totale du nuage.
Contrairement au cas de lACP, dans laquelle linertie des nuages est gale au
nombre de variables, cette inertie en AFC traduit la structure du tableau : linertie
de chacun des deux nuages, des profils-lignes et des profils-colonnes, est gale la
statistique F2 (cf. section 3.7.1). LAFC propose donc une dcomposition de cette statistique et chaque facteur reprsente une part de la liaison entre les variables. Linertie
dun facteur a donc une signification en absolu, et pas seulement en pourcentage de
linertie totale du nuage : elle mesure en absolu limportance de la part de liaison quil
reprsente. Nous donnons linterprtation des deux valeurs limites entre lesquelles elle
se situe.
Lorsquun tableau vrifie les relations dindpendance, les nuages sont concentrs
en un point (leur barycentre) ; tous les profils-lignes sont identiques et gaux la
marge ligne { f . j ; j = 1, . . . , J } et tous les profils-colonnes sont identiques et gaux
la marge-colonne { f i. ; i = 1, . . . , I }. Linertie des nuages N I et N J relativement
leur centre de gravit est nulle et lAFC ne donne aucun facteur (ou plutt toute
direction est associe une inertie projete nulle).
Il dcoule de la double proprit barycentrique que linertie associe un axe
factoriel vaut au maximum 1. Lorsque cette inertie vaut 1, laxe factoriel met en
vidence une situation dextrme dpendance au sens suivant : lensemble des
lignes dune part, et celui des colonnes dautre part, peuvent tre diviss en au moins
deux groupes, chaque groupe de lignes ne sassociant qu un groupe de colonnes (et
rciproquement) selon le schma de la figure 3.9. Dans ce cas, les facteurs dfinis par
ces axes ont la mme valeur pour chaque lment dun mme groupe de lignes ainsi
que pour chaque lment du groupe de colonnes qui sy associe. Une inertie proche de
1 indique que la structure du tableau est proche de cette situation limite : il existe une
partition de I et de J telle que chaque classe de I sassocie presque exclusivement
une classe de J et rciproquement.
Lorsque deux axes factoriels ont une inertie gale 1, les lignes dune part et les
colonnes dautre part peuvent tre divises en au moins trois groupes qui ne sassocient
qu un seul groupe de lautre ensemble, etc. La situation de plus extrme dpendance
entre deux variables qualitatives prsentant le mme nombre de modalits est celle
o chaque modalit de lune des variables ne sassocie qu lune des modalits de
lautre. En ce cas, le tableau de contingence ne possde des effectifs non nuls que sur

3 Analyse Factorielle des Correspondances

78

J1

J2

T11

T12= 0

1
I1

I1
J1
I2

T21= 0

I2

F1

J2

1=1

T22

I
Figure 3.9 Cas dune inertie associe un axe gale 1. Partitions, des lignes dune part et des
colonnes dautre part, mises en vidence par un axe factoriel associ une inertie gale 1. Tous
les effectifs des sous-tableaux T12 et T21 sont nuls.

la diagonale. Il rsulte de ce qui prcde que, dans ce cas, chaque axe de lAFC est
associ une inertie de 1.

3.7.4 Formule de reconstitution des donnes


la dcomposition de linertie, on peut associer une dcomposition du tableau luimme. En effet, on peut montrer (cf. section 5.6) que :


f i j f i. f . j = f i. f . j
Fs (i)G s ( j)/ ls
s

Cette formule, appele formule de reconstitution des donnes, permet de recalculer les
valeurs du tableau initial en fonction des marges et des facteurs. Lorsque lon dpouille
les rsultats dune AFC, on limite gnralement linterprtation aux premiers facteurs.
Cela revient considrer non pas le tableau des donnes mais son approximation
obtenue laide des premiers termes de la somme ci-dessus.
Cette relation met en vidence une dcomposition de lcart du tableau relativement
lhypothse dindpendance en une somme de tableaux dont chacun ne dpend que
dun couple de facteurs (Fs , G s ) de mme rang. Elle formalise laspect de lobjectif
annonc : dcomposition de la liaison en lments simples. En effet, chaque tableau
de terme gnral f i. f . j Fs (i)G s ( j) exprime une liaison simple puisque le terme de la
case (i, j) ne dpend que de la ligne i et de la colonne j. Si les valeurs de Fs (i) et de
G s ( j) sont de mme signe, cette case exprime une attirance entre i et j ; dans le cas
contraire, il exprime une rpulsion dautant plus importante que Fs (i) et G s ( j) sont
grands en valeur absolue.

3.8 Nombre daxes et inertie totale

79

Nous illustrons cette dcomposition dans la section 10.3.1.a, page 231, propos
dun exemple.

3.8 NOMBRE DAXES ET INERTIE TOTALE


Dans lespace R J , le nuage N I est contenu dans un sous-espace de dimension J 1 ;
dans cet espace, on peut donc trouver au maximum J 1 dimensions orthogonales
dinertie non nulle. De mme, dans lespace R I , on peut trouver au maximum I 1
dimensions orthogonales dinertie non nulle. Compte tenu de la dualit (mme inertie
sur les axes de mme rang dans les deux espaces), en AFC on peut trouver au maximum
min{I 1, J 1} axes dinertie non nulle.
Linertie associe un axe tant au maximum gale 1, linertie totale en AFC
est donc comprise entre 0 (indpendance) et min{I 1, J 1} (liaison dintensit
maximum = association stricte entre les modalits des deux variables mises en correspondances).

Dunod La photocopie non autorise est un dlit

3.9 AIDES LINTERPRTATION ET LMENTS


SUPPLMENTAIRES
Les indices daide linterprtation (qualit de reprsentation dun lment par un
axe ou un plan et contribution dun lment linertie dun axe) dfinis en ACP (cf.
section 1.9) sont valables pour un nuage quelconque. Ils sappliquent donc en AFC.
Notons que, si en ACP les poids de tous les lments sont en gnral gaux, ce nest
pas le cas en AFC ; or ces poids interviennent dans la contribution dun point linertie
dun axe.
En AFC, comme en ACP, on utilise presque systmatiquement la technique des
lments supplmentaires, qui consiste projeter sur les axes factoriels des profils
de lignes ou de colonnes qui ninterviennent pas dans le calcul de ces axes. Une
ligne supplmentaire est relie aux colonnes actives par la formule barycentrique.
De mme, une colonne supplmentaire est relie aux lignes actives par la formule
barycentrique. Ces lments servent trs souvent, eux aussi, daides linterprtation ;
dans les tableaux de grande dimension, par exemple, il est trs pratique de connatre
la position et la qualit de reprsentation du barycentre de plusieurs lignes ou de
plusieurs colonnes.

3.10 SCHMA GNRAL DE LAFC


Nous rsumons les principaux rsultats de lAFC dans un schma gnral (cf.
Figure 3.10). Les numros ci-dessous renvoient ce schma.

3 Analyse Factorielle des Correspondances

80

f ij / f i .

k ij

i
I

tude des profils-lignes


1
j
J
1
i

J marge

f
ij

fij /fi.

f
.j

I
marge

I
GI

tude des profils-colonnes


1
j
J GJ
1
i

i.

fij /f.j

f
i.

I
.j

RI

RJ

5
profil-ligne l

profil-colonne k

hyperplan HI

hyperplan H J
GJ

GI

profil-ligne i
f.j f /f
ij i.

profil-colonne j
f
i. fij /f.j
ligne i

colonne j

AF

11

AF

relations
de transition

9
F2

10

G2
i

GI

12
F1

G2
k
l

GJ

F2
i
j

GI
GJ

G1
F1

Figure 3.10 Schma gnral de lAFC.

G1

Dunod La photocopie non autorise est un dlit

3.10 Schma gnral de lAFC

81

1. Les donnes brutes. Lignes et colonnes jouent des rles symtriques : ce sont des
modalits de variables. La somme de tous les termes ki j du tableau est n.
2. Ce tableau intermdiaire fait apparatre les donnes sous forme de loi de probabilit : f i j = ki j /n. Les probabilits marginales sont { f i. |i I } et { f . j | j J }.
3. et 4. Pour tudier les lignes du tableau, on les transforme en profils-lignes. Pour
tudier les colonnes, on les transforme en profils-colonnes. On dispose donc de deux
tableaux. Un profil sinterprte comme une probabilit conditionnelle. Les profils
moyens G I et G J sont les distributions marginales associes au tableau 2.
5. Un profil-ligne est une suite de J nombres et peut tre reprsent par un point
de R J . Le nuage N I des profils-lignes appartient lhyperplan HI des vecteurs dont
la somme des coordonnes vaut 1. Chaque profil-ligne i est affect du poids f i. ; le
nuage N I ainsi pondr a pour barycentre le profil moyen G I . Dans le nuage N I , on
sintresse la ressemblance entre les profils mesure au travers de la distance du x2 .
6. La reprsentation des profils-colonnes dans R I appelle des commentaires strictement symtriques ceux de la reprsentation des profils-lignes dans R J .
7. LAnalyse Factorielle (AF) dun nuage consiste mettre en vidence une suite de
directions orthogonales telles que linertie, par rapport O, de la projection du nuage
sur ces directions est maximum. Applique N I , lAF fournit une premire direction
dite triviale reliant O G I et orthogonale HI . Pour les directions suivantes, G I se
projette lorigine des axes : ces directions suivantes sont les directions dallongement
maximum de N I . Il est donc quivalent de raliser lanalyse par rapport O ou par
rapport G I .
8. On peut reprendre point par point le commentaire de 7 en le transposant aux
colonnes.
9. et 10. Les plans factoriels, croisant deux facteurs, sur les lignes ou sur les
colonnes, fournissent des images approches des nuages N I et N J . Sur ces plans,
la distance entre deux points sinterprte comme une ressemblance entre les profils de
ces points. Lorigine des axes est confondue avec le profil moyen.
11. Les relations de transition expriment les rsultats dune AF (par exemple dans
I
R ) en fonction des rsultats de lautre (par exemple dans R J ).
12. Du fait des relations de transition, les interprtations des plans factoriels reprsentant N I et N J doivent tre menes simultanment. Il est commode de superposer
ces reprsentations. Linterprtation de cette reprsentation simultane est rgie par la
double proprit barycentrique.

82

3 Analyse Factorielle des Correspondances

3.11 CONCLUSION
Dans ce chapitre, lAFC est introduite comme une mthode particulirement bien
adapte ltude dun tableau de contingence. Dun point de vue historique, elle a
dailleurs t imagine pour traiter ce type de tableau. Toutefois, les remarquables
proprits de cette mthode ont trs tt incit lappliquer dautres tableaux :
aujourdhui, la pratique courante de lAFC dpasse largement le cadre des tableaux de
contingence.
Ds linstant que lon tudie un tableau qui nest pas un tableau de contingence,
lobjectif de lAFC ne peut plus tre formul en terme de liaison entre deux variables
qualitatives. En revanche, il existe des tableaux dont ltude ncessite une typologie
des lignes dune part et des colonnes dautre part, travers leur profil.
Pour tablir lintrt de lAFC dans la ralisation de telles typologies, il convient de
sassurer que les diffrentes notions mises en jeu par cette mthode (transformation en
profils, distance du x2 , poids des lments) sont en accord avec le point de vue que
lon veut avoir sur les donnes tudies. Les formules barycentriques, qui relient les
projections des lignes et des colonnes et qui permettent elles seules de caractriser
les facteurs, peuvent aussi justifier lapplication de lAFC.
Nous illustrons ces situations laide de deux exemples.
Premier exemple : Dans ltude de la liaison entre le diplme obtenu et lemploi
occup, on peut sintresser deux tableaux de mme structure tablis lun en se
limitant aux hommes et lautre en se limitant aux femmes. Le chapitre 10 propose une
srie danalyses pour ce couple de tableaux. Ds maintenant, on peut se rendre compte
de lintrt de lAFC sur une juxtaposition en ligne de plusieurs tableaux. En
ralit, ce tableau est encore un tableau de contingence dont lune des deux variables
est obtenue par croisement des deux variables emploi et sexe.
Second exemple : Les lignes sont les entreprises dun secteur conomique. Les
colonnes sont les postes dactif du bilan. lintersection de la ligne i et de la colonne
j, se trouve la valeur du poste j pour lentreprise i. Un tel tableau peut tre analys
laide dune ACP. En ce cas, les postes sont des variables centres et rduites ;
chaque poste est affect du mme poids ainsi que chaque entreprise. Gnralement,
les entreprises diffrent assez sensiblement par leur total dactif, ce qui induit presque
toujours un effet taille en tant que premier facteur (cf. section 1.6).
Mais ce tableau peut aussi tre analys laide dune AFC. Tout dabord, ses marges
(qui servent de rfrence) ont une signification claire : la somme des termes de la i e
ligne est le total des actifs de lentreprise i ; la somme des termes de la j e colonne
est la valeur du poste j pour lentreprise fictive que constitue lensemble du secteur.
Sans entrer dans les dtails, les principales caractristiques impliques par lAFC de
ce tableau sont les suivantes.

3.11 Conclusion

83

1. Chaque entreprise est analyse au travers de son profil : chacun de ses postes est
exprim par rapport au total des actifs. Un ventuel effet taille est limin.
2. Chaque entreprise a un poids proportionnel son total dactif.
3. Chaque poste de bilan a un poids proportionnel son importance pour lensemble
du secteur.
4. Les postes du bilan sont transforms en profil ; cette harmonisation des donnes
nest pas trs diffrente du couple centrage-rduction en ACP. la diffrence de
lACP, le nuage des postes est analys partir de son barycentre : on tudie les
diffrences entre postes. Ce qui est commun lensemble des postes est limin :
on ne peut observer deffet taille.
Ce second exemple montre que certains tableaux peuvent tre analyss par ACP ou
AFC. Ces deux analyses ne sont pas quivalentes et peuvent fournir des clairages
assez diffrents. On examinera les pondrations induites par lAFC aussi bien pour
choisir entre les deux mthodes que pour interprter conjointement leurs rsultats.

Chapitre 4

Analyse des Correspondances


Multiples

4.1 DONNES ET NOTATIONS


4.1.1 Donnes
LAnalyse des Correspondances Multiples (ACM) permet dtudier une population de
I individus dcrits par J variables qualitatives.
Une variable qualitative (ou nominale) est une application de lensemble I des
individus dans un ensemble fini sur lequel on ne considre aucune structure : par
exemple un ensemble de trois couleurs (bleu, blanc, rouge). Les lments de cet
ensemble sont appels modalits de la variable et lon dit par exemple quun individu
bleu possde la modalit bleu.
Lapplication la plus courante de lACM est le traitement de lensemble des rponses
une enqute. Chaque question constitue une variable dont les modalits sont les
rponses proposes (parmi lesquelles chaque enqut doit faire un choix unique).
Nous commenons par passer en revue diffrentes faons de transcrire numriquement lensemble de ces donnes.

4.1.2 Codage condens


Ces donnes peuvent tre rassembles dans un tableau de type IndividusVariables
tout fait analogue celui tudi en ACP. Les lignes reprsentent les individus, les
colonnes reprsentent les variables : lintersection de la ligne i et de la colonne j, se
trouve la valeur xi j (on dit aussi le codage condens) de lindividu i pour la variable j
(cf. Figure 4.1). Gnralement, xi j est le numro de la modalit (de la variable j)

4 Analyse des Correspondances Multiples

86

possde par i mais beaucoup de logiciels acceptent pour xi j une chane de caractres
dsignant la modalit (codage dit alphabtique ).
Naturellement, mme lorsque ce sont des nombres, les valeurs xi j sont des codifications qui ne possdent pas de proprits numriques. Si la variable j est la couleur
des individus, cette couleur peut tre codifie ainsi : bleu = 1, blanc = 2, rouge = 3.
Il est clair que la moyenne entre bleu et rouge na pas grand sens et ne peut tre
considre comme tant blanc ! Il nest donc pas possible de traiter directement ce
tableau par ACP (ou AFC) : les tableaux IndividusVariables qualitatives possdent
des spcificits et leur analyse factorielle ncessite une mthode spcifique.

variables qualitatives
j
J

individus

xij

I
Figure 4.1 Tableau des donnes sous forme de codage condens. I : nombre et ensemble des
individus. J : nombre et ensemble des variables qualitatives. xi j : codage condens de la valeur de
lindividu i pour la variable j (numro ou chane de caractre).

4.1.3 Tableau Disjonctif Complet


Une autre faon de prsenter ces mmes donnes est de construire un Tableau Disjonctif Complet (TDC). Dans ce tableau, les lignes reprsentent les individus et les
colonnes reprsentent les modalits des variables : lintersection de la ligne i et de
la colonne k, on trouve xik qui vaut 1 ou 0 selon que lindividu i possde la modalit
k ou non (cf. Figure 4.2). Lorigine de la terminologie Tableau Disjonctif Complet
est la suivante : lensemble des valeurs xik dun mme individu, pour les modalits
dune mme variable, comporte la valeur 1 une fois (complet) et une fois seulement
(disjonctif).
Les colonnes de ce tableau sont des fonctions numriques dfinies sur lensemble
des individus appeles indicatrices de modalit.

4.1 Donnes et notations

variable 1
1

87

variable j
1 k Kj

variable J
K

individus

marge
J

0100

xik

0010

I
marge I1

Ik

IK

IJ

Figure 4.2 Tableau des donnes


sous forme disjonctive complte. K j = nombre et ensemble des
modalits de la variable j. K = jj =J
=1 K j = nombre et ensemble des modalits toutes variables
k=K
confondues. xik = 1 si lindividu i possde la modalit k et 0 sinon k=1 j xik = 1 pour tout (i, j)
k=K
i=I
k=K j
k=1 Ik = I pour tout j
k=1 x ik = J pour tout i ;
i=1 x ik = Ik pour tout k ;

Dunod La photocopie non autorise est un dlit

4.1.4 Hypertableau de contingence


Lorsque le nombre de variables J est rduit 2, ces mmes donnes peuvent tre
prsentes sous la forme dun tableau de contingence mettant en correspondance les
deux ensembles de modalits.
Une gnralisation directe du cas o J = 2 suggre de concevoir, sinon de
construire explicitement, lhypertableau de contingence dont chaque dimension est
une variable. La figure 4.3 reprsente cette construction quand J = 3. Cet hypertableau est bien quivalent aux donnes initiales. Nanmoins, son nombre de cases crot
si rapidement avec J que, dans la plupart des situations concrtes, presque toutes les
cases ont un effectif nul (si lon mesure sur 1 000 plantes 10 variables 5 modalits,
lhypertableau associ possde environ 107 cases dont au plus une sur 10 000 sera
deffectif non nul). Le dveloppement de mthodes gnrales danalyse de cet hypertableau est sans intrt pratique immdiat. En revanche, le cas o J = 3 conduit un
hypertableau de dimension raisonnable et mrite une attention particulire : nous lui
consacrons le chapitre 10.

4 Analyse des Correspondances Multiples

88

K3

q
Iklq

K2

1
k
K1

Figure 4.3 Lhypertableau de contingence associ 3 variables qualitatives. K 1 : nombre de


modalits de la premire variable. Iklq : nombre dindividus possdant les modalits k (de la
variable 1), l (de la variable 2) et q (de la variable 3).

4.1.5 Tableau de Burt


Lhypertableau tant la plupart du temps impossible manier, pour gnraliser lanalyse des correspondances ltude des croisements entre plus de deux variables, on
peut construire un tableau contenant lensemble des tableaux de contingence entre
les variables prises 2 2. Le tableau de Burt (cf. Figure 4.4) nest pas exactement
un tableau de contingence mais une juxtaposition de tels tableaux ; chaque individu
y apparat J 2 fois. Les tableaux contenant la diagonale croisent chaque variable avec
elle-mme : ils ne contiennent que des 0 sauf sur la diagonale qui contient les effectifs
totaux Ik des modalits.
1

variable j
k

variable l
q
K

variable j

variable l

0
0

Ik

Iqk

Iqk

Iq

K
marge

JIk

Figure 4.4 Tableau de Burt. Le tableau est symtrique. Les tableaux J situs sur la diagonale sont
diagonaux. Iqk : nombre dindividus possdant la fois la modalit q (de la variable l) et la
modalit k (de la variable j). Ik : nombre dindividus possdant la modalit k (de la variable j).

4.2 Objectifs

89

Ce tableau est analogue une matrice des corrlations en ce sens quil rcapitule
lensemble des liaisons entre les variables prises 2 2. Il contient beaucoup moins
dinformation que lhypertableau et ne permet pas de reconstruire le TDC.

4.2 OBJECTIFS
La problmatique de lACM est apparente celle de lACP (tude dun tableau IndividusVariables) mais peut tre considre aussi comme une gnralisation de celle de
lAFC (tude de la liaison entre plusieurs variables qualitatives). Ces deux aspects sont
toujours plus ou moins explicitement prsents dans les objectifs de lACM, prsents
ici partir des trois familles dobjets qui interviennent en ACM : les individus, les
variables et les modalits des variables.

Dunod La photocopie non autorise est un dlit

4.2.1 tude des individus


De faon analogue lACP, lun des objectifs de lACM est de raliser une typologie
des individus. Cette typologie doit sappuyer sur une notion de ressemblance telle
que deux individus sont dautant plus proches quils possdent un grand nombre de
modalits en commun.
En outre, dans la plupart des applications de lACM, les individus sont trs nombreux et ne sont connus que par leurs caractristiques prsentes dans le tableau de
donnes. Par exemple, dans une enqute dopinion, on ne dispose pour chaque individu daucune autre connaissance que ses rponses au questionnaire. En ce cas, les
individus sont tudis au travers des classes dfinies par les variables. Ainsi, dans les
enqutes dopinion, on sintresse, par exemple, aux femmes, aux jeunes, aux retraits, etc. Une analyse des individus au travers de ces classes doit tre telle que deux
classes se ressemblent dautant plus que leurs profils de rpartition sur lensemble des
modalits sont proches.

4.2.2 tude des variables


Procdant encore de faon analogue lACP, on peut adopter deux points de vue dans
ltude des variables.
Le premier est celui du bilan des liaisons entre les variables. Ltude de la liaison
entre deux variables qualitatives ncessite de considrer le tableau de contingence
croisant leurs modalits. Un bilan un tant soit peu dtaill de ces liaisons implique
donc de se situer au niveau des modalits plus qu celui des variables.
Le second consiste rsumer lensemble des variables (qualitatives) par un petit
nombre de variables numriques. Par exemple, on peut chercher rsumer un ensemble
de variables socio-professionnelles par un indicateur de statut social . Lintrt de
ces variables synthtiques provient de ce quelles sont lies lensemble des variables

4 Analyse des Correspondances Multiples

90

tudies. Ainsi, une variable ne pourra tre considre comme un indicateur de statut
social que si elle est lie la fois la catgorie socio-professionnelle, au type de
diplme, etc.
Remarque. Par rapport lACP, on cherche, selon ce second point de vue, une
variable quantitative pour synthtiser un ensemble de variables qualitatives (et non
quantitatives) ce qui implique, dune faon ou dune autre, daffecter un coefficient
chaque modalit de chaque variable ; pour un individu, la valeur de la variable
synthtique est alors la somme des coefficients des modalits quil possde.

4.2.3 tude des modalits


Etudier lensemble des modalits revient dresser un bilan de leurs ressemblances. Or
une modalit peut tre considre selon deux points de vue :
1. en tant que variable indicatrice dfinie sur lensemble des individus, soit une
colonne du TDC (cf. section 4.1.3) ;
2. en tant que classe dindividus dont on connat la rpartition sur lensemble des
modalits, soit une ligne ou une colonne du tableau de Burt (cf. section 4.1.5).
La notion de ressemblance entre modalits diffre selon le point de vue adopt. Dans
le premier cas, la ressemblance entre deux modalits doit reposer sur leur association
mutuelle : deux modalits se ressemblent dautant plus quelles sont prsentes ou
absentes simultanment chez un grand nombre dindividus. Les autres modalits
ninterviennent pas.
Dans le second cas, la ressemblance entre deux modalits est analogue celle que
lon utilise dans les tableaux de frquence. Une ligne du tableau de Burt caractrise
lassociation de la modalit avec les modalits de toutes les variables : deux modalits se ressemblent dautant plus quelles sassocient beaucoup ou peu aux mmes
modalits.

4.2.4 Conclusion sur les objectifs


Ltude dun tableau IndividusVariables qualitatives met en jeu trois familles dobjets : individus, variables et modalits. Il en rsulte une problmatique beaucoup plus
riche et complexe que le triptyque classique : typologie des lignes, typologie des
colonnes, mise en relation des deux typologies. Cette richesse ne doit cependant pas
faire oublier lunicit du tableau : il ne peut tre question dtudier sparment les
diffrents aspects de la problmatique par des mthodes sans rapport entre elles. Pratiquement, cette unicit est ralise en articulant les interprtations autour de la typologie
des modalits. En effet, cette typologie permet dtudier lassociation mutuelle entre
les modalits, cest--dire les liaisons entre les variables. Elle permet aussi daborder
celle des individus en examinant le comportement moyen de classes dindividus.

4.3 AFC applique un Tableau Disjonctif Complet

91

Les objectifs indiqus dans ltude des variables et des individus sexpriment ainsi
en grande partie laide des modalits.

4.3 AFC APPLIQUE UN TABLEAU DISJONCTIF COMPLET


4.3.1 ACM et AFC

Dunod La photocopie non autorise est un dlit

Lorsque les programmes dAFC ont commenc tre diffuss, lide est venue dappliquer ces programmes des TDC. Rapidement, on sest rendu compte que cette
mthodologie fournissait des rsultats intressants, cest--dire faisait apparatre des
structures du tableau des donnes mettant en jeu un grand nombre de lignes et de
colonnes.
En fait, conue pour traiter des tableaux de frquence, lAFC en tant que mthode
ne peut sappliquer aux tableaux IndividusVariables qualitatives. En revanche, les
calculs de lAFC, cest--dire concrtement le programme, peuvent bien sr tre
appliqus aux TDC. Mais, dans ce cas, ces calculs doivent tre rinterprts en fonction
de la nature particulire du tableau. Ces calculs, munis de cette nouvelle interprtation,
constituent une mthode part entire ; do lintroduction du vocable Analyse des
Correspondances Multiples. LAFC dun TDC nest quune faon pratique de raliser
les calculs, dailleurs incomplte puisquelle ignore la notion de variable et donc ne
fournit aucun rsultat les concernant.
Cela tant, nous suivrons cette dmarche historique et commode pour prsenter
lAnalyse des Correspondances Multiples.
Un TDC possde non seulement une nature diffrente de celle dun tableau de
contingence (ils codent les donnes diffremment) mais aussi des proprits numriques particulires. Les plus importantes sont celles-ci (cf. Figure 4.2) :
1. les valeurs dans le tableau ne sont que des 0 et des 1 ;
2. les colonnes peuvent tre regroupes par paquets (qui correspondent chacun
une variable) dont la somme est une colonne compose de 1 ;
3. la somme des nombres dune mme ligne est constante et gale J , nombre total
de variables.
Les sections suivantes montrent que les distances, les poids et les facteurs de lAFC
dun TDC correspondent aux objectifs pralablement fixs.

4.3.2 Nuage des individus


La marge sur I tant constante, la transformation en profils-lignes ne modifie gure les
donnes. Un individu est reprsent par les modalits quil possde. Deux individus
se ressemblent sils prsentent globalement les mmes modalits. Plus prcisment, la

4 Analyse des Correspondances Multiples

92

distance entre deux individus i et l est dfinie par :


 I J
xik
xlk 2
1 I

=
(xik xlk )2
d 2 (i, l) =
Ik
J
J
J
Ik
k

Lexpression (xik xlk )2 vaut 0 ou 1 et ne diffre de 0 que pour les modalits k


possdes par un seul des deux individus i et l. La distance d(i, l) crot avec le nombre
de modalits qui diffrent pour les individus i et l (ce qui est logique !). Une modalit k
intervient dans cette distance avec le poids I /Ik , inverse de sa frquence : la prsence
dune modalit rare loigne son ou ses possesseurs de tous les autres individus.
La distance induite par lAFC applique un TDC est donc satisfaisante. Le poids
affect chaque individu lest aussi puisquil est identique pour chacun (du fait de la
marge constante).
Le centre de gravit de ce nuage, not G I , a pour coordonne, pour la modalit k,
Ik /I J , proportion, au coefficient J prs, des individus ayant choisi la modalit k .
Il peut sinterprter comme un individu thorique moyen (dans une enqute, cet
individu aurait pu partager sa rponse une question dans les diffrentes modalits,
et ce proportionnellement aux rponses de lensemble des individus). On retrouve
ici le fait quun individu est dautant plus loign de G I quil possde des modalits
rares.

4.3.3 Nuage des modalits


La modalit k est reprsente par le profil de la colonne k. Les nombres du TDC ne
pouvant prendre que les valeurs 0 ou 1, le profil de la colonne k ne contient son tour
que deux valeurs possibles : 0 ou 1/Ik . En outre, le centre de gravit du nuage des
modalits, not G K , qui se confond avec le profil de la marge sur I , est caractris
par un profil constant gal 1/I (quivalent une modalit que tous les individus
auraient choisie). Il en rsulte que le profil de la colonne k ressemble dautant plus au
profil moyen que leffectif de la modalit k est grand. Rciproquement, une modalit
rare sera toujours loin du centre de gravit du nuage des modalits.
La distance entre deux modalits k et h est dfinie par :
2
  xik
xih
2
d (k, h) =
I

Ik
Ih
i

En utilisant le fait que (xik )2 = xik et en dveloppant le terme carr, on obtient :


I
[nombre dindividus possdant une et une seule des modalits h et k]
d 2 (k, h) =
Ih Ik
Cette distance crot avec le nombre dindividus possdant une et une seule des
deux modalits h et k, et dcrot avec leffectif de chacune de ces modalits. Deux

4.3 AFC applique un Tableau Disjonctif Complet

93

modalits dune mme variable sont obligatoirement assez loignes lune de lautre
dans lespace. Deux modalits possdes par les mmes individus sont confondues.
Les modalits rares sont loignes de toutes les autres. Cette distance traduit bien le
premier des deux points de vue sur la ressemblance entre modalits indiqus dans les
objectifs.
En appliquant ce calcul la distance entre une modalit k et le centre de gravit
G K du nuage des modalits (correspondant une modalit possde par tous les
individus), on trouve : d2 (k, G K ) = (I /Ik ) 1 ; cela spcifie linfluence de leffectif
dune modalit sur sa distance au point moyen.
Le poids de la modalit k vaut Ik /I J ; il est proportionnel leffectif Ik .
Remarques

Un lment (ligne ou colonne) influence la construction des axes par lintermdiaire


de son inertie par rapport au centre de gravit. Un calcul simple donne :

Dunod La photocopie non autorise est un dlit

Inertie de k par rapport G K =

1
Ik
(1 )
J
I

Ce rsultat montre que, dans linfluence dune modalit rare, le faible poids ne
suffit pas compenser leur loignement. Par exemple, une modalit prsente dans 1 %
seulement de la population possde une inertie (cest--dire une influence) presque
deux fois plus grande quune modalit prsente dans 50 % de la population. Concrtement, il est courant de voir les premiers facteurs dune ACM dtermins presque
exclusivement par quelques modalits trs rares partages par les mmes individus.
Comme il est souvent beaucoup plus intressant de dgager des phnomnes gnraux
plutt que ces phnomnes ponctuels, on cherche, en pratique, viter les modalits
trop rares (en effectuant des regroupements).
En sommant les inerties des modalits, on montre facilement que linertie totale du
nuage tudi vaut (K /J ) 1. En ACM, comme en ACP et la diffrence de lAFC,
linertie totale des nuages nintervient pas dans linterprtation.
Linertie des K j modalits de la variable j vaut (K j 1)/J . Cette inertie, tant lie
directement au nombre de modalits de la variable j, incite exiger des nombres de
modalits gaux pour toutes les variables actives. En fait, cette diffrence dinertie
entre variables ayant des nombres de modalits diffrents vaut pour lespace entier R I .
Ds linstant que lon considre une seule direction de R I , ce qui est le cas des axes
factoriels, linertie du nuage des K j modalits dune mme variable j est toujours
infrieure 1/J , quantit ne dpendant pas de K j . Il en rsulte quil nest pas gnant,
de ce point de vue, de faire intervenir simultanment en actif des variables ayant des
nombres de modalits diffrents. Ce problme sera nouveau abord en section 4.3.5.

4 Analyse des Correspondances Multiples

94

4.3.4 Relations de transition et reprsentation simultane


Avec les notations dj utilises en ACP et en AFC, les relations de transition de
lAFC, appliques un TDC, scrivent :
Fs (i) =
G s (k) =

1  xik

G s (k)
ls kK J
1  xik

Fs (i)
ls iI Ik

Du fait que xik ne prend que les valeurs 0 ou 1, ces relations de transition sinterprtent

simplement. En projection sur laxe s, lindividu i est plac, au coefficient 1/ ls prs,


au barycentre
des modalits quil possde. Paralllement, la modalit k est place, au
coefficient 1/ ls prs, au barycentre des individus qui la possdent. Il en rsulte que,
sur un axe, une modalit (colonne du TDC) reprsente une dilatation prs la moyenne
des individus qui la possdent (lignes du TDC). Aussi, dans ltude de sa projection,
on peut considrer une modalit aussi bien comme barycentre dune classe dindividus
(i.e. une ligne du tableau de Burt = somme des lignes du TDC correspondant aux
individus possdant la modalit concerne) que comme indicatrice dune variable (i.e.
une colonne du TDC). Le coefficient de dilatation varie avec les axes, ce qui nest
pas gnant lorsque linterprtation des rsultats se fait facteur par facteur et milite
pour examiner conjointement de prfrence des axes dinerties comparables (principe
commun toute les analyses factorielles).
Cette quivalence entre facteurs ne doit pas faire oublier que les modalits, dune
part en tant quindicatrices et dautre part en tant que barycentres, sont situes dans
des espaces diffrents. Il en rsulte que les qualits de reprsentation dune mme
modalit selon chacun des points de vue ne sont pas lies. En outre, les notions de
proximit entre ces deux types dobjets diffrent.
En effet, la proximit entre indicatrices mesure leur association mutuelle (cf. section 4.3.3). Dautre part, la proximit des moyennes de classes dindividus dcoule
des distances dfinies entre les individus : deux classes dindividus k et h sont dautant
plus proches quelles possdent des caractristiques identiques quant lensemble des
variables, cest--dire que les modalits k et h sassocient de la mme manire aux
modalits de toutes les variables. Cette notion de proximit correspond au second point
de vue sur les ressemblances entre modalits dgag dans les objectifs. Il est remarquable de constater, qu des dilatations axiales prs, les deux notions de proximit
fondes sur des principes diffrents conduisent aux mmes graphiques dans lanalyse
du TDC.
En pratique, les deux notions de proximit sutilisent conjointement ; en particulier,
on interprte souvent la proximit entre modalits de variables diffrentes en tant
quassociation de modalits et la proximit entre modalits dune mme variable en

4.3 AFC applique un Tableau Disjonctif Complet

95

tant que ressemblance entre deux classes dindividus. Par exemple, en dcrivant un plan
factoriel sur lequel apparaissent diffrents repres sociaux, on interprte la proximit
entre les modalits retraits et plus de 65 ans en terme dassociation (ce sont presque
les mmes individus qui possdent ces deux modalits) et la proximit entre 60 65 ans
et plus de 65 ans en terme de ressemblance (ces deux classes dindividus possdent
des caractristiques identiques quant aux autres variables). Ainsi, les relations de
transition, mme si elles ne sont pas utilises dans le cadre strict dune reprsentation
simultane, confrent la reprsentation des modalits les proprits souhaitables
dgages dans lexpos des objectifs.

4.3.5 Les variables travers leurs modalits


Les variables qualitatives ne sont pas introduites explicitement dans lAFC dun TDC.
Elles napparaissent qu travers lensemble de leurs modalits. Les sous-nuages des
modalits dune mme variable ont des proprits quil est intressant de connatre
pour interprter des rsultats mais aussi pour coder des variables quelconques en vue
de les traiter en variables qualitatives dans une ACM (cf. section 4.5).
a) Barycentre des modalits dune variable

Comme le montre la relation ci-dessous, le barycentre des modalits dune mme


variable se confond avec celui de lensemble du nuage.
 Ik xik
1
=
I Ik
I

Dunod La photocopie non autorise est un dlit

kK j

La projection conserve cette proprit. Lensemble des modalits dune mme variable
est donc centr sur lorigine pour tous les graphiques ; les facteurs opposent entre elles
la fois lensemble de toutes les modalits et lensemble des modalits de chaque
variable.
b) Sous-espace engendr par les modalits dune variable

Du fait du caractre disjonctif du TDC, les vecteurs de R I joignant lorigine (avant


centrage) aux modalits dune mme variable sont orthogonaux entre eux. Lensemble
des r modalits dune variable engendre un sous-espace de dimension gale r . Du
fait du caractre complet du TDC, tous ces sous-espaces possdent une direction
commune : celle qui relie lorigine au centre de gravit du nuage. Cette direction
tant limine lors du centrage (cf. section 3.3), on peut considrer que, en ACM, une
variable prsentant r modalits engendre un sous-espace de dimension gale r 1.
Il en rsulte que, pour reprsenter parfaitement les r modalits dune mme variable,
au moins (r 1) facteurs sont ncessaires.

96

4 Analyse des Correspondances Multiples

Cette proprit a plusieurs consquences pratiques :


1. quelle que soit la structure du tableau, le pourcentage dinertie associ chaque
facteur, en particulier au premier, est ncessairement faible lorsque les variables
prsentent beaucoup de modalits ;
2. mme si un facteur est trs li une variable (en ce sens quil regroupe clairement
les individus possdant la mme modalit pour cette variable), il est impossible
que toutes ses modalits soient bien reprsentes par ce seul facteur ;
3. dans llaboration dun tableau de donnes, mme si le nombre dindividus est
trs grand, il nest pas utile de multiplier de faon importante les modalits dune
mme variable : le gain de finesse obtenu risque de ne pas pouvoir tre valoris
dans lanalyse.
Linertie dune variable r modalits (gale (r 1)/J ; cf. section 4.3.3) est donc
rpartie dans un sous-espace r 1 dimensions. On peut montrer en outre quelle
est gale 1/J dans toutes les directions de ce sous-espace. Il en rsulte quune
variable ayant un grand nombre de modalits, bien quengendrant une inertie importante dans R I , na aucune raison dinflchir le premier axe de faon privilgie puisque
cette inertie importante est en quelque sorte dilue dans un sous-espace de grande
dimension.

4.3.6 Synthse des variables qualitatives


Un aspect de ltude dun ensemble de variables est la mise en vidence dun petit
nombre de variables synthtiques, cest--dire lies le plus possible lensemble des
variables initiales (cf. section 4.2.2). Pour montrer que les facteurs de lACM constituent ces variables synthtiques, nous utilisons le rapport de corrlation, qui mesure la
liaison entre une variable numrique (ici le facteur) et une variable qualitative.
Rappelons la dfinition de ce rapport. Une variable qualitative dfinit une partition
sur lensemble des individus en autant de classes quelle a de modalits. Utilisant le
thorme de Huygens, linertie totale (ou variance) dune variable numrique peut se
dcomposer en somme de linertie inter (i.e. inertie des centres de gravit des classes)
et des inerties intra (i.e. inertie des individus par rapport au centre de gravit de la
classe laquelle ils appartiennent). Le carr du rapport de corrlation est le quotient
de linertie inter par linertie totale. Il varie entre 0 et 1. Lorsquil est proche de 1,
les individus dune mme classe sont trs regroups et les classes sont spares les
unes des autres : cest une situation de liaison trs forte entre la variable qualitative et
la variable numrique. Lorsquil est proche de 0, les moyennes des classes sont trs
proches de la moyenne gnrale et les individus dune mme classe sont trs disperss :
la variable qualitative et la variable numrique ne sont pas lies. La figure 4.5 illustre
ces deux cas extrmes.

4.3 AFC applique un Tableau Disjonctif Complet

97

2 1

2 0
Figure 4.5 Illustration des deux valeurs extrmes du rapport de corrlation. 8 individus,
reprsents par un symbole diffrent selon leur modalit pour une variable qualitative, figurent
sur un axe reprsentant une variable numrique.

En notant G k le barycentre des individus prsentant la modalit k, le carr du rapport


de corrlation entre une variable j et le facteur Fs vaut :

(Ik /I )(Fs (G k ))2
kK
inertie
inter
j
=
h2 (Fs , j) =
inertie totale
ls
En utilisant le fait que, en ACM, la modalit k a le poids Ik /IJ et se trouve, un
coefficient prs, au barycentre des individus qui la possdent, soit :

G s (k) = Fs (G k )/ ls
on trouve :
h2 (Fs , j) = J

(inertie de la modalit k, projete sur laxe dordre s)

Dunod La photocopie non autorise est un dlit

kK j

Notons que le rapport de corrlation tant compris entre 0 et 1, linertie du sousnuage des modalits dune mme variable sur un axe est comprise entre 0 et 1/J : elle
vaut 1/J si Fs appartient au sous-espace engendr par les modalits de la variable.
La quantit maximise par les axes factoriels dans lespace R I est linertie projete
du nuage de lensemble des modalits. En regroupant les modalits dune mme
variable, ce critre nest autre que la moyenne des carrs des rapports de corrlation
entre le facteur et chacune des variables. Il en rsulte que les facteurs Fs de lACM
sont les variables numriques les plus lies lensemble des variables qualitatives
tudies et, en ce sens, constituent bien les variables synthtiques annonces.
La premire relation de transition (cf. section 4.3.4) fournit un clairage sur la faon
dont le facteur Fs est calcul pour chaque individu. chaque modalit k, lACM
affecte le poids G s (k) ; Fs (i)est la moyenne de ces coefficients pour les modalits
possdes par lindividu i ( ls prs).
Les proprits nonces dans ces deux derniers paragraphes permettent de prciser
linfluence relative dune variable en ACM : pour un axe donn, limportance a

4 Analyse des Correspondances Multiples

98

priori de chaque variable est la mme mais le nombre daxes sur lesquels une
variable peut influer est directement li au nombre de ses modalits. Cela implique
notamment que, si quelques variables trs riches en modalits sont lies entre elles,
les premiers facteurs peuvent nexprimer que ces liaisons et il faudra alors chercher
trs loin dans la suite des facteurs pour percevoir dautres liaisons.

4.3.7 Reprsentation des variables en ACM


Le concept de variable (et non plus de modalit) apparat en ACM et conduit des
aides linterprtation. Ces indices compltent ceux dj obtenus dans une simple
AFC du TDC et qui concernent les individus et les modalits.
La contribution dune variable linertie dun facteur est la somme des contributions
de toutes ses modalits. Elle permet aussi de mesurer la liaison (rapport de corrlation)
entre la variable et le facteur. Il est intressant de commencer lanalyse des rsultats
dune ACM par la consultation systmatique de ces coefficients, qui met en vidence
les variables les plus lies chacun des facteurs.
Il peut tre utile de construire le graphique suivant (cf. Figure 4.6) dit carr des
liaisons . En abscisse et en ordonne figurent deux facteurs, par exemple Fs et Ft .
Dans ce repre, on peut reprsenter chaque variable j par un point dont la coordonne
sur Fs (respectivement Ft ) est le carr du rapport de corrlation entre la variable j et
Fs (respectivement Ft ).
On montre (cf. section 8.6.2) que ce graphique sinterprte aussi comme la projection dun nuage dans lequel chaque point reprsente une variable, la proximit entre
deux points-variables traduisant la ressemblance entre les partitions engendres par
les deux variables.
Ft
1
j'

2(j,Ft)

2(j,Fs)

Fs

Figure 4.6 Reprsentation des variables en ACM (carr des liaisons). h2 ( j, Fs ) : rapport de
corrlation entre la variable qualitative j et le facteur Fs . Par construction, pour tout j et tout s :
0  h2 ( j, Fs )  1. Ce graphique montre que les variables j et j  sont trs lies au facteur Fs et
que seule j  est lie Ft .

4.4 Analyse des Correspondances dun tableau de Burt

99

4.4 ANALYSE DES CORRESPONDANCES DUN TABLEAU DE


BURT

Dunod La photocopie non autorise est un dlit

4.4.1 Tableau de Burt et Tableau Disjonctif Complet


Nous avons vu, dans la section prcdente, que la reprsentation des modalits dans
lanalyse du TDC fournissait, des dilatations axiales prs, des reprsentations des
barycentres de classes dindividus. Mais cette reprsentation est-elle optimum ? Autrement dit, si au lieu de calculer les axes dinertie du nuage dindividus et de projeter
les barycentres sur ces axes nous avions analys directement le nuage des barycentres,
aurions-nous obtenu le mme rsultat ? Trs curieusement, et ce nest pas la moindre
surprise que rserve lACM, la rponse est oui.
Remarquons tout dabord que la k e ligne du tableau de Burt est la somme des
lignes du TDC qui prsentent la modalit k. Gomtriquement, cela signifie que dans
lespace R K , le profil de la modalit k (dfini dans le tableau de Burt) se trouve au
barycentre des profils des individus i (dfinis dans le TDC) qui la possdent.
De plus, le TDC et le tableau de Burt ont la mme marge sur lensemble K (cf.
Figures 4.2 et 4.4). La mtrique induite sur R K dans lAFC de chacun de ces deux
tableaux est la mme : les individus (dfinis dans le TDC) et leurs barycentres (dfinis
dans le tableau de Burt) sont situs dans le mme espace euclidien.
Enfin, dans lAFC du TDC, tous les individus ont un poids identique tandis que dans
lAFC du tableau de Burt, le poids affect au barycentre dune classe est proportionnel
son effectif.
Lanalyse du nuage des barycentres sobtient donc par une AFC du tableau de
Burt.
Or, on montre (cf. section 5.7) que lAFC du tableau de Burt et celle du TDC
aboutissent au mme rsultat. Plus prcisment, les axes dinertie du nuage des
individus (lignes du TDC) et ceux de leurs barycentres (lignes du tableau de Burt) sont
confondus. Il en dcoule que, pour obtenir simultanment les projections optimales des
uns et des autres, il suffit dappliquer une AFC au tableau juxtaposant en colonne le
TDC et le tableau de Burt, en mettant indiffremment lun ou lautre des deux tableaux
en supplmentaire . Cette quivalence prsente un intrt thorique important :
loptimalit simultane des reprsentations des individus et des barycentres des classes.
Elle prsente aussi un intrt pratique : la possibilit danalyser le tableau de Burt la
place du TDC, le premier tant en gnral bien plus petit.
Attention : dans lanalyse du TDC, il faut bien distinguer la reprsentation des
modalits en tant que colonnes (ou variables indicatrices) et la reprsentation des
barycentres (ou moyennes de lignes). Selon les relations
de transition, les deux repr
sentations sont homothtiques dans le rapport ls pour laxe dordre s. Cest la
deuxime reprsentation qui est confondue avec celle des lignes du tableau de Burt
(dans lanalyse de ce dernier, lignes et colonnes ont dailleurs la mme reprsentation

100

4 Analyse des Correspondances Multiples

du fait de la symtrie). Il en dcoule que les facteurs dfinis sur le mme ensemble de
colonnes
K des deux tableaux ne sont pas gaux, mais homothtiques dans le rapport

ls . Les inerties (dans lesquelles les distances interviennent par leur carr) associes
aux facteurs du tableau de Burt sont les carrs de leurs homologues dans le TDC.

4.4.2 Analyse des liaisons binaires et dcomposition des x2


Le tableau de Burt est compos de J 2 tableaux de contingence croisant les variables
deux deux. Tous ces tableaux tant calculs partir du mme ensemble dindividus,
les marges du tableau de Burt correspondant aux modalits des variables j et l sont
gales, au coefficient J prs, aux marges du tableau binaire croisant ces deux variables
(cf. Figure 4.4). Le profil dune modalit, ligne du tableau de Burt, nest autre que la
juxtaposition des J profils de cette mme modalit dans les tableaux binaires o elle
apparat.
Dans lAFC du tableau de Burt, il est intressant dinterprter linertie totale du
nuage tudi. Rappelons que, dans lAFC dun tableau de contingence, cette inertie est
proportionnelle au x2 dindpendance. En utilisant le fait que les marges du tableau
de Burt sont proportionnelles aux marges des sous-tableaux croisant les variables 2
2, on peut montrer que linertie totale est gale la somme des x2 dindpendance
associs chacun des J 2 sous-tableaux. La projection sur les facteurs dcompose
linertie des nuages. On peut interprter un facteur comme une part de la somme de
ces x2 . En ce sens, cette AFC est une tude simultane des liaisons binaires.
Dans cette somme de x2 , les tableaux croisant deux variables diffrentes interviennent deux fois et les tableaux diagonaux croisant une variable avec elle-mme
interviennent une seule fois. Or les tableaux croisant une variable avec elle-mme
sont diagonaux, puisque les modalits dune mme variable sexcluent entre elles,
et leur x2 nest jamais nul (de ce fait linertie dun tableau de Burt nest pas nulle
mme lorsque tous les couples de variables sont indpendants). Le biais introduit
par ces tableaux diagonaux dans ltude simultane des liaisons binaires est nul. En
effet, on peut montrer que lanalyse dun nouveau tableau, driv du tableau de Burt
en remplaant les tableaux diagonaux par le produit de leurs marges, aboutit, un
coefficient prs, aux mmes facteurs que celle du tableau de Burt.
Remarque : cas de deux variables LACM peut thoriquement sappliquer
ltude de deux variables seulement. Dans ce cas, il est aussi possible danalyser
par lAFC le tableau binaire croisant ces deux variables. On montre que ces
deux analyses aboutissent encore aux mmes rsultats, en ce sens que si lon
juxtapose les facteurs de mme rang obtenus sur les lignes et les colonnes du
tableau binaire, on obtient, une homothtie prs, les facteurs du tableau de
Burt.

4.5 Codage en classes des variables quantitatives

101

4.5 CODAGE EN CLASSES DES VARIABLES QUANTITATIVES


Dans la pratique, les variables qualitatives tudies en ACM rsultent souvent dune
transformation de variables numriques (e.g. : lge est souvent pris en compte au
travers de lappartenance une tranche dge). En outre, mme lorsque la variable
est par nature qualitative, il existe souvent, pour la prendre en compte, un choix entre
plusieurs partitions plus ou moins fines (e.g. : les catgories socio-professionnelles).
Les rsultats dpendant du choix des partitions associes aux variables, ce problme
est crucial.
En analyse des donnes, on appelle gnralement codage la construction, partir de donnes brutes, dun tableau prt tre analys : en ce sens, le problme du
choix des classes est un problme de codage. Il ny a pas de mthode systmatique
pour raliser un codage. La pratique et la thorie ont cependant dgag un certain
nombre de principes quil est prudent de respecter. En outre, les rsultats dune analyse permettent une validation ou une remise en question du codage utilis. Seuls
seront dtaills ici quelques problmes relatifs au codage des variables numriques en
variables qualitatives.

Dunod La photocopie non autorise est un dlit

4.5.1 Pourquoi transformer des variables quantitatives en variables


qualitatives ?
Deux objectifs principaux conduisent coder par classes des variables continues en
dcoupant leur intervalle de variation.
Tout dabord, on peut vouloir rendre homognes des donnes qui se composent
initialement de variables numriques et de variables qualitatives. Ainsi, dans lanalyse
dun ensemble de repres sociaux (sexe, profession, ge, revenu, etc.), le fait de
transformer les variables numriques ge et revenu en variables qualitatives permet de
traiter lensemble de ces variables par lACM.
On peut aussi avoir intrt raliser un codage qualitatif mme lorsque lon dispose
dun ensemble de variables numriques sur lequel une ACP peut tout fait sappliquer. En effet, une ACM sur ces mmes variables codes en classes donne une autre
approche des donnes. En reprsentant chaque variable par autant de points quelle
possde de classes, lACM peut mettre en vidence, si elles existent, des liaisons non
linaires entre les variables. Ce type de liaison est assez frquent car beaucoup de
phnomnes prsentent des effets de seuil : un tat pathologique peut tre caractris
par une valeur trop faible ou trop leve ; un fromage sera dautant plus apprci
quil est sal mais jusqu un certain point (de ce point de vue, les deux extrmits
de lintervalle de variation du caractre sal sont plus proches entre elles quelles
ne le sont des valeurs moyennes). Concrtement, sur les graphiques, la proximit de
modalits extrmes dmontre laptitude de lACM mettre en vidence des liaisons
non linaires.

102

4 Analyse des Correspondances Multiples

De tels phnomnes sont naturellement invisibles dans les rsultats dune ACP qui
ne tient compte que des liaisons linaires. Paradoxalement, en rduisant linformation
traite (lappartenance une classe ou un intervalle est moins prcise quune valeur
numrique), on augmente la richesse du rsultat ! Notons par exemple que la moyenne
dune classe dindividus comprenant des individus trs grands et des individus trs
petits correspond un individu moyen pour une variable numrique alors quelle
correspond une rpartition dans les deux extrmes pour cette mme variable code
en qualitative.
LACM de variables numriques codes en variables qualitatives est une approximation dune analyse non linaire dans le sens suivant : on cherche des variables
synthtiques qui soient des combinaisons linaires de fonctions quelconques des
variables tudies et non, comme en ACP, des variables elles-mmes. Ce problme
na de sens que dans le cadre dun modle o la population est infinie. En pratique, en
ACM sur une population finie, au lieu de considrer lensemble des fonctions dune
variable, on divise lintervalle des valeurs de la variable en sous-intervalles et lon
considre lensemble des fonctions constantes sur chaque sous-intervalle. En effet,
quand on traite par lACM une variable qualitative j, cette variable est reprsente
dans R I par le sous-espace E j engendr par les indicatrices de ses classes ; E j nest
autre que lensemble des variables ayant une mme valeur pour tous les lments
dune mme classe. Le premier facteur est la combinaison linaire des lments de ces
J sous-espaces E j (chaque lment est une fonction constante sur les classes dune
variable) la plus proche possible de tous ces sous-espaces.
Ce codage permet aussi dtudier des variables dont les distributions sont trs
irrgulires et pour lesquelles le coefficient de corrlation est une mesure de liaison
inadapte. Par exemple, si un lment a une valeur trs loigne des valeurs des autres
lments, il influe de manire prpondrante sur les coefficients de corrlation et un
codage qualitatif le neutralise.

4.5.2 Choix du nombre de classes


Pour coder par classes une variable continue, cest--dire dcouper son intervalle de
variation en sous-intervalles qui dfinissent autant de modalits, il faut dterminer
dune part le nombre de classes et dautre part leurs limites. Cette sparation est un
peu formelle dans la mesure o les deux choix sont souvent effectus simultanment.
Combien de classes faut-il utiliser ? Ni trop, ni trop peu.
En diminuant lexcs le nombre de classes, on regroupe des individus de plus en
plus diffrents et de ce fait on perd beaucoup dinformations. Les modalits recouvrent
alors des situations trs varies et leur tude ne peut mettre en vidence que des
phnomnes trs gnraux.

4.5 Codage en classes des variables quantitatives

103

En augmentant le nombre de classes, on risque dobtenir des classes deffectif faible


avec tous les inconvnients que cela comporte. Si leffectif de la population est trs
grand, ce risque est cart et lon peut tre tent de prendre un grand nombre de
classes. Toutefois, un nombre de classes excessivement grand nest pas sans poser de
problmes. Plus on clate les classes, plus on risque de faire apparatre des liaisons
ponctuelles entre quelques modalits. Dautre part, chaque variable intervient dans
lanalyse par le sous-espace de dimension r 1 engendr par ses r modalits. Lorsque
lon augmente r , le nombre de facteurs sur lesquels une variable peut influer augmente
et laspect synthtique de lanalyse nest pas amlior, bien au contraire !
Indiquons, pour fixer les ides, que lexprience montre quil nest pas utile de
dpasser le nombre de 8 modalits dans le codage de variables quantitatives et que 4
ou 5 sont souvent bien suffisantes.

Dunod La photocopie non autorise est un dlit

4.5.3 Choix des classes


Pour choisir les classes, on examine tout dabord sil nexiste pas des seuils naturels
ou classiques pour la variable mesure. Ainsi, dans une tude sociale, lge du dpart
la retraite est une limite naturelle .
Lorsque ce point de vue ne suffit pas, on tudie les irrgularits de la rpartition
des valeurs. Pour cela, on construit un histogramme avec de nombreuses classes. Les
creux dans la rpartition suggrent des coupures de lintervalle de variation.
Lorsque les deux principes prcdents nimposent aucun seuil, on ralise un dcoupage systmatique de lintervalle de variation. Le principe respecter dans cette
opration est dobtenir des classes de mme effectif plutt que des intervalles de
mme amplitude. Cette procdure de dcoupage est toujours prvue dans les programmathques compltes danalyse des donnes.
Il existe des justifications thoriques cette pratique. Un certain nombre darguments directs militent pour ce choix.
1. Les modalits reprsentant un ensemble dindividus, il est souhaitable, pour que
leur comparaison ait un sens, que ces ensembles soient analogues du point de
vue de leur effectif. Cela est particulirement important en ACM o la distance
dune modalit au barycentre crot quand son effectif dcrot.
2. Cette procdure vite les modalits deffectif trop faible dont nous avons soulign
leffet perturbateur. Par ailleurs le profil de ces modalits est trs sensible de
faibles variations des individus tudis ; cela est particulirement gnant lorsque
ces individus proviennent dun chantillonnage dans une population.

4 Analyse des Correspondances Multiples

104

4.6 ANALYSE FACTORIELLE DE DONNES MIXTES (AFDM)


Il est frquent de souhaiter raliser une analyse factorielle sur un tableau croisant des
individus et des variables des deux types, quantitatives ou qualitatives, ce que nous
appelons des donnes mixtes. Dans cette perspective, il convient de bien distinguer
deux cas, selon que les variables actives sont de mme type ou mixtes.
Lorsque toutes les variables actives sont quantitatives, le problme revient introduire des variables qualitatives illustratives dans une ACP (cf. section 1.10). Lorsque
les variables actives sont qualitatives, le problme revient introduire des variables
quantitatives illustratives dans une ACM. Pour cela, on calcule les coefficients de corrlation entre les variables quantitatives et les facteurs de lACM ; cette dmarche est
la mme quen ACP et conduit au mme type de graphique : le cercle des corrlations.
La prise en compte simultane des deux types de variables en tant qulments actifs
dune mme analyse a t lobjet du paragraphe prcdent : le codage, en classes, de
variables quantitatives est une mthodologie excellente mais qui trouve ses limites
dans deux cas :
Lorsque le nombre dindividus est faible, disons infrieur 100 pour fixer les
ides, lACM est souvent instable vis--vis de lajout ou de la suppression dun
petit nombre dindividus et de variables.
Lorsque le nombre de variables qualitatives et trs faible en regard du nombre
de variables quantitatives ; concrtement, lutilisateur qui pressent surtout des
liaisons linaires hsitera coder en classes vingt variables quantitatives avec
pour seul objet de prendre en compte (en actif) une seule variable qualitative.
Dans ces deux cas, on pourra recourir lAnalyse factorielle de Donnes Mixtes
(AFDM). Le principe tient en quatre points.
1. On considre lespace R I des fonctions dfinies sur I . Dans cet espace (muni
de la mtrique des poids des individus), on reprsente simultanment les variables
quantitatives comme en ACP norme (une variable = un vecteur de longueur 1) et les
variables qualitatives comme en ACM (une variable = lensemble des indicatrices de
ses modalits = le sous-espace engendr par ces indicatrices).
2. On adopte le point de vue de lanalyse factorielle selon lequel les facteurs Fs
sont lis le plus possible aux variables actives. Ainsi, en ACP, la quantit maximise
scrit (en notant r le coefficient de corrlation ; cf. section 1.6)

r 2 (k, Fs )
k

En ACM, elle scrit (en notant h2 le carr du rapport de corrlation ; cf. section 4.3.6) :

h2 ( j, Fs )
j

4.7 Conclusion

105

Dans le cas de donnes mixtes, il est naturel de proposer le critre suivant :




r 2 (k, Fs ) +
h2 ( j, Fs )
k

Ce critre quilibre le rle de chacune des variables quel que soit son type ; cet
quilibre implique que les variables quantitatives soient centres et rduites.
3. Pour raliser pratiquement une AFDM (en labsence dun logiciel ad hoc), on
juxtapose le tableau des variables quantitatives centres rduites et le tableau disjonctif

complet dans lequel les valeurs 1 pour la modalit k sont remplaces par Ik . Ce
tableau est ensuite soumis une ACP non norme.
4. Les trois graphiques de base de lAFMD reprsentent :
les individus comme en ACP ou en ACM ;
les variables quantitatives comme en ACP (cercle des corrlations) ;
les modalits des variables qualitatives comme en ACP cest--dire
lexact
barycentre des individus qui les possdent (et non pas au coefficient ls prs
comme en ACM).

Dunod La photocopie non autorise est un dlit

ces graphiques, on ajoute celui des variables des deux types construit de la faon
suivante : la coordonne de la variable quantitative k sur laxe de rang s est r 2 (k, Fs ) ;
celle de la variable qualitative j vaut h2 ( j, Fs ). Ce graphique a dj t introduit
pour lACM (Figure 4.6) ; il montre simultanment les liaisons entre les variables
des deux types et les facteurs (do sa dnomination carr des liaisons ) mais
sinterprte aussi, pour les variables actives, en terme de contributions au critre (une
autre interprtation, gomtrique, sera donne en 8.4 propos de lAFM). Le carr des
liaisons peut-tre construit partir de nimporte quelle analyse factorielle applique
un tableau dont les lignes sont des individus (ACP, ACM, AFDM, AFM).

4.7 CONCLUSION
LACM est une mthode dtude de plusieurs variables qualitatives dfinies sur un
ensemble dindividus. Sa problmatique est trs riche et va bien au-del dune simple
mise en uvre de lAFC sur un tableau particulier.
Cest l un des aspects de lquivalence entre lAFC sur le TDC et sur le tableau
de Burt. Il existe dailleurs dautres quivalences que celles dj cites ; des points
de vue trs diffrents sur ltude de variables qualitatives ont induit la conception de
mthodes qui conduisent, au moins partiellement, aux mmes rsultats que lAFC sur
le TDC (cf. section 8.6).
Outre quelles permettent de considrer lACM comme une mthode part entire,
ces convergences la renforcent. Les mcanismes de lACM, supportant plusieurs
interprtations, sont dune part adapts une vaste palette de problmes concrets et
dautre part fournissent des rsultats en accord avec plusieurs points de vue.

Chapitre 5

Calculs et dualit
en Analyse Factorielle

5.1 INTRODUCTION
Les mthodes danalyse factorielle prsentes dans les premiers chapitres sont fondes
sur des principes communs : partir dun tableau de donnes, on construit deux nuages
de points reprsentant respectivement les lignes et les colonnes ; ces deux nuages sont
projets chacun sur une suite daxes orthogonaux maximisant linertie projete ; sur
chacun de ces axes, les deux nuages ont la mme inertie projete et les projections des
points sont lies dun nuage lautre par les relations dites de transition.
Dans ce chapitre, nous indiquons comment calculer ces facteurs, montrons la dualit
des deux nuages et donnons des dmonstrations des formules de transition. Le cadre
dans lequel nous nous plaons est assez gnral. Non seulement il recouvre lACP et
lAFC, mais il permet dintroduire et de calculer les facteurs danalyses factorielles
fondes sur dautres distances et dautres poids.

5.2 CALCUL DES AXES DINERTIE ET DES FACTEURS


DUN NUAGE DE POINTS
Le problme est pos en ces termes : tant donn un nuage de I points not N I dans
un espace euclidien de dimension J , on cherche une suite daxes orthonorms (pour la
mtrique de lespace) telle que linertie du nuage projet sur ces axes soit maximum.
Lensemble des coordonnes des I points du nuage sur un de ces axes dfinit une
fonction numrique sur I , appele facteur sur I . Dans les rsultats dune analyse,
seuls les facteurs apparaissent, les axes ntant que des intermdiaires de calcul. Pour

5 Calculs et dualit en Analyse Factorielle

108

obtenir les facteurs et leur inertie, nous utilisons des techniques simples de calcul
matriciel.

5.2.1 Notations : les matrices X, M et D


Les coordonnes xi j des I points du nuage N I dans lespace R J forment un tableau,
ou une matrice, de dimensions (I , J ), note X . Lespace R J est muni dune mtrique
euclidienne qui peut tre diffrente de la mtrique canonique (ou usuelle). Cette
mtrique drive dun produit scalaire dont la matrice, de dimensions (J , J ), est note
M. Nous nous restreignons des mtriques associes des matrices diagonales car
elles seules sont facilement interprtables en termes de donnes initiales. En effet,
lorsque M est diagonale, la distance d M entre deux points i et l de N I scrit, en notant
m j les lments diagonaux de M :

2
dM
(i, l) =
(xi j xl j )2 m j
j

Les coefficients m j pondrent linfluence de chaque colonne j dans les distances entre
lments ; cette proprit justifie leur nom de poids des colonnes . Or, lorsque M
nest pas diagonale, ses termes apparaissent comme des poids associs des couples
de colonnes, ce qui na pas de rsonance concrte.
Le produit scalaire (associ d M ) entre deux vecteurs u et v scrit :
u, v M = u  Mv = v  Mu
o u  et v  dsignent les transposs des vecteurs colonnes u et v.
Les coordonnes des points de N I et la mtrique de lespace R J dfinissent entirement la forme du nuage mais, dans le calcul des axes dinertie, le poids des points
de N I intervient. Ces poids, nots pi , sont rangs dans une matrice diagonale, de
dimension I , note D. Toute linformation ncessaire pour calculer les facteurs est
contenue dans les trois matrices X , M, D.
Matrice et application linaire. Dans ce chapitre, nous serons conduit considrer
lapplication linaire associe une matrice ; nous utilisons la mme notation pour ces
deux objets. Nous prcisons quil sagit dun endomorphisme lorsque lapplication
associe un vecteur dun espace vectoriel E un autre vecteur de cet espace.

5.2.2 Projection dun nuage sur un axe


Soit u un vecteur unitaire (pour la mtrique M, i.e. vrifiant u  Mu = 1) dun axe
quelconque de R J . Lensemble des coordonnes des projections des I points du nuage
N I sur laxe u constitue un vecteur de dimension I , que nous notons Fu . Pour tout

5.2 Calcul des axes dinertie et des facteurs dun nuage de points

109


O

Fu (i) = xi , u M = xi Mu


Fu = X Mu
pi [Fu (i)]2 = Fu D Fu

Fu(i)

Figure 5.1 Projection Fu (i) du point i sur laxe dfini par le vecteur unitaire u.

point i du nuage N I , Fu (i) = xi Mu o xi est le vecteur de R J dont les coordonnes


sont celles de i : xi nest autre que la ligne i de la matrice X . De cette galit, on
dduit la relation matricielle Fu = X Mu.

5.2.3 Inertie du nuage projet


Linertie du nuage projet sur u est gale i pi [Fu (i)]2 . Cette quantit scrit matriciellement en fonction de la matrice diagonale D et du vecteur Fu sous la forme
Fu D Fu . Comme Fu = X Mu, linertie vaut u  M X  D X Mu.
Chercher un axe de R J tel que linertie du nuage projet soit maximum revient
donc chercher un vecteur u, unitaire pour la mtrique M (i.e. u  Mu = 1), rendant
maximum la quantit u  M X  D X Mu.

Dunod La photocopie non autorise est un dlit

5.2.4 Calcul des axes dinertie maximum ; cas de la mtrique identit


Lorsque le produit scalaire sur R J est le produit scalaire canonique, la matrice M
est la matrice identit et lcriture des expressions ci-dessus sallge : on cherche un
vecteur u, vrifiant u  u = 1 et rendant maximum u  X  D X u.
La matrice X  D X est symtrique, donc diagonalisable, et ses vecteurs propres
forment une base orthonorme de R J . Soient l1 , ..., ls , ..., l J les valeurs propres de
X  D X ranges par ordre dcroissant et {es ; s = 1, ..., J } une base orthonorme de
vecteurs propres associs (X  D X es = ls es ). Dcomposons le vecteur u sur cette base.
On a :

u =



s


u s es avec

X DXu = X DX


s

u 2s = 1

u s es =


s

ls u s es

5 Calculs et dualit en Analyse Factorielle

110

Linertie projete sur u scrit donc :

u X  D X u =

ls u 2s  l1

u 2s = l1


Ainsi, avec la contrainte s u 2s = 1, cette inertie est majore par l1 . Ce maximum
est atteint lorsque la premire composante u 1 de u vaut 1 ou 1 et que les autres sont
nulles cest--dire lorsque u = e1 . Linertie du nuage projet sur un axe est donc
maximum lorsque cet axe est colinaire aux vecteurs propres de X  D X associs sa
plus grande valeur propre l1 . Elle vaut alors l1 .
Les vecteurs propres de la matrice symtrique X  D X tant orthogonaux deux
deux, le mme raisonnement montre que la direction orthogonale u 1 qui maximise
linertie du nuage projet est celle dun vecteur propre associ la deuxime valeur
propre l2 de X  D X ; cette inertie vaut alors l2 . La suite daxes orthogonaux maximisant linertie projete est donc dfinie par une suite de vecteurs propres de X  D X
rangs par valeurs propres dcroissantes (les valeurs propres sont supposes distinctes
ce qui toujours le cas en pratique).

5.2.5 Calcul des axes dinertie maximum pour une mtrique quelconque
Si la mtrique M nest pas la mtrique identit, le raisonnement ci-dessus sapplique
sans changement majeur. En effet, X  D X M dfinit un endormophisme de R J symtrique pour la mtrique M. Rappelons que la M-symtrie dun endomorphisme A est
dfinie par lgalit, pour tout couple de vecteurs u et v, des deux expressions :
u, Av M =  Au, v M
Matriciellement : A M = M A ; on retrouve la notion usuelle de matrice symtrique si
M est la matrice identit. Cette galit est vrifie pour X  D X M :
u, X  D X Mv M = u  M X  D X Mv = X  D X Mu, v M
Lendomorphisme X  D X M, tant M-symtrique, est diagonalisable et admet une
base M-orthonorme de vecteurs propres. Comme au paragraphe prcdent, la dcomposition dun vecteur u quelconque sur cette base montre que la solution est donne
par les vecteurs propres de X  D X M rangs par valeurs propres dcroissantes.

5.2.6 Calcul des facteurs et de leur inertie


Notons Fs le facteur de rang s dfini par la projection du nuage sur le s e axe dinertie.
Pour calculer les facteurs Fs , on peut diagonaliser la matrice X  D X M, calculer une

5.2 Calcul des axes dinertie et des facteurs dun nuage de points

111

suite de vecteurs propres M-norms u s associs aux valeurs propres ls , et appliquer


aux vecteurs u s la matrice X M, soit Fs = X Mu s .
Il est possible aussi dobtenir directement les facteurs Fs et leur inertie en diagonalisant la matrice X M X  D de dimension I . En effet, les galits ci-dessous montrent
que si u s est vecteur propre de X  D X M associ ls , alors Fs = X Mu s est un vecteur
propre de X M X  D associ la mme valeur propre ls :

X  D X Mu s = ls u s
(X M)(X  D X Mu s ) = ls (X M)u s
X M X  D Fs = ls Fs
Linertie du nuage N I projete sur u s est la somme des carrs des termes de Fs
pondrs par les poids des lments i soit :


pi Fs (i)2 = Fs D Fs = ls

Dunod La photocopie non autorise est un dlit

5.2.7 Dfinition du nuage des colonnes de X


Le nuage des colonnes N J comprend J points situs dans un espace de dimension
I , not R I . Les coordonnes xi j de ces points sont contenues dans les colonnes de
X (qui sont dailleurs les lignes de la transpose X  ). Pour quil y ait dualit entre
le nuage des lignes N I et le nuage des colonnes N J , il est ncessaire que ces deux
nuages reprsentent la mme information et soient construits de faon symtrique.
Tout dabord, il est logique daffecter chaque colonne j le poids m j (terme gnral de
la matrice M dj interprt comme un poids de colonne : cf. section 5.2.1 ; rappelons
que nous nous sommes limits aux mtriques associes une matrice diagonale).
Ainsi, le choix des poids des lments du nuage N J et le choix de la mtrique dans
R J sont lis.
En outre, la construction symtrique des deux nuages implique que le poids des
individus du nuage N I induise la mtrique dont R I est muni. De faon directe, on peut
remarquer quil revient au mme de dupliquer un lment i ou de doubler son poids.
Dans R I , la distance entre deux points est la mme dans ces deux cas condition
dadopter la mtrique D.
Le tableau 5.1 page suivante rsume les poids et les mtriques mis en jeu. Les
nuages N I et N J ainsi construits sont dits duaux en ce sens quils reprsentent tous
deux les mmes donnes {X , M, D}.

5 Calculs et dualit en Analyse Factorielle

112

Tableau 5.1 Les deux nuages duaux

Nuage des lignes N I


Nuage des colonnes N J

Espace
RJ
RI

Mtrique
M
D

Poids
D
M

Coordonnes du point k
k e ligne de X
k e ligne de X 

5.3 NUAGES DES LIGNES ET DES COLONNES EN ACP


ET EN AFC
Le cadre gnral choisi pour dmontrer les principaux rsultats danalyse factorielle
suppose que lon peut dfinir de manire totalement symtrique, partir du triplet
{X , M, D}, le nuage des lignes et celui des colonnes. En Analyse des Correspondances, comme en Analyse en Composantes Principales, il est possible de calculer
des matrices {X , M, D} permettant cette construction symtrique. Nous les prcisons
dans les paragraphes suivants.

5.3.1 Matrices X, M, D en ACP


En Analyse en Composantes Principales, la matrice X est le tableau des donnes
centres et gnralement rduites. Dans certains cas assez rares, on souhaite conserver
lchelle de chaque variable : la matrice X est alors la matrice des variables centres
non rduites.
La matrice diagonale D contient les poids des individus. Dans la plupart des cas,
tous les individus ont le mme poids 1/I mais il est possible de leur affecter des poids
diffrents. Notons que les poids pi des individus doivent avoir pour somme 1 afin que
le cosinus dans R I traduise exactement la corrlation.
Les variables ont presque toujours un poids gal 1, mais il est possible, l encore,
de modifier ces poids pour moduler linfluence respective des variables.
Si lon ne centre pas les variables, lanalyse factorielle est techniquement possible :
ses rsultats sinterprtent alors comme les projections duales du nuage des lignes et
du nuage des colonnes mais il ne sagit plus alors vritablement dune ACP en ce sens
quelle na pas les mmes proprits. Ainsi, cest le centrage qui permet dinterprter
les axes factoriels dans R J comme les directions de plus grande variabilit de N I ; en
labsence de centrage, ces axes sont influencs non seulement par la forme du nuage
N I mais aussi par sa position par rapport lorigine. Par ailleurs, le centrage permet
dinterprter le cosinus de langle entre deux vecteurs reprsentant deux colonnes dans
R I comme un coefficient de corrlation.
Remarquons que la matrice X  D X est, dans le cas de donnes centres-rduites,
la matrice des corrlations (et la matrice des covariances lorsque les donnes sont
seulement centres). Le calcul des axes factoriels ne dpendant des donnes X quau

5.3 Nuages des lignes et des colonnes en ACP et en AFC

113

travers de cette matrice, il apparat clairement ici que ces axes ne dpendent que des
liaisons linaires entre variables.

5.3.2 Matrices X, M, D en AFC


La prsentation de lAFC (chapitre 3) met laccent sur lanalyse des nuages des profils des lignes et des colonnes du tableau de donnes. Ainsi, les deux matrices qui
contiennent les coordonnes des profils des lignes et des colonnes du tableau de donnes correspondent deux transformations diffrentes de ce tableau et, dautre part,
les mtriques employes dans lanalyse dun nuage ne sont pas les poids de lautre
nuage mais leur inverse. Cela laisserait penser que lAFC nentre pas dans le cadre
gnral dfini au dbut de ce chapitre. Nous introduisons ici une autre dfinition de
lAFC avec des matrices X , M, D qui respectent les conditions de la section 5.2.7.
a) Une autre dfinition de lAFC

En reprenant les notations du chapitre 3, le terme gnral de la matrice X scrit :


xi j =

fi j
f i j f i. f . j
1=
f i. f . j
f i. f . j

Dunod La photocopie non autorise est un dlit

Cette matrice contient les carts (rapports au produit f i. f . j ) entre le tableau des
donnes f i j et le tableau de terme gnral f i. f . j qui correspond lhypothse dindpendance. Cette prsentation des donnes correspond bien aux objectifs de lAFC
dcrits au chapitre 3.
Les matrices M et D sont diagonales de coefficients f . j et f i. respectivement.
Les poids des lignes sont donc gaux aux f i. et ceux des colonnes sont gaux aux
f. j .
b) quivalence entre les deux dfinitions

Pour montrer quavec ces matrices on obtient les rsultats de lAFC prsente au
chapitre 3, il faut montrer que les nuages de lignes et de colonnes obtenus par les
deux approches sont isomorphes. Le nuage des lignes de X est, comme le nuage
des profils-lignes du tableau de donnes, situ dans un espace de dimension J . Les
coordonnes des points sont diffrentes et les deux espaces ne sont pas munis de la
mme mtrique. Lun est muni de la mtrique M et lautre de la mtrique du x2 qui
nest autre que linverse M 1 de M.
On peut vrifier directement que les distances entre les couples de points homologues sont les mmes. Mais cette galit dcoule dun isomorphisme induit par M
que lon peut utiliser dans toute analyse factorielle et qui a une signification intressante en AFC. En effet, la mtrique M de lespace R J dfinit un isomorphisme de R J
dans son dual not R J . Si lon munit R J de la mtrique M 1 , lapplication M est

5 Calculs et dualit en Analyse Factorielle

114

un isomorphisme despaces euclidiens : les distances et les formes sont conserves


(u, v M = Mu, Mv M 1 ).
Le dual, not E , dun espace vectoriel E est lespace des formes linaires : f :
E R. Projeter, dans E et au sens de la mtrique M, le vecteur v sur u revient
appliquer v la forme linaire Mu. Cette forme linaire est llment de E associ
u de E par lapplication M. La figure 5.2 rsume les relations entre un espace euclidien
et son dual.

Mu

(R J , M)

1

M
M
(R J , M 1 )

Figure 5.2 Relations entre lespace euclidien R J et son dual.

Or le nuage des profils-lignes dans R J , not ici N I , est limage, par cet isomorphisme M, du nuage N I dfini en 5.3.2. En effet, si lon applique M au point i de N I ,
sa j e coordonne devient :
xi j =

f i j f i. f . j M
f i j f i. f . j
fi j
xi j =
=
f. j
f i. f . j
f i.
f i.

On retrouve la coordonne, aprs centrage, du point i dans le nuage des lignes de


lAFC du chapitre 3. LAFC prsente dans ce chapitre est lanalyse factorielle de N I
dans (R J , M). LAFC prsente au chapitre 3 est celle de N I dans (R J , M 1 ).
Lisomorphisme entre ces deux nuages assure la mme dcomposition sur les axes
dinertie, donc lgalit des facteurs de rangs homologues. Notons que les axes dinertie sont situs dans des espaces diffrents et, par consquent, sont diffrents.
Paralllement, les colonnes de X (dfini en a) peuvent tre reprsentes par un
nuage N J situ dans un espace de dimension I (not R I ) muni de la mtrique D.
Lapplication D associe ce nuage N J le nuage N J situ dans le dual de R I muni de
la mtrique D 1 . Le nuage N J nest rien dautre que le nuage des profils-colonnes
analys au chapitre 3. Les nuages N J et N J sont isomorphes et les facteurs sur J de
lAFC peuvent tre obtenus par lanalyse factorielle de lun ou lautre de ces nuages.

5.3.3 Matrices X, M, D en ACM


Les facteurs de lACM pouvant tre obtenus en ralisant les calculs de lAFC sur
le tableau disjonctif complet, appliquons les formules du paragraphe prcdent un

5.4 Dualit

115

TDC. Notons yi j le terme gnral de ce tableau, Q le nombre de variables qualitatives,


I j le nombre dindividus possdant la modalit j et I le nombre total dindividus.
Le terme gnral f i j du tableau dont la somme des termes est gale 1 est yi j /I Q.
La marge sur J a pour terme gnral I j /I Q. La marge sur I est constante et gale
1/I : la matrice D est donc, 1/I prs, la matrice identit et le terme gnral de la
matrice X scrit :
fi j
I yi j
1=
1
xi j =
f i. f . j
Ij
Comme il sagit dun tableau IndividusVariables, on peut souhaiter imposer des
poids diffrents aux individus. Par exemple, tripler le poids dun individu est quivalent
tripler la ligne concernant cet individu : la structure disjonctive complte est donc
conserve lorsque des poids pi sont affects aux individus.

5.4 DUALIT
5.4.1 Relations entre les axes dinertie et les facteurs des deux nuages
Le calcul des axes dinertie et des facteurs du nuage des colonnes est absolument
identique celui du nuage des lignes. Tous les rsultats concernant le nuage des
colonnes se dduisent de ceux obtenus pour le nuage des lignes, en remplaant X par
sa transpose X  et en changeant les matrices M et D.
Ainsi, dans lespace R I , on cherche une suite de vecteurs {vs ; s = 1, ..., I }, chacun
rendant maximum la quantit vs X M X  Dvs sous la double contrainte dtre unitaire
(vs Dvs = 1) et orthogonal aux vecteurs dj trouvs (vs Dvt = 0 pour tout t < s). La
solution est donne par lquation :

Dunod La photocopie non autorise est un dlit

X M X  Dvs = ms vs
qui exprime que vs est vecteur propre unitaire de X M X  D associ la valeur propre
ms de rang s. La comparaison de cette quation avec lquation aux facteurs de la
section 5.2.6 (X M X  D Fs = ls Fs ) conduit aux deux rsultats suivants.
1. ms = ls : les inerties projetes des nuages N I et N J sur leurs axes principaux de
mme rang sont identiques. Ces valeurs propres
 tant positives ou nulles, les inerties totales des deux nuages sont gales s ls . Lorsque les matrices X  D X M
et X M X  D ne sont pas de mme dimension et admettent des nombres diffrents
de valeurs propres, les valeurs propres non communes aux deux matrices sont
nulles.
2. Les facteurs Fs et les axes vs sont vecteurs propres, de la mme matrice X M X  D,
associs la mme valeur propre. Or, les quations aux vecteurs propres caractrisent ces vecteurs la norme prs (sauf en cas dgalit de plusieurs valeurs

5 Calculs et dualit en Analyse Factorielle

116

propres, cas particulier ne se produisant jamais avec des donnes relles). Le


facteur Fs et laxe vs sont donc deux vecteurs colinaires de R I .
Le vecteur vs tant unitaire et la norme de Fs tant donne par :
Fs  D = u s M X  D X Mu s = ls
2

il en rsulte la relation trs importante :


1
vs = Fs
ls
Un raisonnement analogue, comparant lquation aux facteurs G s sur les colonnes et
lquation aux axes u s , conduit la relation symtrique de la prcdente :
1
us = Gs
ls
Ces deux dernires relations sont illustres dans la figure 5.3. Lensemble des rsultats
est prsent schmatiquement dans le tableau 5.2.
Tableau 5.2 Les deux nuages, leurs axes dinertie et leurs facteurs.

Espace
Mtrique
Coordonnes
Poids
Axe dinertie
Equation
Norme
Orthogonalit
Facteur
Equation
Norme
Orthogonalit
Inertie sur laxe s
Inertie totale

Nuage N I
RJ
M
X
D
us
X  D X Mu s = ls u s
u s  M = 1
u s , u t  M = 0 si s = t
Fs = X Mu s
X M X  D Fs =
ls Fs
Fs  D = ls

F
(i)F
s
t (i) pi = 0 si s = t
s

ls
2
s ls =
i
j pi p j x i j

Nuage N J
RI
D
X
M
vs
X M X  Dvs = ls vs
vs  D = 1
vs , vt  D = 0 si s = t
G s = X  Dvs

X D X M Gs =
ls G s
G s  M = ls

G
(
j)G
s
t ( j)m j = 0 si s = t
s

ls
2
s ls =
i
j pi p j x i j

5.4.2 Le schma de dualit


La mthode factorielle consiste analyser simultanment dune part dans (R J , M) le
nuage N I affect des poids contenus dans D et dautre part dans (R I , D) le nuage N J
affect des poids contenus dans M.

5.4 Dualit

117

Fs
1

i Fs(i)

RJ
i

RI
j

Gs
Fs(i)

us

Fs

I
Gs(j)

vs

Gs
1

j Gs(j)

Dunod La photocopie non autorise est un dlit

Figure 5.3 Relations entre les axes dinertie dun nuage et les facteurs de lautre nuage.

Les matrices XM et X  D dfinissent des applications de R I dans R J et de R J dans


R I qui lient les facteurs et les axes des deux nuages.
Lapplication M a dj t considre comme un isomorphisme de R J dans son
dual R J (cf. section 5.3.2). De mme, D dfinit un isomorphisme de R I dans son
dual R I . Lanalyse des nuages N I et N J est quivalente celle de leurs images N I et
N J par M et D.
La matrice X dfinit donc une application X de R J dans R I . De faon analogue, la
matrice X  dfinit une application de R I dans R J . La figure 5.4, appele le schma
de dualit , rcapitule ces applications et les relations qui permettent de passer des
axes (ou des facteurs) dun nuage aux axes (et aux facteurs) des autres nuages.
Si, par exemple, on applique au vecteur u s de R J successivement M, X , D et X  , on
obtient u s au coefficient ls prs. Lcriture de cette proprit pour nimporte quel axe
principal ou nimporte quel facteur fournit lquation qui le caractrise, cest--dire la
matrice dont il est vecteur propre. Ainsi, par exemple, les axes principaux u s de N I
vrifient : M X  D X u s = ls u s .

5 Calculs et dualit en Analyse Factorielle

118

RJ , M

RJ*, M -1

Gs = s us

X'

X'
RI*, D -1

u*s
X

v*s

RI, D

Fs = s vs

Figure 5.4 Le schma de dualit. M, D, X et X  dsignent ici les applications associes aux
matrices de mme nom. gauche, les espaces en jeu et leur mtrique ; droite, les rsultats de
lanalyse factorielle dans ces espaces.

Appliqu lAFC, ce diagramme schmatise bien les deux prsentations de la


mthode. Si lon met en vidence les carts lindpendance de chaque case du
tableau de donnes, on analyse les nuages N I et N J , et la matrice des poids pour un
nuage est la mtrique pour lautre. Si lon met en vidence les profils (cf. chapitre 3),
on analyse les nuages N I et N J , et la matrice des poids pour un nuage est linverse de
la mtrique pour lautre.

5.4.3 Dualit des objectifs en ACP


Toute projection Fu du nuage N I sur un axe u de R J 
est une combinaison linaire
des colonnes x j de X puisquelle
scrit
F
=
X
Mu
=
u
j m j u j x j . Rciproquement,

toute combinaison linaire j y j x j des colonnes x j est colinaire une projection de
N I sur un axe de R J , laxe dfini par le vecteur de composantes y j /m j :

j

yjx j =


j

mj

yj
xj
mj

En ACP, o les colonnes de X sont les variables initiales, nous avions propos deux
objectifs : la recherche de projections du nuage des individus et la recherche de
variables synthtiques, combinaisons linaires des variables initiales. Les critres
dajustement choisis, inertie projete maximum du nuage dindividus et variable maximisant la somme des carrs des corrlations avec les autres variables (= inertie projete
du nuage des variables), aboutissent au mme rsultat. Lidentit entre projection du
nuage dindividus et combinaison linaire des variables montre que ces deux objectifs
sont deux expressions dun mme problme exprim travers les individus dune part
et travers les variables dautre part.

5.4 Dualit

119

5.4.4 Formules de transition


Dans le paragraphe 5.4.1, un aspect de la liaison entre les analyses de chacun des deux
nuages a t exprim laide des relations suivantes :
us

vs

1
Gs
ls
1
Fs
ls

Elles indiquent que, dans lespace R I , la reprsentation des colonnes (G s ) sert de base
(u s ) la reprsentation des lignes et rciproquement. La liaison entre les facteurs des
deux nuages est donc une liaison fondamentale et il est ncessaire de les interprter
conjointement.
Les formules de transition permettent de calculer les projections de lun des deux
nuages en fonction des facteurs sur lautre nuage. Elles drivent directement des
relations entre axes et facteurs et scrivent :
Fs

Gs

1
X M Gs
ls
1
X  D Fs
ls

Ce qui donne, point par point :

Dunod La photocopie non autorise est un dlit

Fs (i) =
G s ( j) =

1 

xi j m j G s ( j)
ls j
1 

xi j pi Fs (i)
ls i

Ces formules montrent comment, de faon concrte, les facteurs des deux nuages
doivent sinterprter conjointement, cest--dire comment chacun des ensembles peut
servir de support et daide linterprtation des facteurs de lautre ensemble. Dans une
reprsentation superposant les projections des lignes et des colonnes (pour les facteurs
de mme rang), la relation entre la position dun lment dun ensemble et celles de
tous les lments de lautre ensemble peut sexprimer ainsi : si xi j est positif, il y a
attirance entre i et j, si xi j est ngatif il y a rpulsion. Les poids m j et pi pondrent
cette influence. Un lment i (resp. j) est donc situ du ct des lments j (resp. i)
pour lesquels les valeurs de xi j sont les plus grandes.
Applique lACP norme, la seconde formule de transition montre que la coordonne de la variable centre-rduite j sur laxe de rang s est gale au coefficient de

5 Calculs et dualit en Analyse Factorielle

120

corrlation entre la variable j et le facteur Fs . Si lon applique ces formules lAFC,


on obtient :
1  f i j f i. f . j
1  fi j
1 
f . j G s ( j) =
G s ( j)
f . j G s ( j)
Fs (i) =
f i. f . j
ls j
ls j f i.
ls j
La premire formule indique que llment i est situ du ct des j auxquels il
sassocie plus que dans lhypothse dindpendance et est loppos de ceux auxquels
il sassocie moins que sil y avait indpendance. La deuxime formule, o le second
terme est nul du fait du centrage de G s , se rduit la formule barycentrique dj
commente dans la prsentation de lAFC (cf. section a page 75).

5.4.5 Analyse factorielle de tableaux de distances ou de similarits


Les vecteurs propres de X M X  D concident, un facteur prs, avec les facteurs
sur les individus. Il est donc possible dobtenir, uniquement partir de la matrice
W = X M X  des produits scalaires entre individus et de la matrice D des poids des
individus, une projection du nuage N I , sans faire appel aux coordonnes des individus
dans R K .
Concrtement, on dispose rarement dune matrice de produits scalaires entre individus sans disposer en mme temps des coordonnes des individus. En revanche, il
peut arriver quun ensemble de donnes soit constitu uniquement de lensemble des
poids des individus et de leur distances. En notant pi le poids dun individu i, d(i, l)
la distance entre deux individus i et l et en posant :

d 2 (i, .) =
pl d 2 (i, l)
l

d 2 (., .) =


i

pi d 2 (i, .) =

pi pl d 2 (i, l)

i,l

on peut dfinir une matrice W de produits scalaires de terme gnral :


i, l =


1 2
d (i, .) + d 2 (., l) d 2 (i, l) d 2 (., .)
2

Cette relation est dite formule de Torgerson . On appelle Analyse Factorielle sur
Tableau de Distances (AFTD) la technique qui, partir dun tableau de distances entre
individus, calcule la matrice W associe et construit la reprsentation des individus
dduite des premiers vecteurs propres de WD (cette ide drive de la proprit selon
laquelle Fs est vecteur propre de WD ; cf. tableau 5.2).
On peut montrer que si la distance d est une distance euclidienne, W correspond
au produit scalaire dont drive d. Si d nest pas une distance euclidienne, les valeurs

5.5 Mise en uvre des calculs

121

propres de W D ne sont pas toutes positives. Dans ce cas, on se limite aux vecteurs
propres associs aux valeurs propres positives, cest--dire une approximation euclidienne des donnes.
Si les donnes ne sont pas des distances mais des similarits, on se ramne au cas
prcdent en les transformant en distances. Par exemple, on peut dfinir la distance
par la diffrence entre la borne suprieure des similarits et chaque similarit.

5.5 MISE EN UVRE DES CALCULS

Dunod La photocopie non autorise est un dlit

Les formules de transition, outre lintrt fondamental quelles prsentent pour linterprtation conjointe des facteurs des lignes et des colonnes, permettent des conomies
de calcul trs substantielles. En effet, les facteurs de lun des ensembles se dduisant
des facteurs de lautre ensemble, il suffit de diagonaliser une seule matrice pour obtenir
tous les rsultats. Ainsi, au niveau des calculs, une des deux dimensions du tableau
de donnes nest pratiquement pas limite. La plupart des logiciels diagonalisent une
matrice de dimension gale au nombre des colonnes, X  D X M par exemple, dont les
facteurs G s sont vecteurs propres. La construction de cette matrice ne ncessite quune
seule lecture ligne ligne du tableau de donnes, proprit prcieuse dans le cas dun
trs grand nombre dindividus ne permettant pas le stockage des donnes en mmoire.
En ACP, o les individus et les variables ne sont pas traits de la mme faon, ce
sont les variables qui constituent les colonnes car elles sont le plus souvent moins
nombreuses que les individus. Lorsquil ny a pas de pondration des variables, cest
la matrice des corrlations qui est diagonalise si les variables sont rduites ; cest la
matrice des covariances, lorsque les variables ne sont pas rduites. Certains logiciels
diagonalisent la plus petite des deux matrices X  D X M et X M X  D ce qui permet
danalyser des tableaux dans lesquels un petit nombre dindividus est dcrit par un
trs grand nombre de variables.

5.5.1 Simplification en AFC


En AFC, la matrice X  D X M a pour terme gnral :
a j j =

 fi j fi j 
f. j 
f i. f . j
i

On se contente gnralement du premier terme ; la matrice obtenue correspond alors


une analyse des nuages non centrs pour laquelle X se rduit f i j / f i. f . j tandis
que M et D restent inchanges. Aprs diagonalisation de cette matrice, on supprime
des rsultats son premier vecteur propre, associ la valeur propre 1 et dont toutes
les coordonnes sont gales (appel facteur trivial). Un calcul simple permet en effet
de vrifier que ce vecteur est aussi vecteur propre de X  D X M, associ une valeur

5 Calculs et dualit en Analyse Factorielle

122

propre nulle et que les autres vecteurs propres et valeurs propres sont exactement ceux
de X  D X M.
Indiquons le principe de ce calcul. Les deux matrices dfinies par les deux lments
du terme gnral de X  D X M admettent, comme vecteur propre associ la mme
valeur propre 1, le vecteur dont toutes les coordonnes sont gales 1 :

  fi j fi j 
=
f. j  = 1
f i. f . j


i
j

La seconde matrice est de rang 1. Elle annule donc tous les vecteurs orthogonaux ce
premier vecteur et notamment tous les autres vecteurs propres de la premire matrice.

5.5.2 Diagonalisation dune matrice non symtrique particulire


Lorsque M nest pas un multiple de lidentit (ce qui est toujours le cas en AFC et
qui se produit en ACP lorsque les variables ont des poids diffrents), la matrice
diagonaliser X  D X M nest pas symtrique. Or, les algorithmes de diagonalisation de
matrices symtriques sont beaucoup plus efficaces que ceux dune matrice quelconque.
Aussi, on construit et on diagonalise plutt la matrice symtrique M 1/2 X  D X M 1/2 .
Cette matrice a les mmes valeurs propres que X  D X M et il suffit dappliquer la
matrice M 1/2 ses vecteurs propres pour obtenir ceux de X  D X M puisque, si u est
vecteur propre de X  D X M, on a :

X  D X Mu = lu
M 1/2 X  D X M 1/2 M 1/2 u = lM 1/2 u

5.5.3 Enchanement des calculs (cf. Tableau 5.3)


lissue de la diagonalisation de X  D X M, les facteurs G s , dfinis sur
J , sobtiennent
en multipliant les vecteurs propres M-norms de X  D X M par ls . Les facteurs
Fs sobtiennent directement par projection du nuage N I sur u s ; cette opration est
valable pour tous les lments, actifs ou supplmentaires. Les projections des colonnes
supplmentaires se dduisent ensuite de Fs par la formule de transition de Fs vers G s .
Les facteurs et les inerties constituent les rsultats de base dune analyse factorielle.
Ces rsultats sont toujours complts par des ensembles dindices, appels aides
linterprtation, qui peuvent varier dun logiciel lautre mais qui comprennent
toujours au moins les qualits de reprsentation et les contributions linertie de
chaque lment, ligne ou colonne.

5.6 Reconstitution des donnes et approximation de X

123

Tableau 5.3 Enchanement des calculs.

Relation utilise
X  D X
Mu s = ls u s
G s = ls u s
Fs = X Mu s
G s = 1l X  D Fs
s

Rsultat
u s et ls
Coordonnes des colonnes actives
Coordonnes des lignes actives ou supplmentaires
Coordonnes des colonnes supplmentaires

5.6 RECONSTITUTION DES DONNES ET APPROXIMATION


DE X
La projection dun nuage sur ses axes dinertie correspond un changement de base
orthonorme. En crivant, par exemple, le vecteur xi reprsentant la ligne i dans la
base orthonorme des axes u s , on obtient :

xi =
Fs (i)u s
s

Do, pour sa composante xi j sur la base canonique :



xi j =
Fs (i)u s ( j)
s

Dunod La photocopie non autorise est un dlit

 Fs (i)G s ( j)

=
ls
s
Cette dernire expression, appele formule de reconstitution des donnes, permet de
calculer les valeurs xi j en fonction des facteurs et des valeurs propres de lanalyse.
En limitant la somme ses premiers termes, on obtient des valeurs approches. La
formule de reconstitution dordre S ne retient que les S premiers termes de la somme ;
plus S est grand, plus lapproximation se rapproche des donnes initiales.
Interprtation dans lespace des matrices

La formule de reconstitution des donnes scrit matriciellement :



 1
Fs G s =
ls vs u s
X=
l
s
s
s
La matrice X est ainsi dcompose en une somme de matrices de rang 1 (le rang dune
matrice est la dimension de lepace vectoriel engendr par ses colonnes ou par ses
lignes).
Considrons lespace des matrices de dimension IJ, not R I J , muni de la mtrique
diagonale des produits m j pi . Dans cet espace, les matrices vs u s (de rang 1) forment

5 Calculs et dualit en Analyse Factorielle

124

v2u'2
1

v1u'1

Figure 5.5 Dans lespace R I J , la reconstitution dordre 2 de X est une projection de X sur un plan.

vs u s , vt u t m j pi

ls vs u s est la projection de X sur vs u s :



=
vs (i)u s ( j)vt (i)u t ( j)m j pi

un systme orthonorm et

vs (i) vt (i) pi

u s ( j) u t ( j) m j

0 si s = t
1 si s = t



=
xi j vs (i)u s ( j)m j pi =
pi vs (i)Fs (i) = ls
=

X , vs u s m j pi

Lanalyse factorielle dcompose la matrice X , en tant que vecteur de lespace R I J ,


sur un systme orthonorm de matrices de rang 1. La restriction de la formule de
reconstitution des donnes, ses S premiers termes, correspond une approximation
de X par projection sur le sous-espace engendr par les S premiers vecteurs (cf.
Figure 5.5). Cette approximation est une matrice de rang S.

Le carr de la norme de la diffrence entre X et son approximation dordre S est


gal la somme des valeurs propres dordre suprieur S.
On peut dfinir lanalyse factorielle par cette dcomposition. Lobjectif est alors
dapprocher le tableau X avec un tableau de rang fix S (S tant suprieur ou gal
1 et infrieur I et J ). On ralise lajustement avec le critre des moindres carrs
pondrs, la case (i, j) ayant le poids m j pi . On cherche alors une suite orthogonale
de matrices de rang 1, qui scrivent donc comme le produit dun vecteur As de R I et
dun vecteur Bs de R J , qui minimisent lexpression :

2
S


xi j
As (i)Bs ( j) m j pi
i

s=1

5.7 Une quivalence en ACM

125

Quelques calculs, en procdant par itration sur s, permettent de vrifier que la solution
unique est donne par les premiers facteurs de lanalyse factorielle.

5.7 UNE QUIVALENCE EN ACM


Nous montrons ici que les facteurs sur les modalits en ACM peuvent tre acquis en
mettant en uvre une AFC indiffremment sur un tableau disjonctif complet ou sur
un tableau de Burt. Par commodit, nous appliquons lAFC des nuages non centrs.
Dans une AFC sur TDC, les matrices X , M et D ont pour terme gnral respectivement : (I yi j /I j ), (I j /I Q) et 1/I (cf. section 5.3.3). En notant Y le TDC et E la
matrice diagonale des effectifs des modalits, on a :

X = I Y E 1 et M = E/(I Q)
La matrice diagonalise scrit :

X  D X M = E 1 Y  Y /Q

Dunod La photocopie non autorise est un dlit

Notons B le tableau de Burt. Dans une AFC sur ce tableau, les matrices X et M
ont pour terme gnral respectivement : (I I jk )/(I j Ik ) et (I j /I Q). Le tableau de Burt
tant symtrique, les matrices M et D sont identiques. En remarquant que le tableau
de Burt est li au TDC (B = Y  Y ), ces matrices peuvent scrire :

X = I E 1 Y  Y E 1
M = D = E/(I Q)
La matrice diagonalise scrit : X  D X M = E 1 Y  Y E 1 Y  Y /Q 2
Si u s est laxe de rang s issu de lAFC sur le TDC, alors il vrifie :

(1/Q)E 1 Y  Y u s = ls u s
Il vrifie aussi lquation de lAFC applique au tableau de Burt :

126

5 Calculs et dualit en Analyse Factorielle

(1/Q)2 E 1 Y  Y E 1 Y  Y u s = l2s u s

Compte tenu de la relation entre axes et facteurs (u s = Fs / ls ), les deux analyses


conduisent aux mmes axes dans R J et aux mmes facteurs sur les modalits. Toutefois, la valeur propre de rang s issue de lanalyse du tableau de Burt est gale au carr
de son homologue de lanalyse du TDC.

Chapitre 6

Exemple de traitement de tableau


multiple par ACM et AFC

6.1 LENQUTE OUEST-FRANCE


Le quotidien rgional Ouest-France a ralis en 1973 une enqute auprs de 340 abonns de Rennes et de sa rgion. Le but gnral de cette enqute tait de mieux connatre
ses lecteurs , de savoir ce qui tait lu dans le journal et de rpondre la question :
Qui lit quoi ? .
Pour cela, 26 rubriques, qui paraissent quotidiennement et qui couvrent peu prs
entirement les sujets abords dans le journal, ont t choisies (cf. tableau 6.1).
chaque enqut, on demande dindiquer, parmi les 26 rubriques cites, celles quil lit
habituellement. Pour chaque rubrique, il y a deux solutions possibles : soit elle est
dclare lue habituellement, soit elle ne lest pas. Chacune delles dfinit donc, sur
lensemble des enquts, une variable qualitative deux modalits : rubrique-lue et
rubrique-non-lue. Le comportement de lecture dun enqut est donc caractris par
un ensemble de 26 variables qualitatives 2 modalits.
Pour prciser le Qui dans qui lit quoi ? , plusieurs questions dcrivant les
individus compltent le questionnaire. Lensemble de ces questions constitue ce que
lon appelle le signaltique. Ce signaltique est donn dans le tableau 6.2. Pour la
plupart des questions (zone dhabitat, sexe, etc.), lenqut doit choisir une (et une
seule) rponse parmi un ensemble propos. Ces questions dfinissent donc aussi des
variables qualitatives. Pour deux questions, lge et le nombre denfants, la rponse
est un nombre. Afin de rendre homogne lensemble des variables, ces deux questions
sont transformes en variables qualitatives quatre modalits. La premire, lge, est
divise en 4 tranches deffectifs peu prs gaux : 16-26 ans, 27-38 ans, 39-55 ans

128

6 Exemple de traitement de tableau multiple par ACM et AFC

Tableau 6.1 Les 26 rubriques du journal Ouest-France et leffectif de leurs lecteurs.

Rubrique
Effectif
informations locales
276
faits divers
250
page tl
241
accidents
224
informations dpartementales 221
informations sociales
208
informations politiques
206
dcs
204
informations trangres
177
informations conomiques
167
sports
164
larticle de premire page
161
spectacles
161

Rubrique
Effectif
Lariflette
159
reportage de la page 2
150
jeunesse ducation
139
courrier des lecteurs
128
courrier des consommateurs 127
au jour le jour
120
pour vous Madame
117
petites annonces
112
crmonies officielles
109
annonces sur lemploi
91
informations agricoles
78
feuilleton
46
informations maritimes
17

et + de 56 ans. Les modalits de la seconde, le nombre denfants, sont : pas denfant,


1 enfant, 2 enfants, 3 enfants ou plus (la dernire modalit regroupe les parents de
famille nombreuse, en minorit dans lchantillon).
Lensemble des donnes est donc compos de deux groupes de variables qualitatives
dont lobjet est diffrent : le signaltique dcrit le qui, tandis que les rubriques dcrivent
le quoi.

6.2 ANALYSE SIMULTANE DE PLUSIEURS GROUPES


DE VARIABLES
Le cas de cette enqute illustre une situation trs courante : les variables dfinies sur
un ensemble dindividus ne constituent pas un ensemble homogne mais sont structures en plusieurs groupes. Les enqutes, comme celle de Ouest-France, comprennent
presque toujours, en plus du thme particulier de lenqute, un questionnaire concernant le signaltique. En effet, chaque enqut nest pas intressant en lui-mme mais en
tant que reprsentant de certaines catgories de la population. En outre, gnralement
(bien que ce ne soit pas le cas ici), le thme de lenqute lui-mme peut se subdiviser
en plusieurs sous-thmes qui constituent autant de sous-groupes de variables.
Ce type de structure existe aussi pour des variables numriques. Un exemple de
cette nature est tudi dans le chapitre suivant : les variables sont des notes affectes
un ensemble de vins suivant certains critres de dgustation, soit olfactifs, soit visuels,
soit gustatifs.

6.2 Analyse simultane de plusieurs groupes de variables

129

Tableau 6.2 Le signaltique et les effectifs de ses modalits.

Zone
dhabitat

Sexe

Situation
de
famille

Age

Dunod La photocopie non autorise est un dlit

Enfants
charge

Rurale
Centre ville
Z.U.P.
Rsidentielle
non-rponse
Homme
Femme
non-rponse
Clibataire
Mari
Veuf
Autre
non-rponse
18-26 ans
27-38 ans
39-55
+ de 55 ans
non-rponse
Pas denfant
1 enfant
2 enfants
3 enfants et +

132
77
72
43
16
198
137
5
77
229
24
4
6
75
91
106
61
7
159
46
63
72

CSP

Niveau
dinstruction

Mode
dhabitat

Agriculteur
Gros Com. Indus.
Com. Artisan
Cad. sup-Prof. lib.
Cad.moyen
Employ
Ouvrier
Etudiant-scolaire
Retrait-div.-inactif
Femme foyer
non-rponse
Primaire
Primaire suprieur
Techniq. commerc.
Secondaire
Suprieur
non-rponse
Maison propritaire
Maison locataire
Appart. propritaire
Appart. locataire
non-rponse

35
14
43
36
55
31
27
8
25
10
66
117
66
23
51
76
7
113
62
43
114
8

Il existe aussi des tableaux mixtes qui prsentent des groupes de variables
numriques et des groupes de variables qualitatives.
Un autre exemple de tableaux comprenant plusieurs groupes de variables est celui
de mesures (numriques ou qualitatives) effectues plusieurs dates. Les variables
mesures peuvent tre les mmes chaque date ou varier dans le temps. Contrairement
au cas de lenqute Ouest-France, le nombre de tableaux peut tre alors trs grand.
Pour analyser des donnes structures en plusieurs groupes de variables, il est
possible dappliquer les mthodes classiques danalyse factorielle : ACP pour des
variables numriques et ACM pour des variables qualitatives. Une mthodologie
sest dgage usant trs largement de la technique des lments supplmentaires :
un ou plusieurs tableaux servent de base lanalyse, les autres tableaux sont mis en
supplmentaire.
Dans lenqute Ouest-France, qui comporte deux groupes de variables qualitatives,
deux solutions de ce type sont possibles :

130

6 Exemple de traitement de tableau multiple par ACM et AFC

1. une ACM de lensemble des rubriques (en principal) et du signaltique (en


supplmentaire) ;
2. une ACM de lensemble du signaltique (en principal) et des rubriques (en
supplmentaires) ;
ces deux analyses, dans lesquelles lun des deux groupes est privilgi et sert
de base de rfrence, on peut ajouter :
3. une ACM avec lensemble des rubriques et du signaltique en principal.
Enfin, comme les deux groupes sont qualitatifs, sajoute une possibilit inexistante pour des groupes numriques :
4. une AFC du tableau croisant les deux groupes de variables.
Lobjet de ce chapitre est double. Dune part, nous tudions et comparons les objectifs
de ces diffrentes approches en les commentant sur lenqute Ouest-France. Dautre
part, nous montrons leurs limites et donc la ncessit dajouter, la panoplie des
mthodes factorielles, une technique qui inclut la notion de groupes de variables et
qui puisse donner des solutions aux questions laisses sans rponse par les mthodes
classiques.
Mais, avant daborder ces analyses, nous consacrons une section la rsolution du
problme des rponses manquantes dans les questionnaires.

6.3 LE PROBLME DES RPONSES MANQUANTES


Dans lenqute Ouest-France, ce problme se pose pour plusieurs variables du signaltique. Pour la CSP notamment, 66 individus nont pas indiqu de catgorie ; pour
chacune des autres variables, le nombre de rponses manquantes ne dpasse pas 8.
Pour la lecture des rubriques, le problme ne se pose pas : une rubrique non cite dans
les lectures habituelles est considre comme non-lue.
La manire de traiter les non-rponses une question dpend de plusieurs lments :
le pourcentage dindividus concerns, la signification de cette non-rponse et surtout la
manire dont la question intervient dans lanalyse (en lment actif ou supplmentaire).

6.3.1 Les non-rponses dans les variables supplmentaires


Dans ce cas, les non-rponses nont aucune influence sur lensemble des rsultats et le
problme nest pas crucial. Une premire solution consiste crer pour chaque question concerne une modalit non-rponse. Une deuxime solution est envisageable si
lon applique un programme classique dAFC au TDC : elle consiste mettre en supplmentaire un tableau disjonctif incomplet (sans les modalits non-rponse). La seule
diffrence entre ces deux solutions est que les modalits non-rponse napparaissent
pas dans les rsultats de la deuxime.

6.3 Le problme des rponses manquantes

131

Dunod La photocopie non autorise est un dlit

6.3.2 Les non-rponses dans les variables actives


Dans ce cas, lensemble des rsultats dpend de la manire dont les non-rponses sont
traites et le problme doit tre tudi avec soin.
La solution qui consiste crer une modalit supplmentaire est encore possible.
Mais il faut prendre garde au fait que cette modalit aura autant dimportance dans
les typologies des individus et des variables que les autres modalits. Or, cela ne se
justifie qu deux conditions. La premire condition est que cette non-rponse traduise
une attitude particulire (soit le refus de rpondre, soit le fait de ne pas savoir, ou toute
autre modalit de rponse non prvue dans le questionnaire) : sil sagit seulement
dune omission involontaire de lenquteur ou de lenqut, son influence doit tre
minimise. La deuxime condition est que le pourcentage des rponses manquantes
ne soit pas trop faible. On rejoint ici le problme des modalits rares dont linfluence
risque dtre trop grande par rapport la part trs marginale de la population quelles
concernent. Dans lenqute, seule la CSP rpond ces deux conditions. Nous crons
donc pour elle une modalit non-rponse. Pour les autres questions, le problme est
le suivant : il faut obtenir les rsultats dune ACM en minimisant linfluence des
donnes manquantes ou, plus gnralement, celle de modalits qui traduisent une
information dont on ne veut pas tenir compte (par exemple des modalits trop rares).
Une seconde solution consiste supprimer les individus dont les rponses au
questionnaire sont incompltes. Cest une perte dinformation qui nest pas trs
regrettable si le nombre dindividus est trs grand et les non-rponses rares. Dans
lenqute, cette solution nest pas envisageable : sans tenir compte de la CSP, 37 individus prsentent une seule donne manquante et 6 en prsentent deux ; ainsi, on serait
conduit se priver de 43 individus sur les 340.
Une troisime solution consiste ventiler alatoirement les rponses inconnues
sur lensemble des autres modalits de la mme variable. Cette technique a linconvnient de fausser les donnes ce qui pose un problme lorsque leffectif ventiler
est assez important.
Une quatrime solution consiste appliquer une variante de lACM adapte aux
donnes manquantes. Formellement, on peut la dfinir comme une variante de lAFC
applique un tableau disjonctif incomplet1 . Comme la plupart des proprits de
lAFC dun TDC qui dfinissent lACM tiennent au fait que la marge sur les individus
est constante et que cette proprit nest pas vrifie pour les tableaux disjonctifs
incomplets, le principe de la variante est de remplacer la marge relle de ces tableaux
par une marge constante partout o elle intervient (profil et poids des lignes, mtrique
et origine des axes du nuage des colonnes). Toutes les proprits fondamentales de
lACM sont vrifies pour cette variante : dualit entre le nuages des individus et celui
1. Traitement des questionnaires avec non-rponse, Analyse des correspondances avec marge modifie
et analyse multicanonique avec contrainte. Publication ISUP XXXII fasc.3 1987 B.Escofier.

132

6 Exemple de traitement de tableau multiple par ACM et AFC

des modalits ; concidence entre une modalit et le barycentre de la population quelle


caractrise ; maximisation de la somme des rapports de corrlation par les facteurs
obtenus (le rapport de corrlation dune variable ayant des rponses manquantes est
calcul en plaant les individus aux rponses inconnues au barycentre).
Dans ce chapitre, aprs avoir constat que ces quatre mthodologies conduisent
des rsultats assez proches, nous avons dcid de conserver la premire solution, qui
conservent les non-rponses telles quelles.

6.3.3 Les non-rponses dans les tableaux croiss


Pour le tableau crois, la solution est trs simple : les effectifs sont calculs avec les
rponses effectivement connues, sauf pour la CSP dont la modalit non-rponse est
introduite.

6.4 PREMIRE ANALYSE : ACM DES RUBRIQUES


Dans cette premire analyse, celle commente le plus largement, les lments principaux sont les 52 modalits des 26 variables concernant la lecture des rubriques. Les
38 modalits des 8 variables du signaltique interviennent en supplmentaire. Avant
dtudier les rsultats de cette analyse, indiquons brivement ce que lon peut en
attendre.
1. Une typologie des individus suivant leur profil de lecture : deux individus sont
proches sils lisent les mmes rubriques du journal.
2. Une tude des liaisons entre la lecture (ou la non-lecture) des diffrentes
rubriques : si plusieurs rubriques sont souvent lues par les mmes lecteurs,
elles constituent un groupe qui sera mis en vidence. Si, linverse, il existe
des phnomnes dexclusion (les lecteurs de la rubrique A ne lisant jamais la
rubrique B), ils seront dtects.
3. Avec les lments supplmentaires, une tude de la liaison entre chaque variable
du signaltique, prise sparment, et les principaux facteurs de variabilit des
profils de lecture.

6.4.1 Plan des deux premiers facteurs


a) Les variables actives : rubrique-lue et rubrique-non-lue

Aprs stre assur que la rpartition des individus est peu prs rgulire sur le premier plan factoriel, on examine la projection des rubriques-non-lues et des rubriqueslues (cf. Figure 6.1). Notons dabord que les deux modalits dune mme rubrique
(lue et non-lue) sont toujours alignes avec lorigine des axes. En effet, en ACM, lorigine des axes est au barycentre des modalits dune mme variable (cf. section 4.3.5) ;

6.4 Premire analyse : ACM des rubriques

133

lorsquil ny a que deux modalits, comme cest le cas ici, lorigine est situe sur le
segment qui les joint. Certaines modalits, comme les informations conomiques par
exemple, ont des positions peu prs symtriques car les effectifs des lecteurs et des
non-lecteurs de cette rubrique sont presque gaux (167 et 173). Lorsque ces effectifs
ne sont pas du tout quilibrs (cas des informations maritimes qui nintressent que
17 personnes sur 340), la modalit lourde (non-lue) est prs de lorigine tandis que la
modalit lgre (lue) est excentre. En termes de mcanique, on retrouve le principe
du bras de levier.

Dunod La photocopie non autorise est un dlit

Sparation des modalits lue et des modalits non-lue

Un simple coup dil ce graphique rvle une structure particulire ; le phnomne


serait beaucoup plus frappant encore si nous avions pu disposer de couleurs, faisant
apparatre les rubriques lues en rouge et les non-lues en vert ! En effet, il existe une
sparation trs nette entre les deux types de modalits (par la deuxime bissectrice) :
toutes les modalits lue sont au-dessus et toutes les modalits non-lue sont en dessous.
Or rien ni dans le codage ni dans la mthode ne les diffrencie a priori.
Cette sparation, si nette sur le graphique, provient des donnes cest--dire du comportement de lecture des enquts : globalement, il existe une certaine ressemblance
entre lensemble des modalits lue dune part et entre lensemble des non-lue dautre
part. Ceci implique que les tendances les plus marquantes dans la lecture du journal
ne sont pas des exclusions systmatiques (quand on lit le sport, on ne lit pas pour
vous Madame et rciproquement) mais plutt un effet boule de neige : quand on lit
des rubriques, on a tendance en lire dautres, quelles quelles soient. Ce qui ne veut
pas dire que lattitude exclusive voque ci-dessus nexiste pas (on la dcouvre dans
la suite) mais quelle est moins importante que le phnomne illustr sur ce premier
plan.
La ligne de partage ne correspond pas lun des deux premiers facteurs mais,
comme les inerties de ces facteurs sont trs proches (0.155 et 0.125), le plan est
une structure plus stable que chacun des facteurs pris sparment et on a tendance
ltudier globalement. Nous pouvons cependant interprter sparment chacun de ces
facteurs.
Groupes de rubriques

Sur le plan des deux premiers facteurs, certains regroupements sont visibles, notamment celui des informations trangres, conomiques, politiques et sociales avec les
articles de fond de la page 1 et de la page 2 ainsi que la rubrique jeunesse et ducation.
Les modalits lue de ces rubriques sont toutes situes en haut du graphique (coordonne positive sur le deuxime facteur) et les modalits non-lue sont toutes situes en bas
du graphique (coordonne ngative sur le deuxime facteur). Le point commun entre
ces diffrentes rubriques est leur aspect relativement intellectuel. Cela explique sans
doute quelles intressent (ou nintressent pas) les mmes sous-populations. Notons

6 Exemple de traitement de tableau multiple par ACM et AFC

134

F2
2 = 12.5 %
2 = .125

info maritimes

info trangres
info conomiques
info politiques
dcs
accidents

page 2
ducation

page 1

info sociales
spectacles
faits divers

annonces emploi

sports

tl
pour vous Madame
petites annonces

info dpartementales
lariflette
feuilleton
au jour le jour
crmonies
agriculture
info maritimes
courrier consommateurs courrier lecteurs
petites annonces

info locales

annonces emploi

agriculture
info locales
tl
faits divers

courrier lecteurs
crmonies
F1

1 = 15.5 %

au jour le jour 1 = .155

lariflette
info dpartementales

sports
ducation

page 2

spectacles

courrier consommateurs

accidents
dcs
feuilleton

page 1
pour vous Madame

info conomiques

LEGENDE

info sociales

Minuscules : rubrique non lue


Minuscules italiques : rubrique lue

info trangres
info politiques

Figure 6.1 Les deux premiers facteurs de lanalyse des rubriques : les rubriques. En haut
gauche, lallure du nuage des individus.

que les proximits entre ces rubriques prises deux deux ne sont pas forcment trs
fortes ; par contre, elles sont globalement assez proches entre elles (la lecture de lune
de ces rubriques est associe frquemment la lecture de deux ou trois autres rubriques
du groupe). Lintrt dune analyse multidimensionnelle est de mettre en vidence de
tels phnomnes.
Le premier facteur

Les rubriques dont la contribution linertie du premier facteur est la plus importante
(en cumulant celle des deux modalits) sont : le courrier des lecteurs, le courrier des
consommateurs, les dcs et les autres rubriques dinformation plutt anecdotiques.
Les modalits lue sont toutes situes lextrme-droite et les non-lue sont situes
lextrme-gauche. Ce facteur oppose donc les lecteurs et les non-lecteurs de plusieurs

6.4 Premire analyse : ACM des rubriques

135

de ces rubriques. On peut aussi suivre lordre des rubriques lues et non-lues qui
apparat sur le premier axe et qui donne un classement des enquts : depuis les
lecteurs assidus des rubriques trs anecdotiques (courrier des lecteurs, feuilleton,
crmonies officielles, etc.) jusqu ceux qui non seulement ne sintressent pas ces
rubriques mais ne lisent mme pas les informations locales qui ont pourtant un large
public (276 sur les 340 enquts).
Schmatiquement, ce facteur classe les lecteurs suivant lintrt quils portent aux
rubriques anecdotiques.
Le deuxime facteur

Le deuxime facteur oppose les lecteurs des rubriques intellectuelles aux nonlecteurs de ces mmes rubriques. Les premiers nprouvent gure dintrt pour les
rubriques dcs et accidents dont les modalits non-lue ont des coordonnes positives
sur le deuxime axe.

Dunod La photocopie non autorise est un dlit

Les rubriques mal reprsentes sur le premier plan

La modalit lue de la rubrique sports est assez proche de celles des rubriques intellectuelles . Mais la qualit de reprsentation des deux modalits des sports (identiques
car elles sont alignes avec lorigine) est faible sur les deux premiers axes (0.010 et
0.068) ; cela indique que sa position dans lensemble des rubriques est mal exprime
sur ce plan. Le rapprochement avec les rubriques intellectuelles existe, mais ce nest
pas ce qui caractrise le plus la lecture des sports : on en conclut aussi que lattitude
vis--vis de cette rubrique est assez indpendante de la dispersion gnrale des profils
de lecture reflte par le premier plan. Pour prciser la situation des sports dans la lecture du journal, il faut tudier plutt le troisime facteur o sa qualit de reprsentation
est la plus forte (0.279).
Nous nattachons gure dimportance la rubrique informations maritimes dont
la position trs excentre est due son faible effectif. Elle est en ralit peu lie
aux deux premiers facteurs, comme lindiquent ses qualits de reprsentation et ses
contributions linertie (sa qualit de reprsentation sur ces facteurs vaut 0.002 et
0.041 et les contributions cumules de ses deux modalits valent 0.005 et 0.013).
b) Les individus

Les observations prcdentes ne rpondent pas la question qui lit quoi ? . Lanalyse
factorielle permet aussi dy rpondre. En effet, la reprsentation des rubriques, on
peut superposer une reprsentation des individus, ici les 340 enquts (pour des raisons
de lisibilit, nous navons pas reproduit cette superposition). Dans ce nouveau nuage de
points, deux aspects sont retenir : dune part, deux individus sont proches sils lisent
(et ne lisent pas) les mmes rubriques ; dautre part, un individu est situ, une homothtie prs, au centre de gravit des modalits lue ou non-lue des rubriques quil lit ou
ne lit pas. Concrtement, cela signifie quun individu situ au bas droite du graphique

136

6 Exemple de traitement de tableau multiple par ACM et AFC

est un lecteur assidu dun ensemble de rubriques assez peu intellectuelles (courrier
des lecteurs, feuilleton, crmonies officielles, etc.) dont les coordonnes sur laxe
horizontal sont fortement positives comme la sienne. Mais les informations politiques,
trangres, sociales ou conomiques ne lattirent gure car, pour ces rubriques, ce sont
les modalits non-lue qui ont, comme lui, une coordonne ngative sur laxe vertical.
Mais la position de tel ou tel point ne nous intresse gure : le seul intrt de ce
graphique est de voir que les enquts se rpartissent assez uniformment sur le plan
et quil ny a donc pas de classes de profils de lecture trs marques. Par contre, la
position des enquts nous intresse pour reprsenter les tendances du qui ? dans la
question qui lit quoi ? . Cest l quintervient le signaltique des enquts puisque
lon connat pour chaque individu son sexe, son niveau dinstruction (cod en cinq
niveaux), sa CSP, etc. Pour mieux voir comment ces catgories sont lies aux modes
de lecture, il est possible de reprsenter les deux barycentres des hommes et des
femmes, les cinq barycentres du niveau dinstruction, les huit barycentres des CSP,
etc. Ce point de vue sur lanalyse des individus se confond avec ltude des modalits
supplmentaires.
c) Les variables supplmentaires : le signaltique

La projection des modalits de ces variables sur le plan 1-2 (seulement les plus loigns
du barycentre) est donne figure 6.2 o sont rappeles quelques-unes des rubriques.
Lune des variables est troitement lie au premier plan : cest le niveau dinstruction.
Les cinq niveaux dinstruction vont du plus faible au suprieur en passant par les
niveaux intermdiaires. Il est remarquable de voir ces 5 niveaux ordonns et aligns ;
ils sont de plus trs loigns de lorigine qui reprsente le barycentre des 340 enquts.
Le fait de retrouver lordre naturel des cinq modalits du niveau dinstruction est un
argument qualitatif mais essentiel pour conclure que cette variable est lie la structure
des profils de lecture schmatise sur le premier plan. Lloignement, par rapport
lorigine, des cinq points est un autre argument qui peut tre quantifi par le calcul du
rapport de corrlation. Le carr de ce rapport, pour un facteur donn, est proportionnel
la somme des contributions des modalits de cette variable au facteur (cf. section 4.3.6
page 96). Parmi les variables supplmentaires, cest le niveau dinstruction qui a le
plus fort rapport de corrlation avec le second facteur (h2 = 0.247) : en remplaant
les 340 individus par les cinq barycentres des classes de niveau dinstruction, on
conserve presque le quart de linertie ! Le niveau dinstruction est donc trs li au
profil de lecture (h2 (F1, niveau dinstruction) = .157) ; calcul pour le plan, linertie
des barycentres des modalits du niveau dinstruction rapporte linertie totale
vaut : .207). Les lecteurs dont le niveau dinstruction est faible sont en moyenne en
bas droite du graphique : ils ont dj t dcrits. Ils sopposent aux enquts de
niveau dinstruction lev, situs en haut gauche. Ces derniers lisent les informations
intellectuelles et passent sans sarrter sur les pages des dcs, des accidents et des

6.4 Premire analyse : ACM des rubriques

137

F2 : 12.5 %
2 : .125

TUDIANT

info maritimes

TUDES SUPRIEURES

info trangres

CADRE SUPRIEUR

info conomiques
page 2

ZONE RSIDENTIELLE

accidents

dcs
ducation

CLIBATAIRE

spectacles
16-26 ANS

faits divers

HOMME

tl

CENTRE VILLE

sports
TUDES SECONDAIRES

F1 : 15.5 %
1 : .155

27-38 ANS

info locales

courrier des lecteurs


crmonies
TUDES TECHNIQUES
PRIMAIRES-SUPRIEURES

39-55 ANS

RETRAIT

info dpartementales

>55 ANS

ZONE RURALE

dcs
OUVRIER
ZUP

page 1

AGRICULTEUR

pour vous madame


feuilleton

FEMME

LEGENDE
Majuscule : signaltique
Minuscule : rubrique non lue
Minuscule italique : rubrique lue

COMMERANT

TUDES PRIMAIRES

info conomiques

VEUF

Dunod La photocopie non autorise est un dlit

Figure 6.2 Les variables du signaltique dans lanalyse des rubriques.

autres informations anecdotiques . Cest tout au moins ce quils dclarent, car il ne


faut pas oublier que nous disposons de rponses et non de comportements de lecture ;
mais cest un autre problme. Le respect de lordre des niveaux dinstruction montre
que plus on est instruit, plus on est intellectuel dans la lecture de Ouest-France .
Que les cinq points reprsentant les niveaux dinstruction soient tous sur une mme
ligne montre que, dans la dispersion du nuage des profils de lecture, il existe une autre
dimension indpendante du niveau dinstruction. Cette dimension, figure sur le plan
par la premire bissectrice des deux axes, oppose les individus qui lisent un grand
nombre de rubriques ceux qui en lisent peu.
Nous ne commentons pas compltement lensemble des rsultats concernant les
variables. Nous laissons au lecteur le plaisir dapprofondir les interprtations. Notons
seulement que la graduation obtenue pour le niveau dinstruction se retrouve dans la
variable ge dont les modalits schelonnent aussi le long de la deuxime bissectrice :
les enquts les plus gs sont situs vers le bas et la droite du graphique.

6 Exemple de traitement de tableau multiple par ACM et AFC

138

Cette structure se retrouve aussi dans ltude de la CSP : les tudiants et les cadres
suprieurs sont des lecteurs intellectuels ; les retraits, agriculteurs, commerants et
ouvriers sont des lecteurs plus anecdotiques . Une seule variable, la zone dhabitat,
traduit une dispersion en partie orthogonale la premire bissectrice : les habitants de
la ZUP, situs en moyenne en bas gauche du ct des modalits non-lue, lisent peu
de rubriques dans le journal, beaucoup moins en tout cas que ceux du centre ville.
F4
4 = 6.3 %
4 = .063

info maritimes

annonces emploi

petites annonces

16-26 ANS

sports

TUDIANT-SCOLAIRE
EMPLOY
CLIBATAIRE

info locales
spectacles
feuilleton

lariflette

OUVRIER

pour vous Madame


HOMME
GROS COMMER-INDUS

spectacles

FEMME

pour vous Madame


sports

F3
3 = 7.0 %
3 = .070

AGRICULTEUR

agriculture
CAD. SUP. PROF. LIB.

Figure 6.3 Le plan 3-4 de lanalyse des rubriques. En italiques : rubriques lues ; en haut droite,
lallure du nuage des individus.

6.5 Deuxime analyse : ACM du signaltique

139

6.4.2 Facteurs 3 et 4
La figure 6.3 donne la projection des points les plus caractristiques du plan 3-4 ainsi
que lallure du nuage des individus.
Le troisime facteur met en vidence une diffrence entre les profils de lecture,
indpendante de celle traduite sur le premier plan. Trois rubriques contribuent elles
seules la moiti de linertie du facteur : sports, pour vous Madame et spectacles. Ce
facteur montre une opposition entre la premire de ces rubriques et les deux autres :
les lecteurs des sports ne sont pas lecteurs de pour vous Madame et des spectacles et
rciproquement.
Les premiers sont plutt des hommes et les seconds plutt des femmes (le sexe est
la variable du signaltique la plus lie ce facteur : son rapport de corrlation atteint
0.318 !).
Le quatrime facteur particularise les lecteurs des petites annonces et annonces
pour lemploi, ces deux variables contribuant 48 % de linertie de cet axe. Ce facteur
est peu li aux variables du signaltique.

6.5 DEUXIME ANALYSE : ACM DU SIGNALTIQUE


La solution inverse de la prcdente consiste mettre en lments principaux les
modalits des 8 variables du signaltique en laissant les modalits de lecture en
lments supplmentaires.
De lanalyse des variables du signaltique on peut attendre :

Dunod La photocopie non autorise est un dlit

1. une typologie des individus suivant leur signaltique : deux individus sont
proches si leurs signaltiques se ressemblent (et ce, indpendamment de leurs
lectures) ;
2. une tude des liaisons entre les diffrentes variables du signaltique ;
3. avec les lments supplmentaires, une tude de la liaison entre les principaux
facteurs de variabilit du signaltique et la lecture de chaque rubrique considre
sparment.
La figure 6.4 donne les projections des modalits actives et des modalits supplmentaires les plus loignes du barycentre sur le plan 1-2. En outre, lallure du nuage des
individus est figure.

6.5.1 Les modalits actives : le signaltique


Le premier facteur

Sa valeur propre, moyenne des rapports de corrlation entre le facteur et chacune des
variables actives, vaut 0.406. Cette valeur leve indique une forte liaison globale

6 Exemple de traitement de tableau multiple par ACM et AFC

140

27-38 ans
gros commer.-indus.

cad. sup. prof. lib.


technico-commercial
cadre moyen

2 enfants
suprieur

1 enfant

3 enfants et +
mari
39-55 ans
primaire suprieur
agriculture
maison propritaire
rural
commercant-artisan

employ

secondaire

dcs
appart. propri.
accidents
ouvrier
centre ville
spectacles
homme
zup
info. loc.

maison locataire

appart. locataire

rsidentiel
tudiant-scolaire
16-26 ans

femme
dcs

autre

crmonies

clibataire

1 = .406

F1 = 9.28%
1

feuilleton

agriculteur

au jour le jour
sans enfant
primaire

56-80 ans

retrait-inactif
veuf

F2

2 = .295
2 = 6.73%

Figure 6.4 Le plan 1-2 de lanalyse du signaltique. En italiques : rubriques lues ; en bas droite,
lallure du nuage des individus.

entre les variables. Lexamen de chacune des variables du signaltique montre que
toutes, sauf une, le sexe, sont trs lies ce facteur et donc trs lies entre elles.
Linterprtation gnrale de ce facteur est simple : il met en vidence les plus jeunes,
qui cumulent beaucoup de modalits qui les caractrisent bien : dans lensemble, ils
sont tudiants, de niveau dinstruction lev, clibataires, sans enfant et habitent une
zone rsidentielle ; toutes ces modalits, comme celles des CSP assez leves dans la
hirarchie sociale, sont situes du mme ct.
Le deuxime facteur

Il dtache trs nettement des autres un groupe de trois modalits souvent partages :
g, veuf, et retrait. Ces trois modalits contribuent un peu plus de la moiti de
linertie de ce deuxime facteur. Ce deuxime axe met donc en vidence les plus gs.

6.5 Deuxime analyse : ACM du signaltique

141

Finalement, on peut dire que ce plan est trs structur autour le la variable ge avec
laquelle varient la plupart des autres variables du signaltique. Notons au passage la
mise en vidence dune liaison non linaire entre lge et le nombre denfants : la
modalits pas denfants ( charge) est associe la fois aux plus jeunes et aux plus
gs.
Description de lchantillon

Cette analyse permet de dcrire lchantillon, ou plus exactement les liaisons entre les
variables dans lchantillon. Les rsultats ne sont pas trs originaux (que les jeunes
soient plutt clibataires et les veufs plutt gs nest pas une dcouverte !). Mais
cette banalit est un bon signe : une incohrence avec la ralit (bien connue) de la
population gnrale signalerait un biais de lchantillon par rapport la population
quil est cens reprsenter. Cette analyse attire aussi lattention sur la liaison entre
certaines variables : par exemple ici, le niveau dinstruction est trs li lge de
lenqut (il varie en sens inverse). Il faut prendre garde dans linterprtation des
rsultats ce lien sous-jacent : linflchissement avec lge des profils de lecture vers
des rubriques de moins en moins intellectuelles (mis en vidence dans la premire
analyse) traduit peut-tre essentiellement le moindre niveau dinstruction des enquts
gs.

6.5.2 Les modalits supplmentaires : les rubriques


Les modalits de lecture et de non-lecture des 26 rubriques sont presque toutes situes
trs prs de lorigine des axes. Notons quand mme quelques exceptions : les spectacles
(qui intressent les tudiants), les dcs (lus beaucoup plus par les personnes ges
que par les jeunes), les informations agricoles (lues par les agriculteurs), etc.

Dunod La photocopie non autorise est un dlit

6.5.3 Contradiction apparente entre les deux analyses


La plupart des rubriques tant trs proches de lorigine, on en conclut que le signaltique est trs peu li la lecture dune rubrique particulire. Et pourtant nous avons vu
dans la premire analyse que profil de lecture et signaltique sont trs lis !
Ces rsultats ne sont pas contradictoires. Chacune des deux analyses focalise lattention sur un aspect des donnes et ces points de vue se compltent mutuellement.
Dans la premire analyse, la typologie des individus traduit le comportement de lecture devant lensemble des rubriques. Ce comportement gnral est trs li plusieurs
variables du signaltique, notamment le niveau dinstruction. Dans cette deuxime analyse o les rubriques sont en lments supplmentaires, elles apparaissent sparment.
On en conclut que le signaltique est trs li au profil gnral de lecture mais peu la
lecture dune rubrique particulire (un niveau social lev implique trs frquemment
une lecture intellectuelle du journal qui privilgie ce type de rubriques, mais non
systmatiquement lune dentre elles).

142

6 Exemple de traitement de tableau multiple par ACM et AFC

Cet exemple illustre une fois de plus la richesse de lanalyse multidimensionnelle


qui permet de dceler des liaisons que ltude spare de chaque dimension (ici chaque
rubrique) ne peut rvler.

6.5.4 Perte des dispersions spcifiques des profils de lecture


Lopposition entre lecture et non-lecture, valable pour les 26 rubriques, est une des
caractristiques les plus marquantes de la premire analyse. Elle traduit une dispersion
des profils de lecture lie au nombre total de rubriques lues. Cela napparat plus du
tout dans cette analyse o la typologie des individus est faite sur leur signaltique
uniquement : toute dispersion qui ne lui est pas lie est forcment invisible.
Inversement, la sparation du groupe veuf-retrait-ag apparat beaucoup moins
nettement dans la premire analyse que dans la deuxime.

6.6 UNE ANALYSE NON SATISFAISANTE : ACM DES


RUBRIQUES ET DU SIGNALTIQUE
Il est possible denvisager une analyse dans laquelle les deux groupes de variables
sont en actifs. Mais cette analyse est dlicate car les variables des deux groupes sont
htrognes. tudions les problmes spcifiques quelle pose.

6.6.1 Typologie des individus


Dans la typologie des individus obtenue par cette ACM, le signaltique et le profil de
lecture interviennent simultanment, deux individus tant proches sils se ressemblent
socialement et lisent les mmes rubriques. Au premier abord, les deux groupes de
variables semblent intervenir galement. Mais cette galit apparente peut cacher
un dsquilibre important : rien nempche que lun des deux groupes prdomine
sur lautre : la typologie mixte serait alors pratiquement la typologie induite par
ce groupe. Ce nest pas le but cherch : lorsquon considre simultanment deux
groupes aussi htrognes, on souhaite (implicitement au moins) quils interviennent
rellement tous deux dans la typologie.

6.6.2 Typologie des modalits


Lintrt dune typologie conjointe des modalits des variables des deux groupes est
dtudier lensemble des liaisons : la fois lintrieur de chaque groupe et entre les
deux groupes. Sil y a dsquilibre entre les deux groupes, les liaisons internes du
groupe dominant seront mises en vidence aux dpens des liaisons internes de lautre
groupe et des liaisons inter-groupes.

6.7 Troisime analyse : AFC du tableau croisant signaltique et rubriques

143

En conclusion, que ce soit pour ltude des individus ou pour celle des variables,
dans une analyse o plusieurs groupes de variables htrognes interviennent simultanment en actifs, il est ncessaire dquilibrer leur influence.

6.6.3 Indices concernant les groupes


Dans ces donnes, en plus des trois types dobjets classiques de lACM (les individus,
les modalits et les variables), un quatrime type apparat : les groupes de variables.
Linterprtation des rsultats doit senrichir de chacun de ces niveaux. Pour les trois
premiers types dobjets, on dispose de deux indices daides linterprtation : la
contribution linertie dun facteur et un indice de liaison avec le facteur (qui est la
qualit de reprsentation pour les individus et les modalits, et le rapport de corrlation
pour les variables qualitatives). Tout naturellement, on souhaite disposer dindices
analogues pour les groupes de variables. La contribution linertie mesure limportance dun groupe dans la typologie traduite par un facteur ; elle se dfinit en cumulant
les contributions des variables du groupe. La liaison entre un groupe de variables et
un facteur est une notion complexe dont nous proposons un indice de mesure dans la
section 8.5 page 194.
En pratique, pour guider linterprtation des rsultats de donnes htrognes, des
indices concernant les groupes sont ncessaires : par exemple, avant dtudier en dtail
une typologie dindividus, il faut savoir si cette typologie correspond surtout leur
signaltique, leur profil de lecture ou ces deux aspects.

Dunod La photocopie non autorise est un dlit

6.6.4 LAnalyse Factorielle Multiple, alternative de cette ACM


LAnalyse Factorielle Multiple (AFM), mthode danalyse de tableaux comprenant
plusieurs groupes de variables, apporte une solution trs satisfaisante au problme
de lquilibre des groupes. Ses rsultats sont plus complets que ceux de lACM. Ils
comprennent des indices daides linterprtation concernant les groupes et bien
dautres indices permettant en plus de comparer les groupes entre eux.
Nous donnons donc les rsultats de lAFM plutt que ceux de lACM. On les trouve
dans la dernire section du chapitre suivant, aprs une prsentation gnrale de cette
mthode qui sappuie sur un exemple plus simple concernant des variables numriques
et non des variables qualitatives.

6.7 TROISIME ANALYSE : AFC DU TABLEAU CROISANT


SIGNALTIQUE ET RUBRIQUES
Nous commentons ci-aprs lAFC du tableau croisant lensemble des 52 modalits de
lecture et les 38 modalits du signaltique. Ce tableau est form dune juxtaposition
de tableaux de contingence ; cest un sous-tableau du tableau de Burt dfini par les

144

6 Exemple de traitement de tableau multiple par ACM et AFC

variables des deux groupes (cf. Figure 6.5). Cette quatrime analyse est assez diffrente des autres en ce sens quelle est focalise sur la liaison entre les variables du
signaltique et la lecture des rubriques.
Ce tableau est structur, en ligne et en colonne, par les variables. La marge de chaque
sous-tableau dfini par lensemble des modalits dune variable du signaltique (ou
dune rubrique) est proportionnelle celle du tableau entier. Ceci implique que le
barycentre des modalits dune mme variable est, comme en ACM, situ lorigine
des axes.
Signaltique

Rubriques

Signaltique

Rubriques

Figure 6.5 Le tableau croisant signaltique et rubriques est un sous-tableau du tableau de Burt.

6.7.1 Plan des deux premiers facteurs (cf. Figure 6.6)


Le premier facteur extrait un fort pourcentage dinertie (58 %).
a) Le signaltique sur le premier facteur

La variable du signaltique qui contribue le plus linertie de ce facteur est le niveau


dinstruction dont les 5 modalits ordonnes stagent de gauche (niveau suprieur)
droite (niveau le plus faible). La contribution cumule de ces 5 modalits dpasse
25 %. Lge, qui a aussi une contribution trs importante, est gradu des plus jeunes
( gauche) aux plus gs. Lopposition entre les CSP agriculteur dune part et cadre
suprieur et tudiant dautre part, montre que ce facteur est li au niveau social.
b) Les rubriques sur le premier facteur

Les modalits les plus extrmes sont des modalits de non-lecture : celles des dcs,
des accidents et des informations locales. Ces 3 modalits, concernant des rubriques
trs anecdotiques, sont situes du mme ct que les modalits de lecture des rubriques
intellectuelles : informations trangres, politiques, conomiques et les spectacles.
Cest un axe de niveau intellectuel.

6.7 Troisime analyse : AFC du tableau croisant signaltique et rubriques

145

c) La liaison signaltique-rubriques sur le premier facteur

Du point de vue du signaltique, cest un facteur de niveau social ; du point de vue des
rubriques, cest un facteur de niveau intellectuel des rubriques. Les modalits caractrisant un niveau social lev sont lies aux modalits de lecture des rubriques les plus
intellectuelles et aux modalits de non-lecture des rubriques les plus anecdotiques (et
inversement). Sur ce facteur, on retrouve une structure assez proche de celle remarque
dans la premire analyse (non pas le long dun facteur mais le long de la deuxime
bissectrice du plan 1-2 sur laquelle stageaient notamment les 5 modalits ordonnes
du niveau dinstruction).
Le lien entre les profils de signaltique et de lecture est donc en trs grande partie
exprim par la liaison entre le niveau social des lecteurs et le niveau intellectuel des
rubriques lues.
d) Le deuxime facteur

Le deuxime facteur extrait 15 % de linertie. Beaucoup moins important que le


premier, il peut encore sinterprter clairement.
Pour le signaltique, plus de la moiti de linertie de ce facteur est fournie par les
deux modalits de la variable sexe. Pour les rubriques, la lecture du feuilleton et de
pour vous Madame soppose celle des informations agricoles et des sports.
Ce deuxime facteur montre quun deuxime lment important dans le lien entre
le signaltique et la lecture des rubriques est lopposition entre :
1. les hommes, lecteurs des informations agricoles et des sports ;
2. les femmes, lectrices de pour vous Madame et du feuilleton.

Dunod La photocopie non autorise est un dlit

Cette liaison a dj t en partie dcele sur le troisime facteur de la premire analyse,


lACM des rubriques.

6.7.2 Intrt et limites de cette analyse


Cette analyse fait jouer un rle symtrique aux deux groupes et met trs bien en
vidence diffrents aspects de leurs relations. Mais elle a trois limites principales :
1. elle ne permet dtudier que des groupes de variables qualitatives ;
2. elle ne permet de comparer que deux groupes de variables ;
3. elle ne met en vidence que les points communs entre ces deux groupes : toutes
les dimensions spcifiques du signaltique (groupe veuf-g-retrait) et des profils de lecture (nombre de rubriques lues) non lies lautre profil sont supprimes. Limportance relative des structures communes et des structures spcifiques ne peut absolument pas tre mesure.

dcs

CAD. SUP. PROF. LIB.

F2 : 16.0 %
2 : .007

sports

HOMME

sports

info politiques

feuilleton

pour vous Madame

+ de 55 ANS
AGRICULTEUR

agriculture

spectacles

OUVRIER
RETRAIT-INACTIF

courrier lecteurs
accidents
38-55 ANS
dcs
au jour le jour

PRIMAIRES SUPRIEURES

VEUF
TUDES PRIMAIRES

crmonies

COMMERANT-ARTISAN

FEMME

TUDES TECHNIQUES

info conomiques

26-36 ANS

TUDES SECONDAIRES

info trangres

faits divers

spectacles

CLIBATAIRE

TUDES SUPRIEURES

accidents

Majuscules : Signaltique
Minuscules : rubrique non lue
Minuscules italiques : rubrique lue

LEGENDE

F1 : 58.5 %
1 : .025

TUDIANT

- de 26 ANS

info locales

Figure 6.6 Le plan 1-2 du tableau croisant signaltique et rubriques.

146
6 Exemple de traitement de tableau multiple par ACM et AFC

6.8 Conclusion

147

6.8 CONCLUSION
Ces trois analyses ont permis dtudier plusieurs aspects de ces donnes.
Mais nous avons mis en vidence les limites des techniques classiques qui ne
permettent ni la comparaison globale de plusieurs groupes de variables (structures
communes et spcifiques) ni la construction des typologies des lignes et des colonnes
dans laquelle les groupes sont quilibrs.
LAFM, prsente dans le chapitre suivant, est conue spcialement pour lanalyse
de tableaux comportant plusieurs groupes de variables. Elle ne prsente pas ces limites
et permet une comparaison systmatique des groupes travers lensemble de points
de vue trs divers que la richesse de la structure de groupes de variables suggre.

Chapitre 7

LAnalyse Factorielle Multiple


partir de deux applications

Ce chapitre prsente une mthode factorielle adapte au traitement de tableaux dans lesquels un ensemble dindividus est dcrit par plusieurs groupes de variables : lAnalyse
Factorielle Multiple (AFM). Cette prsentation sarticule autour de deux exemples.
Le premier rassemble des apprciations sensorielles fournies par un ensemble
de dgustateurs sur un ensemble de vins. Les diffrents rsultats de lAFM sont
comments de faon mettre en vidence les problmes auxquels ils apportent
des solutions. Les premiers rsultats prsents sont trs proches de ceux des
mthodes classiques ; les rsultats sans quivalents dans lACP ou lACM sont
introduits progressivement.
Le second est lenqute Ouest-France tudie par les mthodes classiques dans
le chapitre prcdent.

7.1 LEXEMPLE DES VINS


7.1.1 Prsentation des donnes
Cet exemple est issu de recherches ralises pendant plusieurs annes par lquipe
constitue autour de C. Asselin et R. Morlat au Centre de Recherches INRA dAngers.
Les donnes se prsentent initialement sous la forme suivante : 36 dgustateurs ont
jug chacun 21 vins laide dune fiche comprenant 29 variables. Les variables sont
des caractristiques du vin dont le dgustateur doit apprcier lintensit laide dune
chelle comportant cinq modalits ordonnes (trs faible ou nul, faible, moyen, fort,
trs fort) codes de 1 5.

7 LAnalyse Factorielle Multiple partir de deux applications

150

variables
1

29 31

vins

xik

21
Figure 7.1 Tableau analys. Pour les 29 premires variables, xik est la moyenne des apprciations
des 36 juges sur le vin i propos de la variable k. Pour les deux dernires variables, xik est le
numro de la modalit du vin i pour la variable k.

partir de ces donnes, un fichier plus petit a t construit (cf. Figure 7.1) : pour
chaque vin et chaque variable de la fiche, on a calcul la moyenne des apprciations
de lensemble des juges. Lorsquune donne est manquante, elle nintervient pas dans
la moyenne.
ce fichier de 29 variables numriques, on ajoute deux variables qualitatives qui
caractrisent lorigine des vins : laire dappellation (Saumur, Bourgueil, Chinon) et
le type de sol (squence de rfrence, milieu 2, milieu 3 et milieu 4 ; la squence
de rfrence est, selon lhypothse des chercheurs, le type de sol qui possde les
meilleures potentialits viticoles).
Le tableau obtenu nest pas homogne puisquil prsente la fois des variables
quantitatives et qualitatives. Dans la suite, les variables qualitatives apparaissent au travers de leurs modalits : lors de linterprtation, on parle peu de la variable appellation
mais surtout de la modalit Saumur, de la modalit Bourgueil, etc.

7.1.2 Description de la problmatique


Lobjectif gnral de ltude est la caractrisation de ces vins rouges. On cherche
dabord une typologie des vins permettant de rpondre des questions du type suivant :
quels sont les vins qui globalement, cest--dire du point de vue de lensemble des
variables, se ressemblent ?
Pour cela, nous utilisons la mthodologie factorielle qui met en vidence les principales dimensions de variabilit et dcrit les individus (ici les vins) laide de ces

7.1 Lexemple des vins

151

dimensions. Dans cette optique, une ACP semble bien adapte au tableau. Dans cette
ACP, comme dans lAFM par la suite, les variables sont normes pour quelles aient
la mme influence a priori.
Toutefois, lexamen de la fiche de dgustation montre que les variables sont structures en groupes. Tout dabord, les variables qui caractrisent lorigine des vins jouent
un rle bien part : elles ne doivent pas participer la construction des principaux
facteurs de variabilit mais simplement intervenir titre illustratif. Cela tant, mme
parmi les variables sensorielles, on distingue :

Dunod La photocopie non autorise est un dlit

5 variables relatives lolfaction au repos ; intensit olfactive, qualit aromatique, note fruite, note florale, note pice ;
3 variables relatives la vision ; intensit visuelle, nuance (orang/violet), impression de surface (larmes) ;
10 variables relatives lolfaction aprs agitation : intensit olfactive, qualit
olfactive, note fruite, note florale, note pice, note vgtale, note phnolique,
intensit aromatique de bouche, persistance aromatique de bouche, qualit aromatique de bouche ;
9 variables relatives la gustation : intensit dattaque, acidit, astringence,
alcool, quilibre acidit-astringence-alcool, velout, amertume, intensit de fin
de bouche, harmonie ;
2 variables relatives un jugement densemble ; qualit densemble, typicit.
Le dernier groupe comporte deux variables synthtiques : nous dcidons de leur faire
jouer un rle illustratif.
Les variables sur lesquelles nous appuyons principalement lanalyse sont donc
structures en quatre groupes : olfaction au repos, vision, olfaction aprs agitation,
gustation. Lexistence de cette structure pose dabord un problme technique : une
ACP globale ne risque-t-elle pas dtre influence de faon prpondrante par un seul
groupe ? Auquel cas, la prise en compte simultane des quatre groupes serait illusoire.
Ainsi, le premier problme pos par le traitement simultan de plusieurs groupes de
variables est la pondration de ces groupes. Dans un premier temps, lAFM peut tre
vue comme une analyse factorielle (ici une ACP) dans laquelle linfluence des groupes
de variables est quilibre. Cest dans cet esprit que nous effectuons une premire
prsentation des rsultats de lexemple dans la section 1.4. Laspect technique de la
pondration est prsent dans la section 1.3.
En outre, la prise en compte de la structure en groupes dun ensemble de variables
enrichit la problmatique de ltude. De mme que lon cherche comparer des
vins (en termes de ressemblances) ou des variables (en termes de liaisons), on peut
chercher comparer globalement les groupes de variables. On dira que deux groupes
de variables se ressemblent si deux vins proches pour lun des deux groupes (par
exemple, laspect visuel) sont aussi proches pour lautre (par exemple, le got). On

152

7 LAnalyse Factorielle Multiple partir de deux applications

tente donc de mettre en vidence une typologie des groupes, cest--dire, dans notre
exemple, des aspects sensoriels mis en jeu dans la dgustation. LAFM fournit une
telle typologie : son application lexemple est dcrite aux sections 1.6 et 1.7.
Lexistence de groupes de variables conduit vouloir dcrire les vins, non seulement
au travers de lensemble des variables mais aussi au travers de chacun des groupes.
Pour cela, il est toujours possible de raliser des analyses spares des groupes. Toutefois leurs rsultats, tant obtenus indpendamment, sont difficilement comparables
entre eux : par exemple, une ressemblance, mme forte, entre sous-espaces factoriels peut tre masque par des rotations. Pour comparer les reprsentations des vins
vus par chacun des groupes, il est ncessaire de les situer dans un rfrentiel commun. LAFM rpond ce problme en fournissant une reprsentation factorielle
dans laquelle figurent les reprsentations des vins dcrits par chacun des groupes de
variables considr sparment. Son application lexemple est dcrite section 1.5.
En rsum, la prise en compte dune structure en groupes dun ensemble de
variables pose un problme technique (la pondration des groupes) et enrichit la
problmatique dune tude (comparaison des groupes ; comparaison des typologies
des vins dfinies par chaque groupe). LAFM propose une solution technique (la pondration dcrite dans la section suivante) au problme technique (quilibrer linfluence
des groupes) et fournit des reprsentations adaptes aux diffrents aspects de lobjectif.

7.1.3 Pondration des groupes de variables


Deux lments interviennent dans le rle que peut jouer un groupe de variables dans
une analyse densemble :
son inertie totale (gale au nombre de variables lorsquelles sont normes) ; plus
cette inertie est importante, plus grande est linfluence du groupe ;
la structure du groupe ; plus le groupe possde une structure forte, cest--dire
plus ses variables sont lies, et plus son influence sera dterminante dans la
construction des principales dimensions de variabilit.
Dans la construction du premier axe dune analyse globale, la direction principale
dinertie de chaque groupe joue un rle majeur. Or, les inerties associes ces directions (i.e. la premire valeur propre des ACP spares) peuvent tre trs variables.
Dans lexemple (cf. Tableau 7.1), les premires valeurs propres des groupes 3 et 4
sont beaucoup plus leves que celles des groupes 1 et 2 : cest l une consquence
du plus grand nombre de variables (et donc dune inertie totale plus grande) pour ces
groupes 3 et 4. Mais, dans le dtail, la premire valeur propre du groupe 2 est plus
leve que celle du groupe 1 et ce malgr un nombre de variables plus petit pour le
groupe 2 : linertie totale du groupe 2 (3) est plus petite que celle du groupe 1 (5) mais
est concentre dans une direction (% dinertie de laxe 1 = 94, 49 %). Cet exemple
illustre le fait quil nest pas suffisant deffectuer une normalisation des inerties totales.

7.1 Lexemple des vins

153

Tableau 7.1 Inerties des ACP spares des quatre groupes actifs.

Groupe

Dunod La photocopie non autorise est un dlit

totale
1 olfaction au repos
5
2 vision
3
3 olfaction aprs agitation 10
4 gustation
9

Inerties
axe 1 axe 2
2,24 1,52
2,83 0,15
4,70 2,48
5,64 1,79

axe 3
0,82
0,01
1,05
0,67

Pourcentages
axe 1 axe 2 axe 3
44,84 30,33 16,31
94,49 5,03
0,48
47,01 24,83 10,46
62,69 19,90 7,49

LAFM quilibre linfluence des groupes de variables en donnant chaque variable


un poids. Ce poids doit tre le mme pour toutes les variables dun mme groupe afin
de conserver la structure interne de chaque groupe.
Le poids donn par lAFM chacune des variables dun groupe est gal linverse de linertie de la premire composante principale de ce groupe. Ainsi, dans
lexemple, les poids des variables de chacun de ces quatre groupes dans lAFM sont
respectivement 0.45, 0.35, 0.21 et 0.18.
Lorsque lon affecte un mme poids toutes les variables dun groupe, linertie
du nuage associ est multiplie par ce poids dans chaque direction de lespace. Avec
le poids indiqu, linertie de la premire composante principale de chaque groupe
de variables est gale 1 ; par suite, la somme des inerties des variables dun mme
groupe sur un axe quelconque de lespace est infrieure ou gale 1. De cette faon, le
rle de chacun des groupes est quilibr en ce sens quaucun groupe ne peut influencer
lui seul la premire composante principale de lensemble (qui maximise linertie
projete de toutes les variables). Cette pondration est une caractristique majeure de
lAFM ; elle lui confre plusieurs proprits qui apparatront par la suite.
LAFM consiste dabord en une analyse factorielle (ici une ACP norme) des
variables ainsi pondres.
Le tableau 7.2 prsente la dcomposition, selon les quatre groupes, de linertie
des trois premires composantes principales de lAFM. Son interprtation, qui fait
rfrence la pondration des variables, en illustre les consquences.
Pour la premire composante principale, les inerties des variables de chacun des
quatre groupes sont toutes assez proches entre elles : les quatre groupes contribuent de
faons quilibres cette direction, ce qui tait lobjectif de la pondration. En outre,
ces inerties sont proches de la valeur maximum : 1. Du fait de la pondration des
variables, la valeur 1 ne peut tre atteinte que dans le cas extrme o cette composante
est confondue avec la premire composante principale de lACP spare du groupe.
Cette premire composante principale est donc trs lie chacun des groupes en ce
sens quelle constitue une direction dinertie importante pour chacun.

154

7 LAnalyse Factorielle Multiple partir de deux applications

Tableau 7.2 Dcomposition de linertie des trois premires composantes principales de lAFM
selon les quatre groupes.

inertie totale
1 olfaction au repos
2 vision
3 olfaction aprs agitation
4 gustation

1e composante
3.46
.78
.85
.92
.90

2e composante
1.37
.62
.04
.47
.24

3e composante
.62
.37
.01
.18
.05

La situation est diffrente pour la deuxime composante principale. Le groupe 2 ne


contribue pas cette direction. Ce fait est rapprocher du rsultat suivant : lACP du
seul groupe 2 conduit une premire composante principale associe un pourcentage
dinertie de 0.94. Ainsi ce groupe est presque unidimensionnel alors que les autres
groupes sont plus riches , cest--dire comportent au moins quelques variables
peu corrles entre elles. La pondration ne modifie pas cette structure inhrente aux
donnes : les groupes riches influencent plus daxes que les groupes pauvres.

7.1.4 Typologie des vins et principales dimensions


Les rgles dinterprtation de ces premiers rsultats sont identiques celles dune ACP.
Compte tenu des pourcentages dinertie (49,4 % pour laxe 1 ; 19,5 %pour laxe 2 et
8,8 % pour laxe 3) nous limitons, dans cette prsentation mthodologique, lessentiel
de linterprtation au premier plan factoriel.
a) Reprsentation des variables

La figure 7.2 montre que les variables les plus corrles au premier facteur sont, pour
chacun des groupes :
Olfaction au repos : qualit globale des armes, fruit.
Vision : impression de surface, intensit, nuance (violace).
Olfaction aprs agitation : persistance aromatique, intensit olfactive rtronasale, qualit globale des armes.
Gustation : intensit fin de bouche, harmonie, intensit dattaque, velout.
Jugement densemble : qualit globale, typicit.
Ce premier axe recouvre des notions classiquement (dans le monde du vin) regroupes
dans les mots puissance et harmonie qui possdent des connotations nettement
positives. Ces deux termes ne sont absolument pas synonymes en gnral, mais sont,
pour la population de vins tudis ici, trs lis.

7.1 Lexemple des vins

155

F1 : 49.4 %
0.6

olfaction au repos
vision
olfaction aprs agitation
gustation
jugement d'ensemble

arme vgtal
0.4

0.2

F2 : 19.5 %
0
-1

-0.8

-0.4

-0.6

0.2

-0.2

0.6

0.4

arme pic
floral

-0.2

arme pic
amertume

intensit olfactive

-0.6

intensit olfactive

intensit d'attaque
nuance
intensit visuelle
persistance aromatique
impression de surface

Dunod La photocopie non autorise est un dlit

floral

-0.4

fruit

fruit

typicit

qualit globale
qualit globale armes
qualit globale
velout
armes
harmonie
intensit olfactive rtronasale
intensit de fin de bouche

Figure 7.2 Reprsentation des variables (par leur corrlation avec les axes) sur le premier plan
factoriel.

Les variables les plus corrles au second facteur sont :


Olfaction au repos : pic, intensit olfactive.
Olfaction aprs agitation : pic, vgtal, intensit olfactive.
Gustation : amertume.
Ce deuxime axe est li la reconnaissance dune particularit perue de faon
intense par de nombreux juges comme la caractristique pic ou vgtal. Il correspond une particularit essentiellement olfactive (elle nest associe qu une seule
caractristique provenant dun autre sens : lamertume).

156

7 LAnalyse Factorielle Multiple partir de deux applications

b) Reprsentation des vins (cf. Figure 7.3)

Le premier axe tant interprt comme un axe de puissance et harmonie , la coordonne dun individu sinterprte en ces termes. Ainsi, le vin 1DAM a t considr
comme le plus puissant et harmonieux . loppos, les vins 1VAU et 2ING, possdant les coordonnes les plus fortes, ont t perus comme particulirement peu
puissants et harmonieux . Ces deux derniers vins se dmarquent franchement des
autres le long de cette dimension laquelle ils contribuent pour 32.8 + 26.4 = 59.2 %.
Le deuxime axe est essentiellement d aux deux vins nots Smi4 (contribution
de ces deux vins cet axe : 29.7 % + 39.3 % = 69 %). Il sagit en fait du mme
vin prsent deux fois aux dgustateurs. On interprte donc cet axe comme le cas
particulier du vin Smi4 .
En outre, dans une question ouverte relative lolfaction, ce vin a t trs souvent
(8 fois pour lun, 9 fois pour lautre) associ sous-bois et/ou champignon, termes trs
peu cits pour les autres vins. Ces donnes renforcent linterprtation de cet axe en
tant que particularit olfactive du vin Smi4. Remarquons au passage que le fait que les
dgustateurs aient jug de la mme faon les deux chantillons provenant du mme
vin est un bon argument en faveur de la valeur des donnes.
Relation entre les deux premiers facteurs et lorigine du vin

Chaque modalit dune variable qualitative est reprsente au centre de gravit des
individus qui la possdent. chaque coordonne dune modalit sur un axe, on associe
une valeur-test (cf. 2.4.4 page 54).
Les modalits Saumur, Chinon et Bourgueil sont trs proches de lorigine des axes
(valeurs-test < 1.4) : lorigine du vin, au sens de lappellation, est sans rapport avec les
principales dimensions de variabilit de ces vins. La modalit milieu 4 est trs loigne
le long de laxe 2 (valeurs-test = 3.9) mais elle ne concerne que deux vins. La modalit
squence de rfrence est fortement loigne le long de laxe 1 (valeur-test = 2.4) ;
rappelons quelle correspond un type de sol qui, dun point de vue agronomique,
possde une excellente potentialit viticole ; cet a priori est confirm par la place de
cette modalit sur le plan.

7.1.5 Reprsentation superpose des vins dcrits par chaque groupe


de variables sparment
La reprsentation des vins dcrite prcdemment sappuie sur lensemble des variables
des quatre groupes. Un vin comme 1DAM, qualifi de puissant et harmonieux ,
occupe une position extrme sur la premire composante car les notes qui lui ont t
attribues pour les variables corrles cette composante sont en gnral trs leves.
Un retour au tableau de donnes permet de prciser ce quil en est pour chacune
dentre elles, savoir si la grande puissance et harmonie du vin 1DAM sexprime
de faon homogne sur lensemble des variables ou si, au contraire, 1DAM prsente

7.1 Lexemple des vins

157

F1 :
Bmi2
(2ING)

49.4 %
Cmi3
(1VAU)

Smi2

Smi3

Bmi2
milieu 2

milieu 3

Chinon

Cmi3
Bourgueil

Cmi2
Smi4

milieu 4
Smi4

Bref
Smi2

Smi2

F2 : 19.5 %

Saumur
Smi3

Bref
Smi3

Bmi2
Bref

Cref

Squence de rfrence

Sref
(1POY)

Sref

Sref (1DAM)

Figure 7.3 Reprsentation du nuage des vins vus par lensemble des variables. Lemplacement
dun vin est repr par linitiale de lappellation [S = Saumur ; B = Bourgueil ; C = Chinon] suivi de
sa modalit de milieu [ref = squence de rfrence, mi2 = milieu 2, etc.]. Quatre vins, comments
en dtail par la suite, ont un nom particulier [1DAM, 1POY, 1VAU et 2ING]. En outre, le point
moyen de chaque modalit est reprsent.

158

7 LAnalyse Factorielle Multiple partir de deux applications

variables des
autres groupes

R 27
1DAM-g

1DAM-m
1DAM-1

R5
variables du
premier groupe

Figure 7.4 Individu global, partiel et moyen. La reprsentation du vin 1DAM du point de vue du
seul groupe 1 (individu partiel 1DAM-1) est obtenue en projetant le point global (1DAM-g R 27
engendr par toutes les variables) sur le sous-espace (not R 5 ) engendr par les 5 variables du
groupe 1. Le point moyen 1DAM-m est obtenu partir de 1DAM-g par une homothtie de rapport
1/J = 1/4.

des points plus ou moins forts. Cette question peut tre pose, non plus en termes de
variables mais de groupes de variables : la puissance du vin sexprime-t-elle de faon
gale ou ingale dans son aspect visuel, ses parfums, son got ?
La perception de chaque aspect nest pas lisible facilement sur les donnes puisque
chacun est mesur par un groupe de variables. Il est donc utile de disposer dun outil
qui synthtise la perception des vins non plus du point de vue de lensemble des
variables mais du point de vue de chacun des groupes de variables. Pour cela, en AFM,
on sappuie sur la reprsentation gomtrique suivante.
Remarquons tout dabord que, dans lACP dun seul groupe de variables, on dfinit
un nuage qui reprsente lensemble des vins peru laide de ce seul groupe. On
dispose ainsi de quatre nuages des vins, dits nuages partiels, correspondant chacun
un groupe actif (lexpos thorique de lAFM, chapitre 8, montre pourquoi on se
limite ici aux groupes actifs).
Ces quatre nuages partiels peuvent tre construits dans lespace de dimension 27
(not R 27 ) engendr par toutes les variables actives. Le nuage olfaction au repos est
obtenu en projetant le nuage global des vins sur le sous-espace de dimension 5
(not R 5 ) engendr par les cinq premires variables, cest--dire, puisque les variables
sont centres, en annulant toutes les coordonnes qui ne concernent pas cet aspect (cf.
Figure 7.4).
En AFM, on traite comme des lignes supplmentaires les quatre tableaux obtenus
en annulant les valeurs des variables (centres) de trois groupes sur 4. Ainsi, les
quatre nuages des vins dfinis sparment par chacun des quatre aspects mesurs,
sont projets sur les axes factoriels du nuage regroupant ces diffrents aspects. On

7.1 Lexemple des vins

159

Tableau 7.3 Quelques valeurs pour les trois variables du groupe olfaction au repos les plus
corrles au premier facteur.

maximum
1DAM
1POY
moyenne

qualit globale
des armes
3.429
3.429
3.107
3.046

note
fruite
3.154
3.154
2.731
2.714

intensit
olfactive
3.708
3.607
3.071
3.111

obtient ainsi une reprsentation superposant ces quatre nuages partiels au nuage
global. En AFM, une homothtie (qui ne modifie strictement pas la forme du nuage)
est applique au nuage global pour obtenir un nuage moyen ; elle met chaque
point de ce nuage (par exemple 1DAM) au barycentre des 4 points (1DAM1, 1DAM2,
1DAM3 et 1DAM4) dcrivant ce mme vin dans ses diffrents aspects. La lecture
des graphiques en est grandement facilite : il est beaucoup plus rapide de comparer
chaque point au barycentre que de comparer les quatre points deux deux. Le chapitre
suivant montre plusieurs proprits de ces graphiques.
La figure 7.5 est un extrait de cette reprsentation superpose applique lexemple.
Elle est limite, pour des raisons de clart, 6 vins extrmes (cf. Figure 7.3) :

Dunod La photocopie non autorise est un dlit

1DAM et 1POY, jugs globalement les plus puissants et harmonieux ;


1VAU et 2ING, jugs globalement les moins puissants et harmonieux ;
le vin Smi4, prsent en double, bien individualis sur le deuxime axe.
Daprs la figure 7.5, le vin 1DAM a t peru comme le plus puissant et harmonieux du point de vue de lolfaction au repos (cf. la position extrme de 1DAM1).
Par contre, pour ce mme groupe de variables, le vin 1POY a t peru seulement
comme un peu plus que moyen (cf. la position relativement centrale de 1POY1). Ces
informations se retrouvent facilement dans les donnes (cf. Tableau 7.3).
La situation est diffrente du point de vue de la gustation pour laquelle cest 1POY
qui a t peru comme le plus puissant et harmonieux . Lcart est, selon ce sens,
moins important que pour lolfaction. Ces informations se lisent aussi dans les donnes
(cf. Tableau 7.4).

7.1.6 Facteurs communs


Pour mesurer la similitude entre les projections des quatre nuages partiels sur un mme
axe, on calcule le coefficient de corrlation entre chacune de ces projections et celle
du nuage global. Le tableau 7.5 contient ces valeurs pour les premiers axes.

7 LAnalyse Factorielle Multiple partir de deux applications

160

F1

3
4

2
2ING
2

1VAU
1

3
1

F2

Smi4

Smi4

2
2

3
1POY

2
4

2
1DAM

1
Figure 7.5 Reprsentation superpose limite 6 vins extrmes. Chaque vin est caractris par
chacun des quatre groupes de variables et par lensemble des groupes.

Tableau 7.4 Quelques valeurs pour les quatre variables du groupe gustation les plus corrles au
premier facteur.

velout
maximum
1POY
1DAM
moyenne

3.286
3.231
3.036
2.674

intensit fin
de bouche
3.676
3.667
3.643
3.166

harmonie
3.786
3.786
3.643
3.148

intensit
dattaque
3.519
3.519
3.464
3.156

7.1 Lexemple des vins

161

Tableau 7.5 Corrlations, pour les sept premiers axes de lAFM, entre la projection du nuage
global et celle de chacun des quatre nuages partiels (i.e. associs un seul groupe).

Dunod La photocopie non autorise est un dlit

olfaction au repos
vision
olfaction aprs agitation
gustation

axe 1
.89
.93
.97
.95

axe 2
.96
.22
.89
.87

axe 3
.89
.16
.90
.30

axe 4
.48
.22
.57
.25

axe 5
.42
.17
.66
.52

axe 6
.27
.08
.49
.56

axe 7
.42
.21
.46
.42

Pour synthtiser le tableau 7.5, on dira que la premire composante de lAFM,


puissance et harmonie, est un facteur commun aux quatre groupes de variables.
En effet, les valeurs assez leves des quatre coefficients de corrlation de la premire
colonne indiquent que les projections des quatre nuages partiels sont presque des
homothties de la projection du nuage global (qui est la moyenne entre ces projections).
Cette premire colonne permet daffirmer quil existe une direction de dispersion
presque analogue dans les quatre nuages.
La composante, cas particulier du vin Smi4, est une dimension qui se traduit uniquement dans les parfums et le got puisque seule la corrlation entre la projection du
nuage global et celle du nuage dfini par les variables visuelles est trs faible (0.22).
Le second facteur est commun trois groupes seulement.
La troisime composante de lAFM est un facteur commun aux deux olfactions
seulement. Ceci incite examiner cette composante dont nous dirons seulement quelle
oppose, pour chaque olfaction, les caractres fruit et floral (ces 4 variables contribuent
73 % de linertie de ce facteur).
Il nexiste pas (actuellement) de seuil partir duquel on pourrait dire que tel coefficient de corrlation est grand. Ce seuil dpendrait du nombre dindividus, de la
dimensionalit des groupes, etc. En labsence, ces coefficients se servent mutuellement de rfrence, raison pour laquelle ils sont donns pour les sept premiers axes.
Ces corrlations permettent donc de juger de lexistence dun facteur commun
tous les groupes ou certains dentre eux. Lorsque cette direction de dispersion
commune existe, il est intressant de mesurer et de comparer son importance dans les
diffrents groupes. Limportance dun facteur dans un groupe est mesure par linertie
cumule des variables du groupe sur ce facteur (cf. Tableau 7.2).

7.1.7 Reprsentation des groupes de variables


Les quatre groupes actifs de lanalyse ainsi que les deux groupes supplmentaires
sont reprsents sur un graphique qui correspond axe par axe aux graphiques des
variables et des vins (cf. Figure 7.6). La coordonne dun groupe sur un axe est linertie
cumule des variables du groupe sur laxe correspondant de lAFM (cf. Tableau 7.2).

7 LAnalyse Factorielle Multiple partir de deux applications

162

F2

terroir

Qualit de reprsentation des groupes (inertie


projete / inertie totale)
1 olfaction au repos : 0.617
2 vision : 0.729
3 olfaction aprs agitation : 0.784
4 gustation : 0.772
5 apprciation densemble : 0.444
6 origine : 0.189

0.8
6

0.6

1
3

0.4
5

0.2

appellation

0
0

0.2

0.4

0.6

0.8

1 F1

Figure 7.6 Reprsentation des groupes de variables : carr des liaisons.

La pondration (applique aussi aux variables des groupes supplmentaires) implique


que les coordonnes dun point-groupe sont comprises entre 0 et 1.
Ce graphique admet plusieurs interprtations listes ci-aprs.
a) Contributions des groupes la construction des axes

Les quatre groupes actifs ont des coordonnes voisines le long du premier axe : ils
contibuent galement au premier facteur (puissance et harmonie). Les coordonnes
des groupes le long du deuxime axe montrent que le deuxime facteur est d principalement lolfaction (groupes 1 et 3) et lgrement la gustation (groupe 4).
b) Liaison entre les composantes principales de lAFM et les groupes

La coordonne dun groupe sur un axe peut tre considre comme une mesure de
la liaison entre le groupe et le facteur correspondant : si cette coordonne est proche
de 0, les variables du groupe ne sont pas corrles au facteur ; si elle est proche de
1, le facteur correspond une direction dinertie importante (voisine du maximum)
pour le groupe de variables. Ainsi, le premier facteur est une direction dinertie trs
importante pour les quatre groupes actifs et, en ce sens, leur est trs li. Le deuxime
facteur a une importance presque aussi grande que le premier pour un seul groupe
actif : lolfaction au repos. Le sixime groupe (origine des vins), trait en illustratif,
est beaucoup plus li au deuxime facteur quau premier.
Linterprtation de ce graphique en terme de liaisons lui vaut le nom de carr des
liaisons. Il a dj t vu en ACM (cf. 4.3.7) ce qui suggre de reprsenter aussi les deux
variables du groupes 6 sparment (par le carr de leurs rapports de corrlation) : on
visualise ainsi lindpendance entre lappellation et les deux premires composantes

7.1 Lexemple des vins

163

de lAFM, la liaison forte entre le terroir et la deuxime composante (qui individualise


presque parfaitement la modalit milieu 4) et la liaison faible (mais significative, cf.
7.1.4) entre le terroir et la premire composante (qui distingue les vins de la squence
de rfrence).
c) Reprsentation optimale du nuage des groupes

Ce graphique sinterprte aussi comme la projection orthogonale dun nuage de points


reprsentant chacun un groupe. Dans ce nuage, prcis au chapitre suivant, deux
groupes sont dautant plus proches que les structures quils dfinissent sur lensemble
des vins (cest--dire les quatre nuages partiels de la section 7.1.5) se ressemblent.
Sur ce plan, les deux groupes supplmentaires (5 et 6) sont mal reprsents. Le
groupe 6 est loign des autres : lorigine des vins (appellation et terroir) est, dans
lensemble, moins lie leurs principales caractristiques organoleptiques que ces
caractristiques ne sont lies entre elles.
Les groupes les plus proches entre eux sont les deux olfactions : ces deux groupes
sont proches (entre eux et des autres) du point de vue de la puissance et harmonie ; en
outre, ce sont surtout eux qui mettent en vidence le cas particulier du vin Smi4.

Dunod La photocopie non autorise est un dlit

7.1.8 Projections des composantes principales de chaque groupe


La figure 7.7 reprsente la projection des deux premires composantes principales
normes de chacun des 5 groupes sensoriels sur le plan des deux premires composantes de lAFM (concrtement, le programme ralise une ACP de chaque groupe et
traite les composantes ainsi obtenues comme des variables supplmentaires).
La premire composante de lAFM (puissance et harmonie) est trs corrle la
premire composante principale de chaque groupe actif. Nous avons dj indiqu que
les quatre groupes actifs possdent une direction de dispersion commune dinertie
importante. Il apparat ici que ce facteur commun est, pour ces quatre groupes, proche
de leur principale direction de dispersion.
La deuxime composante principale de lAFM (cas particulier du vin Smi4) est
trs lie la deuxime composante principale des trois groupes : olfaction au repos,
olfaction aprs agitation, et gustation. Nous avons dj conclu lexistence dun
second facteur commun ces trois groupes. Ce nouveau rsultat prcise limportance
relative de ce facteur dans les groupes concerns.

7.1.9 Conclusion sur lexemple des vins


LAFM prend en compte la structure en groupes de variables deux niveaux. Elle
pondre les variables de faon quilibrer linfluence des groupes dans lanalyse
globale ; de faon indirecte, cette pondration enrichit la signification dindicateurs
(e.g. linertie projete des variables dun groupe) et donc facilite linterprtation.

164

7 LAnalyse Factorielle Multiple partir de deux applications

F1
G3F1

G4F1
G2F1

G5F1
G3F2
G2F2

G5F2

-.5

G4F2
G1F2

F2

G1F1
-1
Figure 7.7 Reprsentation des deux premires composantes principales de chaque groupe par
leur corrlation avec les deux premires composantes de lAFM. G1 F2 = deuxime composante du
groupe 1.

Elle fournit des reprsentations spcifiques de la structure en groupes (reprsentation


superpose des nuages partiels et reprsentation des groupes).

7.2 AFM APPLIQUE AUX DONNES DE LENQUTE


OUEST-FRANCE
Dans lexemple des vins, les variables des groupes actifs sont des variables numriques ; dans lenqute Ouest-France commente dans le chapitre prcdent, ce sont
des variables qualitatives. Le fait que les variables soient qualitatives et non numriques ne modifie fondamentalement ni la problmatique ni les solutions proposes
en AFM : il suffit de remplacer la notion dACP par celle dACM pour les groupes
composs de variables qualitatives.
Une AFM applique aux donnes de lenqute Ouest-France, dans laquelle les
variables actives sont subdivises en deux groupes (lecture et signaltique), permet
dobtenir :
une reprsentation optimale des individus dans laquelle leur profil de lecture et
leur profil de signaltique interviennent de faon quilibre ;

7.2 AFM applique aux donnes de lenqute Ouest-France

165

une reprsentation optimale conjointe des modalits des variables du signaltique


et de celles de lecture des rubriques ;
la rponse la question : existe-t-il ou non des facteurs communs aux deux
groupes (i.e. des directions de dispersion analogues dans les deux nuages dindividus dfinis respectivement par le signaltique et les rubriques) ?
une reprsentation superpose des nuages dindividus dfinis par chaque groupe
de variables, outil commode notamment pour dtecter des individus dont le profil
de lecture ne correspond pas leur signaltique ;
la rponse la question : existe-t-il ou non des facteurs spcifiques de lun
des groupes (i.e. une direction de dispersion dun des deux nuages qui napparat
pas ou peu dans lautre) ?
une mesure de limportance relative, pour chaque groupe, des directions communes ou spcifiques ;
la comparaison des premiers facteurs de lanalyse spare du signaltique et de
celle des rubriques ;
une reprsentation graphique dun nuage de points reprsentant chacun un groupe
sur des axes correspondant aux axes factoriels des nuages dindividus et de
modalits (peu utile dans cet exemple avec deux groupes seulement).

Dunod La photocopie non autorise est un dlit

Compte tenu des commentaires des analyses classiques de cette enqute (cf. Chapitre 6), la question principale est la suivante : quy a-t-il de commun ou de spcifique
entre la lecture du journal et le profil signaltique global ? Nous portons donc notre
attention, facteur par facteur, sur les indices de comparaison des groupes. Enfin, en
harmonie avec les ACM du chapitre 6, les modalits correspondant aux donnes manquantes sont laisses telles quelles (remarquons au passage que les quatre possibilits
de gestion des donnes manquantes voques en ACM valent en AFM).

7.2.1 Premier facteur : les modalits


Linertie du premier facteur vaut 1.57. La valeur maximum possible est 2 (cas o le
facteur de lAFM est confondu avec le premier facteur de chaque groupe) et la valeur
minimum 1 (inertie maximum de chaque groupe sur un axe). On en conclut que ce
facteur nest pas la principale direction de dispersion des nuages du signaltique et
des rubriques (qui ne sont donc pas confondues), mais reprsente une direction de
dispersion qui apparat dans les deux nuages. Cette remarque est confirme et prcise
par les autres indices.
Les corrlations entre ce premier facteur et les projections associes de chacun des
deux nuages dindividus dfinis sparment par le signaltique et les rubriques valent
respectivement 0.921 et 0.909 : ces fortes valeurs indiquent quil sagit dun facteur
commun aux deux groupes.

7 LAnalyse Factorielle Multiple partir de deux applications

166

R2

R1
F2

S2
F1 : 9.1 %

F1

S1

F2 :
5.8 %
Figure 7.8 Reprsentation des deux premiers facteurs des analyses spares de chaque groupe
sur le cercle des corrlations du premier plan de lAFM. R1 : premier facteur de lanalyse des
Rubriques. S1 : premier facteur de lanalyse du Signaltique. gauche, allure du nuage des
individus.

Sur ce premier facteur, linertie de lensemble des variables du signaltique vaut


0.816 tandis que celle de lensemble des rubriques vaut 0.752. Ces valeurs sont sensiblement infrieures la valeur maximum 1 : cette direction de dispersion, commune
aux deux groupes, ne se confond pas avec le premier facteur de chaque groupe. Cependant, ces deux valeurs sont suffisamment grandes pour conclure que cette direction de
dispersion est assez importante dans les deux groupes.
Les corrlations entre ce facteur et ceux des deux ACM spares ne sont jamais
trs leves. Le graphique (cf. Figure 7.8) reprsentant les projections des deux premiers facteurs norms des deux ACM (spares) sur le plan des deux premiers facteurs
de lAFM montre les relations entre les facteurs de ces trois analyses.
Les plans engendrs par les deux premiers facteurs, de lACM des rubriques dune
part et de lAFM dautre part, sont pratiquement confondus. Le premier facteur de
lAFM nest autre que la seconde bissectrice du plan 1-2 comment dans la section 6.4
page 140 (cf. Figures 6.1 et 6.2). Cette direction du plan, le long de laquelle stagent
les cinq niveaux dinstruction et plusieurs autres variables du signaltique, oppose les
individus ayant un profil de lecture intellectuel (lecture de ce type de rubriques
et non-lecture des rubriques anecdotiques) aux individus ayant un profil de lecture
inverse. Cette rpartition des rubriques et du signaltique est aussi trs proche de celle

7.2 AFM applique aux donnes de lenqute Ouest-France

167

du premier facteur du tableau crois qui permet danalyser leur liaison (cf. section 6.7
page 143).

7.2.2 Deuxime facteur : les modalits


Linertie de ce facteur vaut 0.978. Les coefficients de corrlation entre ce facteur et
la projection associe des deux nuages dfinis lun par le signaltique et lautre par les
rubriques valent 0.546 pour le premier et 0.964 pour le second. Cest donc une direction
de dispersion des profils de lecture qui nest pas vraiment lie au signaltique (un
cosinus de 0.546 correspond un angle de 57 degrs). Ce facteur est donc spcifique
des profils de lecture.
Sur ce deuxime facteur, linertie cumule des variables du signaltique (0.147) et
celle des variables de lecture des rubriques (0.825) confirment la prpondrance des
variables du deuxime groupe pour lequel, dailleurs, cette direction spcifique est un
peu plus importante que la direction commune exprime par le premier facteur.
La figure 7.8 montre que ce facteur est trs proche de la premire bissectrice du
plan 1-2 de lACM des rubriques, direction lie au nombre total de rubriques lues.

Dunod La photocopie non autorise est un dlit

7.2.3 AFM et ACM des rubriques


Nous ne donnons pas le graphique des projections des modalits des variables sur le
plan 1-2 car il se dduit, trs peu de choses prs, du plan de lACM des rubriques par
une rotation 3p/4. Cette concidence entre lanalyse dun groupe et lAFM est rare
lorsque les groupes tudis sont assez diffrents entre eux.
Bien que les graphiques soient peu prs identiques, linterprtation de lAFM est
diffrente de celle de lACM des rubriques puisque lon se rfre aux deux groupes
qui sont tous deux actifs. Le premier facteur tant un facteur commun et le deuxime
tant spcifique des profils de lecture, on sattache chaque axe sparment plutt
quau plan. Rappelons que ces deux axes ne sont pas confondus avec ceux de lACM
des rubriques mais avec leurs bissectrices.
Les variables les plus lies au premier facteur, et donc lies entre elles, sont dune
part le niveau dinstruction et lge et, dautre part, les rubriques les plus anecdotiques
ainsi que les plus intellectuelles. La dispersion des profils de lecture mise en vidence
par le deuxime facteur, donc spcifique de la lecture, est lopposition entre rubriquelue et rubrique non-lue.

7.2.4 Reprsentation superpose des individus


La reprsentation superpose des individus caractriss dune part par leur signaltique
et dautre part par leur lecture est un rsultat de lAFM sans quivalent dans les
mthodes classiques. Elle nest intressante que sur une dimension commune, ici le

7 LAnalyse Factorielle Multiple partir de deux applications

168

premier facteur. La plupart des individus sont reprsents par deux points trs proches
ainsi que lindique le rapport [inertieinter/inertietotale] dont la valeur pour ce facteur
est 0.837. Ce rapport se rfre au nuage des individus vu par chacun des deux groupes
(680 = 340 2 points), partitionn en 340 groupes (1 groupe = 1 enqut) de 2
points chacun (le mme enqut caractris par chacun des deux groupes) : il vaut 1
si les 2 images de chaque enqut concident entre elles et donc avec leur centre de
gravit. Comme nous ne nous intressons pas chaque individu mais plutt ce quil
reprsente, nous tudions seulement les reprsentations superposes des barycentres
des classes dfinies par les modalits de toutes les variables. La figure 7.9 donne un
extrait de cette reprsentation superpose en rappelant linterprtation gnrale de ce
facteur et la projection des 5 niveaux dinstruction. De cette interprtation on dduit
deux cas de figure.
F2 : 5.8 %
L
Statut social lev,
lectures intellectuelles
info politiques
L
L

S
TUDES
PRIMAIRES

PRIMAIRES
SUPRIEURES

tl

TUDES
TECHNIQUES

AGRICULTEUR

F1 : 9.1 %

TUDES SECONDAIRES

S
L

TUDIANT

L
S
feuilleton

CADRES SUP.

TUDES SUPRIEURES

info politiques

S
Statut social peu lev,
lectures anecdotiques

L
LEGENDE
S : classe caractrise par son signaltique
L : classe caractrise par sa lecture
Majuscule : signaltique
Minuscule : rubrique non lue
Minuscule italique : rubrique lue

Figure 7.9 Un extrait de la reprsentation superpose de lAFM de lenqute Ouest-France.

Un individu dont le profil de lecture est situ sensiblement plus droite que son
signaltique a un profil de lecture plus intellectuel que ne le laisse prsager
son signaltique ou, ce qui est quivalent, un statut social moins lev que ne le
laisse prsager sa lecture du journal.
Inversement, un individu dont le profil de lecture est situ sensiblement plus
gauche que son signaltique a un profil de lecture moins intellectuel que ne
le laisse prsager son signaltique ou, ce qui est quivalent, un statut social plus
lev que ne le laisse prsager sa lecture du journal.
Pour les barycentres linterprtation est analogue. De la grande proximit entre les deux
points reprsentant un mme individu, dcoule une grande proximit entre les deux

7.2 AFM applique aux donnes de lenqute Ouest-France

169

points reprsentant leurs barycentres. On peut commeter cependant deux exceptions


concernant une modalit du signaltique et une modalit de lecture : les tudiants et
les lecteurs du feuilleton.
Les tudiants sont trs extrmes par leur signaltique ; ils cumulent des modalits caractristiques des lectures intellectuelles : jeune, niveau dinstruction
suprieur, habitant la zone rsidentielle, etc. Leur profil de lecture, beaucoup plus
moyen, est moins intellectuel quil ne le devrait !
Les lecteurs du feuilleton sont beaucoup plus extrmes par leur lecture (peu intellectuelle) du journal que par leur signaltique relativement moyen. On caractrise
donc un lecteur du feuilleton plus sa lecture des autres rubriques du journal
qu son signaltique.

Chapitre 8

Aspects thoriques et techniques


de lAnalyse Factorielle Multiple

laide de deux exemples, le chapitre prcdent dcrit les grandes lignes de la problmatique de ltude des tableaux multiples ainsi que les principaux rsultats de
lAFM. Dans cette premire prsentation, les considrations thoriques et techniques
sont rduites au minimum. Nous reprenons ici lexpos de lAFM en faisant toujours
rfrence lexemple des vins pour illustrer les objectifs mais en dtaillant les calculs
ainsi que leurs justifications.
Dans un premier temps, nous adoptons successivement comme cadre les trois
espaces dans lesquels lAFM peut tre prsente :
R K , dans lequel sont situs les nuages des individus ;
R I , dans lequel est situ le nuage des variables ;
2
R I , dans lequel est situ le nuage des groupes de variables.
Dans un second temps, nous fournissons des complments qui concernent :
une autre prsentation de la mthode : lestimation des paramtres du modle
INDSCAL ;
le cas des variables qualitatives ;
la mise en uvre.

8 Aspects thoriques et techniques de lAnalyse Factorielle Multiple

172

8.1 DONNES ET NOTATIONS


Par souci de clart, nous restreignons dabord lexpos au cas des variables numriques ; la prise en compte des variables qualitatives est tudie sparment (cf. section 8.6 page 197). Comme en ACP, les variables quantitatives sont toujours centres
et, sauf mention explicite du contraire, rduites.
Les donnes sont constitues par un ensemble dindividus dcrits par plusieurs
groupes de variables. chaque groupe de variables correspond un tableau.
Tous les groupes de variables tant dfinis sur le mme ensemble dindividus, tous
les tableaux peuvent tre juxtaposs en ligne et former ainsi un seul tableau croisant
individus et variables. Lensemble initial de plusieurs tableaux apparat alors comme
un unique tableau structur en sous-tableaux. Nous notons : X le tableau complet ;
I lensemble des individus ; K lensemble des variables (tous groupes confondus) ;
J lensemble des sous-tableaux ; K j lensemble des variables du groupe j ; (K =
j K j ) ; X j le tableau associ au groupe j (cf. Figure 8.1).
K1

Kj

KJ

X1

Xj

XJ

individus

Figure 8.1 Tableau X des donnes en AFM.

Les symboles I , J , K ou K j dsignent la fois lensemble et son cardinal. Une


variable du groupe K j est note : vk (k K j ). Nous supposons les individus
 et les
variables munis de poids : pi dsigne le poids affect lindividu i (avec i pi = 1)
et m k le poids affect la variable vk . Les matrices diagonales des poids des individus
et des variables sont notes respectivement D, M j (pour le groupe K j ) et M (pour
K ). Il faut distinguer le poids des variables dans les analyses spares des groupes de
variables et dans lanalyse densemble.
Dans les analyses spares, les variables numriques ont presque toujours le
poids 1. Il est toutefois possible daffecter des poids diffrents dune variable lautre :
cette situation se rencontre notamment lorsque les variables sont des facteurs norms
issus dune autre analyse, auquel cas on affecte une variable-facteur un poids gal
linertie laquelle elle est associe (autre solution : on analyse les facteurs non norms
chacun affect du poids 1).

8.2 LAFM dans lespace des individus R K

173

Dans lanalyse densemble, ainsi que cela a t prsent dans lexemple des vins,
les poids initiaux des variables sont modifis. Le poids initial de chaque variable
du groupe j est divis par l1j (en notant l1j la premire valeur propre de lanalyse
factorielle spare du groupe j).
Nous gardons la mme notation m k pour le poids de la variable k quel que soit le
stade de lanalyse : pratiquement, du fait du contexte, il nen rsulte aucune ambigut.
De mme, nous gardons une seule notation lsj pour la valeur propre de rang s associe
lACP de X j avant ou aprs la pondration (l1j vaut 1 aprs la pondration).
Cette pondration a pour but dquilibrer le rle des groupes dans tous les aspects de
lanalyse. Elle est interprte dans tous les espaces dans lesquels lAFM est prsente.

8.2 LAFM DANS LESPACE DES INDIVIDUS RK


Lespace R K contient les reprsentations des individus. Chacune de ses dimensions
est associe une variable. partir de cet espace, nous cherchons deux types de
reprsentation.
1. Une reprsentation du nuage des individus caractriss par lensemble des
variables. Lexemple des vins a montr que cette reprsentation tait obtenue par
une ACP du tableau X , les variables tant pondres.

Dunod La photocopie non autorise est un dlit

2. Une reprsentation superpose des J nuages dindividus caractriss chacun par


un seul groupe de variables. Dans lexemple des vins, cette reprsentation faisait
figurer sur un mme graphique les vins du point de vue de lolfaction au repos,
de la gustation, etc. Ce graphique est obtenu laide de projections de lignes
supplmentaires dans lACP prcdente.

8.2.1 Influence de la pondration des groupes sur les J nuages NIj


chaque groupe de variables j, correspond un nuage reprsentant les individus. Ce
nuage not N Ij est situ dans un espace de dimension K j not R K j .
Rappelons que la pondration, qui vise quilibrer le rle des groupes de variables,
revient diviser par l1j le poids initial de chaque variable du groupe j. Ce coefficient,
tant identique pour toutes les variables du groupe j, ne modifie pas la forme des
nuages N Ij . En revanche, il normalise ces nuages en ce sens que, avec ces poids,
linertie maximum de tout nuage N Ij dans une direction quelconque vaut 1 (de faon
quivalente : le premier axe de lACP du seul nuage de N Ij est alors associ une valeur
propre de 1). Enfin, avec cette pondration, deux nuages homothtiques deviennent
gaux.

8 Aspects thoriques et techniques de lAnalyse Factorielle Multiple

174

8.2.2 Influence de la pondration des groupes sur le nuage NI associ


toutes les variables
lensemble de toutes les variables, correspond un nuage reprsentant les individus
situ dans lespace R K . Dans ce nuage, not N I , le carr de la distance entre deux
points i et l est la somme des carrs de leur distance dans les N Ij . Notons i j le point
reprsentant i dans le nuage N Ij et vk (i) la valeur de la variable k pour i. Alors :

 

m k (vk (i) vk (l))2 =
m k (vk (i) vk (l))2 =
d 2 (i j , l j )
d 2 (i, l) =
kK

jJ kK j

jJ

Dans la distance entre deux lments du nuage N I , linfluence des diffrents groupes
nest quilibre que si les distances dans les diffrents nuages N Ij sont du mme ordre
de grandeur. Multiplier les poids initiaux des variables du groupe j par un coefficient
a j est un moyen dquilibrer linfluence des groupes puisque la distance scrit alors :

d 2 (i, l) =
a j d 2 (i j , l j )
jJ

Avec la pondration a j = 1/l1j , aucun groupe ne peut tre prpondrant dans la


premire direction dinertie du nuage moyen. Cependant, le nombre de directions de
N I sur lesquelles le groupe j influe crot avec la dimensionalit de N Ij .
j

8.2.3 Reprsentation des J nuages NI dans RK et nuage moyen


Pour reprsenter simultanment les J nuages N Ij dans lespace R K , il suffit de remarquer que R K peut se dcomposer en somme directe de J sous-espaces orthogonaux
deux deux et isomorphes aux espaces R K j . Soit :
R K = R K j
Sur chacun de ces sous-espaces, la mtrique induite par M est la mtrique M j; il
sagit donc dun isomorphisme despaces euclidiens. Les coordonnes des points du
nuage N Ij sont contenues dans le tableau X j . Les coordonnes de ces points dans
lespace R K sont contenues dans un tableau de dimensions I et K , dans lequel X j est
complt par des zros (cf. Figure 8.2) ; ce tableau est not X j .
Les nuages N Ij tant situs dans des sous-espaces orthogonaux, cette reprsentation
simultane est artificielle et inutilisable directement mais sert de base une vritable
reprsentation simultane obtenue par projection sur des sous-espaces de R K .
Soit N I le nuage des centres de gravit, nots i , des J points i j reprsentant le
mme individu i dans les N Ij . Ce nuage se dduit de N I par une homothtie de rapport
1/J . Le nuage N I est un nuage moyen pour les N Ij .

8.2 LAFM dans lespace des individus R K

Kj

175

RK

Kj
j

~
Xj =

NI
0

Xj

Figure 8.2 Les nuages N Ij dans R K . N Ij appartient au sous-espace R K j (de R K ) engendr par les
variables du seul groupe j.

8.2.4 Reprsentation du nuage moyen


Cette reprsentation sinscrit dans la problmatique classique de lanalyse factorielle.
On souhaite projeter le nuage N I , ou, ce qui revient au mme, son homothtique N I ,
sur un sous-espace de petite dimension tel que la projection obtenue ressemble le plus
possible N I .
Pour cela, on ralise une ACP du tableau X . La particularit de cette ACP est que
les variables sont pondres afin dquilibrer le rle des groupes.

8.2.5 Reprsentation superpose des J nuages dfinis par chaque


groupe de variables
Dunod La photocopie non autorise est un dlit

a) Problmatique

Lintrt de cette reprsentation a t mis en vidence dans lexemple des vins du


chapitre prcdent. Ainsi, il a t possible de montrer que tel vin, du point de vue de
la puissance, tait plus caractristique sur le plan olfactif que sur le plan gustatif.
Toujours dans cet exemple, nous avons indiqu que cette reprsentation tait obtenue
par projection, en tant qulments supplmentaires, des nuages N Ij sur les axes
factoriels de N I . Nous justifions ici cette dmarche en posant le problme de la
recherche directe dune reprsentation superpose.
Les nuages N Ij tant tous situs dans R K , il est possible den obtenir une reprsentation simultane par projection sur un mme sous-espace. Le choix du sous-espace
cherche satisfaire deux conditions essentielles pour quune telle reprsentation permette de comparer la position dun mme individu dans les diffrents nuages.

176

8 Aspects thoriques et techniques de lAnalyse Factorielle Multiple

(C1) Chaque nuage N Ij doit tre bien reprsent

Dans ce but, nous choisissons comme reprsentation du nuage N Ij une projection


orthogonale de ce nuage. La qualit dune reprsentation peut alors tre mesure
par son inertie : nous cherchons des projections des N Ij dinertie importante. Plus
prcisment, on cherche maximiser linertie de lunion des N Ij . Soit N IJ = j N Ij .
(C2) Les reprsentations des nuages N Ij doivent se ressembler entre elles

Il nest pas possible de comparer les positions dun mme point dans les diffrents
nuages si ces reprsentations sont, dans lensemble, trs diffrentes. En particulier,
des symtries, rotations ou homothties, peuvent masquer compltement de fortes
ressemblances entre les nuages. Pour assurer cette condition, il faut que les points
homologues (reprsentant le mme individu) soient le plus proche possible les uns des
autres.
Le nuage N IJ a t partitionn jusquici en J nuages (contenant chacun I points et
nots N Ij ) reprsentant chacun lensemble des individus vus au travers dun groupe
de variables. Introduisons maintenant une autre partition de N IJ : I nuages (contenant
chacun J points et nots NiJ ) reprsentant chacun le mme individu i vu au travers de
chaque groupe de variables (cf. Figure 8.3).
Le centre de gravit de NiJ est i . Selon le thorme de Huygens appliqu cette
nouvelle partition, linertie totale de N IJ se dcompose en inertie intra (inertie des NiJ
autour des i ) et inertie inter (inertie de N I ). Pour que les points associs au mme
individu i soient proches entre eux, on cherche minimiser linertie projete de chaque
NiJ donc linertie intra de N IJ .
Compromis entre (C1) et (C2)

Pour satisfaire simultanment les critres associs (C1) et (C2), le sous-espace


cherch devrait tre tel quen projection le nuage N IJ ait une inertie totale maximum
et une inertie intra minimum. Ces deux proprits sont gnralement incompatibles :
la qualit de reprsentation des nuages et la ressemblance entre ces reprsentations ne
peuvent tre optimises simultanment. Ainsi, les meilleures reprsentations planes
sont obtenues par les projections des nuages sur les plans engendrs par leurs deux
premiers axes dinertie ; mais le cas limite, o deux nuages ne diffrent que par
lordre de leurs axes dinertie, montre bien que ces reprsentations de deux nuages
trs semblables peuvent ne pas tre comparables. linverse, une projection des
nuages telle que tous les points sont confondus lorigine, optimise la ressemblance
mais ne prsente aucun intrt. Il faut donc trouver un compromis entre ces deux
extrmes. Nous lobtenons en dfinissant un critre qui donne, a priori, une importance
quivalente aux deux proprits.

8.2 LAFM dans lespace des individus R K

Kh

R
ij

177

Kj

R
R

Kh

Ni

ih
i
NI

NI

Kj

ij

i*

NI

ih
h

NI

NI

NI

i
i*
NI
N I*

N I = {i, i I } nuage des individus


associ X .
N Ij = {i j , i I } nuage dans R K j associ X j = projection de N I sur R K j.
{NiJ = i j , j J } images du mme individu i.
{N I = i , i I } nuage des barycentres
des nuages NiJ , homothtique de N I (rapport 1/J ).
N IJ = j N Ij = i NiJ

Dunod La photocopie non autorise est un dlit

Figure 8.3 Nuages en prsence dans R K .

Le thorme de Huygens (inertie inter = inertie totale - inertie intra) suggre un


compromis entre une inertie totale maximum et une inertie intra minimum : une inertie
inter maximum.
b) Solution : interprtation en termes danalyse factorielle

Le sous-espace de R K sur lequel la projection de N IJ a une inertie inter maximum


est engendr par les premiers axes dinertie, nots u s , du nuage N I des centres de
gravit. Or ce nuage est homothtique au nuage N I associ lensemble de toutes les
variables. Le sous-espace cherch sobtient par une ACP du tableau X tout entier.
Les coordonnes des points de N Ij sont contenues dans le tableau X j de dimension
(I , K ) dans lequel X j est complt par des zros (cf. Figure 8.2). En introduisant ces
tableaux en supplmentaire dans lACP de X , on obtient la reprsentation simultane
des N Ij .
La concidence de cette reprsentation simultane avec une ACP est prcieuse : ses
rgles dinterprtation drivent directement de celles de lACP.

8 Aspects thoriques et techniques de lAnalyse Factorielle Multiple

178

K
ij

sj

Kj

u sj
us

u s : axe principal (de rang s) de N I .


u sj : composante de u s dans R K j .
Projeter i j sur u s est quivalent projeter i
dabord sur u sj puis sur u s .

Figure 8.4 Projection de i j .

c) Remarques sur la projection des nuages N Ij

Le nuage N Ij , qui appartient au sous-espace R K j , est projet sur un vecteur u s de R K


qui nappartient pas R K j . La projection de N Ij sur u s revient raliser successivement
une projection sur un vecteur u sj (projection de u s sur R K j ) puis une projection sur u s
qui contracte le nuage en multipliant les coordonnes par cos(usj ), en notant usj langle
entre u s et u sj (cf. Figure 8.4)
Cela peut conduire se demander sil ne vaut pas mieux conserver les projections
sur les u sj pour la reprsentation simultane. En fait, il nen est rien. Dans R K , les axes
u s sont orthogonaux, ce qui nest pas le cas des u sj . On superposerait alors des nuages
dans des espaces munis de mtriques diffrentes, ce qui est illisible. la rigueur, on
pourrait le faire en se limitant un seul axe u s . Mais, mme dans ce cas simple, la
proprit qui veut que le nuage moyen concide avec les centres de gravit des NiJ
ne serait plus vrifie. En outre, les points homologues (i j ; j = 1, J ) ne seraient plus
proches entre eux.
d) Aides linterprtation
Qualit de reprsentation de chaque nuage N Ij

Elle se mesure de manire classique par le rapport entre linertie projete et linertie
totale du nuage. Cette qualit de reprsentation est toujours trs faible puisque le
vecteur u s de R K , sur lequel N Ij est projet, nappartient pas au sous-espace R K j dans
lequel ce nuage est situ. Ce vecteur u s fait, avec sa projection u sj sur ce sous-espace
R K j , un angle dj not usj . Do :
Qualit de reprsentation de N Ij sur u s =(cos usj )2 (qualit de reprsentation sur u sj )

8.3 LAFM dans lespace des variables R I

179

Les termes cos2 usj sont en gnral petits : ils sont en nombre J et leur somme
vaut 1. Cette mesure de la qualit de reprsentation de N Ij est donc systmatiquement
beaucoup plus faible que celle que lon obtient dans lACP du seul nuage N Ij , mme
si u sj est une composante principale de N Ij .
En dautres termes, lindicateur [inertie projete / inertie totale] appliqu N Ij rend
compte de faon pessimiste de la qualit de reprsentation en ce sens que la forme
du nuage peut tre bien respecte mme si ce rapport est faible. Pour cette raison, cet
indicateur nest pas utilis en pratique ; pour valuer la qualit de reprsentation dun
groupe, on utilise plutt le nuage des variables (cf. section 8.3.5).
Ressemblance entre les reprsentations des diffrents nuages N Ij

Lanalyse cherche rendre petite linertie intra du nuage N IJ pour que les points i j
reprsentant le mme individu i soient proches entre eux. Il est naturel de prendre
comme mesure de ressemblance entre les projections des nuages N Ij sur un axe cette
inertie intra. Mais cette valeur na de signification que compare linertie totale. On
calcule donc, pour chaque axe, le rapport : [inertie inter / inertie totale].
Ce rapport, ntant pas la quantit minimise, ne dcrot pas forcment avec lordre
des axes. Mais il constitue un indicateur de lutilit globale de la reprsentation superpose des nuages N Ij . Lobjet de cette reprsentation est, rappelons-le, une analyse
dtaille des diffrences de forme entre les nuages N Ij . Si ce rapport est proche de 1,
tous les nuages N Ij ont suffisamment de caractres communs pour autoriser une tude
fine de leurs diffrences.

Dunod La photocopie non autorise est un dlit

8.3 LAFM DANS LESPACE DES VARIABLES RI


Lespace R I est lespace des fonctions numriques dfinies sur lensemble des individus. Cest dans cet espace que sont situes les variables initiales : lespace R I permet
avant tout dobtenir une reprsentation de ces variables.
Les composantes principales issues des ACP spares de chacun des groupes
peuvent aussi tre situes dans R I . Il est utile de visualiser leurs positions relatives au
mme titre que les variables initiales.
Enfin, lexemple des vins a fait apparatre la notion de facteur commun plusieurs
ensembles de variables. En tant que fonction dfinie sur lensemble des individus, un
facteur commun est un lment de R I et la problmatique qui lui est associe peut
tre prsente dans cet espace.
Aprs avoir introduit les composantes principales de lAFM comme espace de
reprsentation des variables initiales et des composantes des analyses spares, lAFM
est situe par rapport lanalyse multicanonique dfinie par Carroll.

8 Aspects thoriques et techniques de lAnalyse Factorielle Multiple

180

8.3.1 Influence de la pondration des groupes sur les nuages


des variables

RI

Ej

NK

NK

vk

l
NK

R I est muni de la mtrique D.


vk : vecteur reprsentant la variable k.
N Kj : ensemble des vecteurs vk appartenant au groupe j.
N K = j N Kj
E j : sous-espace engendr par les
variables du groupe j.

Figure 8.5 Les nuages de variables.

Chaque groupe de variables K j est reprsent par un nuage N Kj (cf. Figure 8.5).
La pondration des groupes, divisant le poids de chaque variable du groupe j par
l1j , rend gale 1 linertie de la premire composante principale de chaque nuage N Kj .
La figure 8.6 illustre cette pondration dans un cas simple.
En AFM, la pondration des variables dun groupe tient compte la fois du nombre
de variables et de leurs liaisons. Remarquons quune pondration qui ne tiendrait pas
compte des liaisons entre les variables (par exemple, en galisant les inerties totales
(1)
(1/4)

(1/4)

(1/4)

(1/4)
Groupe 1

(1)
Groupe 2

Figure 8.6 Illustration de la pondration de lAFM dans un cas simple. Les vecteurs reprsentent
les variables dans R I . Les nombres entre parenthses sont les poids associs aux variables dans
lAFM. Les variables du premier groupe sont pratiquement identiques : chacune est affecte dun
poids tel que lensemble du groupe a un poids pratiquement gal 1. Les variables du second
groupe sont non corrles : chacune est affecte dun poids gal 1.

8.3 LAFM dans lespace des variables R I

181

des N Kj ) rendrait faible (relativement) linertie, dans chaque direction, dun groupe
compos de beaucoup de variables indpendantes. En revanche, une telle pondration
rendrait forte (relativement) linertie dans une direction dun groupe compos dune
seule variable.

8.3.2 Reprsentation des variables


Cette reprsentation est obtenue directement dans lACP du tableau complet X : elle
est donc duale de limage de N I obtenue dans R K . Comme en ACP, la reprsentation
des variables peut tre considre la fois :
1. comme une aide linterprtation de la reprsentation du nuage des individus ;
2. comme une reprsentation optimale des (corrlations entre) variables.
Dans le cas dun tableau multiple, on obtient ainsi une image simplifie des corrlations
inter et intra groupe. En ce sens, la reprsentation des variables est un aspect de la
comparaison fine des groupes de variables.
Les composantes principales rendent maximum linertie des projections de toutes
les variables. Linertie projete de chaque nuage N Kj peut donc tre interprte comme
la contribution dun groupe. La pondration des groupes (par 1/l1j ) quilibre leur
influence en ce sens que la contribution dun groupe la construction dun axe est
borne par 1. On retrouve ici lide selon laquelle :
1. aucun groupe ne peut, lui seul, dterminer le premier axe (sauf situation de
symtrie exceptionnelle) ;
2. un groupe influe sur dautant plus daxes quil est de grande dimensionalit.

Dunod La photocopie non autorise est un dlit

8.3.3 Reprsentation des composantes principales de chaque groupe


Dans lexemple des vins, la premire composante de lAFM (de lensemble des
variables) tait trs corrle avec la premire composante de chaque groupe. Une
tude systmatique des corrlations entre les premires composantes de chaque groupe
apporte des lments intressants pour la comparaison de ces groupes.
Une telle tude peut tre ralise par une ACP des composantes principales de tous
les groupes. Les composantes principales du tableau X j tant les projections du nuage
dindividus sur une base orthonorme, les nuages dindividus dfinis dans lACP
de X j et dans celle du tableau des composantes de X j sont identiques. Mais ceci
condition de conserver les valeurs brutes de ces composantes. Une ACP non norme
des composantes principales des groupes aboutit donc aux mmes composantes quune
ACP de lensemble des variables. Une autre faon de respecter linertie lsj de la
composante de rang s du groupe j consiste normer cette composante et lui affecter
le poids lsj .

182

8 Aspects thoriques et techniques de lAnalyse Factorielle Multiple

Ainsi, pour comparer les composantes principales des groupes, il suffit de les
introduire en lments supplmentaires dans lanalyse du tableau complet. On peut
calculer en outre, situation paradoxale pour un lment supplmentaire, la contribution
(via lindicateur usuel) dune composante dun groupe la construction des axes.
On peut aussi adopter la dmarche inverse : ACP des composantes principales avec
les variables en supplmentaire.

8.3.4 Recherche de facteurs communs aux groupes de variables :


AFM et analyse multicanonique
a) Les analyses canoniques

Cest en ces termes que lanalyse simultane de plusieurs groupes de variables a


t dabord formule. Nous faisons allusion ici au cas de deux tableaux, tudi par
Hotelling en 1936 laide de ce quil appela lanalyse canonique.
Dans cette analyse, on recherche simultanment une combinaison linaire des
variables du premier groupe (note f) et une combinaison linaire des variables
du second groupe (note c) telles que le coefficient de corrlation entre f et c soit
maximum. Ce couple tant trouv, on en recherche un deuxime orthogonal au premier
qui satisfait le mme critre, etc.
De nombreuses gnralisations au cas de J (J > 2) groupes de variables ont t
proposes. Lobjectif est alors de rechercher J combinaisons linaires de variables
(chaque combinaison est dfinie sur un groupe) telles que ces combinaisons soient lies
entre elles le plus possible. Lexistence de plusieurs variantes dAnalyse Canonique
Gnralise (on dit aussi : Analyse Multicanonique) tient en particulier la multiplicit
des faons de dfinir un critre de liaison entre plusieurs variables.
b) LAnalyse Canonique Gnralise de Carroll

Le principe de cette analyse est de chercher dabord des variables lies lensemble
des groupes. Ces variables, qui rsument les tendances gnrales des groupes, sont
appeles variables gnrales. Puis, une variable gnrale tant obtenue, on cherche
dans chaque groupe une combinaison linaire des variables lie cette variable gnrale. Ces combinaisons linaires, qui sont en quelque sorte les reprsentations de la
variable gnrale dans les groupes, sont appeles variables canoniques.
Lun des avantages de cette approche est quil nest pas ncessaire de dfinir une
mesure de liaison entre deux groupes de variables mais entre une variable et un groupe.
Celle utilise par Carroll est le carr du coefficient de corrlation multiple.
Par dfinition, le coefficient de corrlation multiple entre une variable z et un
groupe de variables K j est le coefficient de corrlation entre z et la combinaison
linaire des variables du groupe j la plus corrle z. Gomtriquement, dans R I ,
cette combinaison linaire est la projection orthogonale P j (z) de z sur le sous-espace

8.3 LAFM dans lespace des variables R I

183

E j engendr par les variables du groupe j (cf. Figure 8.7). Ainsi, le coefficient de
corrlation multiple est le cosinus de langle u j entre z et sa projection sur E j .

Ej

Pj (z)

E j : sous-espace engendr par le


groupe K j
P j : projecteur sur E j
cos u j : coefficient de corrlation multiple entre z et K j .

Figure 8.7 Le coefficient de corrlation multiple dans R I .

Si z est une variable norme, on a (en notant u, v le produit scalaire entre les
vecteurs u et v) :
cos2 u j = z, P j (z)
Dans lanalyse multicanonique de CARROLL, on recherche une suite de variables
gnrales z s qui rendent maximum la somme des carrs des coefficients de corrlation
multiple entre z s et les J groupes K j (avec la contrainte dorthogonalit : z s z t si
s = t). Cette quantit scrit :



cos2 u j =
z s , P j (z s ) =z s ,
P j (z s )

Dunod La photocopie non autorise est un dlit

Loprateur S j P j tant une somme doprateurs de projection orthogonale, il est


symtrique, diagonalisable et ses vecteurs propres sont orthogonaux deux deux. Une
suite de vecteurs propres norms de cet oprateur, ordonne par les valeurs propres,
dfinit donc les variables gnrales (cf. section 5.2.4).
La variable canonique du groupe j, associe une variable gnrale z s , est sa
projection P j (z s ) sur le sous-espace E j .
Cette analyse multicanonique est intressante sur le plan thorique car elle donne
un cadre commun plusieurs mthodes danalyse.
1. LACP est une analyse multicanonique de groupes de variables rduits chacun
un lment. Les composantes principales sont les variables gnrales et les
variables canoniques sont confondues avec les variables initiales.
2. LACM est une analyse multicanonique dans laquelle les groupes de variables
sont composs chacun par les indicatrices des classes dune mme variable
qualitative.

184

8 Aspects thoriques et techniques de lAnalyse Factorielle Multiple

Mais la mesure de liaison utilise, le coefficient de corrlation multiple, nest pas sans
inconvnient dans le cas o les variables du groupe sont corrles entre elles. Lorsque
les variables du groupe K j sont lies, le sous-espace E j est instable (cest--dire
sensible de petites variations des variables) et lon peut se trouver confront des
situations paradoxales (cf. Figure 8.8).

Ej
Pj(z)
v1
v2

Figure 8.8 Inadaptation du coefficient de corrlation multiple dans le cas de variables lies. La
variable z est presque orthogonale chacune des variables v1 et v2 du groupe K j . Or, son
coefficient de corrlation multiple avec E j vaut presque 1.

c) Une mesure de liaison entre une variable z et un groupe K j : linertie du


nuage pondr projet sur z

Avec la pondration des groupes, linertie de la projection de N Kj sur une variable z


est toujours comprise entre 0 et 1.
Elle atteint sa valeur maximum 1 lorsque z est dans la direction dinertie maximum
de N Kj , cest--dire lorsque z est confondue avec la premire composante principale
de N Kj . Cette inertie vaut 0 pour toute variable z orthogonale au sous-espace E j , cest-dire non corrle avec chacune des variables du groupe j. Ailleurs, sa valeur est
strictement positive mais, contrairement au coefficient de corrlation multiple, elle
ne dpend pas uniquement de langle u j entre z et E j . Par exemple, dans le cas (cf.
Figure 8.8) o z est proche de E j mais presque orthogonale chacune des variables
du groupe, linertie projete est trs petite tandis que le coefficient de corrlation
multiple est trs grand. On montre facilement lgalit :
Inertie de N Kj sur z = cos 2 u j Inertie de N Kj sur P j (z)
Toutes ces proprits font que cette inertie projete est une bonne mesure de liaison
entre une variable et un groupe de variables. Elle prsente des avantages sur le coefficient de corrlation multiple lorsque les variables du groupe K j sont corrles entre
elles. Elle a la mme valeur que le carr de ce dernier lorsque les variables (normes
et de poids 1) ne sont pas corrles entre elles ; en effet, dans le cas o les variables de
K j sont orthogonales deux deux, linertie de la projection de N Kj vaut 1 dans toutes
les directions de E j .

8.3 LAFM dans lespace des variables R I

185

On dfinit donc une mesure de liaison, note Lg , entre la variable z et le groupe


de variables K j en posant (les variables du groupe K j tant pondres au sens de
lAFM) :
Lg (z, K j ) =

inertie de la projection de vk sur z

k K j

En notant W j = X j M j X j la matrice des produits scalaires entre les individus vus


par K j , cette mesure de liaison scrit aussi :
Lg (z, K j ) =

m k z, vk 2 =z, W j D(z)

kK j

Cette criture met en vidence le fait que la mesure Lg prend en compte le groupe
K j au travers de loprateur W j D et non pas P j comme le fait le coefficient de
corrlation multiple (cf. section b). Cet oprateur caractrise bien le groupe K j (sa diagonalisation permet de reconstituer la forme du nuage N Ij , cf. section 5.4.5 page 120) ;
il est moins sensible que P j de petites variations des donnes.
d) LAFM vue comme une analyse multicanonique particulire

Nous appliquons ici la dmarche propose par CARROLL mais en caractrisant le


groupe K j non plus par le projecteur P j mais par loprateur W j D. LAFM ne diffre
donc de lanalyse de CARROLL que lorsque les variables dun mme groupe sont
corrles entre elles.

Dunod La photocopie non autorise est un dlit

Variables gnrales

Il est souhaitable que les variables gnrales expriment des directions communes
significatives , cest--dire soient proches de directions dinertie importante des
nuages de variables N Kj . Nous cherchons donc une premire variable gnrale z 1 telle
que la somme des liaisons (au sens du paragraphe prcdent) entre z 1 et les J groupes
K j soit maximum. Cette expression scrit :


Lg (z 1 , K j ) =
inertie de la projection de vk sur z 1
jJ

kK

On retrouve exactement lexpression maximise par les composantes principales de X .


Pondration des groupes

Les variables gnrales z s sont obtenues en cherchant rendre maximum la somme de


leurs liaisons avec tous les groupes. Pour que ces groupes jouent un rle analogue, les
liaisons Lg (z s , gr oupej) doivent a priori avoir le mme intervalle de variation pour
tous les groupes. Avec la pondration de lAFM, la liaison entre z s et K j est comprise

8 Aspects thoriques et techniques de lAnalyse Factorielle Multiple

186

entre 0 et 1. Le rle des groupes


 est ainsi quilibr en ce sens que la contribution de
chacun dans le critre global j Lg (z s , K j ) est borne par 1.
Pour chaque groupe K j et chaque variable gnrale z s , la quantit Lg (z s , K j ) sert
daide linterprtation. Elle mesure linertie projete des variables du groupe K j ,
cest--dire :
leur contribution cumule la construction de laxe z s (optique ACP) ;
limportance relative du facteur commun de rang s dans le groupe K j (optique
analyse canonique). Cette importance doit tre compare dune part linertie du
nuage N Kj dans les autres directions et dautre part linertie des autres nuages
pour ce mme facteur.
La convergence des rsultats de lAFM en tant quACP et de lanalyse multicanonique
transparat au niveau des objectifs. En ACP, on cherche notamment des variables qui
rsument lensemble des variables tudies. En introduisant dans lACP les notions
de groupe de variables et dquilibre entre les groupes, on cherche alors aussi rsumer
ces groupes. Tel est bien lobjet des variables gnrales de lanalyse multicanonique.
Variables canoniques

Les variables canoniques expriment dans chaque groupe la direction commune


quest la variable gnrale. En Analyse Canonique classique, un groupe de variables
j est reprsent par le sous-espace E j quil engendre et par loprateur de projection
associ P j ; la variable canonique associe une variable z est son image par P j . En
Analyse Factorielle Multiple, un groupe est caractris par W j D (cf. fin de la section c)
et la variable canonique associe une variable z est son image par W j D. Montrons
que W j D(z) extrait du groupe j une part dinertie plus importante que la projection
P j (z).
De lcriture matricielle de W j D et de P j (applications de R I dans R I ) :
W j D = X j M X j D
Pj

= X j (X j D X j ) 1 X j D

il rsulte immdiatement que W j D = W j D P j .


Soit {lr ; r = 1, K j } une base de vecteurs propres de W j D tris par valeurs
propres dcroissantes (lr  lr+1 ). Si lon exprime P j (z) dans cette base :
P j (z) =

x r lr

alors :
W j D(z) = W j D P j (z) =


r

lr xr lr

8.3 LAFM dans lespace des variables R I

187

Lapplication W j D renforce dautant plus les coordonnes, ici de P j (z), dans la


base des lr quelles correspondent un axe de faible rang. Autrement dit, dans
sa transformation laide de W j D, un vecteur est dabord projet sur E j puis est
rapproch des premires directions propres de W j D. Ainsi W j D(z s ) correspond
une direction de plus grande inertie que P j (z s ) (sauf dans le cas extrme o
P j (z) est colinaire un vecteur propre, auquel cas P j (z) et W j D(z) ont des
directions identiques).
Remarque : On montre aisment que :

r (z, vk )vk
W j D(z) =
kK j

On retrouve ici lexpression de la rgression PLS, une composante, exprimant z en fonction des vk . La convergence entre les deux approches, AFM et
rgression PLS, est remarquable : par rapport aux mthodes de rfrence, analyse canonique et rgression usuelle, dans les deux cas on prend en compte les
variables du groupe K j non pas au travers du seul espace quelles engendrent
mais de leur rpartition dans cet espace.

Dunod La photocopie non autorise est un dlit

e) Reprsentation des individus

Les variables gnrales permettent la reprsentation dune structure moyenne des


individus. Cette reprsentation concide avec celle du nuage moyen propos dans R K .
Nous montrons ci-dessous que les variables canoniques du paragraphe prcdent
concident, la norme prs, avec les projections des N Ij dans la reprsentation simultane.
Soit u s laxe dinertie dordre s du nuage dindividus N I associ au tableau X dans
R K . Il se dduit de la composante principale Fs par la relation : u s = (1/ls )X  D Fs
dans laquelle ls est la valeur propre de W D associe Fs (W = S j W j ).
La projection de N Ij sur u s scrit :




Fsj = X j Mu s = 1/ls X j M X  D Fs = 1/ls W j D Fs
Cette convergence des rsultats montre bien que les deux approches, a priori trs
diffrentes (reprsentation superpose et analyse canonique), constituent en fait deux
formalisations diffrentes dune mme problmatique. En effet, la reprsentation
superpose des nuages N Ij est lie lexistence de facteurs communs : cest l un autre
point de vue sur lintrt dune reprsentation simultane dj abord section 8.2.5.

8.3.5 Aides linterprtation


Pour juger du caractre vritablement commun (aux groupes de variables) de Fs , loptique reprsentation superpose des N Ij conduit calculer un rapport dinertie.

188

8 Aspects thoriques et techniques de lAnalyse Factorielle Multiple

Loptique analyse canonique suggre, quant elle, dvaluer le degr de ressemblance entre Fs et chaque Fsj au moyen du coefficient de corrlation entre Fs et Fsj .
Ce coefficient peut avoir une valeur leve pour lensemble des groupes, pour certains
dentre eux ou mme pour un seul. En ce sens, lAFM permet de mettre en vidence les
facteurs communs lensemble des groupes, les facteurs communs certains groupes
et les facteurs spcifiques dun groupe (cf. exemple section 7.1.6 page 159). Lors de
linterprtation, on distingue :
1. le coefficient de corrlation entre Fs et Fsj , qui indique dans quelle mesure le
facteur commun Fs est effectivement prsent dans le groupe K j ;
2. la mesure de liaison Lg (z s , K j ), qui indique limportance relative dans le groupe
K j du facteur commun de rang s.
ces aides spcifiques, sajoutent les aides linterprtation usuelles : qualit de
reprsentation dune variable par un axe et contribution dune variable la construction
dun axe.

8.4 LAFM DANS LESPACE DES GROUPES DE VARIABLES RI

Dans ltude de plusieurs groupes de variables, lun des objectifs est de comparer
globalement les groupes. Dans lexemple des vins, la parent entre les deux olfactions a
pu tre mise en vidence laide dun graphique sur lequel les groupes sont reprsents
chacun par un point.
2
Nous introduisons ici lespace R I , base de cette reprsentation qui peut apparatre
comme une aide linterprtation de lACP du tableau complet X (cest ainsi quelle
a t introduite dans lexemple des vins) mais qui possde sa propre optimalit.

8.4.1 Le nuage NJ des groupes de variables


Pour tudier lensemble des groupes, nous construisons, comme pour les individus
et les variables, un nuage de points, not N J , dans un espace euclidien. Nous avons
dj prsent laptitude de loprateur W j D reprsenter le groupe de variables K j ;
en particulier, nous avons insist sur les avantages de ce choix par rapport celui du
sous-espace E j . Largument essentiel est que W j D permet, par sa diagonalisation, une
reconstitution parfaite de la structure du nuage N Ij des individus dfini par le groupe
K j . En tant quensemble de I 2 scalaires, la matrice W j D peut tre considre comme
2
un lment dun espace vectoriel de dimension I 2 not R I . Un groupe j est reprsent
2
dans R I par la matrice W j D. Cet espace est muni du produit scalaire classique, qui
scrit pour les lments W j D et Wl D :

W j D, Wl D =
pi pi  W j (i, i  )Wl (i, i  ) = trace(W j DWl D)
i

i

8.4 LAFM dans lespace des groupes de variables R I

189

8.4.2 Influence de la pondration des groupes sur le nuage NJ


2

La norme, dans R I , de W j D scrit :


2

W j D =

(lsj )2

s
2

La pondration des variables du groupe j par 1/l1j se traduit dans R I par une homothtie des vecteurs reprsentant les groupes. Aprs cette pondration, la norme du
vecteur W j D reprsentant le groupe j nest pas gale 1 mais dpend de la structure
du groupe : cette norme est dautant plus grande que cette structure est multidimensionnelle (cest--dire quil existe de nombreux facteurs dimportance comparable
celle du premier dentre eux). Ainsi, elle constitue un indicateur de dimensionalit
dun nuage.
strictement parler, la dimensionalit dun nuage est gale au nombre de directions
orthogonales dinertie non nulle, soit le nombre de valeurs propres non nulles. En
pratique, il ny a pas lieu de distinguer une valeur propre trs faible dune valeur
propre nulle. Cest ce que ralise, sa manire, la norme de W j D aprs pondration
par lAFM. Cet indicateur, not alors N2g , peut donc finalement scrire, en faisant
apparatre explicitement la pondration de lAFM :
 2

lsj
2
N2g (K j ) = W j D =
l1j
s

Dunod La photocopie non autorise est un dlit

8.4.3 Interprtation du produit scalaire entre deux groupes


Le nuage N J des groupes sapparente plus un nuage de variables qu un nuage dindividus car le produit scalaire entre les vecteurs reprsentant deux groupes sinterprte
comme une mesure de liaison entre ces groupes.
tudions dabord le cas le plus simple o les deux groupes sont composs dune
seule variable, puis le cas o un seul des deux groupes est unidimensionnel et enfin le
cas o les deux groupes sont multidimensionnels.
a) Les deux groupes comprennent chacun une seule variable

La pondration par 1/l1j donne le poids 1 une variable centre rduite qui constitue
2
elle seule un groupe. ce groupe dune seule variable, correspond un lment de R I
dit lment de rang 1 (il est associ une matrice symtrique de rang 1). Lcriture
suivante fait apparatre, dans le cas gnral, W j en tant que somme dlments de rang
1 (en notant vk une variable, de poids m k , du groupe j) :

vk m k vk
Wj =
k

190

8 Aspects thoriques et techniques de lAnalyse Factorielle Multiple

Soit z et v deux variables centres rduites de poids 1 constituant chacune un groupe.


2
Les lments de R I associs ces groupes ont chacun pour norme 1 et leur produit
scalaire est le carr du coefficient de corrlation entre z et v ( pi : poids de lindividu i).
zz  D, vv  D =



pi pi  z(i)z(i  )v(i)v(i  ) =




i

2
pi z(i)v(i)

= inertie de la projection de v sur z


= [r(v, z)]2
b) Un groupe dune variable et un groupe multidimensionnel

Notons z la variable (rduite et de poids 1) du groupe K 1 rduit un seul lment et


vk les variables (rduites et de poids m k ) du groupe K 2 . Alors :


W1 D, W2 D = z z  D,
vk m k vk D =
m k z z  D, vk vk D
=

(inertie de la projection de vk sur z)

= Lg (z, K 2 )
On retrouve ici la mesure de liaison Lg entre une variable et un groupe de variables
(cf. section c). Cette concidence fait que les choix, de Lg dune part et de la mtrique
2
dans R I dautre part, se renforcent mutuellement.
c) Les deux groupes sont multidimensionnels

Notons zl les variables (rduites et de poids m l ) du groupe K 1 et vk les variables


(rduites et de poids m k ) du groupe K 2 . Alors :
 

W1 D, W2 D =
ml
m k zl zl D, vk vk D =
m l Lg (zl , K 2 )
l

m k Lg (vk , K 1 )

Cette quantit vaut 0 lorsque toutes les variables dun groupe sont orthogonales
toutes les variables de lautre groupe. Elle est dautant plus grande que chacune des
variables dun groupe est plus lie lensemble des variables de lautre groupe. Elle
constitue un indice de liaison gnral entre groupes de variables, qui exprime en
quelque sorte le nombre de dimensions communes (aux deux groupes) dinertie
comparable linertie axiale maximum dun groupe . Do lide de gnraliser la

8.4 LAFM dans lespace des groupes de variables R I

191

premire dfinition de Lg deux groupes quelconques de variables ; soit, en faisant


apparatre explicitement la pondration de lAFM :
Lg (K 1 , K 2 ) = 

W1 D W2 D
, 2 
l11
l1

d) Lg et RV

Lindicateur classique de liaison entre deux groupes de variables est le coefficient RV ;


il peut tre dfini par :
RV(K 1 , K 2 ) = 

W1 D
W2 D
,

W1 D W2 D

Cette dfinition fait bien apparatre les W j D norms au sens usuel (de longueur 1) : le
2
coefficient RV sinterprte dans R I comme un cosinus. Etant toujours positif, il varie
entre 0 et 1, valeur atteinte lorsque les nuages dindividus associs aux deux groupes
sont homothtiques (en comparaison, la mesure Lg entre deux nuages homothtiques
est dautant plus grande que ces groupes ont une dimensionalit leve). Un exemple
dinterprtation conjointe de RV et Lg se trouve en section 9.2.1 page 211.

8.4.4 tude du nuage des groupes de variables


a) Reprsentation des groupes en tant quaide linterprtation de lACP

Dans lexemple des vins, nous avons propos un graphique dans lequel :

Dunod La photocopie non autorise est un dlit

1. chaque axe reprsente un facteur de lACP pondre du tableau complet X ;


2. chaque groupe est reprsent par un point. La coordonne du groupe K j le long
dun axe est gale linertie projete (calcule dans R I ) des variables du groupe
K j le long de laxe correspondant.
2

Lespace R I fournit une interprtation gomtrique ce graphique (cf. Figure 8.9).


En effet, considrons le groupe form par la variable dfinie par laxe z de R I : sa
2
reprsentation dans R I est loprateur de rang 1 : Wz D = zz  D. Linertie projete
des variables du groupe K j sur z est gale au produit scalaire entre W j D et zz  D,
cest--dire la projection de W j D sur zz  D.
En outre, si dans R I deux vecteurs sont orthogonaux, alors les vecteurs associs
2
dans R I le sont aussi. Il en rsulte que la reprsentation graphique des groupes de
variables peut tre interprte comme une projection du nuage N J sur une suite daxes
orthogonaux.

8 Aspects thoriques et techniques de lAnalyse Factorielle Multiple

192

NK

Wj D

coordonne

inertie projete

Espace RI

zz'D

Espace RI

Figure 8.9 La reprsentation des groupes vue comme une aide linterprtation de lACP
2
pondre. Au groupe de variables j, on associe le nuage N Kj dans R I et le vecteur W j D de R I . Au
j
I
I2

I
vecteur z de R , on associe dans R le vecteur zz D. Linertie projete de N K sur z dans R est
gale la longueur de la projection de W j D sur zz  D.

b) Reprsentation des groupes en tant quimage optimale du nuage N J

Nous montrons ici que le graphique prcdent peut tre obtenu directement en cherchant une reprsentation optimale de N J .
Le produit scalaire entre W j D et Wl D est une mesure de liaison entre les groupes
de variables j et l. Pour comparer globalement les groupes, nous cherchons dcrire
les proximits entre les W j D en les projetant sur un espace de faible dimension de
2
R I . Les angles entre les W j D doivent tre bien reprsents et il ne convient pas de
centrer le nuage N J .
En exigeant uniquement une bonne qualit de reprsentation (au sens de linertie
projete) des W j D, on est conduit une projection du nuage N J sur ses axes dinertie,
analogue celle du nuage des variables de lACP. Linconvnient de ce type danalyse
est de fournir un repre constitu daxes difficilement interprtables car un axe quel2
conque de R I ne sexprime pas clairement en fonction des donnes. Cest pourquoi,
en AFM, on impose aux axes du repre dtre des lments symtriques de rang 1.
Ces lments, de la forme z s z s D, sont associs des groupes dune seule variable z s
et sinterprtent partir de z s et de ses liaisons avec les variables initiales.
2
Nous cherchons donc un repre orthonorm dans R I dont chaque composant est
de la forme zz  D et qui ajuste au mieux le nuage des W j D. Nous construisons
ce repre progressivement en cherchant dabord un premier vecteur, puis un second
orthogonal au premier et ainsi de suite.
Usuellement, on utilise le critre dajustement des moindres carrs, selon lequel on
rend maximum la somme des carrs des projections des vecteurs du nuage. En AFM,
du fait de la contrainte impose aux vecteurs de base du repre, cest la somme des
projections et non de leurs carrs qui est maximise.

8.4 LAFM dans lespace des groupes de variables R I

193

Ce critre est plus facile mettre en uvre que celui des moindres carrs (souvent
choisi pour les facilits de calcul quil implique) et possde une signification puisque
les coordonnes des W j D sur des lments de type z s z s D sont toujours positives. En
effet, la somme des projections des W j D sur z s z s D, qui scrit :

W j D, z s z s D
j

est gale linertie dans R I des variables (de tous les groupes) projetes sur z s .
La suite orthonorme dlments symtriques de rang 1 qui maximisent cette somme
est celle qui est associe aux composantes principales du tableau X , lorthonormalit
2
des z s dans R I tant quivalente celle des z s z s D dans R I . Les calculs ncessits
2
par lanalyse dans R I se dduisent directement des rsultats de lACP de X : les z s
sont les composantes principales normes de X et la coordonne de W j D sur z s z s D
est la contribution du groupe j linertie de la composante z s .
c) Interprtation de la reprsentation des groupes

La reprsentation des groupes en AFM peut tre vue la fois comme une aide
linterprtation des autres graphiques et comme une image du nuage des groupes
optimale en elle-mme. La coordonne de W j D sur laxe factoriel z s z s D sinterprte
comme :
1. linertie de la projection du nuage N Kj , dfini par le groupe j dans R I sur la
composante principale z s du tableau X ; cest la contribution (absolue, cest-dire non exprime en %) du groupe j laxe s ;
2. une mesure de liaison (Lg ) entre le groupe j et la composante z s de lAFM ;
2

Dunod La photocopie non autorise est un dlit

3. la projection du groupe j dans lespace R I .


Du fait de la pondration des groupes, les coordonnes des W j D sont comprises entre
0 et 1 (sur un plan, W j D est toujours situ dans un carr de ct 1 ; cf. exemple
figure 7.6 page 162). Un groupe j, selon la rpartition de linertie des nuages associs
N Ij et N Kj , peut avoir plusieurs coordonnes proches de 1.
En tant quinertie projete du groupe, la coordonne mesure limportance du groupe
dans la dtermination de la composante. Du fait de la pondration qui rend gale
1 linertie maximum de la projection sur un axe du nuage associ N Kj au groupe
j, une coordonne de W j D sur z s z s D voisine de 1 implique que la direction z s est
une direction dinertie importante pour le nuage N Kj . A contrario, une trs faible
coordonne de W j D sur z s z s D indique que z s est une direction de trs faible inertie
pour N Kj . Cette dernire situation recle une ambigut qui peut tre leve en consultant
le coefficient de corrlation entre Fs et Fsj (cf. section 8.3.5).
En tant que projection sur un sous-espace, la reprsentation des groupes saccompagne des aides linterprtation usuelles. Du fait de la contrainte sur les axes du

194

8 Aspects thoriques et techniques de lAnalyse Factorielle Multiple

repre (lments symtriques de rang 1), la qualit de reprsentation des W j D par ces
axes (mesure au travers du critre usuel : inertie projete/inertie totale) natteint en
gnral pas 1, mme si lon augmente le nombre daxes (qui atteint au plus I alors
que la dimension de lespace est I 2 .
AFM et mthode Statis. Le cur de la mthode Statis est une analyse factorielle
du nuage N J , les W j D tant pralablement norms au sens usuel. Elle fournit une
reprsentation (gnralement) plane des W j D, optimale du point de vue de linertie
projete mais dont les dimensions, ntant pas des lments de rang 1, ne sont pas
interprtables.
Enfin, la reprsentation de N J fournie par lAFM peut aussi tre interprte dans le
cadre du modle INDSCAL (cf. 8.6).

8.5 AFM ET MODLE INDSCAL


Lapproche du modle INDSCAL est diffrente des prcdentes : un modle est propos dont il faut estimer les paramtres. Le modle INDSCAL (Analysis of Individual
Differences in Multidimensional Scaling), d Carroll et Chang, a t dvelopp
partir de besoins exprims par la psychomtrie pour dcrire la situation o plusieurs
personnes (appeles juges) dcrivent leur perception des proximits dun ensemble
dobjets au moyen dune matrice de similarits ou de distances. Il sapplique donc
des donnes plus gnrales que les ntres : matrices de distances entre objets ou
matrices de similarits. Les donnes auxquelles nous nous intressons peuvent tre
vues au travers du modle INDSCAL puisque chaque groupe de variables dfinit une
matrice de distances entre les individus ou objets.
Selon ce modle, les distances entre individus peuvent se dcomposer suivant un
certain nombre de facteurs communs tous les groupes, le poids affect chaque
facteur diffrant suivant les groupes. Plus prcisment, en notant :
1. z s (i) la valeur du s e facteur pour lindividu i (s = 1, ..., S) ;
2. qsj le poids affect z s par le j e groupe ;
3. d j (i, l) la distance entre les individus i et l induite par le j e groupe ;
ce modle scrit : d 2j (i, l) =

S


qsj [z s (i) z s (l)]

s=1

Remarquons enfin que, dans ce modle, tous les individus ont le mme poids. Mme
si lAFM suggre une gnralisation en affectant des poids quelconques aux individus,
nous restons conformes ici au modle original.

8.5 AFM et modle INDSCAL

195

8.5.1 Interprtation du modle INDSCAL dans RK


Lorsque les donnes vrifient exactement le modle INDSCAL, ce dernier exprime
une dcomposition de chacun des nuages N Ij suivant S projections axiales qsj z s homothtiques aux z s .
Les donnes ne vrifient jamais exactement le modle. Les paramtres (facteurs
et poids) doivent tre calculs par un algorithme satisfaisant un critre dajustement
(plusieurs critres sont possibles).
Dans ce cadre, un facteur est une image de dimension 1 des individus telle quil
existe une direction de chaque N Ij presque homothtique ce facteur. Il reprsente
une direction presque commune aux nuages N Ij .
Lajustement du modle INDSCAL dans R K se prsente comme la recherche dune
suite de directions de R K telle que, pour chacune, les projections des nuages N Ij
soient le plus homothtique possible. Cette prsentation est trs proche de celle de la
reprsentation superpose des N Ij de lAFM (cf. la condition C2 de la section 8.2.5).

8.5.2 Interprtation du modle INDSCAL dans RI


En raison de la dualit entre ces deux nuages, une question concernant les nuages des
individus dans R K peut tre traduite propos du nuage des variables dans R I .
Les facteurs du modle INDSCAL sont des lments de R I . Le s e facteur du groupe
j peut tre not Fsj par analogie aux variables canoniques. En effet, la problmatique
du modle INDSCAL est analogue celle de lanalyse multicanonique : on recherche,
au rang s, un ensemble {Fsj ; j = 1, J } de facteurs se ressemblant entre eux. Dans le
cas du modle INDSCAL, la contrainte impose aux Fsj est trs stricte :

Dunod La photocopie non autorise est un dlit

Fsj = qsj Fs
Lestimation des paramtres du modle est oriente principalement sur le facteur
commun Fs . Cette dmarche est celle de lanalyse multicanonique au sens de Carroll.

8.5.3 Interprtation du modle INDSCAL dans RI

la dcomposition des distances dans le modle INDSCAL


d 2j (i, l) =

qsj [z s (i) z s (l)]2

correspond celle des produits scalaires :


W j (i, l) = i, l j =


s

qsj z s (i)z s (l)

196

8 Aspects thoriques et techniques de lAnalyse Factorielle Multiple

Wj

RI

z2 z'2

q2j

q1j

z1 z'1
2

Figure 8.10 Interprtation gomtrique du modle INDSCAL dans R I . Selon ce modle, la


matrice W j des produits scalaires entre individus induite par le groupe j est une somme dlments
symtriques de rang 1.

Soit, matriciellement :
Wj =

qsj z s z s

s
2

Cette formule, traduite dans R I , exprime que les W j sont dcomposs sur un mme
repre form dlments symtriques de rang 1. Le poids qsj est la coordonne de
W j sur llment z s z s de ce repre. Chercher des paramtres z s et qsj qui ajustent le
2
modle revient chercher dans R I une suite orthogonale de vecteurs, reprsentant
chacun une matrice symtrique de rang 1, qui ajuste le nuage des W j (cf. Figure 8.10).

8.5.4 Estimation des paramtres du modle INDSCAL par lAFM


2

Linterprtation du modle INDSCAL dans R I et le calcul des paramtres qui en


dcoule conduisent exactement lajustement du nuage N J tel quil est ralis dans
lAFM. Il en rsulte que cet ajustement fournit une estimation des paramtres du
modle INDSCAL. Compare aux mthodes destimation usuelles (correspondant aux
programmes INDSCAL et SINDSCAL), lAFM prsente les avantages suivants.
1. Pour tout ( j, s) : 0  qsj  1. Les poids sont toujours interprtables et mme
comparables dun groupe lautre, dun axe lautre, dune analyse lautre. Il
en rsulte, entre autres, que la quantit S j qsj mesure limportance du facteur de
rang s.
2. Lorsque les donnes vrifient parfaitement le modle, lAFM donne systmatiquement la bonne solution et hirarchise les facteurs par ordre dimportance
dcroissante (au sens de la somme des poids). En effet, si les nuages N Ij correspondent au modle, alors le nuage moyen N I le vrifie aussi.

8.6 Cas des variables qualitatives et des tableaux mixtes

197

3. Lalgorithme qui fournit lestimation est une diagonalisation et ne pose aucun


problme de convergence.
4. Linterprtation de lestimation comme une projection permet dintroduire trs
simplement des groupes de variables supplmentaires.
5. Cette estimation est incluse dans une analyse complte : les rsultats associs
aux autres points de vue de lAFM peuvent tre utiliss comme des aides
linterprtation en permettant en particulier des mesures, facteur par facteur et
nuage par nuage, de lapproximation donne par le modle. Rciproquement,
lestimation des paramtres du modle INDSCAL peut jouer le rle daide
linterprtation des autres rsultats.

Dunod La photocopie non autorise est un dlit

8.5.5 Cas des tableaux de distances et de similarits (AFMTD)


Lorsque lon souhaite tudier au travers du modle INDSCAL des donnes recueillies
sous la forme de tableaux de distances, lAFM ne sapplique quindirectement.
chaque tableau de distances, on peut associer un tableau de type individusvariables
en lui appliquant une Analyse Factorielle sur Tableau de Distances (cf. section 5.4.5
page 120) : les variables dans ce nouveau tableau sont les facteurs de son AFTD. Les
tableaux ainsi obtenus peuvent tre juxtaposs et lensemble soumis une AFM dans
laquelle chaque groupe comprend les facteurs issus dun mme tableau de distances.
Si les distances sont des distances euclidiennes et si, de plus, on considre tous
2
les facteurs, lAFM analyse dans R I les matrices de produits scalaires qui correspondent exactement aux distances initiales. En revanche, si les distances ne sont pas
euclidiennes, on ne conserve que les facteurs associs aux valeurs propres positives
(cf. section 5.4.5) ; lAFM analyse alors des approximations euclidiennes des donnes.
Les tableaux de similarits peuvent tre traits de la mme faon en les transformant
pralablement en tableaux de distances.
Cette mthodologie, AFTD par tableau de distances puis AFM sur les facteurs
associs aux valeurs propres positives des AFTD, est appele AFM sur tableaux de
distances (AFMTD).

8.6 CAS DES VARIABLES QUALITATIVES ET DES TABLEAUX


MIXTES
La problmatique analyse dans le cas de variables quantitatives stend sans modification fondamentale aux variables qualitatives : quilibre entre les groupes, recherche
de facteurs communs, comparaison globale des groupes, construction dune reprsentation superpose, etc. Nous montrons dans cette section que lAFM sapplique aux
tableaux disjonctifs complets dans lesquels les variables sont structures en groupes.

198

8 Aspects thoriques et techniques de lAnalyse Factorielle Multiple

Lessentiel de la dmonstration rside dans lquivalence entre lACM dune part


et lACP applique aux variables indicatrices pondres de manire adquate dautre
part.
Le fait quune mme technique, lAFM, sapplique aussi bien des variables quantitatives que qualitatives, suggre son tour le traitement simultan de variables des
deux types (le tableau des donnes est dit alors mixte ). Ce type de tableau est trs
rpandu : son analyse pose un certain nombre de problmes inhrents la diffrence
de nature entre les objets que lon souhaite tudier simultanment. Il a dj t trait
lorsque seules les variables quantitatives sont actives (ACP, cf. 1.10 page 27), lorsque
seules les variables qualitatives sont actives (ACM cf. section 4.5 page 101) ou lorsque
les deux le sont mais sans structure de groupes (AFDM, cf. section 4.6 page 104).

8.6.1 quivalence entre ACM et ACP pondre des indicatrices


Les rsultats de lACM peuvent tre obtenus partir dune ACP norme des variables
indicatrices (cest--dire du TDC), condition dassocier celles-ci des poids adquats.
Largumentation sopre en trois temps, dtaills dans les paragraphes suivants.
1. Mise en avant de deux proprits du nuage des modalits en ACM. A ce niveau,
le nuage est considr par rapport lorigine (et non par rapport son centre de
gravit).
2. Construction dun nuage des indicatrices de modalits, ayant les mmes proprits inertielles que le nuage des modalits en ACM, en vue de son traitement par
ACP norme. ce niveau, les indicatrices ne sont pas centres.
3. quivalence entre les oprations de centrage de lACM et de lACP lorsquelles
seffectuent sur les nuages dfinis prcdemment.
a) Proprits des modalits en ACM

Du fait de la transformation des colonnes en profils, de la mtrique dans R I (proportionnelle la mtrique identit) et des poids des lments, les modalits en ACM
possdent les proprits suivantes lorsquon les considre par rapport lorigine :
1. les modalits dune mme variable sont orthogonales entre elles ; la transformation en profil ne change pas leur direction ;
2. chaque modalit possde la mme inertie par rapport lorigine (Ik : nombre
dindividus possdant la modalit k ; xik = 0 ou 1) :
 2
xik
1
Ik 
I
=
Inertie de k par rapport O =
i
IJ
Ik
J

8.6 Cas des variables qualitatives et des tableaux mixtes

199

b) Pondration des indicatrices en vue dun traitement par ACP norme

Considrons, dans R I , le nuage des indicatrices non centres mais divises par leur
cart-type. Si lon affecte chaque indicatrice k le poids (I Ik )/I , alors le nuage
ainsi dfini possde les mmes proprits inertielles que celui analys en ACM (cf.
paragraphe prcdent). Soit :
1. la mtrique de lespace R I est aussi la mtrique identit au facteur 1/I prs ;
2. la direction des indicatrices nest pas modifie par la division par lcart-type (de
mme quen ACM, elle nest pas modifie par la transformation en profil) ;
3. chaque indicatrice possde la mme inertie par rapport lorigine :


I Ik  1
Ik (I Ik )
Inertie de k par rapport O =
xik /
=1
i I
I
I2
c) quivalence entre les deux centrages

En ACP, le centrage des variables sinterprte dans lespace R I comme une projection
du nuage des variables sur lhyperplan orthogonal la premire bissectrice.
En ACM, vue comme une AFC applique un TDC, le nuage des indicatrices est
centr en un autre sens : lorigine est place au centre de gravit G K du nuage N K .
Or, en ACM, le nuage N K des modalits prsente les proprits suivantes :
1. le centre de gravit G K est situ sur la premire bissectrice (la marge sur les
lignes est constante) ;

Dunod La photocopie non autorise est un dlit

2. le nuage N K est contenu dans un hyperplan orthogonal la premire bissectrice.


Il en rsulte que, appliqu ce nuage des modalits, le centrage en ACM sinterprte
comme en ACP : une projection sur lhyperplan orthogonal la premire bissectrice.
En conclusion, une ACP norme des indicatrices pondres conduit aux mmes
facteurs sur I quune ACM (les inerties des facteurs des deux analyses sont gales, au
coefficient J prs).

8.6.2 Variables qualitatives et tableaux mixtes en AFM


a) Principe gnral

De lquivalence prcdente, il rsulte que lon peut appliquer des mthodes factorielles construites pour des variables quantitatives des variables qualitatives
condition de faire intervenir ces dernires laide de leurs indicatrices pondres
de faon adquate. Dans cet esprit, lAFM peut traiter des tableaux dindicatrices
pondres : il est ainsi possible dtendre aux variables qualitatives la mthodologie
lie aux groupes de variables propose initialement pour les variables quantitatives.

200

8 Aspects thoriques et techniques de lAnalyse Factorielle Multiple

Cette extension du champ dapplication de lAFM est renforce par le rsultat


suivant. Sur un ensemble de variables qualitatives, il est quivalent de raliser :
1. une ACM ;
2. une AFM dans laquelle chaque groupe est constitu par lensemble des indicatrices associes une mme variable.
Ce rsultat sobtient en montrant que, lorsquon applique lAFM un ensemble dindicatrices pralablement pondres comme indiqu en section 8.6.1, les coefficients de
pondration spcifiques de lAFM (inverses des premires valeurs propres de chacun
des groupes) sont tous gaux 1.
En effet, le nuage des indicatrices associes une mme variable possde une
inertie de 1 dans toutes les directions du sous-espace quelles engendrent. Cela se
montre directement lorsquon se place avant le centrage : les indicatrices sont deux
deux orthogonales et linertie de chacune vaut 1. Ce rsultat est conserv aprs le
centrage puisque, au niveau du sous-espace engendr par les modalits dune mme
variable, cette opration ne fait que retirer une dimension (i.e. la premire bissectrice)
au sous-espace prcdent.
Il en rsulte que les valeurs propres des ACP de chacun des groupes sont toutes
gales 1. Sur un tel tableau, lAFM conduit alors aux mmes facteurs que lACP
et est donc quivalente une ACM (au coefficient J prs pour les valeurs propres,
celles-ci tant la moyenne des rapports de corrlation en ACM cf. 4.3.6 page 96
et leur somme en AFM).
Linertie du nuage des indicatrices dune mme variable j valant 1 dans toutes les
directions du nuage quelles engendrent, loprateur W j D est gal au projecteur P j et
lAFM dans ce cas (et donc aussi lACM) se confond avec une analyse multicanonique.
La reprsentation des groupes de lAFM correspond alors celle des variables
en ACM propose en section 4.3.7 page 98. puisque la contribution dune variable
qualitative un axe est son rapport de corrlation avec cet axe.
En ce sens, lAFM gnralise lACM et est susceptible de traiter des variables
qualitatives. Elle apporte une solution technique pour aborder la problmatique associe ltude simultane de plusieurs groupes de variables lorsque ces dernires sont
qualitatives.
De faon analogue, lAFM gnralise lACP : si chaque groupe est rduit une
seule variable quantitative, lAFM est quivalente une ACP norme. La mme
technique qui sapplique des variables qualitatives ou des variables quantitatives
sapplique donc aussi un mlange des deux condition de rsoudre le problme de
leurs pondrations respectives. Or la pondration de lAFM, qui quilibre linertie et
donc linfluence a priori des groupes, limine les dsquilibres ventuels entre groupes
induits aussi bien par des diffrences de structure que par des diffrences de types de
variables. Cet quilibre peut tre vu au travers du critre optimis par la composante

8.6 Cas des variables qualitatives et des tableaux mixtes

201

z s de lAFM, crit ci-aprs dans le cas de deux groupes, le premier comportant K


variables quantitatives vk et le second Q variables qualitatives Vq .
1  2
1  2
r
(z
,
k)
+
h (z s , Vq )
s
l11 kK
Ql21 qQ
avec l11 , la premire valeur propre de lACP du groupe 1, l21 la premire valeur propre
de lACM du groupe 2.
Lcriture des inerties via les coefficients et rapports de corrlation montre, comme
en AFDM, lquilibre entre les deux types de variables ; les valeurs propres des
analyses spares assurent lquilibre entre les groupes (comme dans toute AFM). Il
est clair que si chaque groupe est rduit une seule variable, quantitative ou qualitative,
lAFM est quivalente une AFDM. Cette nouvelle quivalence suggre son tour la
possibilit de traiter des groupes de variables mixtes, dont lanalyse spare est une
AFDM. LAFM permet ainsi de traiter simultanment en actif des groupes quantitatifs,
qualitatifs ou mixtes.

Dunod La photocopie non autorise est un dlit

b) Reprsentation des modalits en AFM

Remarquons que, dans une ACP norme des indicatrices, les projections des colonnes
sont les corrlations entre les indicatrices et les facteurs sur I . Elles ne reprsentent
pas, comme en ACM, les centres de gravit des classes dindividus dfinies par les
modalits.
Cette dernire reprsentation tant essentielle dans les interprtations, il est ncessaire de lajouter. En pratique, seule cette reprsentation des modalits, en tant que
centre de gravit dindividus, est utilise, parce quelle est habituelle (cf. ACM) mais
aussi parce quelle sintgre dans la reprsentation superpose. En effet on peut calculer le centre de gravit dun ensemble dindividus vus par lensemble des variables
mais aussi par chacun des groupes (cf. Figure 7.9 page 168).
Cette dernire reprsentation est trs importante car elle permet lAFM daborder des fichiers denqute assez volumineux dans lesquels les individus ne sont pas
intressants en eux-mmes mais uniquement au travers des modalits quils possdent.
La projection de ces centres de gravit est accompagne des aides linterprtation
usuelles en particulier la contribution linertie de chaque facteur. La somme de ces
contributions, pour les modalits dune mme variable, est gale au carr du rapport
de corrlation entre la variable et le facteur Fs .
c) Donnes manquantes et modalits de faible poids

En ACM, les modalits de trs faible effectif sont souvent une source de perturbation
des rsultats. En outre, le problme des donnes manquantes se pose, l comme dans
tout traitement de donnes. En effet, la construction dune modalit supplmentaire

202

8 Aspects thoriques et techniques de lAnalyse Factorielle Multiple

donne manquante, outre le fait quelle conduit frquemment des modalits de


faible effectif, nest vritablement satisfaisante que si la donne manquante possde
une signification, comme cest souvent le cas des non-rponses volontaires dans les
enqutes dopinion.
Pour rsoudre ce problme, nous avons indiqu en section 6.3.2 page 131 une
mthode drive de lACM qui en amliore les possibilits en prsence de donnes
manquantes et de modalits de faible poids. Elle traite des tableaux disjonctifs incomplets dans lesquels les donnes manquantes sont codes par des zros et les modalits
rares supprimes. La marge de ces tableaux, contrairement aux tableaux disjonctifs
complets, nest pas constante. Or la plupart des proprits intressantes de lanalyse
des tableaux disjonctifs complets sont lies cette marge constante. Le principe de
cette variante de lACM est de remplacer la marge du tableau incomplet par une marge
constante, partout o elle intervient (en particulier dans les poids des individus et donc
dans la mtrique dans R I ).
Lorsquil y a des donnes manquantes, il est possible dappliquer une ACP pondre
sur le tableau incomplet dindicatrices. On montre que cette ACP, et par consquent
lAFM, est quivalente la variante de lACM esquisse ci-dessus (linertie du nuage
des colonnes et la mtrique de lespace sont identiques entre ces deux analyses).

8.7 ELMENTS SUPPLMENTAIRES


8.7.1 Individus supplmentaires
Comme dans toute ACP ou toute ACM, des individus peuvent intervenir en tant qulments supplmentaires dans une AFM, cest--dire avec un poids nul. Ces individus
ninfluent pas sur les reprsentations des individus actifs : on calcule simplement la
projection de leur reprsentant dans le nuage N I et dans les diffrents nuages N Ij .
Ds que le nombre dindividus est assez grand, la lecture des graphiques des reprsentations simultanes est trs complexe. En effet, le nombre des seuls points concernant les individus est gal I (J + 1), soit le nombre dindividus multipli par le
nombre de groupes de variables augment de 1 (pour le nuage moyen). La lecture
des aides linterprtation facilite beaucoup le dpouillement. Mais il reste souvent
ncessaire de remplacer ltude de chaque individu par ltude de classes dindividus
ayant un caractre commun. Pour cela, on introduit en lments supplmentaires les
centres de gravit de ces classes.

8.7.2 Groupes de variables supplmentaires


Un groupe de variables peut tre mis en lment supplmentaire. Si ce groupe est
homogne, il peut tre intressant de le comparer aux autres groupes avec tous les
moyens mis en uvre pour ces derniers sans quil ait influ sur le nuage moyen et les

8.8 Mise en uvre de lAnalyse Factorielle Multiple

203

rsultats de lanalyse. La plupart des calculs (mais pas tous) effectus sur les groupes
principaux sappliquent un groupe supplmentaire :
1. normalisation du nuage N Kj : pour comparer aux autres nuages le nuage associ
un groupe supplmentaire, il faut le normaliser de la mme faon en surpondrant les variables du groupe par linverse de la premire valeur propre de son
analyse spare ;
2. projection des composantes principales du groupe : elle permet de comparer la
forme gnrale du nuage N Kj avec celle du nuage moyen N K et celles des nuages
associs aux autres groupes de variables ;

Dunod La photocopie non autorise est un dlit

3. projection des W j D : la prsence dlments supplmentaires dans lanalyse


2
du nuage N J dans R I ne pose pas de problme particulier. La coordonne dun
lment supplmentaire W j D sur laxe de rang s concide avec la mesure de
liaison entre le s e facteur et le groupe j, le poids affect ce facteur par le groupe
j dans le modle INDSCAL et linertie des variables du groupe j le long de la
direction s (qui ne sinterprte plus comme une contribution).
Par contre, il nest pas possible dobtenir une reprsentation superpose des nuages
dindividus associs des groupes de variables supplmentaires : cela reviendrait
projeter un nuageN Ij sur un axe de R K orthogonal au sous-espace qui contient ce
nuage.
Si lon tudie les raisons qui conduisent introduire un groupe en supplmentaire,
on peut voir que cette limite nest pas trs gnante. Si lon craint quil perturbe les
rsultats, car prsentant a priori de grandes diffrences avec les autres groupes, les
indices globaux, projections des composantes principales, etc., permettent de mesurer
et prciser ces diffrences, mais superposer le nuage N Ij des nuages qui ne lui
ressemblent pas assez na pas dintrt. Sil intervient uniquement en tant qulment
explicatif lors de linterprtation, on sintresse alors aux liaisons entre les variables
de ce groupe et les autres et non chaque individu.

8.8 MISE EN UVRE DE LANALYSE FACTORIELLE MULTIPLE


La mise en uvre de lAFM comprend deux tapes.
Dans la premire tape, on analyse chaque groupe sparment ; lorsquil sagit
dun groupe de variables qualitatives (resp. mixtes), on ralise une ACP pondre
quivalente une ACM (resp. AFDM). Cette premire tape est ncessaire pour
calculer :
1. linverse de la premire valeur propre de lACP de chaque groupe, qui pondre
(ou surpondre) les variables dans la seconde tape ;
2. les facteurs de chaque groupe.

204

8 Aspects thoriques et techniques de lAnalyse Factorielle Multiple

La seconde tape est une ACP de lensemble des variables de tous les groupes pondrs ; en pratique, on ralise cette analyse partir des facteurs des analyses spares.
En effet, il est quivalent de considrer un tableau du point de vue de ses donnes
brutes ou du point de vue de ses facteurs. On se limite aux facteurs associs une
valeur propre non nulle, ce qui rduit la dimension de la matrice diagonaliser. Dans
la perspective du traitement de trs grands tableaux, on peut aussi ne pas prendre en
compte les facteurs associs des petites valeurs propres, ce qui conduit une analyse
approche, la qualit de lapproximation tant lie au seuil en dessous duquel on carte
les valeurs propres.

Chapitre 9

Mthodologie de lAFM

Ce chapitre regroupe dabord plusieurs aspects utiles dans la mise en uvre de lAFM.
Ils sarticulent autour de deux thmes : tactique mthodologique et aides linterprtation. Le chapitre se termine par une prsentation synthtique dune extension de
lAFM, lAFM hirarchique (AFMH), ddie aux tableaux dans lesquels les variables
sont structures selon plusieurs partitions embotes.

9.1 TACTIQUE MTHODOLOGIQUE


9.1.1 AFM et analyses spares
Les rsultats de lAFM et ceux des analyses spares des groupes de variables se
compltant, il est souvent utile de les effectuer toutes. Lexprience montre que, dans
ce cas, il est prfrable de raliser dabord lAFM afin davoir une vision globale
des donnes et des relations entre les groupes. Lexemple de lenqute Ouest-France
montre lintrt de cette dmarche : par le jeu des indices de comparaison entre
groupes, lAFM indique demble (cf. section 7.2 page 164) quil existe un facteur
commun aux deux groupes et que le groupe profil de lecture possde un facteur
spcifique important. En outre, lAFM relie ces facteurs ceux des analyses spares
et donne les lments ncessaires leur interprtation. ce stade, on peut dcider en
toute connaissance de cause de raliser ou non lune et/ou lautre de ces analyses et
viter des ttonnements. Si par exemple un groupe de variables se rvle trs diffrent
des autres, il est gnralement inutile de le mler aux autres et ncessaire de ltudier
sparment.

9 Mthodologie de lAFM

206

9.1.2 Cas dans lequel les variables sont homologues


dun groupe lautre
a) Analyses factorielles de tableaux juxtaposs et AFM

Pour fixer les ides, nous considrons le cas dune suite de J tableaux, dans lesquels
les mmes K g variables quantitatives sont mesures sur les mmes I individus, indice
par le temps. LACP usuelle offre deux voies pour dcrire lvolution des donnes (cf.
Figure 9.1).
1

Kg 1

1
Xm

Kg
X1

Kg
Xj

Kg
XJ

I
1
X1

I
1
Xj

I
1
XJ
I

Figure 9.1 Les deux juxtapositions dun ensemble de tableaux doublement apparis. La
juxtaposition A (resp. B) en ligne (resp. colonne) est possible du fait de lhomologie entre les lignes
(resp. colonnes) des tableaux. K g : nombre de variables par groupe ; X m : tableau moyen.

LACP des J tableaux juxtaposs en ligne (A) fournit une reprsentation des individus, chacun considr du point de vue de lensemble des J dates. Elle fournit une
reprsentation des variables dans laquelle chacune donne lieu un point par date.
Elle permet ainsi de suivre lvolution des K g variables au cours du temps. Dans
cette approche, lhomologie entre les variables nest pas utilise dans les calculs mais
seulement lors de linterprtation (en reliant sur les plans factoriels, par exemple, les
points relatifs une mme variable). En revanche, lobservation des mmes individus
au cours du temps est ici essentielle.
LACP des J tableaux juxtaposs en colonne (B) permet de suivre lvolution des
individus au cours du temps puisquune ligne correspond un individu une date
donne. On peut centrer chaque tableau avant la juxtaposition si lon souhaite ne pas
faire apparatre lvolution globale des individus. Dans cette analyse, lhomologie
entre les variables est utilise. En revanche, le fait que ce sont toujours les mmes
individus qui ont t observs au cours du temps nest pas ncessaire dans cette ACP.

9.1 Tactique mthodologique

207

LACP usuelle offre ainsi la possibilit dtudier lvolution des individus et celle
des variables. Chaque volution est dcrite dans un cadre diffrent puisque issu dun
traitement diffrent. Cette mthodologie est, juste titre, trs utilise (on retrouve cette
dmarche, pour les tableaux de frquence, au chapitre 10). Par rapport cette mthodologie, lAFM des J tableaux juxtaposs en ligne (dans laquelle chaque ensemble des
mesures une date donne constitue un groupe de variables) offre les caractristiques
intressantes suivantes :
1. les groupes de variables tant pondrs, linfluence des diffrentes dates de
mesure est quilibre ;
2. grce la reprsentation superpose, on dispose dune visualisation de lvolution des individus et des variables au sein dune mme analyse ;
3. du fait de la pondration et de la prise en compte explicite de la structure en
groupes des variables, on dispose dun large ventail daides linterprtation
(reprsentation des groupes, des facteurs des analyses spares, etc.).

Dunod La photocopie non autorise est un dlit

b) Analyse factorielle dun tableau moyen et AFM

LACP usuelle permet aussi dans certains cas de reprsenter lvolution des individus
et celle des variables au sein dune mme analyse. Pour cela, on construit le tableau X m ,
moyenne des tableauxX j (on prendra soin de vrifier que ce tableau des moyennes a un
sens ; en particulier, si les carts-types diffrent entre variables homologues, il peut tre
ncessaire de centrer et rduire les tableaux X j avant den faire la moyenne). LACP
peut alors tre applique au tableau X m en actif, les tableaux X j tant introduits
la fois en tant que lignes et colonnes supplmentaires. Cette mthodologie est
surtout utilise dans le cadre des tableaux de frquence (cf. chapitre 10 en particulier
figure 10.3 page 230). Elle sappuie sur lhomologie entre les variables, cest--dire
que la structure commune aux tableaux nest mise en vidence que si les variables
homologues sont corrles positivement entre elles.
Tableau 9.1 Deux cas de donnes choisies. Le premier (resp. second) groupe de variables se
limite la variable V1 (resp. V2 ). Vm : moyenne entre V1 et V2 .

Individu
A
B
C

Vm
4
-2
-2

Cas 1
V1
4
-1
-3

V2
4
-3
-1

Vm
0
1
-1

Cas 2
V1
4
-1
-3

V2
-4
3
1

Le cas de deux groupes rduits chacun une seule variable quantitative centre
est commode pour illustrer la comparaison entre AFM de groupes de variables homologues et ACP du tableau moyen (cf. Tableau 9.1 et Figure 9.2). Notons V1 et V2 ces

9 Mthodologie de lAFM

208

B
C
C1
B2

B1
C2

A1
A2

V2
V1
0

1
Vm

Cas 1 : "ACP" de Vm ou AFM de {V1 ; V2}

C1

B
C

B1

A2

C1
B2

V2
-1

A
B1
C2

A1
A2

Vm

V1

Cas 2 : AFM de {V1 ; V2}

B
A1
C2
V2
V1

0
Cas 2 : "ACP" de Vm

B2

Vm
1

ACP : seul le sous-tableau Vm est actif ;


V1 et V2 sont introduits comme lignes et
comme colonnes supplmentaires.
AFM : V1 et V2 constituent chacune un
groupe actif et Vm un groupe supplmentaire.
A1 : individu A vu par V1

Figure 9.2 Axe unique de lACP du tableau moyen ou premier axe de lAFM du tableau 9.1. Pour
chaque cas, reprsentation des individus (en haut) et des variables.

deux variables et r12 leur coefficient de corrlation. Le cur de lAFM de {V1 ; V2 } est
une ACP norme des deux variables. On vrifie aisment que V1 + V2 et V1 V2 sont
vecteurs propres de la matrice des corrlations (cf. section 5.3.1 page 112) et donc que
cette ACP admet comme composantes principales la somme V1 + V2 (inertie associe :
1 + r12 ) et la diffrence V1 V2 (inertie associe : 1 r12 ).
Le signe de r12 dtermine lordre de ces deux composantes.
1. r12 > 0 : la structure commune respecte lhomologie entre les variables.
Exemple : cas 1 du tableau 9.1, dans lequel les variables V1 et V2 mettent
toutes deux en vidence la forte valeur de A. LAFM de {V1 , V2 } et lACP du
tableau moyen (i.e. de Vm ) conduisent aux mmes reprsentations. Exemple : cf.
Figure 9.2 cas 1.
2. r12 < 0 : la structure commune ne respecte pas lhomologie entre les variables.
Exemple : cas 2 du tableau 9.1, dans lequel les variables V1 et V2 mettent toutes
deux en vidence lloignement de A mais chacune dans un sens diffrent. LACP
du tableau moyen ne peut dceler cette structure : elle place le point A lorigine

9.1 Tactique mthodologique

209

des axes (cf. Figure 9.2 cas 2). LAFM de {V1 , V2 }, pour son premier axe, prend
en quelque sorte loppose de lune des variables avant de les superposer.
Dans lACP de Vm , qui se rduit bien sr la reprsentation de Vm , V1 et V2 tant
introduits la fois en lignes et colonnes supplmentaires, on prend en compte lhomologie entre les variables, ce qui inclut le sens de variation des V1 et V2 : ainsi, dans
le cas 2, la structure commune se limite alors des valeurs de B gnralement plus
leves que celles de C. Cest bien ce que met en vidence laxe unique de l ACP
de Vm (cf. Figure 9.2 cas 2). La reprsentation des variables initiales (V1 et V2 ), qui
dans cette mthodologie ne peuvent apparatre quen fonction de leur liaison avec la
structure commune, est ici proche de lorigine.
Dans lAFM de {V1 , V2 }, Vm tant introduite en supplmentaire, on ne prend pas
en compte lhomologie entre les variables ; la structure commune majeure est alors le
particularisme de lindividu A, ce que met bien en vidence le premier axe de lAFM
(cf. Figure 9.2). Les points partiels restituent bien les donnes : A est extrme du point
de vue des 2 groupes ; C est extrme du point de vue du groupe 1 et non du point de
vue du groupe 2. La variable moyenne Vm est non corrle laxe 1. En revanche, elle
est parfaitement corrle laxe 2 de lAFM qui correspond donc laxe 1 de lACP.
En conclusion, on rservera lACP du tableau moyen en actif au cas o lon sintresse aux seules structures communes respectant lhomologie des variables. Autrement,
lorsque toutes les structures communes sont dignes dintrt, on ralisera une AFM,
en introduisant le tableau moyen en tant que groupe supplmentaire.

9.1.3 Dfinition et statut des groupes de variables

Dunod La photocopie non autorise est un dlit

a) Dfinition des groupes

Dans la plupart des cas, le regroupement des variables simpose, tout simplement parce
que la notion de groupe sinsre directement dans la problmatique et a t utilise
dans la dfinition des donnes recueillir. Lenqute Ouest-France en est un exemple
simple mais typique : la mise en relation de la lecture et de repres sociaux fait partie
des objectifs dfinis pralablement ltude, guide la rdaction du questionnaire et
apparat dont tout naturellement dans les traitements. Il en est de mme dans la plupart
des questionnaires, presque toujours structurs en thmes.
Des hsitations peuvent toutefois apparatre lorsque les thmes sont eux-mmes
structurs en sous-thmes. Il nest bien sr pas possible de donner de rgles gnrales
quant au choix des groupes dans ce cas. Il faut rappeler toutefois la possibilit dintroduire plusieurs fois les donnes dans lanalyse : on peut ainsi raliser lAFM sur les
donnes structures en thmes et introduire les donnes structures en sous-thmes en
supplmentaire et voir ainsi apparatre les sous-thmes dans le carr des liaisons.
Un exemple simple de donnes introduites deux fois dans une analyse est fourni
par les donnes vins de Loire examines au chapitre 7.

210

9 Mthodologie de lAFM

Les variables appellation et terroir ont t introduites au sein dun mme groupe,
origine des vins, mais peuvent aussi tre considres sparment. La reprsentation
de ces deux nouveaux groupes (cf. Figure 7.6 page 162) a montr que la liaison entre
lorigine des vins et les deux premiers facteurs est due au terroir et non lappellation.
Un autre exemple dans lequel plusieurs dfinitions des groupes sont possibles
est fourni par les observations rptes dun mme ensemble de variables, cas dj
voqu section 9.1.2. On peut, dans ce cas, regrouper les variables de deux faons et
la formulation de lAFM en tant que mthode de recherche de facteurs communs aide
choisir entre les deux partitions des variables.
1. Partition 1 : un groupe rassemble les variables dune mme date (cas envisag
section 9.1.2). LAFM cherche alors les facteurs communs aux structures sur les
individus dfinies par les diffrentes dates (question : quy a-t-il de commun aux
diffrentes dates ?).
2. Partition 2 : un groupe rassemble les variables de mme nature, toutes dates
confondues ; il reprsente lvolution de la variable tout au long de la priode
tudie. LAFM cherche alors les facteurs communs ces volutions (question :
quy a-t-il de commun aux volutions des diffrentes variables ?).
b) Statut des groupes

Comme dans les analyses factorielles usuelles, le statut des lments, actif ou supplmentaire, simpose dans beaucoup de cas mais mrite quelquefois une discussion.
La dmarche en AFM est identique celle des autres analyses factorielles lorsque
lon considre lAFM comme. . . une analyse factorielle. Ainsi, dans lexemple des
vins, la volont de rechercher les principaux facteurs de variabilit sensorielle conduit
demble introduire les variables appellation et terroir en supplmentaire. Le cas
des variables densemble (typicit et qualit densemble) est plus nuanc puisque
ces variables peuvent tre considres comme sensorielles, mais leur spcificit a
finalement conduit les carter des lments actifs.
Des points de vue spcifiques apparaissent lorsque lon considre lAFM comme
mthode de recherche de facteurs communs. Une illustration en est fournie par un
autre exemple, issu lui aussi du domaine des vins.
Pour un ensemble de vins, on dispose de variables :
1. physico-chimiques mesures sur la vendange ;
2. physico-chimiques mesures sur les vins ;
3. sensorielles.
On peut vouloir donner ces trois groupes le statut actif. Ce faisant, on recherche
les facteurs communs, la vendange, la physico-chimie du vin et la description
sensorielle. Cette problmatique est ambitieuse en ce sens quelle vise des facteurs

9.2 Aides linterprtation

211

communs aux trois groupes. Aussi peut-on prfrer se limiter introduire seulement
deux groupes en actif. Ce qui revient chercher des facteurs communs :
1. soit la physico-chimie des vendanges et celle des vins ;
2. soit la physico-chimie des vins et la description sensorielle des vins.
Ces deux dernires problmatiques sont moins ambitieuses mais plus faciles concevoir. Aussi, pour de telles donnes, une dmarche empirique mais raisonnable consiste
commencer par une AFM avec les trois groupes actifs en sattendant conserver
comme analyse(s) finale(s) celle(s) avec deux groupes actifs.

9.2 AIDES LINTERPRTATION


LAFM fournit un grand nombre daides linterprtation. Certaines de ces aides ne
lui sont pas spcifiques et se retrouvent dans toute analyse factorielle. Soit, principalement :
1. linertie et le pourcentage dinertie associs chaque axe ;
2. les contributions des lignes et des colonnes linertie de chaque axe ;
3. les qualits de reprsentation ( = cosinus carr) des lignes et des colonnes par
chaque axe ;
4. la distance (dans lespace complet) entre chaque individu et lorigine ;
5. les valeurs-tests associes aux modalits des variables qualitatives.

Dunod La photocopie non autorise est un dlit

Parmi les aides spcifiques, certaines ont dj t dfinies et commentes dans lun
et/ou lautre exemple. Soient :
1. les corrlations entre les facteurs du nuage moyen et les facteurs des nuages
partiels (cf. section 7.1.6 page 159) ;
2. les contributions des groupes de variables linertie des axes (cf. tableau 7.1 et
section 7.1.7 page 161) ;
3. le rapport [inertie inter / inertie intra] associ la reprsentation superpose (cf.
section 7.2.4 page 167).
Enfin certaines aides nont pas t illustres. Elles font lobjet des sections suivantes.

9.2.1 Mesures globales de liaison entre deux groupes de variables


Deux mesures de liaisons entre groupes de variables sont prsentes en section 8.4.3
page 189 : Lg et RV. Elles se compltent bien, comme lillustre lexemple des vins (cf.
Tableau 9.2). Dans cet exemple :

9 Mthodologie de lAFM

212

1. RV(1, 3) = .71 RV(2.4) = .75 ; les groupes 1 et 3 dune part et 2 et 4 dautre


part ont des structures voisines, galement proches de lhomothtie ;
2. Lg (1, 3) = 1.05 > Lg (2, 4) = .80 ; la structure commune aux groupes 1 et 3 est
plus riche que la structure commune aux groupes 2 et 4.
Lindicateur Lg ( j, j) nest rien dautre que lindicateur de dimensionalit N2g ( j) dfini
en section 8.4.2 page 189 et illustr en 9.2.2.
Tableau 9.2 Exemple des vins : mesures Lg et RV de liaison entre groupes.
Groupe
1 : olfaction au repos
2 : vision
3 : olfaction aprs agitation
4 : gustation

= {1, 2, 3, 4}

1
1.61
.55
1.05
.68
1.13

Lg
3

1.00
.70
.80
.88

1.37
.94
1.17

1.12
1.02

1.22

1
1
.44
.71
.51
.81

2
1
1
.60
.75
.80

RV
3

1
.76
.91

1
.88

Ces indicateurs sappliquent aussi un groupe rassemblant les variables de plusieurs


groupes j, chaque variable du groupe j tant au pralable pondre par 1/l1j . Ces
calculssont surtout intressants lorsque lon considre lensemble des groupes actifs
(not
dans le tableau 9.2), chaque variable tant pondre selon lAFM. Dans
lexemple des vins :
1. la dimensionalit de lensemble de la dgustation (1.22) est plus faible que celle
des deux olfactions (1.61 et 1.37) ; ceci, qui peut paratre paradoxal, est d au
fait que lcart entre linertie du premier facteur et celle des autres facteurs est
plus important dans lAFM globale que dans ces deux groupes ;
2. ce sont, daprs les mesures Lg , les deux olfactions qui ont la plus riche structure
commune avec lensemble de la dgustation ;
3. mais ce sont, daprs les mesures RV, lolfaction aprs agitation et la gustation
qui ont la structure la plus proche de celle de lensemble de la dgustation.

9.2.2 Aides relatives la reprsentation des groupes de variables


Les diverses interprtations des coordonnes des groupes de variables sont rassembles
la section 8.4.4 page 191 et un exemple se trouve en section 7.1.7 page 161. Ces
coordonnes sont accompagnes de plusieurs indicateurs prsents ci-aprs.
a) Distance entre un groupe et lorigine

Le carr de la distance entre un groupe et lorigine, somme des carrs des valeurs
propres du groupe aprs pondration de lAFM, constitue le critre de dimensionalit
du groupe not N2g . Dans lexemple des vins (cf. Tableau 9.3), cet indicateur met

9.2 Aides linterprtation

213

clairement en vidence la faible dimensionalit de chacun des groupes quantitatifs, en


particulier des groupes gustation, vision et apprciation densemble. La multidimensionalit du groupe origine tient bien sr au codage disjonctif complet, caractristique
classique de lACM (cf. section 4.3.5 page 95).

Tableau 9.3 Exemple des vins : distance d(0, j) des groupes lorigine dans R I . d2 (0, j) = N2g
mesure le nombre de directions dinertie comparable celle de la premire direction .

groupe j
Olfaction au repos
Vision
Olfaction aprs agitation
Gustation
Apprciation densemble
Origine

d2 (0, j)
1.610
1.003
1.369
1.123
1.007
2.645

% dinertie des analyses spares


F1
F2
F3
44.8
30.3
16.3
94.5
5.0
.5
47.0
24.8
10.5
62.7
19.9
7.5
92.5
7.5
29.0
25.6
20.0

Dunod La photocopie non autorise est un dlit

d2 (0, j) mesure, en quelque sorte, le nombre de directions dont linertie est proche
de linertie axiale maximum . Ainsi, selon ce critre, le groupe olfaction au repos est
de dimensionalit plus importante que olfaction aprs agitation du fait du deuxime
axe, dinertie plus proche de celle du premier axe dans le cas de lolfaction au repos.
Le tableau 9.4 illustre ce phnomne dans deux cas de rfrence. Le sous-espace
engendr dans le cas 1 est 3 dimensions (3 valeurs propres non nulles). Dans le cas
2, il est 6 dimensions. Malgr cela, lindicateur de dimensionalit est plus important
dans le cas 1 car il accorde une importance trs faible aux dimensions de faible inertie.

Tableau 9.4 Distance dun groupe j lorigine dans 2 cas de rfrence dcrits par leurs
pourcentages dinertie.

Cas 1
Cas 2

F1
.5
.5

% dinertie
F2 F3 F4 F5
.4 .1
0
0
.1 .1 .1 .1

F6
0
.1

d2 (0, j)
1.68
1.20

Plus prcisment :
1. la valeur 1.68 (proche de 2) traduit la prsence de 2 dimensions prpondrantes dinerties comparables ;
2. la valeur 1.20 (proche de 1) traduit la prsence dune seule dimension prpondrante.

9 Mthodologie de lAFM

214

b) Contribution dun groupe linertie dun axe

Cette notion est dfinie clairement dans lespace des variables comme la somme des
contributions (inerties projetes) des variables dun mme groupe. Dans lespace des
groupes de variables, cet indicateur est la coordonne dun groupe (dans lespace
des groupes, la quantit maximise est la somme des coordonnes ; cf. section 8.4.4
page 191). Ces contributions (absolues) sont souvent exprims en % (contributions
relatives).
Dans lexemple des vins (cf. Tableau 9.5), ces contributions quantifient le rle
quilibr des quatre groupes dans la construction du premier axe et la prpondrance
des deux olfactions dans la construction du second et du troisime.
Tableau 9.5 Exemple des vins : contribution des groupes de variables la construction de chacun
des trois premiers axes de lAFM.
Groupe
Olfaction au repos
Vision
Olfaction aprs agitation
Gustation


Contributions absolues
F1
F2
F3
.78
.62
.37
.85
.04
.01
.92
.47
.18
.90
.24
.05
3.46 1.37
.62

Contributions relatives
F1
F2
F3
22.6 45.3
60.7
24.7
2.9
2.3
26.7 34.3
29.3
26.0 17.4
7.7
100
100
100

Cet indicateur peut aussi tre calcul pour les groupes supplmentaires, auquel cas
il ne sinterprte pas comme une contribution mais sert simplement situer les groupes
supplmentaires par rapport lensemble des groupes actifs.
c) Qualit de reprsentation dun groupe par un axe

La qualit de reprsentation du groupe j (en tant que point du nuage N J dfini en


section 8.4) par laxe ws peut tre quantifie laide de lindicateur classique :

2
Pws ( j)
2
cos ( j, ws ) =
 j
en notant Pws ( j) la projection de j sur ws .
Cet indicateur sutilise, dans ltude de la reprsentation des groupes, de la mme
faon que pour les reprsentations usuelles des analyses factorielles : la proximit sur
le graphique peut tre considre comme une proximit globale lorsque les points sont
bien reprsents (cf. section 7.1.7). En outre, lorsque lAFM est utilise selon le point
de vue du modle INDSCAL, il sinterprte comme une mesure dadquation, axe par
axe ou pour plusieurs axes, dun groupe au modle.
Linterprtation de cet indicateur comme un rapport inertie projete / inertie totale
suggre de le calculer pour lensemble des groupes actifs. La qualit de reprsentation
du nuage N J ainsi obtenue est utile :

9.2 Aides linterprtation

215

1. pour juger globalement de ladquation des donnes au modle INDSCAL ;


2. pour comparer la reprsentation de N J fournie par lAFM et celle fournie par
dautres mthodes.
Cet indicateur peut bien sr tre calcul pour un groupe supplmentaire et mme pour
lensemble de ces derniers lorsque les considrer dans leur ensemble a un sens.
Dans lexemple des vins, la qualit de reprsentation globale des quatre groupes
actifs sur le premier plan de lAFM vaut .72 ; la qualit maximum de reprsentation de
ces points par un plan, obtenue par la mthode Statis, soit une ACP directe de N J (cf.
8.4.4), est de .82 ; la perte de 10 %, prix payer pour pouvoir interprter les axes
de projection (les axes optimaux, issus de lACP de N J , ne sont pas interprtables ; cf.
section c), peut tre considre comme raisonnable dans ce cas.

9.2.3 Qualit de reprsentation du nuage des variables dun groupe


La qualit de reprsentation dun nuage de points par un axe sapprcie usuellement
au travers du rapport [inertie projete sur laxe / inertie totale]. Cest bien l une
interprtation essentielle du pourcentage dinertie en analyse factorielle.
On peut appliquer ce critre aux nuages des variables associs un seul groupe
(nots N Kj au chapitre 8), actif ou supplmentaire. On obtient ainsi, pour chaque groupe
j, une suite de valeurs qui, compares aux pourcentages dinertie de lanalyse spare
du groupe j, quantifie ce que lon perd en qualit de reprsentation du nuage N Kj
en le projetant sur les axes de lAFM plutt que sur ses axes principaux. Appliqu
lexemple des vins, cet indicateur conduit aux valeurs rassembles dans le tableau 9.6.

Dunod La photocopie non autorise est un dlit

Tableau 9.6 Exemple des vins : qualits de reprsentation cumules des nuages des variables de
chaque groupe, dans lAFM et dans les analyses spares.

Groupe
1 : olfaction au repos
2 : vision
3 : olfaction aprs agitation
4 : gustation
5 : jugement densemble

F1
35.1
80.8
43.5
56.4
57.2

AFM
F2
62.9
84.6
65.5
71.3
80.1

F3
79.6
86.0
74.0
74.3
81.6

ACP spares
F1
F2
F3
44.8 75.2
91.5
94.5 99.5 100.0
47.0 71.8
82.3
62.7 82.6
90.1
92.5 100.0
-

Le premier plan de lACP spare du groupe 1 exprime 75.2 % de linertie de ce


groupe. Le premier plan de lAFM extrait 62.9 % de linertie des variables de ce
groupe.
La qualit de reprsentation de chacun des groupes de variables par lAFM est
ncessairement infrieure (gale si tous les groupes ont les mmes premires composantes principales) celle des analyses factorielles spares. Dans lexemple, cette

9 Mthodologie de lAFM

216

diminution de qualit de reprsentation par un plan varie entre 6.3 % et 14.9 %. Elle
quantifie le prix payer en contrepartie de la reprsentation simultane de tous les
N Kj . Dans lexemple, on peut considrer que ce prix payer nest pas exagr.
Cet indicateur peut aussi tre calcul pour les variables qualitatives auquel cas, pour
tre comparable celui dune ACM (vue comme une AFC du Tableau Disjonctif
Complet), il doit prendre en compte les modalits au travers de leurs indicatrices
(et non de leurs centres de gravit). Le tableau 9.7 rassemble ces indicateurs pour
lenqute Ouest-France.
Tableau 9.7 Enqute Ouest-France : qualits de reprsentation cumules des nuages des
variables de chaque groupe.

1 : signaltique
2 : rubriques

AFM
F1
F2
8 % 10 %
12 % 25 %

ACM spares
F1
F2
9%
16 %
15 % 28 %

Ce tableau confirme que, entre les ACM spares et lAFM :


1. la qualit de reprsentation des rubriques est presque inchange, ce qui tait
pressenti puisque le premier plan de lAFM est trs proche, une rotation prs,
de celui de lanalyse des rubriques ;
2. la qualit de reprsentation du signaltique est presque inchange pour le premier
axe mais sensiblement diminue pour le deuxime axe et donc le premier plan ;
ceci aussi tait pressenti ds lors que le deuxime axe de lAFM a t considr
comme spcifique des rubriques.

9.2.4 Aides relatives aux facteurs partiels


Les exemples prsents (cf. Figures 7.7 et 7.8) montrent lintrt de relier les rsultats
dune AFM ceux des analyses factorielles spares des groupes de variables. Pour
cela, on introduit les composantes principales des analyses spares (dits axes - ou facteurs - partiels) dans lAFM comme des variables rduites pondres (cf. section 8.3.3
page 181).
Pour chaque composante principale partielle et chaque axe de lAFM, on calcule
les mmes indicateurs que pour les variables initiales, savoir :
1. le rapport [inertie de la composante / inertie de laxe] qui sinterprte, pour les
groupes actifs, comme une contribution au sens usuel (cf. section 8.3.3) ;
2. la qualit de reprsentation (ou cosinus carr).
Ces indicateurs, calculs dans lexemple des vins, sont rassembls tableau 9.8. Ils
sont complts par des indicateurs relatifs aux groupes et lensemble des groupes.

9.2 Aides linterprtation

217

Pour lensemble des S j premires composantes principales du groupe j et pour


chaque axe s de lAFM, on peut effectuer plusieurs calculs.

Tableau 9.8 Exemple des vins : aides linterprtation relatives aux facteurs partiels.

Olfaction au repos

Vision

Olfaction aprs agitation

Gustation
Ensemble

F1
F2
{F1,F2}
F1
F2
{F1,F2}
F1
F2
{F1,F2}
F1
F2
{F1,F2}
{F1,F2}

Contribution
F1
F2
0.222 0.008
0.002 0.441
0.224 0.449
0.246 0.024
0.001 0.006
0.247 0.029
0.260 0.049
0.007 0.286
0.266 0.335
0.259 0.004
0.000 0.157
0.26 0.161
0.997 0.974

Qualit de reprsentation
F1
F2
{F1,F2}
0.770 0.011
0.781
0.009 0.891
0.899
0.463 0.366
0.829
0.852 0.033
0.884
0.057 0.143
0.199
0.811 0.038
0.850
0.899 0.068
0.966
0.044 0.739
0.783
0.603 0.300
0.903
0.898 0.005
0.903
0.005 0.678
0.683
0.683 0.167
0.850
0.619 0.239
0.858

Dunod La photocopie non autorise est un dlit

1. La contribution des S j composantes laxe de rang s, somme des contributions


de chacune delles ; cet indicateur montre dans quelle mesure les axes de lAFM
sont engendrs par les premires composantes principales du groupe j ;
2. La qualit de reprsentation des S j composantes, qui rapporte leur inertie projete
leur inertie totale ; cet indicateur montre dans quelle mesure lensemble des S j
composantes principales du groupe j est bien reprsent. Ainsi, dans lAFM sur
les donnes Ouest-France, le premier plan reprsente 86 % des deux premires
composantes des rubriques, ce qui est une faon de quantifier la ressemblance
entre les premiers plans de ces deux analyses.
Ces deux indicateurs peuvent enfin tre calculs pour lensemble des composantes
principales tous groupes confondus.
1. La contribution montre dans quelle mesure les premiers axes de lAFM peuvent
tre reconstitus avec les seules premires composantes principales des diffrents groupes. Ainsi, dans lexemple des vins, les 4 premiers axes partiels (i.e.
le premier de chaque groupe) contribuent globalement 99 % de linertie du
premier axe de lAFM, ce qui quantifie le rle majeur de ces axes dans lanalyse
(remarque : si lon conserve toutes les composantes principales de chaque groupe
actif, cet indicateur vaut 100).

9 Mthodologie de lAFM

218

2. La qualit de reprsentation montre dans quelle mesure, les premires composantes principales partielles sont, dans leur ensemble, bien reprsentes par les
premiers axes de lAFM ; ainsi, dans lexemple des vins, la qualit de reprsentation de lensemble des 2 premiers axes de toutes les analyses spares par les
2 premiers axes de lAFM vaut .858, ce qui quantifie globalement lexcellente
reprsentation (pressentie figure 7.7 page 164) de ces axes partiels dans lAFM.
Cet indicateur est particulirement prcieux dans les applications de lAFM ayant
pour objet principal la comparaison de rsultats de diffrentes analyses factorielles. Remarque : si lon conserve toutes les composantes principales de chaque
groupe, les valeurs de cet indicateur sont gales aux pourcentages dinertie de
lAFM.

9.2.5 Dcomposition de linertie associe la reprsentation


superpose des nuages partiels
La section 8.2.5 page 175 prsente la dcomposition de linertie de la reprsentation
superpose selon le thorme de Huygens, associe la partition des I J points
partiels en I groupes comportant chacun les J points partiels correspondant un mme
individu. Cette dcomposition est ralise pour chaque axe. Linertie intra de cette
dcomposition mesure la ressemblance entre les nuages partiels, mise en vidence par
un axe donn (attention : cette inertie ne sadditionne pas dun axe lautre).
En pratique, on calcule le rapport [inertie inter / inertie totale]. Appliqu lexemple
des vins (cf. Tableau 9.9), cet indicateur quantifie ltroite proximit, sur laxe 1, entre
les points partiels relatifs un mme vin. Lintrt de ce critre pour les axes 2 et
3 est faible puisque ces axes ne sont communs respectivement qu 3 et 2 groupes :
il montre toutefois une proximit entre points partiels bien plus importante pour ces
deux axes que pour les quatre suivants.
Tableau 9.9 Exemple des vins : rapports [inertie inter / inertie totale] relatifs la reprsentation
superpose.

Axe
[inertie inter / inertie totale]

F1
.87

F2
.58

F3
.38

F4
.14

F5
.17

F6
.14

F7
.17

Cette inertie intra peut son tour tre dcompose par individu ; ainsi, dans
lexemple des vins, les contributions (en %) des vins 1DAM et 1POY linertie intra
pour laxe 1 valent respectivement 11,4 % et 8,1 %, valeurs qui quantifient la plus
grande variabilit des coordonnes des points reprsentant 1DAM (cf. Figure 7.5
page 160).
En pratique, on trie les individus par inertie intra croissante. Les premiers individus
prsentent les ensembles dimages partielles les plus homognes du point de vue de

9.3 Analyse factorielle multiple hirarchique

219

laxe : ils illustrent bien le caractre commun (aux groupes de variables) du facteur.
loppos, les derniers individus prsentent les ensembles dimages partielles les plus
htrognes du point de vue de laxe. Ainsi, dans lexemple, ce tri selon le premier
axe fait apparatre 1VAU (respectivement 2ING) comme lindividu ayant une des plus
faibles (respectivement fortes) inertie intra. On retrouve bien ce phnomne sur la
figure 7.5.
La quantification de la variabilit axe par axe des points partiels relatifs un mme
individu prsente un intrt en soi. Mais son apport le plus important rside dans le tri
qui permet, lorsque les individus sont nombreux, de slectionner les individus les plus
remarquables selon ce critre sans les examiner tous.
La part dinertie intra de chaque individu peut son tour tre dcompose selon
ses points partiels. Ainsi, la part de 1DAM1 vaut 6.5 %, ce qui montre bien le rle
important de lolfaction au repos dans lhtrognit des perceptions de 1DAM.
En pratique, on slectionne les individus partiels ayant les plus fortes inerties intra.
Cela permet de mettre en vidence des points partiels non concordants avec les
autres images associes ces mmes points.

Dunod La photocopie non autorise est un dlit

9.3 ANALYSE FACTORIELLE MULTIPLE HIRARCHIQUE


Dans de nombreux tableaux individusvariables, les variables sont structures selon
plusieurs partitions, gnralement embotes. Lexemple le plus classique est celui
des questionnaires denqutes dopinion dj voqu, dont les questions sont souvent structures en thmes et en sous-thmes. Ainsi, dans un questionnaire dtude
de marchs, on regroupera les questions relatives aux opinions dune part et celles
relatives au comportement dautre part et, au sein de ce second groupe, on distinguera
comportement dachat et comportement de consommation. Un second exemple est
fourni par les donnes vins du chapitre 7, en considrant que lon dispose de ces
mmes donnes pour plusieurs millsimes : on regroupera les descripteurs sensoriels
dabord par millsimes puis, au sein de chaque millsime, on distinguera, comme nous
lavons fait au chapitre 7, les quatre phases de la dgustation. Dans ces deux exemples,
les variables sont structures selon deux partitions embotes ; plus gnralement, on
peut considrer une structure hirarchique sur les variables (cf. Figure 9.3).
Pour analyser de telles donnes, en prenant en compte la structure hirarchique
des variables, on peut utiliser lanalyse factorielle multiple hirarchique (AFMH)
dveloppe par Sbastien L. Cette extension de lAFM prsente suffisamment de
spcificits pour justifier son statut de mthode part entire. Nous en dcrivons les
principales ci-aprs.

9 Mthodologie de lAFM

220

nud sommital
nud n
partition associe au nud n
(ici 7 variables en 3 groupes)

variables
Figure 9.3 Exemple de hirarchie structurant les variables dun tableau.

9.3.1 Pondration des variables


De mme quen AFM, les groupes de variables doivent voir leurs influences respectives
quilibres ; mais cet quilibre doit ici tre ralis pour chaque nud de la hirarchie.
Ainsi, dans lexemple des vins esquiss ci-dessus, les deux millsimes doivent tre
quilibrs entre eux et, au sein de chacun deux, les quatre phases de la dgustation
doivent tre quilibres entre elles.
Comme en AFM, ces quilibres sont assurs par lintermdiaire de poids affects
aux variables. Ces poids sont calculs en ralisant les analyses spares, ACP ou AFM
(ou AFMH lorsquil y a plus de deux partitions embotes) des variables correspondant
chaque nud de la hirarchie. Ainsi, dans lexemple des vins, on ralise dabord
les huit ACP des quatre phases de dgustation pour chacun des deux millsimes, puis
une AFM pour chaque millsime. Dans lanalyse finale (AFMH) des deux millsimes,
le poids dune variable est gal son poids dans lAFM du millsime auquel elle
correspond divis par la premire valeur propre de cette AFM. En procdant ainsi,
dans lanalyse correspondant chaque nud n, les groupes de variables dfinis par la
partition associe au nud n sont quilibrs.
De faon plus formelle, en considrant les nuds auxquels appartient successivement la variable k dans larbre hirarchique, et en ordonnant ces nuds de la base au
sommet de la hirarchie, le poids Pkn dune variable k dans lanalyse des variables du
nud n est dfini par la formule de rcurrence suivante :
Pk1 est fix a priori ; gnralement 1
Pkn = Pkn1 /ln1
1
en notant ln1 , la premire valeur de lanalyse (des variables) du nud n.
Cette dfinition des poids de variables correspond la faon dont ils sont calculs
en pratique.

9.3 Analyse factorielle multiple hirarchique

221

9.3.2 Reprsentation des groupes de variables.


En AFM, dans la reprsentation des groupes de variables (dite carr des liaisons ),
la coordonne du groupe j le long de laxe s sinterprte principalement de deux
faons (cf. c page 193) :
la contribution des variables du groupe j la construction de laxe s ;
la mesure de liaison Lg entre le groupe j et laxe s.
En AFMH, ces deux notions ne concident que pour les groupes de lanalyse densemble (dfinis par la partition associe au nud sommital). En pratique, on privilgie
la mesure Lg : on calcule linertie projete des variables du groupe dfini par un
nud, en utilisant les poids de ces variables dans lanalyse du nud immdiatement
suprieur.
Le carr des liaisons ainsi obtenu sinterprte comme la projection du nuage N J des
groupes de variables dfinis par la partition associe chaque nud de la hirarchie
et pondrs aux sens de lAFM (premire valeur propre gale 1). Il bnficie, entre
autres, de la proprit suivante : quelles que soient leurs positions dans larbre hirarchique, deux groupes identiques sont confondus dans le carr des liaisons (ce qui ne
serait pas vrai avec loptique contribution ).

Dunod La photocopie non autorise est un dlit

9.3.3 Reprsentation des nuages partiels


chaque individu, outre le point moyen, on peut faire correspondre autant de points
partiels quil y a de nuds dans la hirarchie. En AFM, cette reprsentation est obtenue
en projetant le nuage N Ij de points dfini par chacun des J groupes de variables j
(nuages dits partiels) sur les axes principaux du nuage moyen N I (cf. 8.2.5 page 175).
Cette reprsentation est gnralise en AFMH. Pour chaque nud n, le nuage partiel
N In est construit partir des seules variables regroupes par le nud n. Les N In sont
projets sur les axes principaux de N I .
En AFM, cette reprsentation bnficie dune proprit importante : chaque point
moyen i est au barycentre de ses J points partiels i j . Cette proprit est obtenue en
dilatant le nuage N Ij par une homothtie de rapport J . En AFMH, cette proprit est
tendue de la faon suivante : le point i n (individu i considr du point de vue des
variables incluses dans le nud n) est au barycentre des individus partiels associs aux
groupes de variables rassembls par le nud n. Ainsi, dans lexemple des vins, chaque
vin (moyen) i est au barycentre de ses deux reprsentations annuelles (i.e. associe
un millsime). son tour, chaque reprsentation annuelle est au barycentre de
ses reprsentations par groupe de variables sensorielles (cf. Figure 9.4).
Cette proprit est obtenue en dilatant le nuage N In . En notant Jn le nombre de
classes de la partition associe au nud n, le coefficient de la dilatation est gal aux

9 Mthodologie de lAFM

222

olf. repos
vision

gustation

gustation

olf. agit.
1984

1982
olf. agit.
olf. repos

vision
Figure 9.4 Exemple de reprsentations de points partiels en AFMH. Pour chaque vin i, on
distingue son image pour chaque millsime et pour chaque phase de dgustation au sein dun
millsime.

produits des Jl associs aux L n nuds englobant le nud n, ce qui peut scrire :
l=L
n

Jl

l=1

Dans lexemple des vins, les points partiels relatifs un millsime sont dilats avec le
coefficient 2 (cas 2 millsimes) ; les points partiels relatifs une phase de dgustation
(dans un millsime) sont dilats avec le coefficient 2 4 = 8 (car 2 millsimes4
phases).

Chapitre 10

Comparaison de tableaux de
frquence binaire

10.1 DONNES ET PROBLMES


LAFC est extrmement efficace dans lanalyse des tableaux de frquence binaire et
dans celle de tableaux de type assez semblable. Trs naturellement, on souhaite disposer de techniques analogues pour traiter des tableaux non plus binaires mais ternaires,
cest--dire des tableaux dfinis par le croisement de trois variables qualitatives. Dans
ce chapitre, nous abordons ltude de tels tableaux. Plus gnralement, nous nous intressons ltude conjointe de plusieurs tableaux binaires dfinis partir dun mme
couple de variables sur des populations diffrentes sans que ces tableaux drivent
ncessairement du mme tableau ternaire. De telles suites apparaissent frquemment
lorsque des observations identiques sont effectues des moments diffrents. On a
alors une suite de tableaux indics par le temps et lon souhaite faire intervenir cette
dimension temporelle dans lanalyse.
Pour certaines mthodes, il nest pas ncessaire que lensemble des lignes et lensemble des colonnes soient identiques pour tous les tableaux ; il suffit que lun de ces
deux ensembles soit commun tous les tableaux. Ceci dit, nous choisissons de rester
plutt dans le cadre et le vocabulaire des tableaux ternaires.

10.1.1 Notations
Notons I , J , T les ensembles des modalits des trois variables (la notation T fait
rfrence au temps).

10 Comparaison de tableaux de frquence binaire

224

T
t

f.jt

f..t

f i jt = 1

f i j. =  t f i jt
f i.t = j f i jt

f . jt =  i f i jt
f i.. = jt f i jt

f . j. =  it f i jt
f ..t = i j f i jt
i jt

f.j.

fi.t

fijt

fij.

fi..

Figure 10.1 Le paralllpipde des donnes et ses marges.

Les donnes peuvent tre prsentes sous forme dun paralllpipde (cf.
Figure 10.1) de terme gnral not f i jt . Les f i jt , obtenus en divisant les effectifs par
leur total, peuvent tre considrs comme une mesure de probabilit sur le produit des
trois ensembles I , J et T .
Les marges binaires de ce paralllpipde sont les trois tableaux de contingence
binaire, obtenus en sommant sur lun des trois indices. Leur terme gnral est not
respectivement f i j. , f . jt et f i.t . Chacune peut tre reprsente par une face du paralllpipde. On parlera aussi des trois marges unaires, vecteurs obtenus en sommant sur
deux indices et nots f i.. , f . j. et f ..t : chacune peut tre reprsente par une arte du
paralllpipde. Larte f i.. (resp. f . j. ou f ..t ) est dite souvent marge sur I (resp. sur
J ou T ) .
On peut prsenter aussi les donnes comme une suite de tableaux binaires (cf.
Figure 10.2). Cest dailleurs ainsi quelles se prsentent concrtement. Lune des
dimensions, T par exemple, joue alors un rle diffrent des deux autres. Les T tableaux
binaires croisant I et J sont des tranches du paralllpipde. Leur somme nest
autre que la marge binaire sur ce mme produit.

10.1.2 Exemples
Dans ce chapitre, nous appliquons la plupart des mthodes exposes un tableau de
trs petite dimension issu de donnes de lINSEE ( Bilan formation-emploi 1973 ,

10.1 Donnes et problmes

225

1
i

1
fij1

...

fijT

I
t=1

t=T

Figure 10.2 Lensemble des T tableaux binaires.

Tableau 10.1 lves scolariss en 1972-1973, sortis du systme ducatif en 1973 et ayant trouv
un emploi : sexe masculin.
Niveaux de diplme
sans BEPC BEP/ CAP BAC
BAC DEUG/ DUT/ SUP
Total
diplme
gnral technique ENT BTS
Agriculteur
15068 2701
5709
297
1242
322
25339
Ingnieur
337
309
917
308
4383 6254
Technicien
302 1697
2242
1969
1399
357 1943 381 10290
Ouvrier qualifi
10143 3702 30926
314
1861
337 47283
Ouvrier non qualifi 59394 8087 17862
2887
1696
323 90249
Cadre suprieur
596
298
892
1227
298
2362 318 6781 12772
Cadre moyen
2142 2801
672
6495
924
2807 2301 4030 22172
Employ qualifi
5445 7348
4719
4353
1280
614 982
24741
Employ non qualifi 4879 4987
1514
3478
886
1326
661 17731
Total
97969 31958 64845 21937 9586
7774 5866 16896 256831

Dunod La photocopie non autorise est un dlit

Emploi occup

CEREQ, INSEE, SEIS, volume D 59 des Collections de lINSEE, p. 102 et 103). Il


rpartit, suivant trois critres, la population des lves scolariss en 1972-1973 ayant
trouv un emploi en 1973. Le premier critre est le niveau de diplme qui comprend
8 modalits ; le second critre est le type demploi qui a 9 modalits ; le troisime,
le sexe, spare les hommes et les femmes. Il est clair que les trois dimensions de ce
tableau ternaire ne jouent pas le mme rle et quil est naturel de prsenter des donnes
sous la forme de deux tableaux binaires concernant lun les hommes et lautre les
femmes (cf. Tableaux 10.1 et 10.2).
Certains objectifs de ltude des tableaux ternaires ne simposent pas de manire
trs naturelle sur ces donnes. Pour les illustrer nous voquerons deux autres exemples.
Le deuxime exemple croise lensemble des cantons de Bretagne, lensemble des
causes de mortalits et lge rparti en 10 classes. Le terme gnral du paralllpipde
est le nombre de dcs durant la priode 1960-1970 dans le canton t, dans la classe
dge i, par la cause de mortalit j.
Le troisime et dernier exemple comprend une dimension temporelle. Ce nest
pas un tableau ternaire stricto sensu mais une suite de tableaux contenant, anne par

10 Comparaison de tableaux de frquence binaire

226

Tableau 10.2 lves scolariss en 1972-1973, sortis du systme ducatif en 1973 et ayant trouv
un emploi : sexe fminin.
Niveaux de diplme
sans BEPC BEP/ CAP BAC
BAC DEUG/ DUT/ SUP
Total
diplme
gnral technique ENT BTS
Agriculteur
5089 1212
1166
7467
Ingnieur
316
304 1033 1653
Technicien
281
320
320
283
683
1887
Ouvrier qualifi
7470 1859
4017
1752
657
285
16040
Ouvrier non qualifi 29997 4334
4538
1882
40751
Cadre suprieur
2236
595
911
569 6788 11099
Cadre moyen
1577 1806
4549
17063
875
4152 15731 3991 49744
Employ qualifi
21616 19915 32452 16137 5865
1256 3332 1286 101859
Employ non qualifi 19849 7325
6484
5111
898
294
635
40596
Total
85879 36451 53526 44817 9173
6613 21539 13098 271096
Emploi occup

anne, pour 40 entreprises, le nombre total demplois dans chacune des 10 catgories
demplois qui apparaissent dans ces entreprises.

10.1.3 Rduction des tableaux binaires


Les techniques proposes consistent dabord construire des tableaux binaires. ces
tableaux, on applique soit une AFC classique, en utilisant largement la technique des
lments supplmentaires, soit une mthode moins classique spcifique des tableaux
ternaires qui drive de lAFC.
La rduction des problmes ltude de tableaux binaires est invitable. On pourrait
penser gnraliser lAFC au croisement de trois variables. Mais le concept de trinit ,
qui remplacerait celui de dualit, sest avr inaccessible : il na pas t possible
dobtenir une analyse factorielle de tableaux de contingence ternaire dans laquelle on
puisse faire jouer un rle symtrique aux trois ensembles en traitant toute linformation
contenue dans le paralllpipde des donnes.
Cette limite thorique peut paratre tout fait regrettable mais elle ne lest gure car
les problmes rels ne se posent jamais en termes symtriques suivant les trois
variables. Le plus souvent, un tableau ternaire est considr comme un ensemble
(ou une suite) de tableaux binaires croisant les mmes variables. Le problme de
la comparaison entre ces tableaux binaires est presque toujours la proccupation
essentielle.
Dans les trois exemples cits, cette dissymtrie entre les trois variables dans la
formulation des objectifs est vidente. On cherche comparer : dans le premier, les
deux tableaux concernant les hommes et les femmes ; dans le deuxime, les tableaux de
mortalit (causesclasses dge) des diffrents cantons ; dans le troisime, lvolution
des effectifs de lensemble des catgories demplois des diffrentes entreprises.

10.1 Donnes et problmes

227

Cette comparaison elle-mme recouvre des objectifs trs divers dcrits dans la
section suivante en rfrence aux exemples cits.

Dunod La photocopie non autorise est un dlit

10.1.4 Quelques questions sur la comparaison de tableaux binaires


Dans une suite de tableaux binaires, tous les tableaux ne sont pas absolument identiques mais de grandes tendances peuvent sy retrouver. Par exemple, la liaison entre
emploi et diplme, quil sagisse des hommes ou des femmes, doit avoir des points communs. Dans la comparaison entre ces tableaux, un des objectifs peut tre la recherche
de ces tendances communes qui forment, si elles existent, la structure commune.
Lobjectif complmentaire est lanalyse des carts entre ces tableaux (ou de leur
volution sil sagit dune suite temporelle). Il est bien sr utile de pouvoir mesurer
limportance relative des carts entre tableaux et de la structure commune aux
tableaux. Par exemple, peut-on considrer que les rpartitions croises des emplois et
des diplmes chez les hommes et chez les femmes sont globalement analogues ou, au
contraire, trs diffrentes ?
Dans cette comparaison, on peut sintresser plus particulirement aux profils des
lignes homologues ou aux profils des colonnes homologues : soit les pourcentages
des diffrents niveaux de diplme chez les hommes et chez les femmes occupant un
mme type demploi ; soit les pourcentages des diffrents emplois auxquels conduit
un mme diplme, pour les hommes et pour les femmes.
On peut aussi comparer les facteurs de lAFC des diffrents tableaux puisquils en
schmatisent leurs grandes tendances : lorsquil existe une structure commune assez
forte, les premiers facteurs se ressemblent.
On peut sintresser aussi un phnomne plus complexe : une liaison conditionnelle. Ce type de problme est pos dans les deux derniers exemples cits. Ltude
de la mortalit dans les diffrents cantons de Bretagne a pour but de mettre en vidence dventuelles disparits gographiques des causes de mortalit. Or les causes
de mortalit sont trs lies lge. Une comparaison brute de ces causes dans tous
les cantons ne fait ressortir que la diffrence entre leur structure dge. Il faut tudier
la liaison entre deux variables (canton et cause de mortalit) en neutralisant (en un
certain sens) linfluence de la troisime (classe dge). Une solution couramment
utilise consiste redresser les pourcentages de mortalit de chaque canton en tenant
compte des diffrences entre les rpartitions en classes dge. Mais cette technique
limine toutes les informations concernant ces rpartitions. Pour conserver la richesse
initiale des donnes, nous posons le problme diffremment, en cherchant mettre en
vidence des disparits gographiques valables pour lensemble des classes dge.
Le problme de lvolution de lemploi dans un ensemble dentreprises est analogue : il faut liminer linfluence dune variable. Sachant que la rpartition des
diffrentes catgories demplois varie beaucoup dune entreprise lautre, comment
comparer les volutions de ces rpartitions ?

228

10 Comparaison de tableaux de frquence binaire

10.1.5 Conclusion
En passant du binaire au ternaire, le niveau de complexit crot considrablement.
Ltude dune liaison ternaire est vaste et il ne peut tre question, mme pour un
tableau de trs petite taille, den tudier tous les aspects. Aussi, nous navons la
prtention dans ce chapitre, ni de donner des rponses toutes les questions poses,
ni de faire un bilan exhaustif des traitements. Notre but est dorienter la rflexion
sur ce type de donnes et de proposer quelques outils que chacun peut adapter ses
problmes.
Nous voquons dabord lanalyse des marges binaires dun tableau ternaire. Puis
nous proposons trois mthodes illustres par le mme exemple. La faible dimension
de ces donnes permet de fournir les rsultats complets de chaque analyse. Lintrt de
cette tude systmatique est essentiellement pdagogique. Pour prciser ce quapporte
chacune des techniques proposes, nous mettons laccent sur les diffrences entre
leurs rsultats.
1. La premire analyse est une AFC de la somme des tableaux, avec les diffrents
tableaux en lments supplmentaires.
2. La seconde analyse est une AFC de tableaux juxtaposs complte par de multiples indices.
3. La troisime analyse, baptise analyse intra , permet dtudier des liaisons
conditionnelles.
Nous allons de la plus simple la plus complexe et il est raisonnable de respecter cet
ordre dans les applications. Pour chaque mthode, nous indiquons les grandes lignes
des techniques dinterprtation ; puis nous valuons leur efficacit pour rpondre
chacune des questions souleves concernant la comparaison des tableaux binaires.

10.2 TUDE DES MARGES BINAIRES


Lanalyse de chacune des trois marges binaires est la premire tape indispensable
dans ltude dun tableau ternaire ds que les dimensions I , J , T sont assez grandes.
Ces marges sont des tableaux binaires classiques et lAFC est tout fait adapte leur
tude.
Dans le premier exemple, seule lanalyse de la marge EmploisDiplmes prsente
de lintrt (puisque la troisime variable, le sexe, na que deux modalits). Lanalyse
de cette marge permet de dgager les liens entre les emplois occups et les diplmes
possds, hommes et femmes cumuls, sans tenir compte du sexe.
Dans le troisime exemple o I , J et T reprsentent respectivement les catgories
demplois, les entreprises et les annes, il est utile dtudier les trois marges. La premire marge, qui cumule les annes, donne la rpartition moyenne (sur la priode

10.3 Premire analyse : les tableaux en supplmentaire dans lAFC de leur somme 229

tudie) des catgories demplois dans chaque entreprise. Son analyse met en vidence
les diffrences de rpartition des emplois suivant les entreprises dans la priode considre et de comparer les entreprises suivant ce critre. La deuxime marge, qui cumule
les entreprises, permet dtudier lvolution de la rpartition des emplois dans lensemble du secteur auquel appartiennent les entreprises. La troisime marge croise les
annes et les entreprises en cumulant les catgories demplois ; elle donne lvolution
du nombre total demplois dans chacune des entreprises.
Cette mthodologie permet de dgager dabord les grandes tendances des donnes,
avant de sattaquer la description prcise de phnomnes plus fins. Les nuances que
lanalyse du paralllpipde complet permet de dgager nont en effet de sens qu
lintrieur de structures plus grossires, mais plus fortes, impliques par les marges.
Cette dmarche correspond la philosophie gnrale de lanalyse des donnes.
De plus, on ne le rptera jamais trop, une tude nest pas faite par une seule
squence danalyses. Chaque rsultat remet en question le tableau trait, notamment
le codage et les lments pris en compte. Si des valeurs excentres, appeles couramment aberrantes, qui apparaissent dj au niveau de lanalyse des marges ne sont pas
limines ou recodes avant une analyse fine, les rsultats de cette dernire risquent
de ne prsenter aucun intrt ou dtre mal interprts. Lanalyse de tableaux binaires
se matrise bien, les phnomnes perturbateurs se reprent aisment et on peut les
neutraliser beaucoup plus facilement que lors de lanalyse dun tableau ternaire.

10.3 PREMIRE ANALYSE : LES TABLEAUX EN


SUPPLMENTAIRE DANS LAFC DE LEUR SOMME

Dunod La photocopie non autorise est un dlit

10.3.1 Principe
La mthode classique consiste traiter par lAFC la somme des T tableaux, en mettant
ces T tableaux la fois en lignes et en colonnes supplmentaires (cf. Figure 10.3).
Comment cette analyse permet-elle de comparer les T tableaux ? Voyons dabord
la reprsentation gomtrique des colonnes actives et supplmentaires dans lespace
R I (cf. Figure 10.4).
Comme le montre la formule ci-aprs, la colonne j de la marge tudie, tant la
somme des T colonnes homologues ( j, t) des T tableaux, son profil f i j. / f . j. est situ
au barycentre des T profils f i jt / f . jt (chaque profil tant muni du poids affect en AFC)
puisque :
 f . jt f i jt
f i j.
=
f . j. f . jt
f . j.
t
Lanalyse de la somme des T tableaux est donc lanalyse dun nuage moyen : celui
des barycentres des profils des colonnes homologues des T tableaux. Les facteurs

10 Comparaison de tableaux de frquence binaire

230

kij

kij 1

kij 2

kij 1

kij 2

Le tableau actif est de dimension I J


I = catgories demplois
J = niveaux de diplme
T = sexes
En gris, les tableaux mis en supplmentaire. Le rectangle vide en bas
droite, qui nintervient pas dans les calculs, peut contenir des zros.

Figure 10.3 Structure des donnes pour lAFC du tableau somme .

RI

bacheliers (hommes)
bacheliers
bacheliers (femmes)

Figure 10.4 Le profil de la colonne j de la marge tudie est au barycentre des T profils des
colonnes [j,t] des T tableaux. Le profil demplois de la classe des bacheliers, hommes et femmes
cumuls, est au barycentre des profils demplois des bacheliers hommes et des bachelires.

mettront donc en vidence des tendances communes aux T tableaux (si elles existent).
Dans lexemple, les oppositions entre diplmes qui se retrouvent la fois chez les
hommes et chez les femmes apparaissent clairement ; par contre, les diffrences entre
les profils demplois des deux sexes, diplme gal, sont limines.
Mettre les T tableaux en colonnes supplmentaires dans lAFC de leur somme
consiste projeter les profils de leurs colonnes sur les axes dinertie de leurs barycentres. Ceci permet dtudier, sur chaque facteur, lcart entre le profil de la colonne j
de chaque tableau t et le profil moyen de ces colonnes j. Si ces carts sont tous faibles,
le facteur reprsente une tendance commune tous les tableaux. Cette projection des
profils des colonnes des diffrents tableaux sur un rfrentiel commun permet de les
comparer, au moins dans ce qui apparat dans ce rfrentiel. Mais attention, les diffrences entre profils homologues ne sont pas forcment visibles sur cette projection, soit
parce que les carts entre ces profils sont orthogonaux aux structures moyennes, soit

10.3 Premire analyse : les tableaux en supplmentaire dans lAFC de leur somme 231

Les points dun mme tableau


sont reprsents par un mme
symbole. La droite reprsente
la dispersion inter. La dispersion intra est orthogonale
la dispersion inter (A) ou trs
faible par rapport la dispersion inter (B).

Figure 10.5 Exemples dans lesquels la dispersion intra-tableaux nest pas visible dans ltude de
la dispersion inter-tableaux.

parce que ces carts sont trs faibles par rapport aux carts entre les profils diffrents
(cf. Figure 10.5). La situation est exactement identique pour les lignes.
Les deux paragraphes suivants illustrent cette technique par un commentaire dtaill
des rsultats de lanalyse des donnes croisant emplois, diplmes et sexes.

10.3.2 Interprtation
Le dpouillement des rsultats commence par ltude des lments actifs, les lignes et
les colonnes de la somme des T tableaux ; ce tableau croise 9 catgories demplois et
8 niveaux de diplme.

Dunod La photocopie non autorise est un dlit

a) Rpartition parabolique sur le plan 1-2 et effet Guttman

Le graphique des deux premiers facteurs de cette analyse (cf. Figure 10.8) montre
les ensembles de diplmes et demplois rpartis approximativement sur une courbe
de forme parabolique. Ce phnomne, assez courant en AFC, est appel communment effet Guttman . Il apparat lorsquil existe une structure dordre la fois sur
lensemble des lignes et sur celui des colonnes et que ces structures sont associes.
Plus prcisment, si lon rordonne les lignes et les colonnes dans lordre du premier
facteur, on obtient un tableau dont les lments proches de la diagonale ont de fortes
valeurs tandis que les lments loigns sont nuls ou presque nuls. Nous profitons de
cet exemple pour prsenter quelques rsultats gnraux concernant cette structure.
Le modle de leffet Guttman

Il a t dmontr que lAFC de tableaux modles, ayant tous leurs lments nuls en
dehors dune bande diagonale et constants sur cette bande, aboutit au rsultat suivant :
le deuxime facteur est une fonction polynme du second degr du premier facteur
et, sur le plan 1-2, les points sont situs exactement sur une parabole. De mme, le
troisime facteur est une fonction du troisime degr du premier et, sur le plan 1-3, les

10 Comparaison de tableaux de frquence binaire

232

F2

F3

00

F1

00
Donnes

F1

Figure 10.6 Leffet Guttman : donnes et premiers plans de lAFC. Le tableau des donnes
comporte la mme valeur sur la bande (en gris) autour de la diagonale et 0 ailleurs. Ce tableau
est appel scalogramme . Sur le plan (F1 ,Fs ) de lAFC dun tel tableau, les points (lignes et
colonnes) sont rpartis sur une courbe de degr s.

points sont situs sur une courbe qui coupe trois fois laxe 1 (cf. Figure 10.6). Plus
gnralement, le facteur de rang s est un polynme de degr s du premier.
Dans ce cas, la liaison entre les deux variables peut se rsumer la double structure
dordre mise en vidence par le premier plan. Les facteurs suivants continuent
traduire ce mme phnomne. Notons que les pourcentages dinertie extraite des
nuages par les premiers facteurs sont, dans ce cas, faibles alors que linformation sur
la structure des donnes est complte (ce nest pas le seul exemple qui illustre le fait
que, dans le choix du nombre de facteurs considrer, ces pourcentages nont quune
valeur indicative).
Lorsque lon observe ainsi une rpartition parabolique sur un plan, on interprte
globalement le plan qui traduit lassociation ordonne des lignes et des colonnes.
Deux questions se posent assez naturellement concernant lapport du deuxime facteur, puisque la double structure dordre est dj visible sur le premier facteur. La
premire est relativement thorique : pourquoi observe-t-on une rpartition parabolique et pourquoi plus gnralement y a-t-il dautres facteurs que le premier, suffisant
pour traduire lordre ? La deuxime question est plus pratique : le deuxime facteur
peut-il apporter des rsultats complmentaires concernant les donnes tudies ? Pour
rpondre la premire question, nous ne donnons pas de dmonstration1 , mais remarquons simplement quun facteur unique ne peut traduire correctement les distances
entre profils dans le cas dun effet Guttman.
En effet, sur une droite les distances sajoutent et, sur laxe 1, la distance de la
premire ligne la dernire est plus importante que sa distance nimporte quelle
ligne intermdiaire. Or, dans le nuage des profils, ceci est faux car les deux lignes
extrmes sont rapproches par un caractre commun : les zros qui apparaissent en leur
1. Lanalyse des donnes. J.-P. Benzcri et collaborateurs, Dunod, 1973, Tome 2 p.192.

10.3 Premire analyse : les tableaux en supplmentaire dans lAFC de leur somme 233

milieu. Le premier facteur donne une bonne reprsentation de lensemble des distances
entre tous les couples de points et traduit bien ainsi la structure gnrale les distances
entre lignes successives sont faibles mais traduit mal la distance entre les extrmes.
Le deuxime facteur corrige donc et affine lapproximation relativement grossire des
distances traduite par le premier facteur. Lintrt pratique du deuxime facteur est
avant tout de caractriser par la forme parabolique une situation type laquelle on
peut se rfrer pour dcrire les donnes. En outre, il permet de voir si certains points
scartent de la parabole, ce qui se produit ds que les donnes scartent un tant
soit peu du modle. Nous verrons dans le commentaire de lexemple, au niveau de la
projection des points supplmentaires, linterprtation de ces carts.
Reconstitution des donnes dans un effet Guttman

La reconstitution du tableau de donnes et son approximation par les premiers facteurs


de lAFC (cf. section 3.7.4 page 78) se schmatisent assez bien dans le cas dun effet
Guttman. Cest pour illustrer cet aspect de lAFC que nous lexaminons ici. Rappelons
que lapproximation dun tableau f i j par ses S premiers facteurs est la somme du
tableau de terme gnral f i. f . j (correspondant lhypothse dindpendance) et de S
tableaux de terme gnral :

Dunod La photocopie non autorise est un dlit

1
f i. f . j Fs (i) G s ( j)
ls
Dans le cas dun effet Guttman, le tableau dfini par le premier facteur possde une
structure trs particulire (cf. Figure 10.7). Les lments situs en haut gauche et en
bas droite sont trs fortement positifs tandis que les lments situs dans les coins
opposs sont fortement ngatifs (F1 (i)) et G 1 ( j) sont alors de signes opposs). Les
autres cases du tableau, qui correspondent aux lignes ou aux colonnes moyennes dont
les projections valent presque zro, ont des valeurs trs faibles. Dans cette reconstitution dordre 1, le profil des lignes ou des colonnes moyennes est presque proportionnel
la marge du tableau.
Le tableau dfini de la mme faon par le deuxime facteur a des termes positifs
au centre et aux quatre coins, et des termes ngatifs ailleurs. Le cumul de ces deux
tableaux sapproche de la structure en bande diagonale, caractristique de leffet
Guttman.
Interprtation du plan des deux premiers facteurs

Le modle de leffet Guttman napparat jamais exactement dans des donnes


concrtes, les lments hors de la bande diagonale ntant jamais tous nuls, mais
une rpartition peu prs parabolique traduit un phnomne assez proche. Ici, le
premier facteur (cf. Figure 10.8) classe les diplmes et les emplois du plus qualifi
au moins qualifi. Or, il y a trs peu dindividus non diplms qui occupent un emploi
qualifi ; et rciproquement, peu de diplms de lenseignement suprieur occupent

10 Comparaison de tableaux de frquence binaire

234

+++

fij

fi . f . j

0
Donnes

Indpendance

++

++

Facteur 1

+ ...

Facteur 2

Figure 10.7 Reconstitution des donnes, partir des premiers facteurs de lAFC, dans le cas dun
effet Guttman.

un emploi douvrier : si le tableau est rordonn suivant le premier facteur, seule


la bande diagonale est charge. Cette structure, qui associe prfrentiellement les
emplois et les diplmes de mme niveau, est celle qui apparat de la manire la plus
vidente dans les rsultats, ce qui nest pas pour nous surprendre !
La parabole est ici asymtrique car les effectifs des emplois trs qualifis (et des
diplmes levs) sont beaucoup plus faibles que ceux des emplois non qualifis (et
des sans-diplme).
Le deuxime facteur sinterprte comme une opposition entre modalits extrmes
et moyennes : les ouvriers non qualifis ont, comme les ingnieurs, une coordonne
positive alors que les techniciens ont une coordonne ngative. Il met en vidence
le point commun aux deux extrmes dune mme variable : tudes suprieures aussi
bien que sans diplme correspondent peu des emplois moyens et rciproquement
les cadres suprieurs comme les ouvriers non qualifis sont rarement titulaires dun
diplme moyen. Ce facteur reprsente, beaucoup mieux que le premier, les diplmes
et les emplois moyens, proches de lorigine sur le premier axe.
Le nombre de points actifs est ici trop faible pour juger des carts de ces points une
direction parabolique parfaite. Ltude de la projection des lments supplmentaires
faite dans la section 10.3.3 montre comment ces carts peuvent sinterprter.
b) Plan des facteurs 3 et 4

Contrairement au cas modle, on constate dans notre exemple, laide des graphiques
des plans 1-3 et 1-4, que les facteurs 3 et 4 ne sont pas des fonctions polynmes du
premier. On en dduit que la liaison entre diplmes et emplois ne se rsume pas au

10.3 Premire analyse : les tableaux en supplmentaire dans lAFC de leur somme 235

ingnieur

F2 : 23.8%
2 : .224

TUDES SUPRIEURES

cadre suprieur

SANS DIPLME
H

ouvrier
non qualifi

D-H

agriculteur

E-H

F1 : 57.4 %
1 : .539

employ
non
qualifi

ouvrier qualifi
BEP-CAP

D-F
DEUG

E-F
BAC TECHNIQUE

BEPC

employ qualifi

BAC
GNRAL

LEGENDE
D-H : barycentre des diplmes-hommes
E-H : barycentre des emplois-hommes
D-F : barycentre des diplmes-femmes
E-F : barycentre des emplois-femmes

cadre moyen
technicien

F
DUT/BTS

Dunod La photocopie non autorise est un dlit

Figure 10.8 Plan des deux premiers facteurs de lanalyse du tableau somme.

double ordre et que dautres phnomnes sy ajoutent. Leur importance est moindre
puisque linertie de ces facteurs est beaucoup plus faible. Le plan 1-2 donne une image
globale de la liaison tandis que les facteurs 3 et 4 montrent des phnomnes beaucoup
plus ponctuels, i.e. concernant peu dlments.
Le troisime facteur (cf. Figure 10.9) traduit la forte association entre les ouvriers
qualifis et le CAP/BEP. Ces deux points, chacun dans leur nuage, ont une contribution linertie du troisime facteur trs importante (40 % et 51 % respectivement cf.
Tableau 10.3). Ils dterminent donc en grande partie la direction de laxe dinertie ; le
fait quils soient situs du mme ct signifie quils sassocient trop .
Ce troisime facteur diffrencie entre eux les diplmes (resp. les emplois) de faible
qualification trs proches sur le premier plan. Il montre une nuance trs nette entre les
sans diplme et les titulaires dun diplme de faible niveau (CAP/BEP) : par rapport
lensemble de la population tudie, les premiers aboutissent beaucoup plus des

10 Comparaison de tableaux de frquence binaire

236

F4 : 4.5 %

3 : .042

BEPC

employ non qualifi


D-F

employ qualifi
BAC TECHNIQUE

BAC GNRAL

ingnieur
cadre suprieur
E-F

SANS
DIPLME

agriculteur

ouvrier non
qualifi
cadre moyen

DUT / BTS

TUDES

E-H

DEUG

SUPRIEURES

technicien

F3 : 12.6 %

3 : .119

BEP-CAP

D-H

ouvrier
qualifi

LEGENDE
D-H : barycentre des diplmes-hommes
E-H : barycentre des emplois-hommes
D-F : barycentre des diplmes-femmes
E-F : barycentre des emplois-femmes
H

Figure 10.9 Le plan des facteurs 3 et 4 de lanalyse du tableau somme.

emplois douvrier ou demploy non qualifi tandis que les seconds mnent beaucoup
plus frquemment des emplois douvrier qualifi.
Le quatrime facteur, schmatiquement, oppose les employs (qualifis et non
qualifis) aux ouvriers qualifis. Par rapport lensemble de la population tudie, les
premiers sont plus souvent titulaires dun BEPC et les seconds dun CAP/BEP.

10.3 Premire analyse : les tableaux en supplmentaire dans lAFC de leur somme 237

Tableau 10.3 Contributions des profils-lignes et des profils colonnes.

Inertie totale : Brute


: En %
Agriculteur
Ingnieur
Technicien
Ouvrier qualifi
Ouvrier non qualifi
Cadre suprieur
Cadre moyen
Employ qualifi
Employ non qualifi

Dunod La photocopie non autorise est un dlit

Sans diplme
BEPC
CAP/BEP
BAC gnral
BAC Technique
DEUG/ENT
DUT/BTS/Sant
tudes suprieures

E. complet

Facteur 1

Facteur 2

Facteur 3

Facteur 4

.940
1.00
29
120
27
89
146
270
247
52
21

.539
.574
.035
.139
.008
.039
.145
.353
.265
.006
.010

.224
.238
.020
.147
.061
.000
.126
.269
.310
.067
.000

.119
.126
.019
.013
.003
.403
.241
.013
.129
.158
.022

.042
.045
.008
.040
.030
.323
.040
.002
.093
.273
.255

1.00

1.00

1.00

1.00

1.00

178
36
99
83
15
61
150
378

.183
.010
.044
.071
.000
.090
.107
.494

.142
.016
.005
.149
.012
.006
.286
.384

.303
.019
.507
.013
.037
.016
.088
.017

.018
.518
.182
.074
.023
.001
.183
.000

1.00

1.00

1.00

1.00

1.00

10.3.3 Interprtation des tableaux supplmentaires (hommes


et femmes)
Le dpouillement des rsultats se poursuit par ltude des deux tableaux mis en supplmentaire dans lAFC de leur somme.
a) Profils demplois de chaque diplme, pour les hommes et pour les femmes

Les deux tableaux ont t mis deux fois en supplmentaire, en colonne et en ligne (cf.
Figure 10.3 page 230). Etudions dabord la projection sur le plan 1-2 des colonnes
supplmentaires, cest--dire des profils demplois des hommes et des femmes pour
chacun des diplmes. Pour tous les diplmes, sur le premier axe, les deux points
reprsentant les hommes et les femmes sont presque confondus. Sur le deuxime axe, la
plupart dentre eux sont aussi trs proches de leur barycentre ; pour des raisons de clart
seuls les DEUG, qui font exception cette rgle, sont reprsents sur le graphique de

238

10 Comparaison de tableaux de frquence binaire

Tableau 10.4 Profils demplois des hommes et des femmes titulaires dun DEUG, rordonns
suivant le premier facteur.

Agriculteur
Ouvrier non qualifi
Ouvrier qualifi
Employ non qualifi
Employ qualifi
Technicien
Cadre moyen
Cadre suprieur
Ingnieur
Total

DEUG
Hommes Femmes
0
0
0
0
0
0
17
4
9
19
5
0
35
63
30
14
4
0
100
100

la figure 10.8. Lgalit des coordonnes des deux points DEUG-Hommes et DEUGFemmes sur le premier axe implique que, en moyenne, le niveau des emplois des
hommes et des femmes qui ont un DEUG est le mme (en loccurrence un niveau
moyen). Sur le deuxime axe, la diffrence est trs importante : la coordonne du point
DEUG-Femmes est trs fortement ngative tandis que celle du point DEUG-Hommes
est trs fortement positive. Les proprits barycentriques indiquent que les femmes
occupent plus que les hommes les emplois de coordonnes ngatives, donc les emplois
moyens. Rciproquement, les hommes occupent plus que les femmes les emplois de
coordonnes positives, cest--dire les emplois extrmes. Cette proprit, dcele sur
le graphique se retrouve dans les donnes initiales (cf. Tableau 10.4).
b) Profils de diplmes de chaque emploi, pour les hommes et pour les femmes

Ltude des projections des lignes supplmentaires permet de comparer les profils
de diplmes des hommes et des femmes emploi gal. Sur le plan 1-2, la situation
est tout fait analogue celle des profils demplois : les coordonnes des couples
de points reprsentant le mme emploi sont presque identiques sur le premier axe
et, pour la plupart dentre eux, trs proches sur le deuxime axe ; cadre moyen, qui
fait exception, est reprsent sur le graphique. En moyenne, le niveau de diplme
des cadres moyens diffre peu entre hommes et femmes, puisque leur coordonne
sur le premier axe est quasiment la mme. Par contre, dans cet emploi, la proportion
dhommes qui possdent des diplmes extrmes (sans-diplme, tudes suprieures)
est suprieure celle des femmes qui ont gnralement des diplmes moyens (cf.
Tableau 10.5).

10.3 Premire analyse : les tableaux en supplmentaire dans lAFC de leur somme 239

Tableau 10.5 Profils de diplmes des cadres moyens, rordonns suivant le premier facteur.

Sans diplme
CAP/BEP
BEPC
BAC technique
BAC gnral
DUT/BTS/Sant DEUG
tudes suprieures
Total

Cadres moyens
Hommes Femmes
10
3
3
9
13
4
4
2
29
34
10
32
13
8
100
100

Dunod La photocopie non autorise est un dlit

c) Barycentre des deux tableaux

Pour faciliter linterprtation des rsultats, on peut ajouter, en supplmentaire, deux


lignes et deux colonnes : les sommes des lignes (et des colonnes) de chacun des
deux tableaux (hommes et femmes). Ceci fournit les barycentres des profils demplois
(resp. de diplmes) des hommes et des femmes. Sur les deux premiers facteurs, les
quatre barycentres sont trs proches de lorigine. Sur le premier facteur, les deux
barycentres des femmes ont une coordonne lgrement positive : les profils demplois
et de diplmes des femmes sont, en moyenne, trs lgrement suprieurs ceux des
hommes (cette situation sexplique-t-elle par le fait que les hommes qui effectuent
leur service national ne sont pas pris en compte ?). Sur le deuxime facteur, ces deux
barycentres sont nettement ngatifs : les profils des femmes sont surtout un peu moins
extrmes.
Sur le quatrime axe, qui oppose ouvriers et employs, les points hommes et femmes
reprsentant les profils demplois dun mme diplme sont trs spars ; les femmes
se dirigent plus vers des emplois demploys que douvriers tandis que les hommes
sont plutt ouvriers. Cela est particulirement marqu pour les titulaires de CAP/BEP
et seuls les diplmes les plus qualifis font exception cette rgle. Les hommes et les
femmes (tous diplmes cumuls) diffrent beaucoup de par leur profil demplois alors
que, tous emplois confondus, ils ont des profils de diplmes analogues : autrement
dit, la tendance moyenne des hommes tre plus souvent ouvriers et moins souvent
employs que les femmes nest pas lie une diffrence de diplmes.

10.3.4 Bilan
Rcapitulons dans quelle mesure cette premire analyse, lAFC de la somme des
tableaux avec ces tableaux en supplmentaires, rpond aux questions poses par la
comparaison des tableaux binaires.

240

10 Comparaison de tableaux de frquence binaire

tude de la structure commune aux deux tableaux : oui.


Sil existe des tendances communes tous les tableaux, elles apparaissent dans le
nuage moyen. LAFC de la somme des tableaux permet alors danalyser cette structure
commune. Mais, sil nexiste pas de structure commune assez forte, la somme peut
ne traduire quun mlange de tendances diverses. Elle peut aussi tre influence de
manire prpondrante par un tableau particulirement typ. Pour juger du caractre
commun des facteurs de la somme, on peut examiner la dispersion des profils des
lignes ou des colonnes homologues.
Dans lexemple comment, le premier facteur est visiblement une structure commune, puisque les profils demplois ou de diplmes des hommes et des femmes sont
presque confondus. Pour le deuxime facteur et surtout le quatrime, la conclusion
doit tre plus nuance.
Comparaisons inter-tableaux entre profils des lignes ou entre profils des
colonnes : un peu.
Nous avons compar sur les graphiques la position des profils demplois et de
diplmes des hommes et des femmes ; mais attention : cette comparaison est incomplte car elle est faite uniquement sur les axes du nuage moyen (cf. Figure 10.5).
Analyse et mesure de limportance relative des diffrences entre tableaux :
non.
Les diffrences entre les tableaux ne sont pas particulirement bien mises en vidence par cette technique. Limportance relative des structures communes et des
diffrences nest pas mesure.
Comparaison entre les facteurs : non.
Les facteurs de chacun des tableaux napparaissent pas du tout dans cette analyse.
Variante
Au lieu de prendre, comme base de lanalyse, la somme de tous les tableaux, il
est possible de prendre lun dentre eux. Par exemple le premier ou le dernier dune
suite temporelle sil simpose de manire naturelle comme base de rfrence. La
mthodologie dinterprtation est tout fait analogue mais ce nest plus un nuage de
barycentres qui est analys.

10.4 DEUXIME ANALYSE : AFC DE VARIABLES CROISES


OU DE TABLEAUX JUXTAPOSS
10.4.1 Tableau trait et problmes spcifiques aux tableaux composs
de sous-tableaux
Le tableau analys (cf. Figure 10.10) est la juxtaposition des deux tableaux hommes
et femmes ; les lignes du tableau sont, comme dans le paragraphe prcdent, les

10.4 Deuxime analyse : AFC de variables croises ou de tableaux juxtaposs

t = 1 (hommes) t = 2 (femmes)
j
J 1
j
J 1

J H

241

F
I = catgories d'emplois

J = niveaux de diplme
i

k ij1

k ij2

k ij.

k i.1 k i.2 T= sexes (H, F)


En gris, tableaux mis
en supplmentaire

Dunod La photocopie non autorise est un dlit

Figure 10.10 Structure des donnes dans lAFC des tableaux juxtaposs.
Le tableau actif est de dimensions I et JT.

catgories demplois et les colonnes sont les modalits de la variable obtenue en


croisant les diplmes et le sexe.
On met en colonnes supplmentaires les marges dfinies par les deux variables :
le tableau 8 colonnes cumulant les 2 sexes (analys dans la premire mthode) et
le tableau deux colonnes cumulant les diplmes pour chaque sexe. Notons que le
rle des emplois et des diplmes nest pas symtrique : chaque diplme apparat
deux fois ( travers les profils demplois des hommes et des femmes) tandis que les
emplois napparaissent quune fois. Nous aurions pu juxtaposer les deux tableaux
hommes et femmes en prenant comme dimension commune les diplmes, ce
qui aurait invers la situation respective des emplois et des diplmes. Nous voquons
cette analyse, fondamentalement diffrente, dans le bilan sur la mthode la fin de
cette section.
LAFC sapplique sans problme ce tableau. Cependant, lune de ces deux
variables tant une variable croise, la nature du tableau est complexe et il est ncessaire de complter les rsultats par des indices daide linterprtation concernant ce
croisement. Nous consacrons lessentiel de cette section lintroduction de ces indices,
valables dailleurs pour tout tableau se dcomposant naturellement en sous-tableaux.
Leur dfinition tant fonde sur une dcomposition de linertie suivant le principe de
Huygens, nous prcisons dabord cette dcomposition qui permet, de plus, de comparer formellement les rsultats de cette deuxime analyse ceux de la premire. Cette
premire srie dindices est complte par des indices de comparaison des facteurs de
tous les tableaux apparaissant dans le tableau trait. Une dernire section introduit le
principe de lanalyse par sous-tableaux qui permet, entre autres, de calculer tous ces
indices et plus gnralement traite de tableaux de frquence composs de plusieurs
sous-tableaux juxtaposs. Enfin, avant de faire le bilan de cette deuxime analyse,
nous comparons les objectifs des analyses de tableaux composs de sous-tableaux
suivant quil sagit de tableaux de frquence ou de tableaux de variables.

10 Comparaison de tableaux de frquence binaire

242

10.4.2 Comparaison avec lanalyse de la somme et dcomposition


de linertie
Nous comparons ici les deux nuages (celui des colonnes et celui des lignes) tudis
dans cette analyse des tableaux juxtaposs aux nuages construits dans lanalyse de
leur somme commente dans la section 10.3.
a) Nuage des colonnes

Si lon considre lensemble des colonnes, actives et supplmentaires, de cette


deuxime analyse, on retrouve exactement tous les points du nuage construit dans la
premire analyse de la section 10.3 ; mais les axes dinertie sont calculs sur 16 points
(les profils demplois des femmes et des hommes pour chaque diplme) et non plus
sur les 8 barycentres (profils demplois, hommes et femmes cumuls).
Le principe de Huygens indique que linertie dun nuage de points compos de
plusieurs sous-nuages peut se dcomposer en une somme de linertie inter nuages
(inertie des barycentres des sous-nuages) et des inerties intra nuages (inertie de chaque
sous-nuage autour de son barycentre). La formule ci-dessous rsume cette dcomposition :

Inertie Totale = Inertie Inter +
Inertie Intra
Dans lanalyse propose dans cette section, la dispersion intra-diplme intervient
donc dans la dtermination des axes. Dans le cas limite (illustr dans la figure 10.5) o
la dispersion intra, orthogonale la dispersion inter, est invisible sur les axes dinertie
du nuage des barycentres, les carts entre les profils homologues peuvent dterminer
un axe et ainsi apparatre sur les graphiques de cette analyse.
b) Nuage des lignes

Le nuage des emplois nest pas le mme que dans lanalyse de la somme puisque la
distance entre deux catgories demplois est induite par une rpartition en 16 modalits
et non plus en 8 modalits : les carts entre hommes et femmes jouent maintenant un
rle. Plus prcisment, on peut montrer que le carr de la distance entre deux emplois i
et l (ou entre un emploi i et le barycentre G du nuage) se dcompose en une somme de
deux termes. Le premier nest autre que le carr de leur distance dans le tableau somme,
actif dans lanalyse de la section 10.3 ; cest la part inter-diplmes de la distance. Le
second terme est aussi le carr dune distance : il exprime la part intra-diplme. Pour
dmontrer cette galit, il suffit dcrire formellement les distances entre profils :

2
2
d 2 (i, l) = dsomme
dintra
(i, l)
(i, l) +
j
j
2
d 2 (i, G) = dsomme
(i, G) +


j

d2intra j (i, G)

10.4 Deuxime analyse : AFC de variables croises ou de tableaux juxtaposs

ingnieur

243

F2 : 24.3%
2 : .321

TUDES SUPRIEURES

cadre suprieur

H
H
ouvrier qualifi

H
H
DEUG

H
H

BAC TECHNIQUE

cadre moyen

SANS
DIPLME

BEPCAP

Technicien

agriculteur
ouvrier
non qualifi

F1 : 42.1%
1 : .558

F
BAC
GNRAL

DUT/BTS

empl.
non
qualifi
empl.
F qualifi

BEPC

F
F

Dunod La photocopie non autorise est un dlit

Figure 10.11 Le plan des deux premiers facteurs de lAFC des tableaux juxtaposs.

Ainsi, que ce soit dans le nuage des lignes ou celui des colonnes, linertie se dcompose
en deux parts : la part inter-diplmes qui est celle de la premire analyse (celle de la
somme) et la part intra-diplme qui sy ajoute. dintra j est spcifi en 10.5.4.
Le graphique des deux premiers facteurs (cf. Figure 10.11) est assez semblable
celui obtenu dans lanalyse de la marge. Ceci na rien pour nous tonner car la double
structure dordre, qui est une structure inter-diplmes, est trs forte. Les paragraphes
suivants permettent de comparer plus prcisment les rsultats de ces deux analyses.
Notons seulement ici que, si linertie de ce premier facteur est lgrement suprieure
celle du premier facteur de la somme, le pourcentage dinertie extrait est beaucoup
plus faible, linertie totale tant plus leve.

244

10 Comparaison de tableaux de frquence binaire

10.4.3 Indices de contribution linertie de la marge


et des sous-tableaux
Lorsque la structure des donnes dfinit une partition naturelle sur lensemble
des points dun nuage, il est intressant de calculer des indices qui gnralisent, aux
sous-nuages et au nuage des barycentres, lindice de contribution linertie dfini pour
un lment. Prcisons bien que la dcomposition de linertie se fait suivant le principe
de Huygens. La contribution linertie dun sous-nuage nest pas la somme des contributions linertie de ses lments mais son inertie intra (rapporte, comme toujours
dans le calcul des contributions, linertie totale). La somme des contributions des
sous-nuages est la part intra de linertie et la contribution du nuage des barycentres
est la part inter . Une discussion analogue, dans le contexte de linterprtation
conjointe dune ACP et dune CAH, est dveloppe en 2.5.2.
Lensemble des colonnes tant, dans notre exemple, form par les modalits de
deux variables croises, deux dcompositions sont possibles. Dans la premire, celle
indique dans la section prcdente pour comparer cette analyse celle de la somme,
lensemble des 16 profils demplois est dcompos en 8 sous-ensembles des deux
lments correspondant au mme diplme. Dans la seconde, il se dcompose en
2 sous-ensembles de 8 lments correspondant aux 8 diplmes pour chacun des deux
sexes. Ces deux dcompositions apportent des rsultats complmentaires.
a) Contribution linertie : dcomposition en 8 sous-tableaux

Schmatiquement, cette premire dcomposition permet de rpondre la question


suivante : dans le choix dun emploi, quel est le plus dterminant ? le diplme obtenu
ou bien, diplme gal, le sexe ? Commentons le tableau 10.6 qui donne, dans
lespace et sur chacun des 4 premiers facteurs :
1. le pourcentage dinertie inter (inertie des 8 profils demplois de chacun des
diplmes hommes et femmes cumuls rapporte linertie totale) ;
2. les 8 pourcentages dinertie intra de chacun des diplmes (inertie du nuage des
deux profils demplois des hommes et des femmes rapporte linertie totale).
Dans lespace tout entier, linertie inter-diplmes est de lordre de 2/3 de linertie
totale : le diplme joue un rle prpondrant dans lemploi occup ; mais la part
restante, presque 1/3 de la totalit, montre bien que le sexe, diplme gal, nest pas
sans importance. La diffrence entre les profils demplois des hommes et des femmes
diplme gal est importante surtout au niveau des CAP/BEP : linertie de ce seul
sous-nuage reprsente 12.2 % de linertie totale et presque la moiti de linertie intra.
Sur le premier facteur F1 , linertie est presque exclusivement une inertie inter
(0.944). Cela montre clairement quil sagit dun facteur inter-diplmes : le niveau
moyen dun profil demplois est dtermin par le niveau de diplme sans que le sexe
intervienne.

10.4 Deuxime analyse : AFC de variables croises ou de tableaux juxtaposs

245

Tableau 10.6 Linertie totale et sa dcomposition inter-diplmes et intra-diplme dans lanalyse


des profils demplois.

Dunod La photocopie non autorise est un dlit

Inertie totale
I. inter (en %)
I. intra (en %)
Sans diplme
BEPC
CAP/BEP
BAC gnral
Bac technique
DEUG
DUT/BTS
Suprieur

Espace entier
1.326
.709
.291
.057
.018
.122
.013
.015
.008
.032
.027

F1
.558
.944
.056
.013
.001
.037
.000
.003
.000
.002
.000

F2
.321
.513
.487
.105
.040
.288
.013
.021
.010
.002
.008

F3
.170
.660
.340
.050
.045
.184
.000
.036
.020
.001
.005

F4
.140
.811
.189
.070
.004
.091
.001
.001
.003
.017
.001

Dans notre exemple o le jeu de donnes est de dimension trs faible, on dcle trs
rapidement cette structure sur les graphiques. Lintrt de cet indice est de la quantifier.
Dans ltude de donnes de dimension plus importante, un tel indice peut apporter un
gain de temps prcieux : une inertie inter aussi importante montre que linterprtation
de laxe doit sappuyer uniquement sur les barycentres.
Le deuxime facteur est mixte : son inertie est pour moiti inter et pour moiti intra.
Son interprtation est plus complexe car elle ncessite de prendre en compte les deux
dispersions. Lcart entre les hommes et les femmes joue un rle important sur cet axe,
surtout au niveau des CAP/BEP et des sans-diplme. La parabole traduisant leffet
Guttman est moins rgulire que dans lAFC de la somme. Le troisime facteur est
encore mixte tandis que le quatrime est plutt inter-diplmes.
b) Contribution linertie : dcomposition en 2 sous-tableaux

Schmatiquement, cette seconde dcomposition des mmes donnes et des mmes


facteurs permet de rpondre la question suivante : dans le choix dun emploi, quel
est le plus dterminant ? Le sexe ou bien, pour un sexe donn, le diplme possd ?
Commentons le tableau 10.7 qui donne, dans lespace entier et sur chacun des 4
premiers facteurs :
1. le pourcentage dinertie inter (inertie des 2 profils des hommes et femmes tous
diplmes cumuls rapporte linertie totale) ;
2. les 2 pourcentages dinertie intra de chacun des sexes (inertie du nuage des
8 profils demplois des hommes ou des femmes rapporte linertie totale).

10 Comparaison de tableaux de frquence binaire

246

Tableau 10.7 Linertie totale et sa dcomposition inter-sexes et intra-sexe dans lanalyse des
profils demplois.

Inertie totale
I. inter (en %)
I. intra (en %)
Hommes
Femmes

Espace entier
1.326
.172
.828
.465
.363

F1
.558
.070
.930
.544
.386

F2
.321
.506
.494
.244
.267

F3
.170
.092
.907
.313
.594

F4
.140
.001
.999
.824
.175

La diffrence entre les profils demplois des hommes et des femmes, tous diplmes
cumuls, reprsentent 17 % de linertie du nuage. Elle ninflue que sur le deuxime facteur. Le premier facteur, comme les facteurs 3 et 4, est d exclusivement lcart entre
profils demplois correspondant des diplmes diffrents, tant chez les hommes que
chez les femmes. Notons que le facteur 4 montre une dispersion beaucoup plus importante chez les hommes que chez les femmes. Sur les autres facteurs, ces dispersions
sont plus quilibres.
c) Complmentarit des deux dcompositions

Les rsultats des deux dcompositions de linertie, suivant le sexe ou le diplme, ne


sont pas directement lis. Ainsi, la dispersion inter-sexes du tableau 10.7 est plus
faible que la dispersion intra-diplme du tableau 10.6 ; la seconde correspond aussi
une dispersion due au sexe, mais diplme constant.
Dans ces donnes, il y a une interaction entre le sexe et le diplme sur le profil
demplois ; en cumulant les diplmes pour un mme sexe, des carts qui ne jouent pas
dans le mme sens se neutralisent.
La figure 10.12 illustre ces deux dcompositions dans deux cas schmatiques comportant chacun deux diplmes. Dans le cas 1, la variabilit intra-diplme est la mme
pour chacun des diplmes : elle est donc identique la variabilit inter-sexes. Dans
le cas 2, la variabilit intra-diplme est trs diffrente dun diplme lautre : la
variabilit inter-sexes est nulle.
On retiendra que les deux dcompositions sont deux regards diffrents sur les
donnes qui peuvent avoir chacun leur intrt ; la dcomposition la plus intressante
(ici celle en 8 sous-tableaux) nest pas forcment celle qui vient la premire lesprit.

10.4.4 Indices de qualit de reprsentation des diffrents nuages


La qualit de reprsentation dun nuage sur un axe (ou sur un sous-espace) est le
rapport entre linertie du nuage projet et linertie du nuage dans lespace. Comme
dans la section prcdente, nous suivons la dcomposition de Huygens pour calculer

10.4 Deuxime analyse : AFC de variables croises ou de tableaux juxtaposs

D1H

D1

D1F

D2H

D2

D1H

D1F

D1F

Cas 1 : deux dcompositions


de l'inertie totale (8)
inter-diplmes : 4 inter-sexes : 4
intra-diplmes : 4 intra sexes : 4

D2F
H

D1

247

Variabilit
inter-diplmes
intra-diplme
inter-sexes
intra-sexe

D2

D2H

Cas 2 : deux dcompositions


de l'inertie totale (8)
inter-diplmes : 4 inter-sexes : 0
intra-diplmes : 4 intra sexes : 8

Figure 10.12 Deux exemples trs simples de dcomposition de linertie totale en inerties
inter-diplmes, intra-diplmes et inter-sexes. D1 H : diplme 1 pour les hommes.

Tableau 10.8 Qualit de reprsentation du nuage des 8 barycentres des profils demplois et de
deux des 8 sous-nuages.

Dunod La photocopie non autorise est un dlit

Barycentres
CAP/BEP
Suprieur

F1
0.560
0.127
0.002

F2
0.175
0.571
0.074

F3
0.119
0.193
0.024

F4
0.121
0.079
0.005

les qualits de reprsentation des nuages dfinis par les sous-tableaux : linertie de ces
sous-nuages est calcule par rapport leur barycentre, comme dans la dcomposition
inter et intra de linertie. Les indices concernant le nuage des barycentres et chacun
des sous-nuages sutilisent de la mme manire que la qualit de reprsentation dun
point : ils permettent de reprer le ou les facteurs sur lesquels ces nuages sont bien
reprsents et, inversement, de reprer le ou les nuages qui caractrisent un facteur.
Les tableaux 10.8 et 10.9 donnent les qualits de reprsentation du nuage des
barycentres dans les deux dcompositions du nuage des 16 profils demplois et la
qualit de reprsentation de quelques sous-nuages.
Commentons dabord le tableau 10.8.
Cest sur le premier facteur que le nuage des 8 barycentres est le mieux reprsent ;
nous avons dj indiqu que ce facteur est un facteur inter-diplmes.
Par contre, cest sur le deuxime facteur que le petit sous-nuage de deux points
dfini par le niveau de diplme CAP/BEP est le mieux reprsent. Si nous voulons
prciser la diffrence entre les profils demplois des hommes et des femmes titulaires
de ce diplme, cest donc sur le deuxime facteur quil faut surtout se pencher.

10 Comparaison de tableaux de frquence binaire

248

Tableau 10.9 Qualit de reprsentation du nuage des deux barycentres hommes et femmes et
des deux sous-nuages.

Barycentres
Hommes
Femmes

F1
.174
.500
.455

F2
.724
.120
.181

F3
.069
.087
.212

F4
0
.190
.052

Pour les diplms du Suprieur, pour lesquels dailleurs la diffrence de profil


demplois des hommes et des femmes est faible (cf. Tableau 10.6), la qualit de
reprsentation est mauvaise sur les quatre premiers facteurs.
Etudions maintenant le tableau 10.9. Les facteurs sur lesquels les deux sous-nuages
hommes et femmes sont les mieux reprsents sont le premier puis le troisime pour les
femmes, le premier puis le quatrime pour les hommes. Cela, ajout au fait que le pourcentage dinertie du sous-nuage hommes sur le quatrime facteur est trs important (cf.
Tableau 10.7), montre que linterprtation de ce dernier doit tre axe essentiellement
sur la dispersion des profils demplois des hommes.

10.4.5 Indices de comparaison des facteurs des diffrents tableaux


La premire dcomposition de linertie suivant les 8 diplmes (cf. section a page 244)
a permis daffirmer que le premier facteur du tableau juxtaposant les deux tableaux
hommes et femmes est un facteur inter-diplmes. Mais est-il confondu avec le premier
facteur de lanalyse inter-diplmes, cest--dire celui de lAFC de la somme de ces
deux tableaux ? La ressemblance entre les graphiques de ces deux analyses tend le
montrer mais il est utile de quantifier cette ressemblance par un indice numrique.
La deuxime dcomposition de linertie, suivant le sexe et non plus le diplme,
montre que le premier facteur est aussi un facteur intra-hommes et intra-femmes. La
mme question se pose : est-il confondu avec le premier facteur de chacun de ces deux
tableaux ?
De mme, on peut chercher comparer entre eux les facteurs des deux tableaux
hommes et femmes et plus gnralement les facteurs de tous les tableaux binaires
tudis conjointement.
Lexprience de lACP montre quil est beaucoup plus efficace de comparer un
ensemble de variables (ici de facteurs) sur un rfrentiel commun que de les comparer
deux deux. Nous effectuons cette comparaison des facteurs dans lAFC des tableaux
juxtaposs car les facteurs de cette dernire forment un rfrentiel commun bien
adapt. Notons dailleurs que la juxtaposition des deux tableaux suivant les catgories
demplois permet de comparer les facteurs dfinis sur cet ensemble mais ne permet
pas de comparer les facteurs dfinis sur lensemble des diplmes.

10.4 Deuxime analyse : AFC de variables croises ou de tableaux juxtaposs

249

marge

marge

fi..

fijt

fi.t

fijt

I
Figure 10.13 Marges du tableau juxtapos et du sous-tableau t.

Dunod La photocopie non autorise est un dlit

a) Problme du poids des lignes et choix dun rfrentiel commun

Les facteurs de tous les tableaux tant des fonctions numriques dfinies sur le mme
ensemble I , il parat naturel, pour les comparer deux deux, de calculer leurs coefficients de corrlation et par consquent de les comparer tous simultanment laide
dune ACP. Mais le calcul des corrlations fait intervenir le poids des individus (ici les
lignes i) ; or ces facteurs proviennent dAFC dans lesquelles les lignes ont des poids
imposs. Ces poids sont dfinis par la marge sur I du tableau analys ; ils interviennent
dans le calcul des facteurs et ces facteurs sont centrs pour ces poids. Or, si la marge
sur I du tableau juxtaposant les tableaux hommes et femmes est gale celle de la
somme de ces deux tableaux, les marges des tableaux pris sparment sont diffrentes
(cf. Figure 10.13). Cette diffrence de marge et par suite de poids ne fait que traduire
une diffrence plus fondamentale : les populations qui dfinissent une mme ligne i ne
sont pas les mmes (hommes et femmes par exemple). En toute rigueur, les facteurs de
ces tableaux tant dfinis sur des objets diffrents, on ne peut dfinir leur corrlation.
Cependant il est utile de disposer dindices mesurant la ressemblance entre facteurs
qui reprsentent la projection du mme ensemble de modalits.
On peut songer affecter un poids identique toutes les lignes i. Dans ce cas,
les facteurs sont recentrs lisobarycentre des points, et les barycentres pondrs,
rfrences fondamentales de la situation dindpendance, ne jouent pas leur rle ce
qui diminue considrablement lintrt des rsultats.
Il est plus logique daffecter aux lignes i les poids f i. dfinis par la population
entire. Ceci rsout le problme de la comparaison des facteurs du tableau juxtapos
et de ceux des deux tableaux somme f i j. et f i.t puisque ces tableaux ont tous deux
pour marge f i.. .
Il ne reste alors que le problme de la comparaison des facteurs des sous-tableaux.
Prenons par exemple le tableau dfini en fixant t. Sa marge sur I vaut f i.t (cf.
Figure 10.13). Pour comparer ses facteurs sur I nots Fst (i) aux facteurs dfinis
sur la population entire o la ligne i a le poids f i.. , nous allons les redresser en les
multipliant par le rapport f i.t / f i.. . Cette transformation sappuie sur trois arguments :

10 Comparaison de tableaux de frquence binaire

250

a) Ce redressement permet dobtenir des fonctions centres pour les poids f i.. :
 


f i.t t
f i..
F (i) =
f i.t Fst (i) = 0
f i.. s
i

b) Le facteur redress apparat comme une mise en perspective du facteur Fst (i), en
tant que terme dcart lindpendance, dans le cadre du tableau juxtapos. En effet, la
formule de reconstitution des donnes applique au tableau t de terme gnral f i jt / f ..t
fait apparatre le modle de rfrence dfini par lindpendance des deux caractres
sur la sous-population t :


 1
f i jt
f i.t f . jt
Fst (i)G ts ( j)
1+
=
f ..t
f ..t f ..t
ls
s
Dans cette formule, Fst (i) apparat comme un terme de lcart au modle dindpendance. Une transformation simple de cette formule fait apparatre dune part le modle
de rfrence dfini par lindpendance sur la population entire ( f i.. f . jt ) et, dautre
part, le facteur redress :




f i jt
f i.. f . jt
f i.t  1
f i.t t
t

=
+
F (i) G s ( j)
f ..t
f ..t f ..t
f i..
ls f i.. s
s
c) On peut montrer2 que les facteurs sur I du tableau juxtapos sont les composantes
principales de lensemble des variables suivantes :
1. les facteurs redresss des T sous-tableaux ;
2. les facteurs du tableau somme f i.t .
Dans cette ACP non norme, les facteurs du sous-tableau t ont un poids gal f ..t ,
ceux du tableau somme un poids gal 1 et les individus ont un poids gal f i.. .
Lquivalence entre cette ACP et lAFC est importante. Outre le fait que les facteurs
redresss sintroduisent naturellement dans cette ACP, elle montre que les facteurs
sur I du tableau juxtapos forment le rfrentiel commun adapt la comparaison de
tous ces facteurs. Elle offre aussi une possibilit de calcul exploite dans lanalyse par
sous-tableaux (cf. Section 10.4.6 page 252).
La reprsentation des facteurs norms des sous-tableaux et du tableau somme sur le
cercle des corrlations sobtient facilement partir des rsultats de lAFC du tableau
juxtapos par de simples calculs de corrlation.

2. Cluster Analysis and Data Analysis. M. Jambu and M.O. Lebeaux, NorthHolland, 1983, p.481.

10.4 Deuxime analyse : AFC de variables croises ou de tableaux juxtaposs

251

Tableau 10.10 Corrlations entre les facteurs de lanalyse du tableau juxtapos et ceux des autres
analyses.

Tableau
analys
Hommes
+
Femmes

Hommes

Femmes

F1
F2
F3
F4
F1
F2
F3
F4
F1
F2
F3
F4

F1
-.986
-.088
.008
.136
.949
.015
-.032
.006
.888
.080
-.067
-.142

Tableau juxtapos
F2
F3
-.158
.060
.784
.607
-.056
.182
-.557
.745
-.120 -.178
.756
.385
.014 -.355
-.284
.595
-.214
.316
.616
.614
-.471
.541
-.354
.329

F4
-.012
-.071
.969
-.139
-.036
.126
.926
.169
.063
.079
.534
-.376

b) Rsultats

Dunod La photocopie non autorise est un dlit

Pour les facteurs, comme pour les autres indices, on peut dcomposer le mme tableau,
soit en 8 tableaux de 2 colonnes, soit en 2 tableaux de 8 colonnes. Dans la premire
dcomposition, seuls les facteurs de la marge prsentent un intrt puisque les soustableaux nont que deux colonnes et un unique facteur. Inversement, dans la deuxime
dcomposition, nous nous intressons aux facteurs des deux tableaux hommes et
femmes et ngligeons celui du tableau marge qui ne comprend que 2 colonnes.
Commentons le tableau 10.10 qui contient les corrlations entre :
1. dune part les facteurs des tableaux juxtaposs ;
2. dautre part les facteurs de la somme du tableau hommes et du tableau femmes
ainsi que les facteurs redresss des deux tableaux hommes et femmes.
On constate la grande ressemblance entre le premier facteur du tableau juxtapos, celui
de la somme ainsi que celui du tableau hommes ; le premier facteur du tableau femmes
est encore assez proche : la double structure dordre des emplois et des diplmes est
assez forte pour dterminer le premier facteur de tous ces tableaux.
Le deuxime facteur du tableau juxtapos est un compromis entre plusieurs facteurs
de chacun des tableaux et de leur somme.
La reprsentation de ces facteurs (facteurs redresss des sous-tableaux et facteurs
du tableau somme) sur le cercle des corrlations du plan 2-3 (cf. Figure 10.14) montre
les ressemblances entre les facteurs dordre 2 des sous-tableaux et du tableau somme.

10 Comparaison de tableaux de frquence binaire

252

F3

F4
f2

h3

s3
f3

s2
h2

h4

F2
f4

s4

F3

Figure 10.14 Reprsentation des facteurs des tableaux somme (s), hommes (h) et femmes (f) sur
les plans 2-3 et 3-4 de lAFC du tableau juxtapos.

Le cercle des corrlations du plan 3-4 montre que les facteurs dordre 3 et dordre 4
des tableaux hommes et femmes ne se correspondent pas.
En conclusion, la dimension principale traduite par le premier plan (double structure
dordre) est commune aux deux tableaux. Les dimensions suivantes diffrent.

10.4.6 Calcul des diffrents indices et AFC par sous-tableaux


Les tableaux juxtaposs issus dun tableau ternaire entrent dans le cadre gnral de
tableaux assimilables des tableaux de frquence dont lensemble des colonnes est
structur en plusieurs groupes. Les trois sries dindices introduites plus haut et qui
concernent les sous-tableaux ainsi dfinis et le tableau (dit tableau-marge) constitu
par lensemble des marges des sous-tableaux (contributions linertie, qualit de
reprsentation des nuages associs et comparaison des facteurs) sont valables dans ce
cadre gnral.
Le calcul de ces indices ncessite un programme spcifique. Il existe, dans la programmathque ADDAD, un tel programme. Initialement, ce programme a t conu
pour traiter des tableaux trop grands pour les programmes classiques. Ce problme se
pose de moins en moins mais cette possibilit demeure.
Le dcoupage en sous-tableaux est choisi par lutilisateur. Les AFC du tableaumarge et des sous-tableaux sont effectues dabord. Ces analyses sont ncessaires,
au moins pour le calcul des corrlations entre leurs facteurs. Les facteurs sur I du
tableau entier sont obtenus ensuite par une ACP non norme de lensemble des facteurs
redresss des sous-tableaux et des facteurs du tableau-marge.

10.4 Deuxime analyse : AFC de variables croises ou de tableaux juxtaposs

253

Les derniers facteurs des sous-tableaux et du tableau-marge peuvent tre limins


de cette ACP. Comme ils correspondent aux inerties les plus faibles, ils ne traduisent
quune information souvent ngligeable si ce nest du bruit. Avec ce principe, on
obtient de bonnes approximations des facteurs de tableaux dont le nombre de colonnes
(qui dtermine la dimension de la matrice diagonaliser) dpasse les capacits de
calcul disponibles. Des indices concernant la qualit de lapproximation compltent
le programme. Le nuage de lignes analys dans lapproximation tant une projection
du nuage exact, lindice gnral de qualit de lapproximation est le rapport entre les
inerties de ces deux nuages.
Les contributions du tableau-marge et des sous-tableaux (inter et intra) sont donnes directement par la somme des contributions de leurs facteurs. Les qualits de
reprsentation de ces nuages en drivent immdiatement.

Dunod La photocopie non autorise est un dlit

10.4.7 AFC de tableaux juxtaposs et AFM


LAFC par sous-tableaux et lAFM traitent de tableaux de donnes dont lensemble
des colonnes est structur en groupes. Elles prsentent donc une certaine analogie
mais, du fait que lAFM a t conue pour traiter des tableaux individusvariables,
son aptitude traiter des tableaux de contingence juxtaposs ncessite dtre discute.
En AFM, les lignes reprsentent des individus ou des classes dindividus. Ce dernier
point de vue est tout fait compatible avec les tableaux de contingence dans lesquels
une modalit est souvent considre comme lensemble des individus qui la possdent.
En outre, chaque ligne est affecte dun poids, identique pour tous les sous-tableaux.
Ce problme a t rencontr lors de la comparaison des facteurs des AFC spares
des sous-tableaux (cf. section a page 249) ; il a pu alors tre rsolu empiriquement
car il ne concernait que des indices daide linterprtation. Il ne peut tre question
dappliquer cette solution lAFM dans laquelle les poids des individus interviennent
ds le centrage des nuages dindividus. En conclusion, lAFM ne peut tre applique
des tableaux de contingence juxtaposs que si les marges de ces tableaux sont
identiques dun groupe de colonnes lautre. Cette contrainte peut sembler restreindre
fortement le champ des applications : ainsi, on ne peut raliser lAFM du tableau de
la figure 10.10, les sous-tableaux hommes et femmes constituant chacun un groupe
actif. En fait, cette contrainte met en exergue la difficult comparer des tableaux de
contingence ayant des marges diffrentes. Dans ce paragraphe, nous considrons donc
des sous-tableaux ayant la mme marge sur les lignes.
Dans loptique de lAFM sur tableaux de frquence, les classes dindividus sont
dcrites par la rpartition des leurs individus selon plusieurs variables qualitatives. En
rfrence lAFC, la ressemblance entre classes doit tre mesure, au sein de chaque
sous-tableau, par la distance du x2 applique aux profils. Ce point de vue de lAFC se
transpose directement lAFM.

254

10 Comparaison de tableaux de frquence binaire

En revanche, la pondration des sous-tableaux, fondamentale en AFM, ncessite


dtre discute dans le cas des tableaux de contingence. En effet, dans un tableau de
frquence, linfluence du sous-tableau t sur les facteurs de lAFC globale dpend de
deux lments :
1. sa marge sur I , qui dtermine la position du barycentre du nuage des colonnes
de t et qui intervient dans linertie inter ; cet aspect est limin par la contrainte
impose plus haut ;
2. la liaison, dans le tableau t, entre les deux variables dont les modalits sont
les lignes pour lune et les colonnes pour lautre : lintensit de cette liaison
dtermine la dispersion du nuage des colonnes de t autour de son barycentre.
Ainsi, alors que dans les tableaux de variables ce sont les redondances entre variables
qui entranent un dsquilibre entre les groupes, dans un tableau de contingence, il ne
peut y avoir de phnomnes de redondance. Le principe dquivalence distributionnelle
montre bien quen aucun cas la ressemblance entre deux colonnes ne perturbe les
rsultats.
Lopportunit de lAFM par rapport lAFC doit tre dcide en rfrence cet
aspect. Si lon considre que chaque sous-tableau doit influer dans lanalyse dautant
plus quil scarte de lindpendance, lAFC simpose : cest le cas gnral lorsque
chaque sous-tableau correspond un seul tableau de contingence. Si, en revanche, on
souhaite quilibrer linfluence a priori des sous-tableaux, on utilisera lAFM. Nous
donnons ci-aprs quelques exemples pour lesquels lAFM est adapte.
1. Chaque sous-tableau est lui-mme une juxtaposition de tableaux de contingence,
auquel cas des redondances peuvent apparatre. Exemple : on reprend le tableau
des vins (cf. Figure 7.1 page 150) en conservant les mmes individus et les
mmes groupes mais en remplaant chaque colonne k par le tableau de contingence contenant la rpartition des 36 juges selon les 5 valeurs de la variable
k.
2. Comparaison de grilles danalyse. Exemple : chaque sous-tableau comporte en
ki j le nombre de personnes habitant dans la ville i et appartenant la CSP j. Les
sous-tableaux diffrent entre eux par le niveau de dtail des CSP.
3. Comparaison des deux tours dune lection. Chaque sous-tableau concerne lun
des tours et comporte en ki j le nombre de voix obtenues dans le bureau de vote
i par le candidat j. LAFM est ici choisie pour lquilibre entre les deux tours
quinduit la pondration.
Remarques

Les Tableaux Disjonctifs Complets peuvent techniquement tre traits soit par lAFM
soit par une analyse par sous-tableaux qui drive de lAFC. Comme il sagit fondamentalement de tableaux de variables, la premire solution est prfrable. Notons dailleurs

10.4 Deuxime analyse : AFC de variables croises ou de tableaux juxtaposs

255

que les commentaires concernant les diffrences entre les marges des sous-tableaux
(qui induisent la part inter de linertie) ne concernent pas les TDC qui ont une marge
constante sur I pour chaque variable.
Au sein dune AFM, on peut faire intervenir simultanment des groupes de variables
de type frquence, quantitatif et qualitatif. Les groupes de type frquence doivent
videmment avoir la mme marge sur I et cette marge impose les poids des individus pour toute lanalyse, mme si les groupes de type frquence sont introduits en
illustratifs.

10.4.8 Bilan sur lanalyse de tableaux juxtaposs


Comme pour lAFC de la somme de T tableaux (tudie dans la section 10.3), examinons la qualit des rponses apportes par lAFC des tableaux juxtaposs aux questions
poses par la comparaison de tableaux binaires. Mais dabord deux remarques sont
ncessaires.

Dunod La photocopie non autorise est un dlit

Non-symtrie des lignes et des colonnes

Dans tous les aspects de la comparaison, la non-symtrie fondamentale du rle des


lignes et des colonnes dans la juxtaposition des tableaux apparat. Nous avons juxtapos les deux tableaux de notre exemple en prenant comme dimension commune
les catgories demplois. Il est possible de les juxtaposer aussi suivant les niveaux de
diplme (cf. Figure 10.15). En inversant, dans la juxtaposition, le rle des emplois et
des diplmes, on pose un problme diffrent. Nous avons compar les profils demplois de chacun des deux sexes, niveau de diplme gal ; dans la juxtaposition suivant
les diplmes, on compare les profils de diplmes de chacun des deux sexes catgorie
demplois gale.
Pour souligner la diffrence, indiquons seulement que, dans notre exemple, linertie
des nuages dans le second cas est beaucoup plus faible que dans le premier. Plus
prcisment, linertie intra-emploi est quatre fois plus faible que linertie intra-diplme.
Autrement dit, si la rpartition des emplois diplme gal varie beaucoup dun sexe
lautre, celle des diplmes emploi gal est bien moins diffrencie.
Caractre mixte de lanalyse

Cette analyse tient compte la fois de la dispersion inter-tableaux et de la dispersion


intra-tableau. Elle peut aboutir des facteurs mixtes qui traduisent la fois les
deux dispersions (cas du deuxime facteur de notre exemple). Leur interprtation peut
tre alors assez complexe.
tude de la structure commune et des carts cette structure : un peu

Tout dpend de leur importance relative : sil existe des tendances communes trs
fortes par rapport aux carts, lAFC des tableaux juxtaposs aboutit peu prs au

10 Comparaison de tableaux de frquence binaire

256

Diplmes

Diplmes
Emplois

Emplois
Emplois

Diplmes

Hommes
Hommes

Femmes

Femmes

Figure 10.15 Les deux juxtapositions des tableaux.

mme rsultat que lAFC de leur somme et la structure commune est analyse (cas du
tableau croisant, par canton, les causes de mortalits I avec les classes dge J : la
diffrence entre les causes de mortalit dune classe dge lautre est beaucoup plus
importante que dun canton lautre pour une mme classe dge). Si, au contraire,
ce sont les carts qui prdominent, cette AFC reprsente bien les diffrences et mal la
structure commune. Par son caractre mixte, cette analyse nest pas la mieux adapte,
ni ltude de la structure commune, ni celle des carts.
Comparaison des profils des lignes et des colonnes : un peu

Comme dans lAFC de la somme des tableaux, les profils des colonnes de tous les
tableaux sont reprsents sur les mmes graphiques, ce qui permet de les comparer.
Les carts entre les profils des colonnes homologues interviennent maintenant dans la
dtermination des axes ; ils seront donc a priori plus visibles dans cette analyse que
dans lAFC de la somme. Cependant, si ces carts sont faibles relativement ceux
des diffrentes colonnes dun mme tableau (comme dans lexemple des causes de
mortalit), ils sont difficiles dtecter. Les profils des lignes des diffrents tableaux
ne sont pas compars.
Mesure de limportance relative des diffrences : colonnes oui, lignes non

Les indices de contribution linertie inter et intra donnent une mesure trs satisfaisante de limportance des carts des colonnes homologues aux colonnes moyennes.
Pour lensemble des lignes, il ny a rien de semblable.
Comparaison des facteurs des analyses spares : oui

Les facteurs du nuage des colonnes du tableau juxtapos forment un rfrentiel commun bien adapt lensemble des facteurs colonnes de tous les tableaux. La projection
de ces facteurs sur ce rfrentiel permet de les comparer efficacement.

10.5 Troisime analyse : analyse intra

257

10.5 TROISIME ANALYSE : ANALYSE INTRA


Le terme analyse intra a t introduit par Brigitte Escofier lorsquelle a propos
la mthode expose ci-aprs. Par la suite, Pierre Cazes a introduit le terme AFC
interne pour une mthode plus gnrale que celle propose par Brigitte Escofier. Nous
conservons le terme intra qui peut tre commodment prcis (e.g. analyse intradiplmes).

10.5.1 Problmatique et principes de lanalyse intra

Dunod La photocopie non autorise est un dlit

a) Diffrences entre les profils demplois des hommes et des femmes diplme
gal

Dans la dcomposition de linertie du nuage des colonnes du tableau juxtapos, lensemble de ces diffrences forme linertie intra-diplme. Aucune des deux premires
analyses ne permet lanalyse systmatique de ces diffrences. En effet, dans la premire (AFC de la somme des tableaux), seule la dispersion inter-diplmes intervient
dans le calcul des axes sur lesquels sont projets les profils demplois des diplms
des deux sexes. Dans la deuxime (AFC des tableaux juxtaposs), les dispersions inter
et intra interviennent conjointement et lune peut masquer lautre. Pour analyser les
diffrences, il faut une analyse dans laquelle seule la dispersion intra intervient.
Gomtriquement, la solution est simple. Pour tudier les diffrences entre les
profils demplois des hommes et des femmes diplme gal, il suffit de considrer
le nuage obtenu en recentrant lorigine tous les sous-nuages de deux points dfinis
par un diplme (cf. Figure 10.17). Dans ce nouveau nuage, le point bachelier-homme,
par exemple, reprsente la diffrence entre le profil demplois des hommes et celui de
tous les bacheliers (hommes et femmes cumuls).
Plus gnralement, pour tudier les diffrences entre les profils des colonnes homologues de T tableaux, nous proposons danalyser un nuage driv du nuage construit
dans lAFC du tableau juxtapos, en recentrant lorigine tous les sous-nuages composs des T colonnes homologues. Toute la dispersion inter du nuage initial tant
ainsi supprime, il ne reste que la part intra qui peut tre analyse quelle que soit son
importance relative. Ce qui rsout le problme, par exemple, de la comparaison des
causes de mortalit dans les diffrents cantons classe dge gale.
b) Comparaison des emplois travers la diffrence de rpartition entre
hommes et femmes diplme fix

On peut aussi chercher faire une typologie des emplois travers la diffrence de recrutement suivant les deux sexes, ceci indpendamment du diplme possd. Autrement
dit, dans la typologie cherche, deux emplois sont proches si, pour certains niveaux de
diplme, ils ont tous deux un pourcentage trop (ou pas assez) lev dhommes.

258

10 Comparaison de tableaux de frquence binaire

Cette question est la duale de la prcdente. En effet (cf. section b page 242),
linertie du nuage des lignes (emplois) construit dans lAFC des tableaux juxtaposs
se dcompose, comme celle du nuage des colonnes, en une part inter-diplmes et
une part intra-diplmes. Pour un emploi donn, caractris par les pourcentages des
diplms des deux sexes, le carr de sa distance un autre emploi est donn par la
diffrence entre leurs profils de diplmes les deux sexes tant cumuls (part inter)
et la diffrence entre les pourcentages dhommes et de femmes diplme fix (part
intra). De mme, dans lexemple du tableau croisant des entreprises (I ), des catgories
demplois (J ) et des annes (T ), les distances entre entreprises induites par la variable
croise J T se dcomposent en une part inter (induite par J , toutes annes cumules)
et une part intra (volution de la rpartition des emplois). Pour analyser les volutions,
il faut une analyse dans laquelle ne subsiste que la part intra.
La solution gomtrique consiste construire un nuage dans lequel les distances
sont ces distances intra.
c) Principe de lanalyse intra

LAFC du tableau juxtapos ne permet pas danalyser isolment la dispersion intra.


Pour cela, nous gnralisons lAFC et tudions lcart entre le tableau juxtapos et un
tableau modle qui nest pas, comme en AFC classique, le modle dindpendance.
Les rsultats peuvent tre obtenus en utilisant un programme classique dAFC
appliqu un tableau transform. On obtient les projections, sur leurs axes dinertie,
dun nuage de colonnes et dun nuage de lignes dans lesquelles ne subsiste que linertie
intra-diplme ; ces projections sont lies par des formules de transition. Ce principe
est suffisant pour comprendre les commentaires de lexemple de la section 10.5.5. Les
sections intermdiaires permettent, au lecteur qui le souhaite, de trouver des prcisions
techniques sur cette mthode ainsi quune ouverture sur une gnralisation de lAFC.

10.5.2 Gnralisation de lAFC


LAFC classique analyse lcart entre un tableau de frquence et un tableau modle
correspondant lhypothse dindpendance. Dans ce modle, qui nest autre que le
produit des marges, les colonnes (resp. les lignes) ont toutes le mme profil. Ce profil
modle est confondu avec le barycentre du nuage. Dans les deux nuages de profils, la
rfrence au modle dindpendance se traduit par le centrage du nuage : chaque ligne
(resp. colonne) est reprsente par la diffrence entre son profil et le profil moyen.
LAFC se gnralise un modle diffrent du modle dindpendance. On suppose
que les deux marges du tableau modle sont gales celles du tableau tudi (le
modle de lanalyse intra que nous introduisons dans la section suivante vrifie cette
condition). Dans cette gnralisation de lAFC, on analyse deux nuages (de lignes
dune part et de colonnes dautre part) relis par les relations de dualit. Les points

10.5 Troisime analyse : analyse intra

259

de ces nuages ont pour coordonnes les diffrences entre les profils des lignes (resp.
colonnes) du tableau de donnes et du tableau modle. Les mtriques et les poids sont
identiques ceux de lAFC.
Techniquement, il est possible dobtenir les rsultats de la gnralisation de lAFC
en appliquant un programme classique dAFC aux donnes pralablement transformes : comme le programme dAFC se rfre au modle produit des marges, il faut
introduire le nouveau modle et supprimer le modle ancien. Le tableau trait
scrit alors :
donnes modle + produit des marges
Notons f i j le terme gnral du tableau de donnes et m i j celui du modle (avec
f i. = m i. et f . j = m . j ; le tableau analys a pour terme gnral :
f i j m i j + f i. f . j

Dunod La photocopie non autorise est un dlit

Lorsque le modle nest autre que le produit des marges, on obtient lAFC classique.
Ce tableau peut comporter des termes ngatifs mais ses deux marges, tant gales aux
marges communes des donnes et du modle, sont positives et les programmes dAFC
peuvent sappliquer. Une ligne i (resp. une colonne j), dans le nuage centr dfini
dans lAFC de ce tableau (obtenu en prenant comme origine le barycentre f . j - resp.
f i. -), reprsente bien la diffrence entre son profil dans les donnes et dans le modle
puisque son terme gnral vaut :
fi j
mi j

+ f. j f. j
f i.
m i.
Les marges du tableau analys tant gales celles du modle, les poids et les
mtriques sont identiques ceux de lAFC du tableau f i j .
Contrairement lAFC classique, la formule de transition comprend des termes
ngatifs.


1  fi j m i j
Fs (i) =
G s ( j)
f i.
ls
j

Dans la reprsentation superpose des lignes et des colonnes, une ligne i est du ct
des colonnes auxquelles elle sassocie plus dans les donnes que dans le modle et
loppos de celles auxquelles elle sassocie moins que dans le modle. En effet, dans
le premier cas, le coefficient de la formule de transition est positif tandis que dans le
second cas il est ngatif. Le mme raisonnement vaut pour les colonnes.

10 Comparaison de tableaux de frquence binaire

260

(1,1)

( j,t)

(J,T)

marge

1
fijt

fi..
f
ij.
m =
f
ijt f
. jt
. j.

I
(1,1)

( j,t)

(J,T) marge

1
i

m ijt

fi..

m = f
i..
i..
m = f
. jt
. jt
m =f
ij.
ij .

I
marge

f.jt
Figure 10.16 Le tableau juxtapos et son modle dans lanalyse intra.

Il est possible de gnraliser lAFC un modle dont les marges sont diffrentes
de celles du tableau des donnes. Dans ce cas, un programme spcial est ncessaire et
linterprtation est plus dlicate. Nous nexposerons pas la technique gnrale3 .

10.5.3 Modle de lanalyse intra


Le tableau modle, de mmes dimensions I et J T que le tableau juxtapos, est
not m i jt . Il est construit pour que son cart avec les donnes traduise exactement la
dispersion intra : il doit donc exprimer la dispersion inter.
Dans le nuage des colonnes du modle, les profils des T colonnes homologues sont
confondus avec le profil moyen f i j. / f . j. (pour un diplme donn, les profils demplois
des hommes et des femmes sont confondus avec le profil demplois de la population
entire). Pour que les caractristiques gnrales de lanalyse (mtriques et poids) soient
conserves, il faut que les marges m i.. et m . jt soient gales celles du tableau f i jt .
Ces contraintes dterminent entirement le modle : ainsi, dans le modle, la colonne
( j,t) est obtenue en multipliant le profil moyen f i j. / f . j. par f . jt .
m i jt =

f i j.
f . jt
f . j.

3. Analyse factorielle en rfrence un modle, B. Escofier, Revue de Statistique Applique, 1984,


vol.XXXII, numro 4 p. 25.

10.5 Troisime analyse : analyse intra

261

Dans lexemple tudi, la colonne Bac-hommes du modle est obtenue en multipliant


le profil demplois moyen des bacheliers hommes et femmes par leffectif total des
bacheliers-hommes.
Il est facile de vrifier les galits entre les marges des donnes et du modle :
m i j. = f i j. et m . jt = f . jt
ainsi que lgalit des profils des colonnes homologues :

Dunod La photocopie non autorise est un dlit

m i jt
f i j.
m i j.
=
=
m . jt
f . j.
m . j.
Gomtriquement, dans lespace R I , quand on passe du nuage associ au tableau
f i jt au nuage du tableau modle, on ne fait que dplacer les profils des colonnes
homologues leur barycentre sans modifier ni la mtrique ni les poids. Il ne reste donc
que la part inter de la dispersion sur le nuage des colonnes.
Appliquons au tableau modle le principe dquivalence distributionnelle (selon
lequel on ne modifie pas les distances entre les lignes dun tableau lorsque lon
regroupe des colonnes proportionnelles ; cf. section 3.4 page 68). Dans ce tableau,
les colonnes indices par le mme j sont proportionnelles entre elles, puisque toutes
proportionnelles au profil moyen f i j. / f . j. . On ne modifie donc pas les distances entre
lignes du tableau modle en regroupant les colonnes indices par le mme j. Or ce
regroupement conduit au tableau somme de terme gnral f i j. (=m i j. ) dont le profil
de la colonne j est au barycentre des colonnes {( j, t); t = 1, T } du tableau juxtapos.
Ainsi la distance entre lignes induite par le tableau modle concide avec la part inter- J
de celle induite par le tableau juxtapos.
Sous forme probabiliste, ce modle exprime lindpendance entre I et T pour la
sous-population dfinie par j :
m i jt
m i j. m . jt
=
m . j.
m . j. m . j.
Cette relation, tant vraie pour tout j, i, et t, dfinit lindpendance conditionnelle de
I et T par rapport J .

10.5.4 Interprtation des formules de lanalyse intra


Dans lanalyse intra, le tableau tudi a pour terme gnral :
ri jt = f i jt

f i j. f . jt
+ f i.. f . jt
f . j.

10 Comparaison de tableaux de frquence binaire

262

RI

bacheliers (hommes)

bacheliers
bacheliers (femmes)

Figure 10.17 Dans lanalyse intra, les sousnuages de colonnes homologues sont translats pour
faire concider leur barycentre avec lorigine.

Profils des colonnes

La i e coordonne du profil de la colonne ( j, t) dans lespace R I , du fait de lgalit


des marges r. jt et f . jt , vaut :
ri jt
f i jt
f i j.
=

+ f i..
r. jt
f . jt
f . j.
En prenant comme origine le barycentre du nuage, cette coordonne scrit :
ri jt
f i jt
f i j.
f i.. =

r. jt
f . jt
f . j.
Le nuage des colonnes de lAFC de ri jt se dduit donc de celui considr dans lAFC
de f i jt en translatant chaque sous-nuage de colonnes {( j, t), t = 1, T } dfini par un
mme j pour faire concider son barycentre avec lorigine (cf. Figure 10.17).
Profils des lignes

Les profils des lignes sont, comme ceux des colonnes, obtenus par diffrence entre
les profils du tableau tudi et ceux du modle. Ce qui donne, pour lanalyse intra, en
prenant comme origine le barycentre :


ri jt
f i jt
f i j. f . jt
f i j. f . jt
1
f . jt =

=
f i jt
ri..
f i..
f i.. f . j.
f i..
f . j.
On peut vrifier que, dans le carr de la distance entre deux lignes, la part dtermine
par les variations inter est supprime :


2
  f i jt
fl jt
fl j.
f . jt f i j.
1
2

d (i, l) =
f i..
fl..
f . j. f i..
fl..
f . jt
jt

10.5 Troisime analyse : analyse intra

263

2
2
  f i jt
  f i j.
fl jt
fl j.
1
1
d (i, l) =

f i..
fl..
f . jt
f i..
fl..
f . j.
2

jt

Dans la seconde criture, le premier terme correspond la distance (entre les profils i
et l) dans lAFC du tableau juxtapos. Le second correspond la distance dans lAFC
du tableau somme. Confronte aux quations de la section b page 242, cette quation
exprime nouveau le rle exclusif des diffrences intra-diplme dans le calcul des
distances dans cette variante de lAFC. Autrement dit, la distance entre deux emplois
ne dpend pas de la rpartition des diplmes, mais seulement des diffrences entre les
pourcentages dhommes et de femmes pour chaque niveau de diplme.
Formules de transition

Dans notre exemple, le modle traduit lhypothse suivante : pour chaque diplme j,
il y a indpendance entre lemploi et le sexe. Les emplois loin de lorigine dans lAFC
de ri jt sont donc ceux qui, pour certains diplmes au moins, nattirent pas de la mme
faon les deux sexes. Par exemple, sur un axe, un emploi est situ du mme ct quun
diplme-homme si, parmi les titulaires de ce diplme, cet emploi attire trop les
hommes.

10.5.5 Commentaires sur le plan issu de lanalyse intra-diplmes


Le plan des deux premiers facteurs (cf. Figure 10.18) est trs diffrent du plan obtenu
dans lAFC de la somme ou dans celle du tableau juxtapos. La double structure
dordre qui dterminait essentiellement ces plans est une liaison inter-diplmes limine dans lanalyse intra-diplmes.

Dunod La photocopie non autorise est un dlit

Inertie

Linertie totale du nuage des lignes et du nuage des colonnes est linertie intra-diplme.
Cette inertie est assez importante : nous avons vu (cf. Tableau 10.6) quelle reprsente
presque la moiti de linertie inter-diplmes.
Premier facteur

Le premier facteur extrait 61 % de linertie. Le diplme qui contribue le plus ce


facteur est le CAP/BEP dont la contribution linertie est de 29 % pour le CAP/BEPHommes et de 35 % pour le CAP/BEP-Femmes (donc 64 % en tout). Les deux points
reprsentant le mme diplme sont opposs sur le graphique, puisque le barycentre
de chaque sous-nuage (ici de deux points) est situ lorigine. La prpondrance
du CAP/BEP ne nous tonne pas puisque nous avons vu (cf. Tableau 10.6) que le
sous-nuage quil dfinit a une inertie intra trs suprieure aux sous-nuages dfinis par
les autres diplmes : cest le diplme pour lequel la rpartition des emplois est la plus
diffrente entre les hommes et les femmes. Cette diffrence est entirement explique
par le premier facteur puisque la qualit de reprsentation de chacun des deux points

10 Comparaison de tableaux de frquence binaire

264

F2 : 15.4 %
2 : .060

H DUT-BTS

technicien
Diplme homme
Diplme femme
Emploi

ingnieur

H BAC GNRAL
H DEUG
H TUDES SUPRIEURES

employ non qualifi


F SANS DIPLME
F BEP-CAP

H BAC TECHNIQUE
H-BEPC

employ qualifi

F1 : 60.9 %
1 : .235

cadre
suprieur

F BEPC

F BAC TECHNIQUE

ouvrier non qualifi


agriculteur

H BEP-CAP
ouvrier qualifi

F BAC GNRAL
H SANS DIPLME
cadre moyen

F TUDES SUPRIEURES

F DUT-BTS
F DEUG

Figure 10.18 Plan des deux premiers facteurs de lanalyse intra-diplme.

vaut 0.92 (elles sont forcment identiques puisque les deux points sont aligns avec O).
Ce facteur explique bien aussi la diffrence entre les profils demplois du BEPC et des
Bacs techniques qui sont aussi des diplmes de niveau moyen. On peut remarquer que
tous les diplmes-hommes sont situs droite tandis que tous les diplmes-femmes
sont gauche. Le premier facteur traduit donc une tendance gnrale de lcart entre
les profils demplois des hommes et des femmes, valable pour chaque diplme et
particulirement marque pour les CAP/BEP et les Bacs Techniques.
La projection des emplois permet dexpliquer cette diffrence. Du ct des femmes,
on trouve les employs qualifis (dont la contribution laxe est de 0.44) et du ct
des hommes, les techniciens, les ouvriers qualifis et dune faon gnrale les emplois
techniques : diplme gal, les hommes occupent plutt des emplois techniques. Cette
diffrence entre les profils demplois des deux sexes apparat en partie au niveau du

10.5 Troisime analyse : analyse intra

265

quatrime facteur de lanalyse de la somme (analyse inter) et au niveau du deuxime


facteur de lanalyse du tableau juxtapos. Elle est prpondrante dans cette analyse
intra qui ne tient compte que de ces carts.
Deuxime facteur

Le deuxime facteur reprsente 15 % de linertie. Il est dtermin essentiellement par


lemploi de technicien qui attire les hommes et repousse les femmes titulaires dun
DUT/BTS/Sant beaucoup plus quil ne le ferait dans lhypothse dindpendance
conditionnelle. Contrairement au premier facteur, les diplmes des hommes et des
femmes ne sont pas ici systmatiquement opposs.

10.5.6 Bilan
Facilit de linterprtation

On pourrait craindre que linterprtation de lanalyse intra soit complexe car elle
utilise des notions de conditionnement qui aboutissent des concepts difficiles. Or,
lexprience montre que linterprtation de ses rsultats ne pose aucun problme
particulier un utilisateur ayant une pratique de lAFC. Elle sappuie, comme elle,
sur les formules de transition et sur les indices classiques daide linterprtation : la
qualit de reprsentation et la contribution linertie des lignes et des colonnes. La
diffrence essentielle avec lAFC classique, la situation modle laquelle on se rfre,
sintgre sans difficult.

Dunod La photocopie non autorise est un dlit

Analyse cumule des sous-tableaux

On peut aussi voir lanalyse intra comme une analyse cumule de tous les soustableaux. Prenons lexemple des causes de mortalit dans les diffrents cantons suivant
chaque classe dge. Il est assez naturel dtudier sparment chacune des T classes
dge qui dfinissent T nuages de cantons et T nuages de causes de mortalit. Dans
lanalyse de chacun des sous-tableaux, les nuages des cantons sont centrs alors
que, dans lanalyse du tableau juxtapos [dcs(cantonsclasses dge)], les sousnuages dfinis par une classe dge ne le sont pas. Dans lanalyse intra, le nuage
classes dgecantons est lunion de ces T nuages centrs ; et dualement, le nuage
des causes de mortalit est un nuage dans lequel les distances au carr sont les sommes
des carrs des distances dfinies par chaque classe dge. Ainsi, une diffrence de
mortalit entre deux cantons pour une certaine cause j, peu significative lorsque lon
tudie les classes dge sparment (du fait des faibles effectifs), peut devenir notable
dans lanalyse intra si elle apparat dans lensemble des classes dge.
Classification intra

Il est possible dappliquer un programme classique de classification aux facteurs


obtenus par une analyse intra. On obtient ainsi des partitions des lignes ou des colonnes

266

10 Comparaison de tableaux de frquence binaire

suivant les proximits dfinies dans lanalyse intra ; ce rsultat est quelquefois le
principal objectif dune telle analyse.
Complments daide linterprtation

Pour faciliter linterprtation de cette analyse, on peut introduire, comme lments


supplmentaires, le tableau somme ri j. . Dans lAFC du tableau ri jt , comme dans
toute AFC, le profil de la somme de plusieurs colonnes est situ leur barycentre. On
obtient ainsi la projection des hommes et des femmes (ou des cantons dans lexemple
des causes de mortalit). Dans ce deuxime exemple o le nombre de barycentres
est assez important, il est mme possible dappliquer au tableau ri jt une analyse par
sous-tableaux en suivant la partition des colonnes induite par les cantons. Les rsultats
de cette analyse sont identiques ceux de lanalyse intra mais lon dispose, en plus,
de toutes les aides linterprtation concernant les cantons.
Nouvelle analyse drive de lanalyse intra

Dans le paragraphe ci-dessus, il est propos dutiliser la structure croise (J , T ) des


colonnes et dintroduire en lments supplmentaires les colonnes du tableau de
dimensions I et J obtenu en sommant sur T . On peut faire une autre analyse en
prenant ce tableau somme en actif. Ceci prsente de lintrt pour de grands tableaux,
comme celui de lexemple des causes de mortalit, qui ont des colonnes deffectif
assez faible : on cumule ainsi les effets des classes dge sans travailler directement
sur ces colonnes. Il sagit en quelque sorte dune analyse inter de lanalyse intra. Cest
aussi une analyse du tableau croisant cantons et causes de mortalit par rapport un
modle ; ce modle drive de lhypothse dindpendance conditionnelle par classe
dge en moyennant sur lensemble des classes dge.
Principaux aspects de lanalyse intra

En ce qui concerne les rponses apportes aux questions poses par la comparaison
des tableaux, le bilan est rapide car nous en avons soulign les diffrents aspects tout
le long de ce texte. Lanalyse intra permet dtudier :
1. la liaison entre deux variables en conditionnant par une troisime ;
2. les diffrences entre les profils des colonnes homologues de tous les tableaux ;
3. les diffrences entre les volutions dun tableau lautre des profils des
lignes.

10.6 CONCLUSION
Il est assez tonnant de voir le nombre de traitements diffrents, et par-l mme de
regards diffrents, que lon peut porter sur ces deux petits tableaux.

10.6 Conclusion

267

Cela illustre bien la fois la complexit du problme des tableaux ternaires et la


ncessit dune rflexion pralable aux traitements qui prcise les objectifs poursuivis.
Cette rflexion est bien entendu indispensable dans toute analyse, mais les tableaux
ternaires, de par leur complexit, exigent une formalisation particulirement rigoureuse des problmes. En effet, en permutant le rle des trois variables, le nombre de
traitements possibles devient considrable. La liste suivante, non exhaustive, en donne
une ide.
1. Trois analyses des trois marges binaires avec les tranches binaires de mme
dimension que la marge en lments supplmentaires (en lignes et en colonnes).
2. Trois analyses de variables croises (I avec J T , etc.) compltes chacune
par deux sries dindices correspondant une dcomposition du tableau suivant
lune ou lautre des deux variables croises.

Dunod La photocopie non autorise est un dlit

3. Six analyses intra puisque dans lanalyse intra les trois variables sont traites
diffremment : lune est traite sparment (lensemble I des lignes dans notre
exemple) et lon peut alors conditionner par rapport lune ou lautre des deux
autres variables. De ces analyses intra drivent aussi six analyses inter de la
dispersion intra.
4. Lanalyse du tableau de Burt obtenu en juxtaposant les tableaux croisant les
variables deux deux. Cette analyse est la seule qui fait jouer exactement le
mme rle aux trois variables. Elle prsente peu dintrt pour trois variables
seulement (nous ne la citons que pour mmoire) pour deux raisons : dune part,
elle ne traite quune trs faible part de linformation puisquelle ne retient du
tableau ternaire que les trois marges binaires ; dautre part, comme nous lavons
dj dit au dbut de ce chapitre, lorsque lon prsente les donnes sous forme
de tableau ternaire ou de suite de tableaux binaires, les problmes ne se posent
jamais en termes symtriques en I , J , T . Si lon reprend lexemple comment, il
est clair que lanalyse du tableau de Burt, qui nest autre que lanalyse conjointe
des liaisons binaires entre Emplois et Diplmes, entre Emplois et Sexes et entre
Diplmes et Sexes ne prsente gure dintrt.
Pour clore ce chapitre, voquons le caractre spcifique de la dimension temporelle.
Les tableaux ternaires sont souvent dfinis par une suite de tableaux binaires indics par
le temps. Le problme pos au statisticien sexprime alors trs souvent sous la forme
du souhait de faire entrer la notion de temps dans lanalyse . Aucune technique ne
permet dintgrer rellement cette notion ; on considre tout au plus lordre induit par
cette dimension. Cet ordre nintervient mme pas dans les calculs fondamentaux des
techniques prsentes. Il est possible cependant de le faire apparatre au moment de
linterprtation des rsultats. Pour le matrialiser sur les graphiques de projection des
nuages, on relie dans lordre les points qui reprsentent le mme objet.

Chapitre 11

Interprtation des rsultats


dune analyse factorielle

11.1 PROLGOMNES
Depuis toujours, ou presque, le terme interprter est utilis propos de ltude
de rsultats statistiques. LAnalyse Factorielle nchappe pas cette rgle : les plans
factoriels ne sont pas tudis, ils sont interprts. Ce terme recouvre plusieurs sens
et, avant de proposer une dmarche dinterprtation, il est utile au pralable den
dlimiter le champ. Pour cela, nous postulons que ce nest pas par hasard si le terme
interprter a t dabord choisi puis surtout consacr par lusage. Nous avons donc
utilis un bon dictionnaire (le Robert !) pour explorer le champ smantique de ce terme
si employ. lissue de cette exploration, nous indiquons dans quelle mesure on peut
proposer une dmarche gnrale dinterprtation.

11.1.1 Interprter, cest dabord rendre clair


Les donnes initiales sont nombreuses mais chacune est claire. (En principe, lexprimentateur sait ce quil mesure : le fait que la vache numro 77 pse 623 Kg est une
valeur claire, sinon sre). Lanalyse factorielle restitue des rsultats (essentiellement,
mais pas seulement, des coordonnes) moins nombreux mais peu clairs en termes
des donnes initiales. Chaque coordonne factorielle dpend a priori des valeurs de
lensemble des colonnes pour lensemble des lignes : elle nest pas immdiatement
comprhensible et demande tre traduite en termes de donnes initiales (do la
ncessit dun interprte). Cette traduction des rsultats factoriels en termes de donnes initiales est le premier aspect de linterprtation. En ce sens, lanalyse factorielle
est utilise comme un outil dexploration du tableau. Plutt que de lire le tableau

270

11 Interprtation des rsultats dune analyse factorielle

directement, on le lit en traduisant les rsultats factoriels. Lintrt de lanalyse factorielle est alors de slectionner, par ordre dimportance dcroissante, les structures
les plus marquantes du tableau. Cette tape est une description des faits statistiques
indiscutables.

11.1.2 Interprter, cest aussi donner un sens


Donner un sens un objet, cest lintgrer dans un contexte. Les donnes initiales
sont claires mais, prises individuellement, nont pas de sens, pratiquement par dfinition. Le fait que lindividu 23 ait la valeur 3 pour la variable 11 est peu charg de sens.
De faon un peu simpliste, plus le contexte dans lequel on situe une information est
grand et plus celle-ci est charge de sens.
Le premier contexte dans lequel il convient de situer une valeur dun tableau est
le tableau lui-mme. Cest dailleurs dans cet esprit que lon peut prsenter des transformations pralables aux analyses comme le centrage et la rduction des variables
quantitatives, ou la transformation en profils dun tableau de contingence. Il en est
de mme des rsultats de lanalyse dun tableau. Le grand pouvoir suggestif des
plans factoriels provient de la visualisation simultane de lensemble des lignes et des
colonnes dun tableau. Chaque lment actif, ligne ou colonne, est dabord situ parmi
lensemble des lignes et des colonnes actives ce qui constitue un premier contexte.
Le deuxime contexte est constitu par les lments supplmentaires. Remarquons
que cest lune des raisons dtre fondamentales des lments supplmentaires, qui
permettent par exemple de disposer :
dindividus qui ne font pas partie de ltude mais servent de points de repre ;
de variables qui ne font pas partie du champ strict de lanalyse mais dun champ
voisin.
En tudiant ces lments supplmentaires, on situe les rsultats de lanalyse des
lments actifs dans un champ plus large et, ce faisant, on les charge de sens.
Le troisime contexte est extrieur aux donnes analyses. Il comprend lexprience gnrale de lanalyste et ses connaissances sur le phnomne tudi. Seul ce
contexte, qui est lchelle humaine, permet de donner vritablement un sens aux
faits statistiques. Il est difficilement formalisable. On peut ici encore profiter de la possibilit dlments supplmentaires : il est utile de reprendre une analyse en ajoutant
en supplmentaire des lments suggrs par un premier passage. Cette introduction
itrative dlments supplmentaires nest rien dautre quune traduction technique du
mode de pense associatif.

11.1 Prolgomnes

271

11.1.3 Interprter, cest enfin jouer de faon personnelle

Dunod La photocopie non autorise est un dlit

Les termes dart et dartisanat sont souvent employs propos de lAnalyse des
Donnes. Mme si ces termes sont trs galvauds, il est rare de les voir employs avec
autant de rgularit dans un domaine scientifique, en particulier par certains de ceux
qui se rclament de ce domaine (les connotations dartiste et dartisan ne sont pas
toutes positives). En tout cas, un examen mme superficiel de quelques applications
danalyse factorielle offre des lments qui ne sont pas sans rappeler linterprtation
dune pice de musique.
Le caractre personnel dune interprtation rside surtout dans le mode de prsentation des rsultats. Cette prsentation peut se limiter quelques phrases qui rsument
les principales tendances observes dans les donnes. En particulier, les noms que
lon donne aux facteurs (par exemple puissance du vin ) facilitent beaucoup ce
type de synthse. Elle peut contenir ou non des graphiques reprsentant les plans
factoriels et leur commentaire. Elle peut contenir ou non des tableaux issus plus ou
moins directement des donnes. Elle peut aussi dcrire les donnes en indiquant et
expliquant les regroupements de lignes ou de colonnes sur les diffrents graphiques.
Dans tous les cas, cette prsentation ne peut expliciter lintgralit de la richesse des
donnes. On est ainsi conduit choisir les faits les plus saillants, les plus intressants.
Ce choix, dans lequel lanalyste simplique, peut diffrer dun analyste lautre.
Cela alarme quelquefois les dbutants qui prouvent des difficults sparer ce qui
est automatique (qualifi aussi dobjectif) et ce qui est personnel (qualifi aussi de
subjectif) dans une interprtation.
Est automatique le tri des faits statistiques prsents dans un tableau par importance dcroissante. Limportance est ici mesure par un critre statistique fond
sur le concept dinertie.
Est personnelle, la rvaluation de ces faits la lumire des connaissances de
lanalyste sur le problme tudi qui sont extrieures au tableau de donnes. Il
en rsulte un nouveau poids des informations, dterminant dans la prsentation
des rsultats.
Par exemple, le regroupement de lignes et/ou de colonnes sur un graphique prsente
un aspect objectif (la proximit des points sur le plan) et un aspect subjectif (un
nuage de points ralise gnralement un continuum que lon scinde en un ensemble
de groupes de points dont les frontires ne simposent pas). Lorsque plusieurs possibilits sont galement raisonnables du point de vue des proximits, on regroupe plutt
des lments qui ont un caractre commun, souvent extrieur aux donnes traites,
mais cependant connu et considr comme important (voire explicatif) par celui qui
dpouille les rsultats. On obtient ainsi des groupes, homognes la fois du point
de vue des variables actives et dautres critres jugs importants, prsentant un fort
pouvoir vocateur.

272

11 Interprtation des rsultats dune analyse factorielle

Une interprtation est aussi personnalise du fait de certains choix caractre plus
ou moins technique. On peut jouer, par exemple, sur le ressort de la dualit : dans
une ACP par exemple, il peut tre plus clair de parler des principales dimensions
de variabilit (on privilgie alors les variables) ou de tendances reprsentes par
des classes dindividus que lon dcrit. Une autre alternative importante est : faut-il
commenter les axes ou les plans ? On est souvent tent dorienter un commentaire de
plan selon dautres directions pas forcment orthogonales que les axes factoriels
(cas dune bissectrice dans un plan issu de lenqute Ouest-France du chapitre 6
page 127).
Les rsultats issus dune Analyse Factorielle posent le problme de la dmarche
dinterprtation, cest--dire de lordre chronologique dans lequel ces diffrents rsultats doivent tre examins. Dans les sections suivantes, nous proposons une dmarche
dinterprtation pour chacune des mthodes factorielles tudies dans cet ouvrage.
La premire prsentation se rfre lACP : elle est la plus dtaille en ce sens
quelle introduit les aspects gnraux communs toutes les mthodes.
Les autres prsentations sappuient sur ce premier schma, en dveloppant uniquement les points sur lesquels la dmarche dinterprtation diffre, entre la
mthode examine et lACP.
Enfin, en guise de conclusion, une dernire section rcapitule quelques types de
facteurs auxquels peut conduire linterprtation.

11.2 INTERPRTATION DUNE ACP


Dans cette section, lessentiel de la prsentation se rfre lACP norme : nous
rservons un paragraphe aux spcificits de lACP non norme. Hormis celui-ci,
tous les paragraphes sont classs selon un ordre chronologique de dpouillement des
rsultats qui constitue une dmarche gnrale dinterprtation.
Dans cet ordre chronologique, deux phases principales ont t distingues.
Un bilan sur les inerties associes aux diffrents facteurs, qui ne se proccupe
pas de la signification des facteurs, mais se fonde seulement sur des indices
numriques.
Linterprtation proprement dite des facteurs, difficilement formalisable, qui
donne une large place aux connaissances sur le problme tudi extrieures au
tableau de donnes.

11.2.1 tude de linertie des facteurs


La premire phase de lanalyse permet dtudier les grands traits de la forme des
nuages et limportance globale des liaisons entre variables.

11.2 Interprtation dune ACP

273

a) Valeurs propres

Rappelons que la premire valeur propre est toujours comprise entre 1 et le nombre
de variables K . Elle vaut 1 lorsque les variables sont toutes non corrles deux deux.
Elle est gale K lorsquil existe une liaison linaire parfaite entre toutes les variables.
Dans le cas limite dune premire valeur propre proche de 1, on est conduit deux
attitudes diffrentes selon lobjectif de lanalyse :

Dunod La photocopie non autorise est un dlit

considrer lensemble des dimensions si lon cherche un rsum des donnes ;


ne considrer aucune dimension si lon sintresse aux liaisons entre variables.
Plus la valeur propre est grande, plus elle rsume de variables et plus le facteur
risque dtre intressant en terme de synthse. La situation est claire pour la premire
valeur propre puisque lon connat ses valeurs extrmes. Pour les valeurs propres
suivantes, la valeur 1 reste un point de repre : une composante principale est une
variable synthtique, et une valeur propre associe infrieure 1 indique que cette
variable synthtise moins de donnes quune variable isole. Il convient donc de
redoubler de prudence dans linterprtation dun facteur associ une valeur propre
proche ou infrieure 1. La valeur 1 ne peut toutefois tre utilise comme seuil
absolu : lexprience fournit, loccasion, des facteurs clairement interprtables dont
limportance trs faible relativement aux autres conduit une valeur propre infrieure
1.
Enfin, il est quelquefois utile de considrer le nombre de valeurs propres pratiquement nulles , ce qui permet de calculer la dimension relle des donnes analyses.
Le diagramme des valeurs propres, appel souvent abusivement histogramme,
est utilis surtout pour tudier lallure de la dcroissance de ces valeurs. Le principe
de lecture de ce diagramme est le suivant : si deux facteurs sont associs des valeurs
propres presque gales, ils reprsentent la mme part de variabilit et il ny a pas
lieu a priori de retenir lun et non lautre dans linterprtation. Rciproquement,
une forte dcroissance entre deux valeurs propres successives incite retenir dans
linterprtation les facteurs prcdant cette dcroissance.
Dans la pratique, on observe souvent le phnomne suivant : les S premires valeurs
propres prsentent une dcroissance assez irrgulire ; puis, au del du rang S, la
dcroissance est lente et rgulire. Cette allure indique que les S premiers facteurs
correspondent chacun des irrgularits dans la forme du nuage de points tudi qui
demandent tre interprtes et suggre que les facteurs suivants ne reprsentent que
linvitable bruit qui accompagne toute observation de nature statistique.
Cas extrme, une dcroissance lente et rgulire ds la premire valeur propre
traduit un nuage peu prs sphrique et donc des donnes peu structures dont les
facteurs sont peu synthtiques. Un diagramme de ce type prsage un intrt limit des
facteurs.

274

11 Interprtation des rsultats dune analyse factorielle

b) Pourcentages dinertie extraits par les facteurs

Le pourcentage dinertie extrait par un facteur est le rapport entre linertie associe au
facteur (i.e. la valeur propre) et linertie totale du nuage tudi ; il mesure limportance
relative du facteur dans le tableau. Il est souvent utilis sous la forme cumule qui
indique le pourcentage dinertie extrait par les S premiers facteurs.
Il ne faut pas oublier de juger ces pourcentages en fonction de la taille du tableau :
10 % est une valeur faible si le tableau comporte 10 variables (elle est gale la
moyenne et correspond la valeur propre 1) ; cest une valeur forte dans le cas de
100 variables.
c) Quel nombre de facteurs retenir ?

propos des valeurs propres et des pourcentages dinertie, on a voqu plusieurs


reprises les pronostics que suggrent ces indicateurs quant lintrt des facteurs.
Poursuivant cette dmarche, certains ont demand ces indicateurs plus que des
pronostics, savoir une rgle de dcision quant au nombre de facteurs retenir dans
linterprtation. Pour cela, on se rfre une situation de parfaite indpendance des
variables qui se traduit par une isotropie des nuages tudis ; on examine ensuite si
limportance absolue (juge partir des valeurs propres) ou relative (juge partir
des pourcentages dinertie) des facteurs effectivement obtenus peut tre considre
comme grande en regard de la situation de rfrence. Cette dmarche doit tre vite
pour un faisceau de raisons convergentes.
La situation de rfrence ne correspond aucune situation concrte ; le tableau
que lon tudie est toujours choisi (plus ou moins soigneusement certes) mais
jamais tir au hasard.
Toute rgle concernant des facteurs de rang suprieur 1 doit tenir compte du ou
des facteurs de rang prcdent, ce qui rend le problme pratiquement inextricable.
Limportance dun facteur nest absolument pas un gage de son intrt. Situation
paradoxale (en apparence) bien connue : les facteurs de rang 3 et 4 prsentent
souvent de lintrt prcisment parce quils apportent des informations difficiles
voir sur le tableau des donnes.
Les critres fonds sur linertie ne permettent pas de prjuger de lintrt des
facteurs, lui-mme dpendant dlments extrieurs aux donnes (objectifs de
lanalyse, degr de connaissance sur le problme tudi, etc.).
lcart de cette fausse route et exploitant la dernire remarque, la rgle suivante est
tout fait recommandable : on retient dans linterprtation dune analyse les facteurs
que lon sait clairement interprter. En effet :
il serait dommage de rejeter avec des critres statistiques un facteur que lon sait
interprter ;
il serait dlicat de mettre en avant un facteur que lon ne sait pas interprter.

11.2 Interprtation dune ACP

275

11.2.2 Interprtation des facteurs


Les facteurs sont apprhends dans lordre dcroissant de leurs valeurs propres. Ils
peuvent tre tudis sparment ou deux par deux laide des plans factoriels. Il faut
constamment garder lesprit que le facteur dordre s (s > 1) traduit les tendances
rsiduelles non prises en compte par les facteurs prcdents.
Lordre propos pour dpouiller les rsultats correspond une phase de dcouverte.
Lapprofondissement dune interprtation donne toujours lieu des va-et-vient entre
les diffrents rsultats, trop lis aux donnes et lanalyste pour tre formaliss. En
particulier, du fait de la dualit, on est souvent conduit consulter alternativement les
rsultats concernant les individus et les variables.
a) Contributions des individus

Dunod La photocopie non autorise est un dlit

Lintrt dun facteur dpend en grande partie du nombre dindividus quil concerne.
On ralise une premire approche de ce nombre en consultant la liste des contributions
des individus aux facteurs pour reprer si un seul individu ou un trs petit nombre
dindividus ont une contribution trs suprieure la moyenne. On peut calculer aussi le
nombre minimum dindividus totalisant, eux tous, un pourcentage dinertie projete
fix lavance (par exemple 50 %). Cet indicateur value le degr de gnralit dun
facteur au sens du nombre dindividus participant ce facteur.
Le premier stade de linterprtation dun facteur qui apparemment ne concerne que
trs peu dindividus est en gnral simple : on identifie rapidement ces individus et
leur particularisme. La signification de ce particularisme est plus ou moins immdiate ;
elle peut remettre en cause le champ de lanalyse, savoir lensemble des individus
tudis.
Envisageons le cas extrme dun facteur induit par un seul individu. Deux cas
peuvent tre distingus.
Si ce facteur est lun des premiers, lindividu concern est ncessairement trs
diffrent des autres. Un tel cas particulier est dune part facilement mis en vidence sans lanalyse et, dautre part, gne ltude du reste de la population. Il faut
alors envisager de refaire une analyse en supprimant cet individu des lments
actifs, ce qui modifie le champ de ltude. Cette nouvelle analyse peut ne diffrer
que de trs peu de la premire. En effet, on peut montrer que si linertie sur
laxe s de lindividu supprim est infrieure la diffrence entre ls et ls+1 , les
facteurs de la nouvelle analyse sont trs corrls ceux de lancienne ; lindividu
est certes trs diffrent des autres, mais comme cette diffrence sinscrit dans une
tendance gnrale il ne perturbe pas les rsultats.

276

11 Interprtation des rsultats dune analyse factorielle

Si lon observe un tel facteur aprs quelques facteurs gnraux prenant en compte
beaucoup dindividus, lanalyse nest pas ncessairement remise en cause : il
est naturel, aprs avoir extrait des tendances gnrales, que des phnomnes
ponctuels apparaissent.
Attention : il ne peut tre question dexclure des individus dune analyse en se fondant
uniquement sur des critres dinertie car cette exclusion implique une modification
des objectifs. Un exemple fictif illustrera cette situation. Supposons que ltude porte
sur les 120 exploitations agricoles orientes vers llevage laitier dune rgion et
que le premier axe mette en vidence le caractre exceptionnel de lexploitation 27.
Renseignements pris, on saperoit que cette exploitation est rattache une Ecole
dAgronomie bien connue, alors que les autres sont de structure familiale classique.
Exclure cette exploitation revient modifier le thme de ltude qui devient ltude
des exploitations familiales orientes vers llevage laitier.
Remarquons enfin quen ACP norme, ce problme dlments exceptionnels ne
concerne que les individus. En effet, les variables possdent chacune la mme inertie.
b) Coordonnes des variables actives

Il est naturel de commencer lexamen dtaill des graphiques par ce que lon connat
le mieux. Gnralement, les variables sont moins nombreuses et plus charges de sens
que les individus.
Par ailleurs, il est logique de privilgier, au moins dans un premier temps, les
lments actifs : linterprtation dun facteur doit se fonder dabord sur les donnes
qui ont particip directement sa construction.
Rappelons que, en ACP norme, les variables ayant le mme poids et tant quidistantes de lorigine, le carr de leur coordonne sur un axe se confond avec leur qualit
de reprsentation et est proportionnelle leur contribution. Aussi, on limite gnralement ltude des variables celle de leurs coordonnes. ce niveau, linterprtation
sappuie essentiellement sur la rgle suivante : la coordonne de la variable k le long
de laxe factoriel s est le coefficient de corrlation entre cette variable k et le facteur s.
Interprtation axe par axe

On recense les variables actives les plus lies chaque axe. Deux situations typiques
peuvent se produire.
Toutes les variables trs lies au facteur sont situes dun mme ct de laxe
(cas de lexemple des vins du chapitre 7 page 149). Le facteur apparat alors
comme une synthse entre ces variables. Leffet taille (cit section 1.6) dans
lequel toutes les variables sont situes dun mme ct de laxe peut tre rattach
cette situation typique.

11.2 Interprtation dune ACP

277

Les variables trs lies au facteur prsentent une coordonne positive pour les
unes et ngative pour les autres. Il faut alors rechercher un dnominateur commun
qui, la fois, relie les variables situes du mme ct et oppose les variables
situes de part et dautre de lorigine. Par exemple, supposons que les variables
soient des notes dans diffrentes matires : un facteur peut traduire lopposition entre matires scientifiques et matires littraires. Cette phase permet dj
dobtenir la signification gnrale de certains axes.
Interprtation par plan

Comparativement ltape prcdente, le plan factoriel apporte le pouvoir synthtique du graphique, plus suggestif quune liste de coordonnes, et la prise en compte
simultane de deux dimensions qui donne une image plus fidle des donnes et peut
aussi suggrer dinterprter dautres directions que les axes factoriels. Il est utile de
reprsenter en plus des points (variables) :

Dunod La photocopie non autorise est un dlit

le cercle de rayon 1, ou cercle des corrlations, car la proximit dun point au


cercle permet de juger aisment de la qualit de reprsentation des variables ;
les vecteurs joignant lorigine aux points variables afin de visualiser les angles
qui mesurent la liaison entre variables.
Le plan factoriel permet une approche des donnes qui laisse de ct, au moins en
apparence, les facteurs eux-mmes. Cette approche consiste en un bilan des liaisons
entre variables. Les angles entre variables tant dforms par la projection, on limite
ce bilan aux variables bien reprsentes (cest--dire dont limage est proche du cercle
de corrlation). Il est ainsi possible de regrouper visuellement (ce qui est dautant
plus prcieux que les variables sont nombreuses) des variables lies entre elles et
desquisser ainsi une typologie des variables.
La construction des plans factoriels implique la dtermination des facteurs que lon
va croiser. Pour cela, on sappuie sur deux lments.
Linertie associe aux facteurs. On croise de prfrence des facteurs dimportance
comparable car, dans le cas de deux facteurs associs des valeurs propres gales,
cest le plan form par ces deux facteurs qui est stable et non les facteurs euxmmes. On est ainsi conduit construire la suite de plans qui croisent les facteurs
1 et 2, les facteurs 2 et 3, etc.
La signification du facteur. On peut vouloir focaliser son attention sur certaines
variables et donc sur les plans qui en fournissent une bonne reprsentation.
c) Coordonnes des variables supplmentaires

Le rle des variables supplmentaires est dlargir le contexte dinterprtation. On


recense, parmi ces variables, celles qui sont trs lies aux facteurs : cela permet ventuellement dexpliquer certains facteurs ou daffiner les interprtations dj proposes

278

11 Interprtation des rsultats dune analyse factorielle

et/ou peut suggrer de rexaminer un facteur dlaiss sur la seule vue des variables
actives. Ce dernier point, qui donne une certaine prminence aux variables supplmentaires, est important. Lexistence de variables supplmentaires trs lies un facteur,
en tant que validation a posteriori, fournit une forte prsomption selon laquelle ce
facteur est charg de sens.
d) Coordonnes et aides linterprtation des individus actifs

Plutt que ltude des coordonnes, fastidieuse si les individus sont nombreux, on
examine le plan pour trois raisons essentielles.
tudier lallure gnrale de la rpartition de lensemble des individus. Toute
plage de trs faible densit ou de trs forte concentration doit tre dcele.
Aider le choix dindividus types qui permettent de concrtiser les dimensions
de variabilit. Dans le choix dindividus types, il est bon de consulter les qualits de reprsentation pour slectionner de prfrence des individus qui ne sont
caractristiques que du ou des facteurs tudis et sont donc moyens pour les
autres facteurs. Par lintermdiaire de ces individus, il est commode de relier les
facteurs aux donnes initiales.
Faire apparatre une typologie des individus, en dlimitant des domaines
connexes communment appels patatodes . Par rapport un rsultat de
classification, ces typologies prsentent deux caractristiques. La premire est
de se fonder sur un plan, cest--dire seulement deux axes (il est ainsi possible
dobtenir plusieurs typologies diffrentes, correspondant chacune un plan
donc un aspect des donnes) : ceci limite leur valeur statistique au sens du
rapport inertie inter / inertie totale mais leur forte adquation un plan est un
avantage si ce dernier est prpondrant dans les interprtations. La deuxime est
quelles peuvent tenir compte dinformations extrieures aux variables actives
en favorisant le regroupement dindividus possdant des caractres communs.
Sans perdre ncessairement beaucoup de valeur statistique du point de vue des
variables actives, on facilite ainsi grandement linterprtation des classes.
Il est souvent ncessaire de regarder la rpartition des individus appartenant une
mme sous-population. On peut identifier sur les graphiques les individus par leur
modalit pour une variable qualitative (dans lexemple des vins du chapitre 7 page 149,
ceux-ci sont reprsents par un signe indiquant leur origine). Cette pratique est une
faon trs fine de faire intervenir dans une ACP des variables qualitatives en tant
qulments supplmentaires.
On peut aussi reprsenter les barycentres de ces populations en introduisant en lignes
supplmentaires les moyennes des individus appartenant la mme sous-population.
Certains logiciels permettent mme de reprsenter les axes dinertie des projections des
sous-nuages ce qui permet de voir lallure gnrale du sous-nuage sur le plan. Cela est

11.2 Interprtation dune ACP

279

particulirement intressant dans le cas o les individus sont nombreux et o la seule


information que lon possde sur eux est constitue par les donnes. Cette situation
est typiquement celle des enqutes. Lensemble des individus ne prsente alors de
lintrt que dans la mesure o il permet daccder une population encore plus vaste.
Il est clair que de telles analyses se situent dans une perspective infrentielle : le fait
que cette infrence soit formalise de faon assez lche nimplique pas quelle soit
sans valeur pratique (certains esprits factieux disent mme : au contraire !).
e) Coordonnes et aides linterprtation des individus supplmentaires

Cest un peu par principe que ltude des individus supplmentaires ne vient quaprs
celle des individus actifs. Cet ordre sapplique bien aux individus mis en supplmentaires parce quils scartent des autres. En revanche, il sapplique moins bien lorsquil
sagit dun individu supplmentaire servant de point de repre ou reprsentant le centre
de gravit dune classe. Ces derniers individus supplmentaires, finalement plus chargs de sens que les actifs, sont gnralement moins nombreux et peuvent intervenir,
dans le dpouillement, juste aprs lexamen de la rpartition des individus actifs.

11.2.3 Cas de lACP non norme


Cette analyse peut tre considre comme une ACP norme dans laquelle on affecte
chaque variable un poids gal sa variance. Le fait danalyser un ensemble de
variables pondres ne modifie pas les grandes lignes de linterprtation mais influe
sensiblement sur quelques rsultats.

Dunod La photocopie non autorise est un dlit

Valeurs propres

Linertie de chaque variable ne vaut pas systmatiquement 1. Les valeurs propres ne


sont donc pas comparables dune analyse lautre. Le seuil de 1 na plus de signification. On sappuie plutt sur les pourcentages dinertie pour apprcier limportance
dun facteur.
Stabilit et degr de gnralit dun facteur

Les variables tant munies de poids, le premier axe factoriel peut parfaitement tre d
une seule variable. Il sensuit que lon examinera en premier lieu non seulement les
contributions des individus mais aussi celles des variables pour dtecter dventuels
lments prpondrants.
Coordonnes des variables

Cest seulement si lon a effectivement ralis une ACP norme de variables pondres, et non une ACP non norme, que les coordonnes des variables actives sinterprtent encore comme des coefficients de corrlation. Le carr de cette coordonne

280

11 Interprtation des rsultats dune analyse factorielle

mesure alors la qualit de reprsentation mais nest plus proportionnel la contribution. Finalement, en ACP non norme, les deux reprsentations des variables (par leurs
corrlations et par leurs covariances) sont utiles.

11.3 INTERPRTATION DUNE AFC


En AFC, les lignes et les colonnes sont des objets de mme nature (des modalits de
variables qualitatives) qui jouent des rles symtriques, analogues dans une certaine
mesure celui des individus en ACP. Il sensuit que la dmarche dans linterprtation
dune AFC est voisine dans ses grandes lignes de celle dune ACP mais en diffre
sur certains points. Ce paragraphe reprend globalement le plan utilis pour lACP
mais ne dtaille que les aspects sur lesquels les deux mthodes diffrent. Lessentiel
de ces remarques concerne lapplication de lAFC un tableau de contingence. Un
paragraphe final envisage dautres cas.

11.3.1 Valeurs propres


Les valeurs propres sont infrieures ou gales 1, valeur atteinte lorsquun axe rend
compte de faon parfaite dune association entre une partition des lignes dune part
et une partition des colonnes dautre part (cf. Figure 3.9 page 78). Ainsi, un facteur
associ une valeur propre voisine de 1 exprime une forte liaison entre les lignes et
les colonnes quil sera toujours facile de traduire en termes de donnes initiales. En
revanche, une valeur propre faible (pour fixer les ides, indiquons lordre de grandeur
de 0.1) correspond une liaison faible : le facteur associ devra tre interprt avec
prcaution en sappuyant sur les donnes.
Au nombre dindividus prs, la somme des valeurs propres est gale lindice x2
mesurant la liaison entre deux variables qualitatives. En AFC, on sintresse peu
cette valeur qui est un indice global et ne permet gure de prjuger de lintrt des
facteurs. Cette somme ntant pas constante, le pourcentage dinertie extrait par un
facteur ne se dduit pas de la valeur propre et du nombre de colonnes. Les valeurs
propres et les pourcentages dinertie sont des informations indpendantes quil est
utile de consulter pour juger numriquement de lintrt dun facteur.

11.3.2 Contributions des lignes et des colonnes


Comme en ACP, il importe de sassurer quun nombre suffisant dlments contribue
aux premiers facteurs. La dmarche est la mme quen ACP la diffrence prs quelle
sapplique aux lignes et aux colonnes.
Dans lAFC dun tableau de contingence, la mise en vidence de facteurs dus un
trs petit nombre dlments est plus embarrassante quen ACP : en effet le recours
la mise en supplmentaire dune ligne ou dune colonne est dlicat en AFC puisquil

11.3 Interprtation dune AFC

281

conduit tudier la liaison entre deux variables en ne considrant quun sous-ensemble


de modalits. Si lon opte pour cette solution, il faut prciser avec soin la modification
du champ de ltude quelle implique. Il existe, en AFC, la possibilit de regrouper
des lignes et/ou des colonnes. Cette possibilit nest toutefois pas trs efficace pour
contourner le problme de facteurs dus un trs petit nombre dlments car, dans ce
cas, elle conduit regrouper des modalits de profils diffrents, ce qui rend difficile
linterprtation des modalits ainsi obtenues.

11.3.3 Coordonnes des lments actifs

Dunod La photocopie non autorise est un dlit

La tactique, prsente propos de lACP, qui consiste tudier dabord les axes au vu
des listes de coordonnes puis des plans sapplique ici. Naturellement, il ny a aucune
raison, en AFC, pour toujours commencer linterprtation par ltude des lignes ou des
colonnes. Nanmoins, il semble y avoir quelque avantage dans lattitude systmatique
qui consiste interprter un axe dabord en fonction dun ensemble puis de lautre, les
associations entre lignes et colonnes ntant exploites que dans un second temps.
Dans le cas gnral, en AFC, les lments ont des poids diffrents. Aussi, la coordonne dun point, sa qualit de reprsentation et sa contribution linertie constituent des
informations diffrentes. Pour interprter un facteur, on sappuie de faon privilgie
sur les lments types qui prsentent :
une forte contribution ; leur importance provient de ce que leur suppression de
lensemble des lments actifs risque dentraner la disparition du facteur ;
une coordonne extrme jointe une forte qualit de reprsentation ; ces lments
sont les plus commodes pour qualifier un facteur : ils sont trs diffrents du profil
moyen (leur coordonne est extrme) et cette diffrence est presque entirement
traduite par le facteur (ils ont une bonne qualit de reprsentation) ;
une coordonne extrme jointe une qualit de reprsentation moyenne ; ils
prsentent un fort niveau les caractristiques associes au facteur, ce qui leur
donne une grande valeur. Mais ces caractristiques sadditionnent dautres, ce
qui les rend plus difficiles mettre clairement en vidence.

11.3.4 Cas de modalits ordonnes ou partitionnes


Frquemment, il existe une structure a priori sur lun ou les deux ensembles mis en
correspondance. Ainsi, les modalits de la variable niveau de diplme peuvent tre
a priori ordonnes selon le nombre dannes dtudes ncessaires, ou partitionnes
selon le critre enseignement technique / enseignement gnral. Lanalyse de ce type
de donnes comporte toujours la recherche des facteurs mettant en vidence de telles
structures.

282

11 Interprtation des rsultats dune analyse factorielle

11.3.5 Cas dans lesquels le tableau analys nest pas un tableau de


contingence
LAFC peut tre employe avec profit dans lanalyse de diffrents types de tableaux.
Le cas du Tableau Disjonctif Complet est suffisamment important (de par le nombre de
ses applications) et spcifique pour mriter un paragraphe particulier (cf. section 11.4).
Un cas frquent est celui o le tableau analys rsulte de la juxtaposition de tableaux
de contingence.
Dans lensemble, les rgles dinterprtation prcdentes demeurent inchanges. Les
valeurs propres restent comprises entre 0 et 1 et la valeur de 1 correspond toujours
une association parfaite entre une partition des lignes et une partition des colonnes en
deux classes. Toutefois, la somme des valeurs propres ne sinterprte plus comme un
x2 .

11.4 INTERPRTATION DUNE ACM


Fondamentalement, comme lACP, lACM sapplique un tableau croisant des individus et des variables (cest la nature des variables qui change dune technique lautre),
mais les calculs auxquels elle conduit consistent en une AFC sur tableau disjonctif
complet. Ds lors, il faut sattendre ce que la dmarche dinterprtation dune ACM
sapparente la fois de celle de lACP et celle de lAFC.
Dans ce qui suit, nous notons I le nombre dindividus, J le nombre de variables et
K le nombre total de modalits.

11.4.1 Inertie de facteurs


Valeurs propres

La somme des valeurs propres est gale (K /J )1, rapport entre le nombre de modalits et le nombre de variables, le tout diminu de 1. Comme en ACP, et la diffrence
de lAFC simple, elle ne dpend pas de la structure des donnes.
En pratique, on observe que les valeurs propres sont faiblement et rgulirement
dcroissantes : lallure gnrale de lhistogramme des valeurs propres est rarement
suggestive en ACM.
La valeur propre associe un facteur est gale la moyenne des rapports de
corrlation entre le facteur et chaque variable (cf. section 4.3.6 page 96). Elle vaut 1
si tous les rapports de corrlation sont gaux 1 donc si pour chaque variable tous
les individus prsentant la mme modalit sont situs au mme point. Cette situation
constitue un extrme dont on est toujours trs loin en pratique : il sensuit que les
valeurs propres sont souvent trs faibles en ACM.

11.4 Interprtation dune ACM

283

Pourcentages dinertie

Une variable r modalits est reprsente par un sous-espace de dimension r 1


(cf. section 4.3.5 page 95). Lorsquun facteur est trs li cette variable (cest-dire si le rapport de corrlation entre la variable et le facteur vaut 1), le pourcentage
dinertie extrait de cette variable est 100/(r 1). Il en rsulte que, lorsque les variables
possdent un grand nombre de modalits, mme les pourcentages dinertie associs
aux premiers facteurs sont, du fait de la nature du tableau, trs faibles.
Bilan sur les valeurs propres et les pourcentages dinertie

La reprsentation des modalits, en ACM, peut indiffremment tre obtenue par une
AFC sur le Tableau Disjonctif Complet ou sur le tableau de Burt. Or, dune analyse
lautre, le mme facteur nest pas associ la mme valeur propre. Cette remarque,
ainsi que les considrations prcdentes, expliquent que les valeurs propres et les
pourcentages dinertie ont peu dinfluence sur linterprtation dune ACM.

Dunod La photocopie non autorise est un dlit

11.4.2 Contributions des individus et des modalits


Pour identifier dventuels lments prpondrants, ltude des axes dune ACM
commence par ltude des contributions des individus.
Comme en ACP, les variables ne peuvent tre aberrantes , mais il est possible en
ACM que le ou les premiers facteurs soient dus un petit nombre de modalits. Cela
peut se produire sil existe des modalits de faible effectif partages par les mmes
individus puisque le carr de la distance dune modalit au centre de gravit est inversement proportionnel son effectif (cf. section 4.3.3 page 92). Lorsque lexamen des
contributions des modalits indique quun petit nombre de modalits est largement prpondrant, les individus qui prsentent cette ou ces modalits possdent gnralement
aussi une contribution trs grande. Aussi, en ACM, lorsque lon cherche liminer
un facteur sappuyant sur un trop petit nombre dlments, il faut examiner simultanment la mise en supplmentaire de lignes et la suppression ou le regroupement de
modalits.

11.4.3 Contributions des variables


En sommant pour le facteur de rang s les contributions des modalits dune mme
variable, on obtient la contribution de la variable ce facteur. Cette contribution est
gale, au coefficient J ls prs (ls : inertie associe au facteur du rang s ; J : nombre
de variables), au rapport de corrlation entre la variable et le facteur. Il en rsulte que :
en ordonnant les variables par contribution dcroissante, on peut slectionner les
variables les plus lies un facteur, cest--dire celles sur lesquelles linterprtation pourra sappuyer de faon privilgie ;

284

11 Interprtation des rsultats dune analyse factorielle

il peut tre intressant de raliser des graphiques dans lesquels les variables ont
pour coordonne sur laxe s leur contribution au facteur de rang s (cf. figure 4.6
page 98). Ce graphique facilite la slection prcdemment cite et fournit une
visualisation des proximits entre variables.
Linterprtation de linertie projete des variables en tant que rapport de corrlation fait
quil est intressant de calculer cette quantit aussi pour les variables supplmentaires.

11.4.4 Coordonnes des modalits et des individus


Ltude des coordonnes des modalits prcde presque toujours celle des individus.
La dmarche qui consiste tudier dabord pour chaque axe (au vu des listes de
coordonnes) les lments actifs puis les supplmentaires, puis les plans, est semblable
celle (dcrite en dtail propos de lACP) des autres analyses factorielles.
Le cas des modalits ordonnes est frquent dans la pratique de lACM. On commence toujours, dans ltude des coordonnes, par reprer les facteurs sur lesquels
les modalits des variables ordonnes se trouvent dans leur ordre naturel (sur les
graphiques, on relie ces modalits dans leur ordre naturel).
La qualit de reprsentation des modalits est elle-mme un indicateur peu pertinent.
En effet, les modalits dune mme variable tant orthogonales, elles ne peuvent tre
simultanment bien reprsentes sur un axe. En outre, une modalit est gnralement
perue comme le centre de gravit des individus qui la possdent (cf. la proprit
barycentrique en ACM) : or la qualit de reprsentation dune modalit est diffrente
de celle du centre de gravit correspondant (cf. section 4.3.4 page 94).
La dmarche dans ltude des individus est la mme quen ACP, les individus actifs
tant toujours trs nombreux en ACM.

11.5 INTERPRTATION DUNE AFM


LAFM fait intervenir trois types dobjets : les individus, les variables et les groupes
de variables. Les rgles dinterprtation concernant les individus et les variables sont
globalement les mmes quen ACP et ACM. ce niveau et par rapport ces mthodes,
le fait davoir pris en compte la structure en groupes inflchit les rsultats mais ne
modifie pas leur nature fondamentale. En revanche, lAFM fournit des rsultats spcifiques de la structure en groupes qui possdent leurs rgles dinterprtation propres.
La prsente section prcise ces rgles et indique quelle place accorder lexamen de
ces rsultats dans une dmarche dinterprtation.

11.5 Interprtation dune AFM

285

11.5.1 Rsultats de lanalyse spare de chaque groupe


On regarde le diagramme des valeurs propres de chaque groupe, essentiellement
pour valuer le nombre de dimensions qui interviendront de manire significative
dans lanalyse globale. La surpondration de lAFM fait que seule la forme de ce
diagramme importe : limportance ultrieure dune valeur propre est dtermine par
son rapport avec la premire de ces valeurs. Ces diagrammes permettent aussi de
comparer la forme gnrale des nuages dfinis par chaque groupe, sans tenir compte
des lments qui le composent.
Ainsi, comme la pondration des variables dans lanalyse globale respecte la structure des groupes, on dtecte ce niveau les groupes presque unidimensionnels qui ne
peuvent influencer plusieurs facteurs et les groupes fortement multidimensionnels qui
influencent plusieurs facteurs.

Dunod La photocopie non autorise est un dlit

11.5.2 Valeurs propres de lanalyse globale


Les valeurs propres peuvent tre considres comme des indices de liaison entre
le facteur associ et lensemble des groupes dans la mesure o la valeur maximum
possible le nombre J de groupes actifs nest atteinte que lorsquun facteur de
lanalyse globale est confondu avec le premier facteur de lanalyse spare de chaque
groupe. Le parallle avec lACM doit tre fait : en ACM, le maximum est atteint
lorsque toutes les partitions dfinies par les variables qualitatives sont totalement
respectes (i.e. les individus dune classe dfinie par chaque modalit ont la mme
coordonne sur le facteur). Ce parallle est dautant plus licite que lAFM se confond
avec lACM dans le cas o chaque groupe comporte une seule variable qualitative.
Une attention toute particulire sera accorde la premire valeur propre. Si elle
est proche de J , le premier facteur est la fois commun lensemble des groupes et
reprsente une direction dinertie importante dans chacun deux. Si elle est faible, on
ne peut rien en dire (sinon que lon nest pas dans le cas prcdent). Les valeurs propres
suivantes ne peuvent tre interprtes de la mme faon puisque leur valeur maximum
dpend de la structure de chacun des groupes : du fait de la pondration, si chacun
des groupes prsente un facteur prpondrant, la seconde valeur propre de lanalyse
globale est ncessairement faible, mme si elle correspond au deuxime facteur de
chaque groupe. En revanche, le diagramme des valeurs propres et des pourcentages
dinertie se lit comme dans les autres mthodes factorielles.

11.5.3 Relations entre les facteurs de lanalyse globale et les groupes


Ltude de ces relations est la premire tape du dpouillement de lanalyse globale. Il
est en effet prfrable davoir dabord une ide de la structure gnrale des donnes
avant de sintresser des aspects plus prcis mais plus parcellaires. Lexprience a
dailleurs montr quil est plus efficace, si lon souhaite raliser des analyses spares

286

11 Interprtation des rsultats dune analyse factorielle

compltes de chaque groupe, de les faire aprs lAFM. Nous proposons dtudier les
indices concernant les liens entre les groupes et les facteurs dans lordre suivant.
Corrlations entre les facteurs communs et leurs reprsentants dans les
groupes

Lorsque les corrlations entre un facteur de lensemble des groupes et ses reprsentants
dans tous les groupes sont proches de 1, il sagit dun facteur commun aux groupes (cf.
section 8.3.5 page 187). Comme les groupes que lon tudie simultanment sont gnralement lis entre eux (ce qui est conforme lintuition de lanalyste qui les tudie
simultanment), il y a au moins un facteur pour lequel plusieurs de ces corrlations
sont assez leves.
On dit quun facteur est commun aux groupes pour lesquels ces corrlations sont
fortes (cest--dire que la tendance quil traduit apparat dans ces groupes) et quun
facteur nexiste pas dans les groupes pour lesquels ces corrlations sont faibles.
Il peut arriver quun seul groupe ait une corrlation importante avec un facteur
donn. Le facteur est alors une dimension spcifique du groupe.
Il peut arriver aussi quun groupe nait de corrlations leves quavec des facteurs
qui lui sont spcifiques. On en dduit alors labsence de liaisons linaires entre ce
groupe et les autres. Il est gnralement judicieux de recommencer alors lanalyse en
supprimant (des groupes actifs tout au moins) ce groupe.
Pour dcider si une corrlation est faible ou leve, il ny a pas de limite bien
dfinie. Cela dpend du nombre dindividus et du nombre de groupes. Lorsquelles ne
sont trs proches ni de 1 ni de 0, on raisonne -comme toujours dailleurs- en termes
de comparaison. On regarde pour un facteur donn si les corrlations associes
chaque groupe sont, ou non, du mme ordre de grandeur ; on ordonne les groupes
par corrlation dcroissante. Inversement, pour un groupe donn, on examine et on
ordonne les corrlations associes aux diffrents facteurs pour reprer les facteurs
proches de directions de dispersion de ce groupe. On regarde aussi de quels autres
groupes ces facteurs sont proches.
Rapport [inertie inter / inertie totale]

Cet indice concerne lensemble des groupes. Proche de 1, il confirme le caractre


commun dun facteur, ce que des corrlations leves ont dj pu faire pressentir.
Dans ce cas, les points reprsentant le mme individu travers les diffrents groupes
sont globalement proches. La reprsentation superpose est alors utilisable pour un tel
facteur.
Coordonnes et aides linterprtation des groupes

Rappelons que la coordonne du groupe j le long de laxe de rang s sinterprte aussi


comme la contribution absolue des variables du groupe j au facteur s, cest--dire en
tant que mesure de liaison entre le groupe j et le facteur s.

11.5 Interprtation dune AFM

287

Le premier intrt de ces coordonnes est de fournir une mesure de limportance


de la direction associe un facteur donn dans les nuages N Kj des variables associs
chacun des groupes j. Naturellement, cette coordonne du groupe j le long de laxe
s nest intressante que lorsque les coefficients de corrlation ont permis de conclure
que le facteur tudi est une direction de dispersion qui apparat dans le groupe j.
Il est frquent que la coordonne de chaque groupe le long du premier axe soit
proche de 1 : les premiers facteurs de chaque groupe sont alors assez proches entre
eux et le premier facteur global en est un compromis. Les valeurs des coordonnes
suivantes sont juger en rfrence aux diagrammes des valeurs propres des analyses
spares. Un groupe quasiment unidimensionnel ne peut avoir plusieurs coordonnes
proches de 1 !
En tant que contribution, ces coordonnes sutilisent tout fait comme les contributions des individus ou des variables. On repre les groupes qui ont dtermin le plus
les facteurs. On sappuie sur eux au moment de linterprtation des facteurs. Du fait
de la pondration, la contribution des groupes au premier facteur est gnralement
assez quilibre. Si elle ne lest pas, on cherche expliquer cette anomalie. Pour les
facteurs suivants, toutes les situations peuvent se prsenter.
Cest finalement en tant que coordonnes que ces valeurs sont le moins utilises. On
consulte certes les graphiques reprsentant les groupes, surtout quand ces derniers sont
nombreux, mais plus en tant quillustration des interprtations prcdentes quen tant
que projection. La raison en est que la proximit entre deux points est une approche
extrmement pauvre de la ressemblance entre deux groupes, ce qui dailleurs se
retrouve dans des qualits de reprsentation presque toujours trs faibles.

Dunod La photocopie non autorise est un dlit

Coordonnes et aides linterprtation des axes des analyses spares

Les coordonnes des axes des analyses spares ne sont autres que les corrlations
entre les facteurs des analyses spares et ceux de lanalyse globale. Elles permettent
de relier lanalyse globale aux analyses spares en rpondant aux questions suivantes :
le facteur global dordre s est-il proche dun des facteurs de chaque groupe ? Sur quels
facteurs globaux les premiers facteurs des groupes sont-ils bien reprsents ?
Conclusion

ce niveau, on peut dcider de continuer le dpouillement des rsultats ou de refaire


une analyse en modifiant le nombre de groupes actifs et/ou la rpartition des variables
dans les groupes, etc. Une telle dcision peut intervenir lorsque lon a trouv soit
un groupe indpendant des autres, soit une anomalie dans la structure des groupes,
soit plusieurs ensembles de groupes assez distincts entre eux pour justifier des tudes
spares, soit des facteurs trop peu communs. Lattitude vis--vis des groupes est
analogue celle que lon peut avoir vis--vis des variables en ACP ou en ACM. On
peut les considrer en quelque sorte comme des supervariables .

288

11 Interprtation des rsultats dune analyse factorielle

11.5.4 Projections des variables et du nuage moyen des individus


Les projections, aides linterprtation et graphiques sinterprtent globalement
comme en ACP ou en ACM. Notons cependant que, pour les variables qualitatives, les
coordonnes des indicatrices sont les corrlations avec les facteurs et non pas, comme
en ACM, les centres de gravit des classes. On consulte donc plutt les coordonnes et
aides linterprtation de ces centres de gravit qui apparaissent, dans les programmes,
comme des individus supplmentaires (que la variable qualitative soit active ou supplmentaire). Rappelons que la somme des contributions des modalits dune mme
variable (en tant que centres de gravit) un facteur est gale au rapport de corrlation
entre la variable et le facteur (cf. section b page 201).
Sur les graphiques des variables, on sintresse dabord aux groupes les plus lis aux
facteurs (au sens de la contribution) ; puis, lintrieur de chaque groupe, on cherche
les variables les plus lies aux facteurs. Linterprtation se fait presque toujours deux
niveaux : on dcle une tendance dans un groupe puis on prcise travers quelles
variables du groupe elle sexprime.

11.5.5 Reprsentations superposes des individus et des modalits


Ces reprsentations nont dintrt que pour les facteurs communs plusieurs groupes.
Ayant tout dabord constat la proximit globale des points reprsentant un mme
individu, on examine les individus qui scartent de ce schma gnral et prsentent des
images diffrentes selon les groupes qui les dcrivent. Dans ce type dinterprtation,
on raisonne avec les groupes comme classiquement avec les variables. Ainsi, dans
lexemple des vins (section 7.1.5 page 156), on relve que tel vin est plus puissant du
point de vue de lolfaction au repos que de la gustation. ce niveau, il est ncessaire
de se rfrer frquemment aux donnes initiales.
Lorsque plusieurs individus prsentent le mme type dcart entre leurs reprsentations au travers des diffrents groupes, on recherche leur point commun (quelquefois,
ce point commun est une zone du plan factoriel). Sil existe, ce point commun mrite
toujours lattention.
En tant que centres de gravit, les modalits participent cette reprsentation superpose. Elles sont particulirement prcieuses lorsque les individus sont nombreux,
voire mme rendent inutile la reprsentation superpose des individus dans des donnes de type enqute.

11.5.6 Cas o tous les groupes comprennent les mmes variables


Dans ce cas, on peut raliser deux ACP (ou deux ACM) en juxtaposant soit les
variables, soit les individus. LAFM contient simultanment des rsultats analogues
ceux de ces deux analyses. Notons toutefois que dans lACP juxtaposant les mmes

11.6 Quelques types de facteurs

289

individus caractriss par chacun des groupes, les variables sont centres sur cet
ensemble rpt dindividus, alors quen AFM elles le sont sur chaque groupe (comme
dans lACP juxtaposant les variables).

11.6 QUELQUES TYPES DE FACTEURS


Il est communment admis que lhabilet dans linterprtation des rsultats dAnalyses
des Donnes dpend beaucoup de lexprience. Grossirement, cette exprience est
constitue dun ensemble de cas auxquels lanalyste se rfre plus ou moins explicitement. Sans prtendre remplacer lexprience, il est utile, propos de linterprtation,
dvoquer quelques situations typiques rencontres en analyse factorielle.
Nous dcrivons ci-aprs sept types de facteurs. Indiquons demble quil ne sagit
pas dune partition, un mme facteur pouvant tre prsent de plusieurs faons, mais
de situations typiques auxquelles on peut se rfrer dans bon nombre de cas concrets.
Pour chaque type, nous voquons un exemple prcis, trs schmatique, mais inspir
dune analyse relle. Enfin, nous abordons le problme, crucial dans la prsentation
des rsultats dune analyse, de lattribution dun nom un facteur.

Dunod La photocopie non autorise est un dlit

11.6.1 Facteur d quelques lments aberrants


Le terme daberrant est discutable et discut mais il est en passe dtre consacr par
lusage. Un lment est aberrant si, possdant quelques particularits remarquables, il
se trouve trs loign des autres. Il possde de ce fait une inertie importante qui peut
influencer de faon prpondrante lun des premiers axes.
Nous avons dcrit quelques critres pour dtecter de telles situations ainsi que la
conduite tenir le cas chant (cf. section a). Les lments aberrants peuvent tre des
individus en ACP ou en AFM, des lignes ou des colonnes en AFC, des individus ou
des modalits en ACM ou en AFM.
Exemple : on a ralis une ACM sur des donnes denqutes. Un petit nombre
dindividus na pas fourni de rponse la plupart des questions. eux seuls, ils
engendrent lun des premiers axes factoriels. Deux conduites sont possibles.
Restreindre le champ de ltude aux individus qui ont suffisamment rempli le
questionnaire. On recommence lanalyse en neutralisant les individus possdant
trop de non-rponses, cest--dire en les mettant en supplmentaire voire en les
liminant. Lors de cette opration, on doit vrifier que les modalits concernes
par cette limination, cest--dire principalement les non-rponses, conservent
des effectifs suffisamment importants (lACM est sensible aux modalits deffectif trs faible).
Conserver lanalyse si, dune part, lobjectif de ltude comprend la faon de
rpondre un questionnaire et si, dautre part, on peut considrer que les quelques

290

11 Interprtation des rsultats dune analyse factorielle

lments aberrants nont fait que mettre en vidence un facteur non-rponse qui
serait peut-tre pass inaperu sans eux, car alors affect dun rang lev.

11.6.2 Facteur dopposition


Lors de linterprtation dun facteur, on sintresse de manire privilgie aux lments
possdant les coordonnes les plus extrmes. Si lopposition qui en rsulte est claire,
elle rsume linterprtation.
Exemple : les individus sont des stations sur lesquelles on a mesur labondance
de diffrentes plantes. Un facteur peut tre interprt comme opposant les prairies
aux bois . Cette opposition concerne aussi bien les stations (stations situes en zone
de prairies, stations situes en zones boises) que les plantes (plantes typiques des
prairies, plantes typiques des bois).

11.6.3 Facteur mettant en vidence un groupe


Ce type de facteur sapparente aux deux prcdents. Il met en vidence un groupe
dlments particuliers trop important pour tre qualifi daberrant. Ce groupe soppose lensemble des autres lments qui occupent la zone centrale ; il en rsulte une
dissymtrie due aux effectifs diffrents des deux groupes.
Exemple : on a effectu diffrentes mesures biomtriques sur des vaches. Un facteur
met en vidence le caractre trs particulier des animaux de la race charolaise.

11.6.4 Facteur associ une partition


On est tent de rsumer un facteur par une partition lorsque la rpartition des lments
le long de laxe prsente des discontinuits. On cherche alors identifier les classes
dlments ; si lon trouve une identification claire, on privilgie cette partition dans la
description du facteur.
Exemple : on effectue plusieurs mesures sur un ensemble de fromages issus de
plusieurs procds de fabrication. Un facteur peut sparer nettement les fromages
selon le procd dont ils sont issus : cette sparation constitue un lment essentiel de
la description du facteur.
Une situation remarquable de facteurs associs une partition se rencontre en
AFC lorsquune valeur propre est gale 1. Il est alors possible de partitionner les
lignes et les colonnes du tableau en classes telles que, lintrieur dune classe,
les lments possdent exactement la mme coordonne sur le facteur associ (cf.
Figure 3.9 page 78).

11.6 Quelques types de facteurs

291

11.6.5 Facteur dchelle


Il sagit dun facteur facilement et efficacement rsum par une variable quantitative,
ou qualitative modalits ordonnes, laquelle il est trs li.
Exemple : des individus sont reprs par la possession de diffrents matriels
dquipement mnager. On peut trouver, selon un axe, les individus rangs selon le
nombre dappareils quils possdent : un tel axe peut tre rsum par le terme niveau
dquipement , qui voque bien une chelle.
Cette situation se rencontre lorsque lexistence dun facteur est suppos a priori et
que lAnalyse Factorielle a prcisment pour but de lexpliciter. Une situation typique
est celle dans laquelle on cherche mesurer lintensit dun phnomne unique au
travers de plusieurs variables, gnralement quantitatives ou qualitatives ordonnes.
On souhaite obtenir une variable quantitative unique, compromis entre les variables
initiales, afin de lutiliser comme indicateur dintensit du phnomne tudi.
Exemple : on veut construire un indice de prcocit pour diffrentes varits de mas.
Pour cela, on dispose dun ensemble de mesures sappuyant sur la date dapparition de
diffrents organes (feuilles, etc.). Chaque mesure constitue un indice de prcocit ; ces
indices sont trs lis entre eux mais ne sont pas identiques. On ralise alors une ACP
dont le premier facteur ralise un compromis entre les diffrentes variables initiales et
sinterprte comme un indicateur synthtique de prcocit.

Dunod La photocopie non autorise est un dlit

11.6.6 Leffet taille en ACP


Il est classique, en ACP (cf. figure 1.7 page 17), dobserver que les coefficients de
corrlation des variables actives avec un facteur (gnralement le premier) sont tous
positifs (cette situation se prsente lorsque toutes les variables sont corrles positivement entre elles, ce qui peut se lire directement sur la matrice des corrlations). Le
vocable effet taille fait rfrence des donnes biomtriques, de type mensurations,
sur des individus : avec ce type de donnes, le facteur prcit classe les individus
depuis ceux qui prsentent les plus faibles valeurs pour lensemble des variables (cest-dire les petits) jusqu ceux qui prsentent les plus fortes valeurs pour lensemble
des variables (cest--dire les grands).

11.6.7 Leffet Guttman en AFC ou ACM


En AFC, lorsquun facteur dchelle est trs fort, il influence plusieurs axes selon
la proprit suivante : le facteur de rang s est une fonction polynme de degr s du
premier. Ce phnomne se dtecte facilement partir du plan factoriel (1,2) sur lequel
le nuage des lignes et des colonnes prsente lallure dune parabole (cf. section 10.3.2
page 231). Le fait didentifier un effet Guttman ne modifie pas sensiblement linterprtation des deux premiers axes dune AFC (le premier axe est un facteur dchelle, le
second un facteur dopposition entre les situations extrmes et les situations moyennes).

292

11 Interprtation des rsultats dune analyse factorielle

En revanche, cela conduit ngliger les facteurs suivants qui sont des fonctions polynmes du premier. Leffet Guttman est plus ou moins net selon lintensit, dans les
donnes, du phnomne quil met en vidence. Si le premier plan factoriel fait apparatre un nuage de points dont la forme parabolique est floue, il est possible que
linfluence du premier facteur ne se fasse sentir que sur quelques axes seulement : il
est alors possible de trouver des facteurs de rang moyennement lev (e.g. 3, 4 ou 5)
sinterprtant indpendamment du premier (cf. section b page 234). Il est donc prudent
de sassurer dun effet Guttman au del des deux premiers facteurs.
En ACM, on observe ce phnomne surtout lorsque les modalits de chacune des
variables sont ordonnes a priori. Par exemple, si des variables qualitatives proviennent
du recodage dun ensemble de variables quantitatives dont lACP produit comme
premier facteur un effet taille, lACM de ces variables qualitatives conduit presque
automatiquement un effet Guttman, le premier axe supportant la mme interprtation
globale dans les deux analyses. En ce sens, lACM est susceptible de mettre en
vidence un effet taille ; cet effet se traduit par plusieurs facteurs (au maximum r 1
si les variables possdent chacune r modalits), alors quil se traduit par un facteur
unique en ACP.

11.6.8 Le nom dun facteur


Linterprtation dune analyse factorielle est une opration complexe en ce sens quelle
met en jeu un grand nombre dlments dorigines varies. Elle comprend en particulier une tape qui consiste donner un nom aux facteurs. Cette tape nest pas
forcment difficile et nintervient pas ncessairement en fin de processus. Elle est
nanmoins la plus voyante car son aspect synthtique fait quelle est privilgie dans
la prsentation des rsultats dune analyse dont elle est souvent llment le plus
mmorisable. Lobjectif est ici dillustrer, autour de laffectation dun nom un facteur, dune part la notion de type de facteurs et sa relativit, et dautre part les diffrents
contextes de linterprtation. Nous reprenons ci-aprs, de faon simplifie, linterprtation du deuxime facteur dune ACM ralise partir de lenqute Ouest-France (cf.
section 6.4 page 132).
Le premier contexte, celui des variables actives met en vidence une opposition
entre les modalits lecture et les modalits non-lecture des rubriques dinformation
gnrale. Linterprtation se situe dabord dans ce premier contexte dans lequel le
premier facteur peut tre rsum par lopposition lecture/non-lecture de ces rubriques.
Le deuxime contexte, celui des variables supplmentaires, fait apparatre une
liaison entre ce facteur et les CSP. Schmatiquement, les agriculteurs et les ouvriers
lisent peu ces rubriques, les tudiants et cadres suprieurs les lisent beaucoup, les
cadres moyens occupant une position intermdiaire entre ces deux extrmes. Une
deuxime faon de prsenter ce facteur, focalise sur cette partition, est facteur
social .

11.6 Quelques types de facteurs

293

Le troisime contexte, celui de nos connaissances gnrales sur la socit, indique


que le facteur place les CSP selon un statut social croissant. Le facteur apparat alors
plutt comme un facteur dchelle : le statut social.
Cet exemple illustre, de faon schmatique mais cependant raliste, quelques problmes gnraux apparaissant lors dune interprtation. La notion de type de facteur
envisag prcdemment fournit des points de repre commodes et non une grille
contraignante : le mme facteur est apprhend dabord en termes dopposition, puis
en termes de partition et enfin en termes dchelle. Lintervention successive des
diffrents contextes fait apparatre une coupure ; le troisime contexte introduit les
connotations les plus synthtiques et des lments de validation (on et rexamin
dun il suspicieux le facteur prcdent sil avait oppos dune part agriculteurs et
cadres suprieurs , dautre part, tudiants et cadres moyens).

Chapitre 12

Fiches techniques

12.1 FICHE 1 : MOYENNE ET BARYCENTRE, VARIANCE


ET INERTIE
12.1.1 Cas dune variable
Une variable x dfinie sur un ensemble I dindividus se reprsente par un nuage de
points sur un axe. Lindividu i est reprsent par le point dabscisse gale la valeur
xi prise par la variable x pour lindividu i.
a) Moyenne et barycentre

Si limportance des individus est la mme pour tous, la moyenne de la variable x,


note x, est gale :
1
xi
x =
I
i

Plus gnralement, si lindividu a un poids pi (par exemple si les individus reprsentent


des populations deffectifs ingaux), la moyenne x scrit :


pi xi /
pi
x =
i


Souvent les poids sont tels que i pi =1 ce qui allge lcriture : x = i pi xi
Sur laxe de reprsentation du nuage, le point dabscisse x est le barycentre
des points xi muni des poids pi . Ce barycentre est la traduction gomtrique de
la notion statistique de moyenne.

12 Fiches techniques

296

En retirant chaque xi la moyenne x, on obtient une variable centre. En passant


de x x x on effectue une translation du nuage sur laxe (ou une translation de
lorigine de laxe) qui fait concider son barycentre avec lorigine.
b) Variance et inertie

Si limportance des individus est la mme pour tous, la variance dune variable x,
note sx2 , est gale :
1
(xi x)2
sx2 =
I
i

Si lindividu i a un poids pi elle scrit :




pi (xi x)2 /
pi
sx2 =



Lorsque les poids sont tels que i pi = 1 on a : = i pi (xi x)2 .
La variance mesure la dispersion des valeurs autour de la moyenne. Le fait de
considrer les carrs des carts et non les valeurs absolues des carts facilite les calculs
et permet des dcompositions suivant le thorme de Pythagore et celui de Huygens
rappel plus loin. Lcart-type sx est la racine carre de la variance.
La notion statistique de variance correspond la notion mcanique dinertie
dun nuage de points par rapport son barycentre.
En effet, linertie dun point i de poids pi par rapport un point A de coordonne
xa est, par dfinition, le produit du poids de i par le carr de sa distance A soit :
pi (xi xa )2 .
Linertie dun nuage de points est la somme des inerties des points du nuage.
Linertie dun 
nuage de points reprsent sur un axe, par rapport
au point G dabscisse
2
x, est gale i pi (xi x) ; on retrouve la variance lorsque i pi = 1.
Quand on divise chaque valeur xi x de la variable centre par son cart-type sx ,
on obtient une variable de variance 1 appele variable centre-rduite.
La transformation gomtrique qui permet de passer de x x (x x)/sx est
une homothtie de centre G et de rapport gal 1/sx .
sx2

c) Thorme de Huygens

La forme la plus simple du thorme de Huygens est la relation entre linertie dun
nuage par rapport un point quelconque Z dabscisse z et son inertie par rapport
G. La premire est gale la seconde augmente de linertie, par rapport Z, de G
affect du poids total du nuage :





2
2
x z)2
pi (xi z) =
pi (xi x) +
pi (
i

12.1 Fiche 1 : moyenne et barycentre, variance et inertie

297

En appliquant cette relation J sous-nuages, on obtient la forme dcrite ci-aprs sous


laquelle le thorme de Huygens est rencontr le plus souvent en statistique.
Linertie dun nuage de points dans lequel on distingue J sous-nuages est la somme
des inerties de ces sous-nuages par rapport leur barycentre (inertie intra) augmente
de linertie du nuage des J barycentres chacun affect du poids total du sous-nuage
e
quil reprsente (inertie inter). Ceci
 scrit, en notant I j le j sous-nuage, x j son
barycentre et p j son poids ( p j = i pi pour i I j ) (cf. illustration Figure 12.1) :


pi (xi z)2 =

iI


j

pi (xi x j )2 +

iI j

p j (
x j z)2

Cest la forme mcanique de la dcomposition classique de la variance :



variance totale = variance inter + pi variance intra I j
j

Inertie totale

xj

xl

Inertie inter
In. intra Ij

In. intra Il

Dunod La photocopie non autorise est un dlit

Figure 12.1 Thorme de Huygens pour une variable. 8 points sont rpartis en 2 sous-nuages de
4 points : I j (carrs) et Il (disques).

12.1.2 Cas de deux variables


Ces proprits se gnralisent un tableau de donnes comportant 2 variables x et
y. Lensemble des valeurs des 2 variables se reprsente par un nuage dans un plan
rapport deux axes orthogonaux correspondant respectivement aux deux variables.
Un individu i est reprsent par un point dont les 2 coordonnes sont ses valeurs xi et
yi .
a) Centrage et rduction

Le point G de coordonnes (
x , y) est le barycentre des points du nuage munis des
poids pi . Quand on retire chaque valeur xi la moyenne x et chaque valeur yi la
moyenne y, on obtient un tableau centr. La transformation gomtrique qui permet

12 Fiches techniques

298

de passer du nuage associ au tableau initial au nuage associ au tableau centr est
une translation qui fait concider lorigine O et le barycentre G.
Quand on divise les valeurs xi x par sx et les valeurs yi y par s y , on obtient un
tableau centr-rduit. La transformation gomtrique qui permet de passer du nuage
centr au nuage centr-rduit est la composition de deux homothties de centre G (la
premire, de rapport 1/sx dans la direction de x, la seconde, de rapport 1/s y dans la
direction de y). Une autre faon de voir cette transformation est de considrer que lon
adopte sx et s y comme units de mesure (cf. Figure 12.2).
Un nuage centr-rduit possde, en projection sur chaque axe, une inertie gale 1.

Figure 12.2 Nuage associ aux mmes 2 variables x et y brutes (A), centres (B) et
centres-rduites (C).

b) Thorme de Huygens
2

Le carr de la distance dun point i lorigine vaut : Oi = xi2 + yi2 . On en dduit
que :
2
inertie de i = pi Oi = pi xi2 + pi yi2
Do, pour le nuage des points i :



2
inertie totale =
pi Oi  =
pi xi2 +
pi yi2
i

Linertie du nuage se dcompose donc suivant les deux axes : elle est la somme
des inerties de ses deux projections suivant les deux directions orthogonales. Si les
variables sont centres, elle est donc gale la somme des variances des deux variables.
Si les variables sont centres-rduites, linertie du nuage vaut 1 dans chaque direction
et vaut donc 2 dans le plan.
Le thorme de Huygens se gnralise sans difficult au cas de deux variables
puisque linertie dun nuage se dcompose sur chaque axe suivant le thorme de
Pythagore (cf. Figure 12.3).

12.2 Fiche 2 : reprsentation des variables dans R I

G2

Inertie totale

299

G2

G1

Inertie inter-classes

G1

Inertie intra-classes

Figure 12.3 Thorme de Huygens dans le plan.

12.1.3 Cas dun nombre quelconque K de variables


Ces proprits se gnralisent un nombre quelconque K de variables. chaque
individu i, on associe le point de R K dont la k e coordonne est la valeur de la k e
variable pour i. Le point dont la k e coordonne est la moyenne de la variable k (quel
que soit k) est le barycentre G du nuage. Centrer le tableau de donnes, cest--dire
retrancher chaque variable sa moyenne, consiste encore prendre le point G comme
origine des axes.
Rduire le tableau de donnes, cest appliquer K homothties successives dans les
directions des axes pour avoir une inertie gale 1 dans chacune de ces K directions.
Le thorme de Huygens se gnralise sans difficult au cas de plusieurs variables.

Dunod La photocopie non autorise est un dlit

12.2 FICHE 2 : REPRSENTATION DES VARIABLES DANS RI


12.2.1 Espace et mtrique
Une variable x dfinie sur un ensemble I dindividus est reprsente par un vecteur
de R I dont les I composantes sont gales aux valeurs xi prises par la variable x pour
lindividu i.
x = (x1 , . . . , xi , . . . , x I )
Sur lespace R I est dfini un produit scalaire (cf. Fiche 3). Si les poids des individus sont tous gaux, le produit scalaire entre deux vecteurs x et y scrit :
x, y =

1
xi yi
I i

12 Fiches techniques

300

Plus gnralement, si les individus ont des poids pi tels que



pi xi yi
x, y =


i

pi = 1 :

Soit u le vecteur colinaire la premire bissectrice dont toutes les composantes sont
gales 1. Ce vecteur a pour norme 1 :

u = (u 1 , . . . , u i , . . . , u I ) = (1, . . . , 1, . . . , 1)


2
pi u i2 =
pi = 1
u = u, u =
i

12.2.2 Centrage
La moyenne x dune variable x est gale la coordonne de la projection de x sur u :


pi xi =
pi xi u i = x, u
x =
i

xu = projection orthogonale de x sur u


Une variable centre est reprsente par un vecteur orthogonal u car :


pi xi = 0 quivaut x, u = 0

Centrer une variable cest considrer, au lieu de x, la variable centre de composantes xi x. Cette variable centre est reprsente par le vecteur x xu :
x xu = (x1 x, . . . , xi x, . . . , x I x)
= x [projection orthogonale de x sur u]
Le vecteur x xu (orthogonal u) est la projection de x sur lhyperplan orthogonal
u. Centrer x revient donc considrer sa projection sur lhyperplan orthogonal u
(cf. Figure 12.4).

12.2.3 Rduction
La variance dune variable x est gale au carr de la norme du vecteur reprsentant la
variable centre ; son cart-type sx est gal la norme de ce vecteur :

2
variance de x =
pi (xi x)2 = x xu = sx2
i

12.3 Fiche 3 : distance, norme et produit scalaire

RI

301

u
xu

x
u

x xu

Figure 12.4 Interprtation gomtrique du centrage dans R I . u : vecteur unitaire constant. La


projection de x sur u est le vecteur constant dont chaque coordonne est gale x. La variable
centre x xu est la projection de x sur lhyperplan u orthogonal u.

Une variable centre-rduite est reprsente par un vecteur de norme 1 orthogonal


u.
Centrer et rduire une variable cest considrer, au lieu de x, la variable centre et
rduite de composantes (xi x)/sx .
Rduire une variable centre consiste la diviser par son cart type ; le vecteur
reprsentant la variable est alors divis par sa norme.

12.2.4 Coefficient de corrlation

Dunod La photocopie non autorise est un dlit

Le coefficient de corrlation entre deux variables x et y, not r(x, y), est gal au
cosinus de langle entre les vecteurs reprsentant les variables centres, cest--dire
au produit scalaire entre les vecteurs reprsentant les variables centres-rduites :


corrlation(x, y) = r(x, y) =
x,y
= xy
= x, y

pi (xi
x )(yi
y)

sx s y

x
x u,y
y u
x
x uy
y u

si x et y sont centres
si x et y sont centres et rduites

Plus la corrlation entre les variables est leve, plus langle entre les vecteurs est
faible. Si la corrlation entre x et y est nulle, les vecteurs sont orthogonaux ; si elle est
gale 1 ou -1, les vecteurs sont colinaires.

12.3 FICHE 3 : DISTANCE, NORME ET PRODUIT SCALAIRE


Cette fiche prcise les notions de distance, norme et produit scalaire ainsi que les relations entre ces structures. Nous donnons dabord une vision gnrale de lensemble des

12 Fiches techniques

302

y
RI
1

y/sy
x
r(x, y)

x/sx

x et y sont deux variables centres.


Leurs normes sont gales leurs cartstypes sx et s y . Le produit scalaire entre
les deux variables normes est gal leur
coefficient de corrlation r(x, y).

Figure 12.5 Rduction de variables centres et coefficient de corrlation dans R I .

termes techniques. Les dfinitions mathmatiques gnralisent les notions habituelles


du plan (et de lespace R 3 ) auxquelles nous nous rfrons systmatiquement.

12.3.1 Espace vectoriel et espace euclidien

x2

y2
e2
e1

x1

y1

e1  = 1 e2  = 1 e1 , e2  = 0


x = x 1 e1 + x 2 e2
Le carr de la distance entre les points x
et y est :
d2 (x, y) = (x1 y1 )2 + (x2 y2 )2
2
= x y
= x y, x y

Figure 12.6 Distance, norme et produit scalaire dans le plan. Les vecteurs x et y se dcomposent
sur la base e1 , e2 .

La notion la plus gnrale est la notion de distance qui peut tre dfinie sur un
ensemble quelconque. Sur un espace vectoriel, une distance peut driver dune norme,
on parle alors despace norm. Une norme peut elle-mme driver dun produit scalaire.
Une norme qui drive dun produit scalaire est une norme euclidienne et la distance
qui en dcoule est une distance euclidienne. On appelle espace euclidien un espace

12.3 Fiche 3 : distance, norme et produit scalaire

303

vectoriel rel de dimension finie sur lequel est dfini un produit scalaire. Dans la suite,
nous parlerons uniquement de lespace R n , seul espace utilis en analyse factorielle (n
dsigne la dimension de lespace). Nous parlons aussi de mtrique euclidienne pour
dsigner la structure dfinie sur R n par un produit scalaire.

12.3.2 Distance
Une distance sur un ensemble E est une application du produit de E par lui-mme
dans R + : tout couple de points (x, y) est associ un nombre positif, la distance entre
x et y note d(x, y).
Cette application vrifie certaines proprits quels que soient x et y appartenant
E:

d(x, y) = 0 si et seulement si x = y
d(x, y) = d(y, x)
d(x, y)  d(x, z) + d(z, y) (ingalit triangulaire)
La distance usuelle (ou canonique) de R 2 scrit, en notant xi et yi les coordonnes
des points x et y sur la base usuelle (ou canonique) :
d2 (x, y) = (x1 y1 )2 + (x2 y2 )2
Plus gnralement la distance usuelle de R n scrit :
d 2 (x, y) =

n


(xi yi )2

Dunod La photocopie non autorise est un dlit

i=1

12.3.3 Norme
Une norme sur R n est une application de R n dans R + : tout vecteur x est associ un
nombre positif, la norme de x, note x.
Cette application vrifie certaines proprits (O = origine des axes) :
x = 0 si et seulement si x = O
ax = |a| x pour tout x de R n et tout a de R
x + y  x + y pour tous x et y de R n
Toute norme induit une distance par la relation : d(x, y) = x y. Ainsi, lorsquune distance drive dune norme :

12 Fiches techniques

304

1. la distance dun point lorigine O des axes est la norme (ou longueur) du
vecteur qui le joint O ;
2. la distance entre deux points x et y est la longueur du vecteur qui joint ces deux
points (cf. Figure 12.3).
Une distance qui drive dune norme a des proprits spcifiques.
2
La distance usuelle de R 2 drive de la norme : x = x12 + x22
Plus gnralement, la distance usuelle de R n drive de la norme :
2

x =

n


(xi )2

i=1

12.3.4 Produit scalaire


Un produit scalaire sur un espace vectoriel E est une application du produit de E par
lui-mme dans R : tout couple de vecteurs (x, y) est associ un nombre, le produit
scalaire entre x et y, not x, y. Cette application vrifie certaines proprits. Ainsi,
quels que soient les nombres a et b et les vecteurs x, y et z, on a :

x, x
x, y
ax + by, z
z, ax + by

=
=
=
=

0 si et seulement si x = 0
y, x(symtrie)
ax, z + by, z (bilinarit)
az, x + bz, y (bilinarit)

Un produit scalaire induit une norme par la relation :


2

x = x, x
Le produit scalaire usuel (ou canonique) de R 2 scrit, en notant xi et yi les composantes des vecteurs x et y sur la base usuelle (ou canonique) :
x, y = x1 y1 + x2 y2
Plus gnralement le produit scalaire usuel de R n scrit :
x, y =

n


xi yi

i=1

La norme usuelle (et donc la distance usuelle) de R n drive de ce produit scalaire.

12.3 Fiche 3 : distance, norme et produit scalaire

305

12.3.5 Angles
Un produit scalaire induit, en plus de la notion de norme, la notion dangle. Langle
u entre deux vecteurs x et y est dfini par son cosinus qui, par dfinition, est gal au
produit scalaire de ces deux vecteurs divis par le produit de leurs normes :
cos u =

x, y
x y

Le cosinus est compris entre -1 et 1. Sil vaut 1, les vecteurs sont colinaires et de
mme sens ; sil vaut -1, ils sont colinaires de sens oppos.

12.3.6 Orthogonalit, thorme de Pythagore et projection orthogonale


Du produit scalaire on dduit une notion dorthogonalit : deux vecteurs x et y sont
orthogonaux si et seulement si leur produit scalaire est nul. Un vecteur x est orthogonal
un sous-espace sil est orthogonal tous les vecteurs de ce sous-espace.
Le thorme de Pythagore sapplique tout produit scalaire : si un vecteur z est la
somme de deux vecteurs orthogonaux x et y, le carr de sa longueur est la somme des
carrs des longueurs de x et de y.
On dfinit la projection orthogonale dun vecteur x sur un axe. Si u est un vecteur
unitaire de cet axe, la projection y de x est le vecteur colinaire laxe de coordonne
x, u et le vecteur x y est orthogonal laxe.
projection de x sur u = x, uu

Dunod La photocopie non autorise est un dlit

On dfinit aussi la projection orthogonale sur un sous-espace E : y est la projection


de x sur E si le vecteur x y est orthogonal E.

12.3.7 Expression matricielle


Soit la base canonique de R n et notons m i j le produit scalaire entre les vecteurs ei et
e j de la base. Du fait de la bilinarit, le produit scalaire entre x et y scrit :




xi ei ,
xjej =
xi y j ei , e j  =
m i j xi y j
x, y = 
i

soit, matriciellement, en notant M la matrice de terme gnral m i j et x  le transpos


de x :
x, y = x  M y = y  M x
La norme et la distance induites par le produit scalaire scrivent :
x = x, x = x  M x
2

12 Fiches techniques

306

d2 (x, y) = x y = (x y) M(x y)


2

La structure de la matrice M est souvent utilise pour qualifier une mtrique. Ainsi,
on parle de mtrique diagonale si M est diagonale. De mme, la distance euclidienne
usuelle tant associe la matrice identit, on la nomme souvent mtrique identit .

12.3.8 Produit scalaire et base orthonorme


Une base dun espace euclidien (ou dun sous-espace) est orthogonale pour le produit
scalaire si les vecteurs de cette base sont orthogonaux deux deux. Si de plus ces
vecteurs ont pour longueur 1, cette base est orthonorme.
Dans une base orthonorme (pour le produit scalaire considr), le produit scalaire
sexprime sous la forme canonique.
Si la base est orthogonale pour le produit scalaire considr, les termes non diagonaux de la matrice M sont nuls ; cette matrice est diagonale et le produit scalaire se
rduit :

m ii xi yi
x, y =
i

Cest le cas des mtriques utilises en analyse factorielle. La diffrence entre ces
mtriques "diagonales" et la mtrique habituelle est que chaque vecteur de base a un
"poids", qui sexprime en particulier dans la distance :

m ii (xi yi )2
d2 (x, y) =
i

Si le produit scalaire nest pas le produit scalaire usuel, la distance induite ne correspond pas la vision habituelle. Pour obtenir une reprsentation des distances
directement perceptible loeil, il faut se ramener au produit usuel. Pour cela il suffit
dexprimer et de reprsenter les points dans une base orthonorme pour le produit
scalaire considr. Cest ce qui est fait en analyse factorielle.
Dans le cas dune mtrique diagonale, une base orthonorme se dduit de la base
canonique en divisant les vecteurs de base par leur norme, ce qui revient multiplier
les coordonnes correspondantes par cette norme.
Prcisons cela en prenant lexemple de R 2 muni de la mtrique diagonale valant 4
pour le premier vecteur de base et 1/9 pour le second. Pour travailler avec la mtrique
habituelle, il suffit de faire la transformation qui tout point x de coordonnes (x1 , x2 )
associe le point de coordonnes (2x1 , x2 /3). Le poids de la premire coordonne tant
suprieur 1, cette coordonne est dilate tandis que la seconde est contracte.
Soit {A, B, C, D} un nuage de 4 points reprsents dans R 2 muni de la base
{u 1 , u 2 } et de la mtrique diagonale {4, 1/9} (cf. Figure 12.7.A). La matrice des
distances inter-individuelles est donne figure 12.7. Dans cet espace, la base {e1 , e2 }
est orthonorme.

12.3 Fiche 3 : distance, norme et produit scalaire

R2 e
2

307

Mtrique
2

u1 u2
u1 4 0
u2 0 1/9

Distances inter-points
A B C D

u2
e 1 u1

R2

A
B
C

0
1

0
2

Mtrique
e1 e2
e1 1
e2 0

0
1

e2
e1

Dunod La photocopie non autorise est un dlit

Figure 12.7 Nuage de 4 points {A, B, C, D} reprsent dans le plan R 2 muni dune mtrique
diagonale (A) et dans une base orthonorme de ce mme plan (B).

La Figure 12.7.B reprsente ce mme ensemble de points dans la base {e1 , e2 }.


Dans cette base, la distance euclidienne usuelle conduit la mme matrice des distances inter-individuelles que prcdemment.
Cette transformation permet donc danalyser avec les rgles usuelles un nuage de
points voluant initialement dans un espace muni dune mtrique autre que lidentit.
Cest bien ce qui est fait par exemple en AFC.

Index systmatique

ACM = Analyse des Correspondances Multiples. Sapplique aux variables qualitatives.


actif : lment actif ou lment principal = lment pris en compte dans le calcul des
facteurs ; par opposition lment supplmentaire ou illustratif.
ACP = Analyse en Composantes Principales. Sapplique aux variables numriques.
ACP norme (resp. non norme) : ACP dans laquelle les variables sont rduites
(resp. non rduites). Voir 1.4, 2.1.2.4. et 11.2.3. Quand rien nest prcis : ACP
norme.
AF

= Analyse Factorielle. Terme gnrique pour dsigner lune des mthodes danalyse factorielle (ACP, AFC, ACM, etc.) ou le principe commun ces mthodes :
projeter un nuage de points sur une suite daxes orthogonaux deux deux
dinertie maximum (5.2).

Dunod La photocopie non autorise est un dlit

AFC = Analyse Factorielle des Correspondances. Conue principalement pour traiter


des tableaux de frquence. Peut tre applique dautres types de tableaux
(3.10).
AFDM = Analyse Factorielle de Donnes Mixtes (4.6). Sapplique un mlange de
variables qualitatives et numriques.
AFM = Analyse Factorielle Multiple. Sapplique aux tableaux comprenant plusieurs
groupes de variables numriques et (ou) qualitatives.
AFTD = Analyse Factorielle sur Tableau de Distances. Dfinition (5.4.5) ; tude de
plusieurs tableaux de distances par AFM (AFMTD : 8.5.5).
agrgation autour des centres mobiles : mthode de construction et/ou damlioration dune partition (2.6).
aide linterprtation cf. contribution, cf. qualit de reprsentation, voir 1.9, cf.
supplmentaire.
arbre hirarchique ; mode de reprsentation des donnes ; construction (2.3.1), arbre
hirarchique et plan factoriel (2.5.1).

310

Index systmatique

axe

dinertie ou axe factoriel : en analyse factorielle, les nuages sont projets sur
des axes : en ACP (1.5 et 1.6), en AFC (3.6), en gnral (5.2) ; ces axes sont les
axes dinertie dun nuage : ils sont orthogonaux entre eux ; linertie du nuage
projet est maximum sur le premier axe, puis le second, etc. ; ils sont vecteurs
propres dune matrice (5.2.4 et 5.2.5) ; axe principal dinertie dun nuage = axe
dinertie calcul en prenant comme origine le barycentre ; relation entre les
axes et les facteurs (5.4.1).

Burt : tableau de Burt (4.1.5).


barycentre ou centre de gravit : dfinition voir 12.1 ; lorigine des axes est au
barycentre du nuage dindividus en ACP (1.3), des deux nuages en AFC (3.5 et
3.6.3) ; en ACM, le barycentre des modalits dune mme variable est lorigine
des axes (4.3.5.1) et (6.4.1.1) ; en AFC, le profil de la somme de plusieurs lignes
(ou colonnes) est au barycentre des profils de ces lignes (ou de ces colonnes)
(10.3.1) ; proprit barycentrique : cf. relations de transition.
CAH : Classification Ascendante Hirarchique. Mthode de construction dun arbre
hirarchique. Les algorithmes ascendants (partir de la partition la plus fine
et agrger petit petit ses lments) sont plus utiliss que les algorithmes
descendants (partir de la partition la plus grossire que lon subdivise de plus
en plus finement).
canonique : analyse canonique et multicanonique (8.3.4.1 et 8.3.4.2).
centr : variable centre = variable numrique de moyenne nulle (1.2) ; centrer une
variable = considrer la variable numrique centre dduite dune variable en
soustrayant sa moyenne ; centrer un tableau = considrer le tableau des variables
centres ; nuage centr = nuage de points dont le barycentre est lorigine
des axes (1.3) ; centrer un nuage = dplacer lorigine des axes au barycentre
du nuage (12.1) ; en ACP, centrer les variables centre le nuage des individus
et projette le nuage des variables sur lhyperplan orthogonal la premire
bissectrice (12.2) ; gnralisation de lACP un tableau non centr (5.3.1) ; en
AFC, il y a quivalence entre lanalyse du nuage centr et du nuage non centr
(3.6.3 et 5.5).
centre de gravit cf. barycentre.
chane ; effet de chane en CAH (2.3.4).
classe cf. modalit cf. indicatrice ; choix des classes pour un codage de variable
numrique en variable qualitative (4.5.2).
classification : (introduction, 2.2) les deux grands types de mthodes en analyse
des donnes sont les mthodes factorielles et les mthodes de classification.
Lobjectif gnral de ces dernires est dobtenir des partitions dun ensemble

Index systmatique

311

dlments (lignes ou colonnes dun tableau de donnes) qui regroupent dans


une mme classe des lments qui se ressemblent ; les mthodes les plus utilises sappuient sur les mmes reprsentations gomtriques que les analyses
factorielles (nuages dfinis comme en ACP, AFC, ACM ou AFM suivant le type
de tableau). Les algorithmes tendent obtenir des partitions qui maximisent le
quotient de linertie inter-classe par linertie totale (2.3.3). Loptimum global
est gnralement inaccessible. Les mthodes de partitionnement construisent
directement une partition (exemple : agrgation autour des centres mobiles) ;
les mthodes hirarchiques (exemple CAH) construisent un arbre hirarchique,
outil commode pour raisonner le choix dune partition.
codage = traduction numrique dun ensemble de donnes en vue dun traitement
statistique particulier ; codage dune variable numrique en variable qualitative
(4.5) ; codage condens de variables qualitatives (4.1.2) ; codage disjonctif
complet (4.1.3).

Dunod La photocopie non autorise est un dlit

composante principale = facteur sur les individus en ACP (1.6).


contribution linertie : contribution dun lment linertie dun nuage (1.9.1.3) =
[inertie de cet lment / inertie du nuage] ; contribution dun lment linertie
dun axe ou dun facteur = contribution de cet lment linertie du nuage
projet sur laxe ; les points dont la contribution linertie est la plus importante
peuvent dterminer le facteur : en ACP (11.2.2.1 et 1.9.2), en AFC (11.3.2) ;
contribution des modalits dune variable qualitative : en ACM (4.3.6 et 11.4.3),
en AFM (8.6.2 et 11.5.4) ; contribution dun groupe de variables (7.1.3, 8.3.2
et 9.2.2.2) ; contribution dun sous-tableau (10.4.3) ; on parle quelquefois, abusivement, de la contribution dun lment supplmentaire en lui appliquant le
mme rapport dinertie ; en AFM, contribution dune composante principale
dun groupe (8.3.3 et 9.2.4) ; contribution dun facteur linertie dun nuage =
quotient entre linertie de ce facteur et linertie du nuage = qualit de reprsentation du nuage sur laxe (1.9) = pourcentage dinertie extrait par laxe.
corrlation = coefficient de corrlation linaire. Dfinition (1.1) ; limite dinterprtation (4.5.1) ; reprsentation des corrlations par des cosinus (1.4 et 12.2.4) ;
en ACP norme, les coordonnes des projections des variables sur les axes sont
gales leur corrlation avec les composantes principales (1.6) ; coefficient de
corrlation multiple (8.3.4.2) ; rapport de corrlation (4.3.6).
dimension, dimensionalit : la dimension dun espace est le nombre de vecteurs
orthogonaux 2 2 que peut contenir cet espace ; la dimension ou dimensionalit dun nuage est la plus petite dimension dun espace dans lequel on peut
reprsenter ce nuage ; si lon souhaite tenir compte du fait que linertie dun
nuage est trs ingalement rpartie selon les dimensions, on peut calculer un
indicateur de dimensionalit (8.4.2).

312

Index systmatique

disjonctif cf.TDC.
distance euclidienne (12.3) ; distance entre individus en ACP (1.1) ; entre individus et
entre modalits en ACM (4.3.2 et 4.3.3) ; distance du khi2 (x2 ) en AFC (3.4) ;
entre groupes de variables en AFM (7.1.7 et 8.4.4) ; tableau de distances (5.5.5
et 8.5.5).
dualit en analyse factorielle = relations entre ltude des lignes et des colonnes dun
mme tableau ; en ACP (1.7), en AFC (3.7), en gnral (5.4) ; le schma de
dualit (5.4.2) synthtise lensemble de ces relations.
effet Guttman en AFC (10.3.2.1), en ACM (11.6.7).
effet taille en ACP (dfinition en 1.6 et 9.6.6 ; exemple en 2.2).
quivalence distributionnelle : proprit de la distance du khi2 (x2 ) (3.4).
euclidien : espace euclidien, distance euclidienne (12.3).
facteur = ensemble des coordonnes des projections dun nuage de points sur un axe
dinertie de ce nuage ; cf. axe, cf. inertie ; relations entre les facteurs dfinis
sur les lignes et les facteurs dfinis sur les colonnes, cf. relations de transition ;
interprtation des facteurs : voir les exemples comments aux chapitres 2, 7
et 10 et le chapitre 11 ; facteurs communs ( plusieurs groupes de variables
en AFM) (7.1.6 et 8.3.4) ; facteurs partiels en AFM = facteurs des analyses
spares des groupes de variables (proprits en 8.3.3 ; exemples en 7.1.8, 7.2.1
et 9.2.4).
Huygens : thorme ou principe de Huygens, cf. inertie (12.1).
illustratif cf. supplmentaire.
indpendance entre deux variables qualitatives (3.1) ; cf. modle et liaison.
indicatrice = variable indicatrice dune classe ou dune modalit (4.1.3) ; les
colonnes dun TDC sont des indicatrices (4.1.3) ; inertie des indicatrices en
ACM (4.3.3 et 8.6.1).
INDSCAL : modle pour lanalyse de plusieurs matrices de distances entre les
mmes individus (8.5).
inertie dun lment M de poids p par rapport un point O = produit du poids p par
le carr de la distance entre M et O ; inertie dun nuage de points = somme des
inerties des lments qui le composent ; quivalence entre inertie et variance
(12.1) ; en ACP norme, linertie des nuages est gale au nombre de variables
(1.7.1) ; en AFC, elle est proportionnelle au khi2 (3.7.1) ; en ACM, elle est
gale au nombre moyen de modalits par variable diminu de 1 (4.3.3) ; en
analyse factorielle, linertie du nuage des lignes est gale linertie du nuage
des colonnes, dans lespace complet et le long de chaque axe factoriel : en ACP

Index systmatique

313

(1.7), en AFC (3.7.1), dmonstration gnrale (5.4) ; inertie dun lment sur un
axe = inertie de la projection de llment sur cet axe ; inertie dun axe ou dun
facteur = inertie du nuage projet sur laxe (cf. valeur propre) ; interprtation
de linertie dun axe : en AFC (3.7.3 et 11.3.1), en ACP (11.2.1), en ACM
(11.4.1) ; dcomposition de linertie sur des axes orthogonaux en AFC (3.7.3) ;
inertie inter et inertie intra (dcomposition de linertie suivant le principe de
Huygens) : principe (12.1), en ACM (4.3.6), en AFM (7.2.4), en AFC (10.4.2.1
et 10.4.2.2), en CAH (2.2.3 et 2.5.2) ; dcomposition de linertie point par
point (cf. contribution linertie) ; pourcentage dinertie extrait (cf. qualit
de reprsentation) ; axe dinertie ou axe factoriel (cf. axe).
inter et intra cf. inertie, Huygens, rapport de corrlation.
inversion en CAH (2.3.4).
khi2 = x2 : distance en AFC (3.4) ; statistique ou indice du khi2 (3.7.1) ; lAFC
dcompose le khi2 (11.3.1).
liaison entre deux variables numriques (1.1 ; cf. corrlation) ; entre deux variables
qualitatives (3.1), cf. khi2 ; entre une variable numrique et une variable qualitative (4.3.6) ; entre une variable numrique et un groupe de variables (8.3.4.2
et 8.3.4.3) ; entre deux groupes de variables (8.4.3 ; exemples en 9.2.1) ; lACP
est une tude des liaisons linaires entre plusieurs variables numriques (5.3.1),
lAFC une tude de la liaison entre deux variables qualitatives, lACM une
tude des liaisons entre plusieurs variables qualitatives. Pour trois variables
qualitatives, voir chapitre 10. LAFM est une tude des liaisons entre plusieurs
groupes de variables numriques et (ou) qualitatives.
manquante : donnes manquantes, rponses manquantes en ACM (6.3 et 8.6.2.3).
Dunod La photocopie non autorise est un dlit

marge dun tableau binaire (3.1) ; marges binaires dun tableau ternaire (10.1.1).
modalit dune variable qualitative (3.1 et 4.1.1) ; relation entre classe, modalit et
indicatrice (4.1.1 et 4.2.3).
modle : modle correspondant lhypothse dindpendance (3.1) ; lAFC est une
analyse de lcart entre un tableau de donnes et ce modle ; elle se gnralise
dautres modles (10.5.2) ; le modle de lanalyse intra correspond lhypothse
dindpendance conditionnelle (10.5.3) ; modle de leffet Guttman (10.3.2.1) ;
modle INDSCAL (8.5).
nuage de points = ensemble de points munis de poids dans un espace euclidien ; on
tudie un nuage dindividus en ACP (1.3), en ACM (4.3.2) et en AFM (8.2),
un nuage de variables en ACP (1.4) et en AFM (8.3), un nuage de modalits
en ACM (4.3.3) et en AFM (8.6.2.2), de profils-lignes et de profils-colonnes en

314

Index systmatique

AFC (3.5), de groupes de variables en AFM (8.4 ; exemples en 7.1.7 et 9.1.3.1) ;


cas gnral (5.2).
partition associe une variable qualitative (4.1.1).
poids : poids dun individu en ACP (1.1) et en ACM (4.3.2) : dans ces analyses, il
est gnralement constant mais des poids quelconques peuvent tre introduits
(5.3.1) ; poids dune variable en ACP (1.1 et 4.5.1) ; en AFM, on affecte chaque
variable un poids gal linverse de la premire valeur propre de lanalyse
spare de son groupe (7.1.3) ; en AFC, le poids des lignes et des colonnes est
proportionnel leur effectif marginal (3.5.1) ; en ACM, le poids dune modalit
est proportionnel son effectif (4.3.3) ; relation entre poids et mtrique (5.2.7).
produit scalaire voir 12.3 ; matrice des produits scalaires entre individus (5.4.5 et
8.4.1).
profil-ligne et profil-colonne dun tableau de frquence (3.3).
proximit cf. similarit.
qualit de reprsentation dun lment (1.9) par un axe (resp. sous-espace) = quotient de linertie de llment projet sur laxe (resp. sous-espace) par linertie
de llment dans lespace (ou inertie totale) = carr du cosinus de langle entre
les deux vecteurs joignant lorigine au point et sa projection ; dun nuage
(1.9) ; dun sous-nuage en AFC (10.4.4) ; dune variable qualitative en ACM
(4.3.6) ; dun groupe de variables en AFM (9.2.2.3) ; dun sous-nuage en AFM
(9.2.3).
reconstitution des donnes : la formule de reconstitution des donnes permet de
retrouver le tableau de donnes partir des facteurs et de leur inertie ; en AFC
(3.7.4), dans leffet Guttman (10.3.2.1), dmonstration gnrale (5.6).
rduit : variable rduite = variable centre-rduite = variable centre de variance
gale 1 ; rduire une variable = diviser une variable centre par son cart-type ;
le vecteur reprsentant une variable rduite a pour longueur 1 (12.2.3) ; en ACP,
rduire les variables quilibre leur influence sur les distances entre individus
(1.2), rend gale 1 linertie de la projection du nuage dindividus sur les axes
de la base canonique de R K ; en ACP, si les variables ne sont pas rduites, cest
la matrice des covariances qui est diagonalise et non la matrice des corrlations
(5.3.1).
reprsentation simultane ou reprsentation superpose : des lignes et des colonnes
dun tableau (cf. dualit), en ACP (1.7.4 et 1.7.5), en AFC (3.7.2.2) ; des
individus caractriss par diffrents groupes de variables en AFM : illustration
(7.1.5 et 7.2.4) et principe (8.2.5).

Index systmatique

315

R K , R I , etc. = espaces euclidiens de dimension K ,I , etc. dans lesquels sont situs


les nuages de points ; voir 12.1 (nuages dindividus) et 12.2 (nuages de variables
numriques).
similarit cf. tableau de similarits.
supplmentaire : un lment (individu, variable ou groupe) supplmentaire ou illustratif ou "de poids nul" est projet sur les axes dinertie dun nuage sans tre
intervenu dans le calcul de ces axes ; la technique des lments supplmentaires
est essentielle en analyse factorielle ; en ACP, dfinition (1.5 et 1.6) et interprtation des individus et des variables supplmentaires (11.2.2.3 et 11.2.2.5) ;
en AFC, dfinition et calcul des projections (3.8) des lignes ou colonnes supplmentaires, application (10.3, 10.3.3 et 10.4.1) ; en ACM, discussion sur
lintroduction des variables et des modalits supplmentaires (6.2), application (6.4.1.3 et 6.5.2) ; calcul dans le cas gnral (5.5.3) ; en AFM, groupe de
variables supplmentaire (8.7.2 et 9.1.3.2).
tableau de contingence ou de frquence (3.1), de frquence ternaire (10.1), disjonctif
complet (4.1.3), disjonctif incomplet (6.3.1 et 6.3.2), structur en sous-tableaux
(8.1 et 10.4.1), de variables numriques ou quantitatives (1.1), de variables
qualitatives (4.1), mixte (8.6.2), de Burt (4.1.5), tableau de distances ou de
similarits (5.4.5 et 8.5.5) ; tableau brut = tableau non transform (par centrage,
rduction, codage, etc.).
TDC) = Tableau Disjonctif Complet (4.1.3).

Dunod La photocopie non autorise est un dlit

transition : relations ou formules de transition = relations entre les facteurs sur les
lignes et les facteurs sur les colonnes ; en ACP (1.7) ; en AFC = relations barycentriques (3.7.2) ; en ACM (4.3.4) ; en analyse intra (10.5.4) ; dmonstration
gnrale (5.4).
valeur propre (cf. inertie) : en analyse factorielle, on appelle souvent valeur propre
linertie dun axe (ou dun facteur) cause de la proprit qui sert les calculer (5.2.6) ; histogramme ou diagramme des valeurs propres = reprsentation
graphique de la dcroissance des inerties de la suite des facteurs ; interprtation
(11.2.1.1).
valeur-test ; indicateur de caractrisation dune classe dindividus (2.4.2).
variable v. continue = v. numrique = v. quantitative (1.1) ; v. qualitative = v. nominale
(4.1.1) ; v. indicatrice (cf. modalit) ; v. illustrative = v. supplmentaire) ; v.
canonique (8.4.3.1).
Ward ; algorithme de CAH (2.3).

Bibliographie

[1] BENZECRI J.-P. et coll. (1973) Lanalyse des donnes. Tome 1 : La taxinomie.
Tome2 : Lanalyse des correspondances. Dunod.
[2] BENZECRI J.-P. et F. (1980) Pratique de lanalyse des donnes. Tome 1 : analyse
des correspondances, expos lmentaire. Dunod.
[3] BENZECRI J.-P, BASTIN Ch., BOURGARIT Ch., CAZES P. (1980) Pratique de
lanalyse des donnes. Tome 2 : Abrg thorique, tude de cas modles. Dunod.
[4] BENZECRI J.-P. et coll. (1984) Pratique de lanalyse des donnes. Tome 3 :
Linguistique et Lexicologie. Dunod.
[5] BENZECRI J.-P. (1972) La place de la priori. in Encyclopdia Universalis.

Dunod La photocopie non autorise est un dlit

[6] BENZECRI J.-P.et coll. (1984) Pratique de lanalyse des donnes en conomie.
Dunod.
[7] BOUROCHE J.-M. et SAPORTA G. (1980) Lanalyse des donnes. PUF Collection Que Sais-je ?
[8] CAILLEZ F. et PAGES J.-P. (1976) Introduction lanalyse des donnes. Smash.
[9] CEHESSAT R. (1981) Exercices comments de statistique et dinformatique
appliques. 2 dition. Dunod.
[10] GOVAERT G. (1989) Classification automatique des donnes. Dunod.
[11] ESCOFIER B. (2003) Analyse des correspondances. Presses Universitaires de
Rennes.
[12] ESCOFIER B. et PAGES J. (1997) Initiation aux traitements statistiques :
mthodes, mthodologie. Presses Universitaires de Rennes.
[13] FENELON J.-P. (1982) Quest-ce que lanalyse des donnes ? Lefonen.

318

Bibliographie

[14] GERI (1996) Analyse des donnes volutives. Technip.


[15] GOVAERT G. (2003) Analyse des donnes. Herms-Lavoisier.
[16] GRANGE D. et LEBART L. (1993) Traitements statistiques des enqutes.
Dunod.
[17] HUSSON F. et PAGES J. (2005) Statistiques gnrales pour utilisateurs. 1
Exercices corrigs. Presses Universitaires de Rennes.
[18] JAMBU M. (1978) Classification automatique pour lanalyse des donnes.
tome1 : Mthodes et algorithmes. Dunod.
[19] JAMBU M. et LEBEAUX M.O. (1978) Classification automatique pour lanalyse des donnes. tome 2 : Logiciels. Dunod.
[20] JAMBU M. (1989) Exploration informatique et statistique des donnes. Dunod.
[21] LEBART L., MORINEAU A., FENELON J.-P. (1979) Traitement des donnes
statistiques. Dunod.
[22] LEBART L., MORINEAU A., PIRON M. (1998) Statistique exploratoire multidimensionnelle. Dunod.
[23] LEBART L. et SALEM A. (1994) Statistique textuelle. Dunod.
[24] MOREAU J., DOUDIN P.-A., CAZES P. (2000) LAnalyse de correspondances
et techniques connexes. Spinger.
[25] PAGES J. (2005) Statistiques gnrales pour utilisateurs. 1 - Mthodologie.
Presses Universitaires de Rennes.
[26] SAPORTA G. (1989) Probabilits, analyse des donnes et statistique. Technip.
[27] SCHIFFMAN S., REYNOLDS M., YOUNG F. (1981) Introduction to multidimensional scaling. New-york Academic Press.
[28] TENENHAUS M. (2007) Statistique. Dunod.
[29] VOLLE M. (1985) Analyse des donnes. Economica.

LOGICIEL
Toutes les mthodes dcrites dans ce livre sont intgres dans FactoMineR, logiciel
libre (en R) danalyse des donnes. FactoMineR est dvelopp par le laboratoire de
Mathmatiques appliques dAgroCampus.

sciences sup

Brigitte Escofier
Jrme Pags

4e dition

Analyses factorielles
simples et multiples
Objectifs, mthodes et interprtation
Cet ouvrage est destin aux tudiants en Masters de mathmatiques
appliques, dconomie ou dconomtrie, ainsi quaux lves
ingnieurs. Il aborde les mthodes danalyse des donnes qui ont
dmontr leur efficacit dans ltude des grandes masses complexes
dinformations. Ces mthodes sont maintenant appliques dans tous
les domaines o lon accumule dimportants fichiers de donnes,
et sont largement utilises hors de leurs champs traditionnels.
Pour cette quatrime dition, le texte a t rvis et augment
notamment sur deux points qui correspondent une demande
croissante des utilisateurs :
une prsentation de lanalyse factorielle sur donnes mixtes
(AFDM);
une prsentation de lAnalyse Factorielle Multiple Hirarchique
(AFMH), prolongement naturel de lAFM.
Le cours est illustr par de nombreuses tudes de cas.

Brigitte Escofier
a t professeur
lUniversit de Rennes
et lIUT de Vannes.
Elle tait lune des
fondatrices de lcole
franaise danalyse
des donnes.

Jrme Pags
est ingnieur
agronome, professeur
lAgrocampus de Rennes.

mathmatiques

physique

chimie

sciences de lingnieur

informatique

sciences de la vie

sciences de la terre

licence

master

doctorat

1 2 3 4 5 6 7 8

ISBN 978-2-10-053809-6

www.dunod.com

Vous aimerez peut-être aussi