Vous êtes sur la page 1sur 13

INTRODUCTION LANALYSE FACTORIELLE DES CORRESPONDANCES

Dominique LAFFLY Matre de Confrences, Universit de Pau UMR 5603 du CNRS et Universit de Pau

Laboratoire Socit Environnement Territoire Domaine Universitaire, IRSAM, 64000 PAU Tl : 05 59 92 31 23 Fax : 05 59 80 83 39 Mail : dominique.laffly@univ-pau.fr

Lanalyse factorielle des correspondances vise rassembler en un nombre rduit de dimensions la plus grande partie de linformation initiale en sattachant non pas aux valeurs absolues mais aux correspondances entre les variables, cest--dire aux valeurs relatives. Cette rduction est dautant plus utile que le nombre de dimensions initial est lev. La notion de rduction est commune toutes les techniques factorielles cest--dire o lon extrait des facteurs lAFC offre la particularit (contrairement aux ACP) de fournir un espace de reprsentation commun aux variables et aux individus. Pour cela lAFC raisonne partir de tableau rduit ou de frquences. Prenons comme exemple la matrice de contingence suivante :
J AF AH V 69 172 133 27 41 84 118 11 18 127 157 43 128 383 408 81 Mains 401 254 rduction fi,j 345 1000 J 0.069 0.041 0.018 0.128 AF 0.172 0.084 0.127 0.383 AH 0.133 0.118 0.157 0.408 V 0.027 0.011 0.043 0.081 Mains 0.401 0.254 0.345 1

Ch Ja Cl Pieds

= ki,j/k..

Ch Ja Cl Pieds

O :

J=jeunes ; AF=adulte femme ; AH=adulte homme ; V=vieux ; Ch=chansons ; Ja=jazz ; Cl=classique

fi,j frquence de la case i, j ; ki,j valeur brute de la case i, j ; k.. somme de la matrice initiale (1000).

Supposons que lon dsire observer la valeur relative des rponses par rapport aux colonnes, cest--dire comment se ventilent les choix des jeunes selon le type de musique, par exemple. Pour ce on transforme le tableau rduit en pondrant chaque case par les pieds :
J 0.539 0.32 0.14 1 AF 0.449 0.219 0.331 1 AH 0.325 0.289 0.384 1 V 0.333 0.135 0.53 1 Mains 1.646 0.963 1.385 4

Ch Ja Cl Pieds

On pourrait ds lors en faire une reprsentation graphique dans un espace trois dimensions (classique, jazz et chanson). Il est mme possible dassocier tous les points un cercle dont la surface est proportionnelle la valeur des mains (figure A8).

Classique

1 Vieux adultes hommes

adultes femmes jeunes 1 A Chanson B Jazz 1

Figure A8 : Projection des variables selon les individus

Tous les points se situent dans le plan dfini par le triangle de coordonnes 1, 1, 1. Lorsque cette condition est vrifie on se trouve dans le cas dune reprsentation duale. Supposons dsormais que lon dsire observer la valeur relative des rponses par rapport aux lignes, cest--dire comment se ventilent les types de musique selon lge et le sexe des individus. Pour ce on transforme le tableau rduit en pondrant chaque case par les mains :

Ch Ja. Cl Pieds

J 0.172 0.161 0.052 0.385

AF 0.429 0.33 0.368 1.127

AH 0.331 0.464 0.455 1.25

V 0.067 0.043 0.124 0.234

Mains 1 1 1 3

Cela revient considrer un nuage de trois points (classique, jazz et chanson) dans un espace quatre dimensions (jeunes, adultes femmes, adultes hommes et vieux). Comme il ny a que trois points ils sont forcment dans un mme plan. En calant ce dernier avec le plan prcdent de manire faire concider les axes on obtiendrait peu prs la mme reprsentation, en tous cas lorigine des axes serait la mme. Les trois points Cl, Ja et Ch ne se superposeraient pas A, B et C mais ils saligneraient sur les mmes directions une chelle diffrente. On aurait le choix alors soit de reprsenter J, AF, AM et V lintrieur de A, B et C soit de faire linverse puisque les origines concident. LAFC permet de rsoudre le problme dchelle et dobtenir le mme reprsentation. Pour cela on introduit une pondration. LAFC consiste, dans lune des analyses, pondrer les pieds par la racine carre des mains, et dans lautre analyse, de pondrer les mains par la racine carre de pieds. Dans la premire analyse fi,j/f.j devient fi,j/f.j * (fi.), dans la deuxime analyse fi,j/fi. devient
fi,j/fi.*(f.j) avec : SQRT pour racine carre, fi,j frquence de la case i, j ; f.j somme marginale

en colonnes (pieds) et fi. somme marginale en lignes (mains). Dans ce qui suit la notation f.. renvoie la somme de toutes les frquences. Soit, pour la premire analyse, la matrice suivante :
J Ch 0.85 Ja. 0.63 Cl 0.24 AF 0.709 0.435 0.564 AH 0.514 0.573 0.655 V 0.526 0.269 0.9

La premire consquence de cette pondration est une dformation du triangle ABC initial, les trois sommets ne sont plus situs la mme distance de lorigine mais des distances diffrentes dpendantes de la pondration. De plus, la perpendiculaire abaisse sur le triangle de lorigine 0 se trouve au centre de gravit G des quatre points J, AF, AM et V. Donc, laxe OG est un axe dinertie du nuage (axe trivial). Enfin, les moments dinertie des deux nuages issus des deux analyses sont gaux entre eux, leur valeur commune nest autre que le lien ou information mutuelle entre deux caractres. Contrairement au Chi2 de Pearson, le lien exprime la liaison entre deux variables indpendamment du nombre dindividus de la population. Le lien est videmment nul pour les tableaux de distributions thoriques. Le lien

est le rapport de la valeur du Chi2 par la population. Il est plus commode de procder au calcul du lien sur des tableaux rduits, la formule devient alors :
Lien =
i =1 j =1 n m

(f

i, j

f ) f

Le lien volue de 0 (indpendance totale) 1 (dpendance totale) alors que le Chi2 varie rciproquement de 0 n (nombre dindividus dans la population). Le calcul du lien offre une particularit importante pour lAFC. Dautre part le calcul du lien peut se simplifier : Sachant que : f.j = 1 et fi. = 1

f.. = 1 fi,j = 1
On a alors :
Lien =
i =1 j =1 n m

(f )
i, j

Nous avons dit plus haut quil existait une signification forte entre linertie du nuage de points de lAFC et le lien. En effet, le moment dinertie dun point de masse m et coordonnes x, y et
z par rapport au point O origine est gal m*(x2+y2+z2). La coordonne dun point tant ici de fi,j/f.j * (fi.) son carr devient fi,j2/f.j2*fi. et en le multipliant ensuite par sa masse qui est f.j on

obtient fi,j2/f.jfi.. Cette expression est parfaitement symtrique par rapport aux sommes marginales et on obtient le mme rsultat pour les deux analyses lorsque lon somme tous les calculs. Cette somme (XX) nest autre que le lien ou le premier terme est le moment dinertie du nuage par rapport O et le second terme -1 le transfert de ce moment au centre de gravit du nuage. Du fait que f.j = 1 et fi. = 1 on se rend compte que : - la masse de chaque nuage est gale 1 ; - les coordonnes du centre de gravit G du nuage sont gales (fi.) dans une analyse et (f.j) dans lautre ; - la distance OG est gale 1 dans les deux analyses.

On peut donc calculer directement le moment dinertie de chaque nuage par rapport son centre dinertie soit : [(fi,j)- (f..)]2/(f..) (b). Les deux expressions (a) et (b) conduisent un

rsultat identique, la seconde prsente lavantage de faire le calcul case par case. La valeur de chaque case ntant autre ici que la contribution au lien. Cette identit des moments dinertie lmentaires avec les composantes du lien est une caractristique essentielle de lAFC. Cest pourquoi on dit souvent que lAFC suit une mtrique du Chi2du fait de la relation troite Chi2 = lien * n.

Nous le verrons plus loin, du fait que lanalyse est la mme pour les deux transformations du nuage on dit que les calculs sont duaux lun de lautre. On peut donc nen choisir quun, le plus facile cest--dire en formant la matrice V de dimensions (k, k) plutt que la matrice W de dimensions (n, n) en supposant toujours (n k). Si la matrice est haute on aura V=XX et si la matrice est basse V=XX (o X est la matrice transpose de X). On dresse alors les deux matrices suivantes :
J 0.218 0.132 -0.348 AF 0.076 -0.069 -0.023 AH -0.118 0.070 0.068 V -0.107 -0.235 0.316 J Ch 0.078 Ja 0.047 Cl -0.124 AF 0.047 -0.043 -0.014 AH -0.076 0.045 0.043 V -0.03 -0.067 0.09

Ch Ja Cl

terme courant (fi,j (f..))/ f.j*(fi.)

terme courant (fi,j (f..))/ (f..)

La premire matrice est celle des coordonnes selon la pondration rappele plus haut. Elle servira plus tard calculer les coordonnes des points sur les axes factoriels. La seconde matrice sera multiplie par sa transpose afin dobtenir la matrice dinertie (ou de variancecovariance) qui sera diagonalise pour obtenir les valeurs propres du nuage de points. Soit la matrice suivante :
Ch 0.0149 0.000235 -0.0164 Ja 0.000235 0.0105 -0.0093 Cl -0.0164 -0.0093 0.0257

Ch Ja Cl

Cest une matrice symtrique dont la trace (somme des termes de la diagonale, cest galement la somme de tous les lments de la matrice V levs au carr) est gale 0.0511. Dans une telle matrice les lments diagonaux sont des lments de variance (le carr dlments de V) les autres lments sont dits de covariance (produit crois de termes de V). Une telle matrice fait correspondre un point Y de coordonnes y1, y2 et y3 un point X de coordonnes x1, x2 et x3 selon la relation suivante :

y1 = 0.0149x1 + 0.000235x2 - 0.0164x3 y2 = 0.000235x1 + 0.0105x2 0.0093x3 y3 = -0.0164x1 0.0093x2 + 0.0257 x3

Y Y' C

C'

B' X'

B A A' X

Figure A9: Transformation par la matrice dinertie

Cest--dire que la matrice transforme la figure dessine par les points de X en une autre figure dessine par les points de Y. Si on avait un cercle (deux dimensions) la transformation donnerait une ellipse. Du fait de cette transformation la matrice dinertie est considre comme un ellipsode dinertie. Cette dernire peut tre assimile la projection du nuage de points qui nous intresse (figure A9). Les directions de plus grand allongement de lellipse reprsentent les tendances dominantes, il est intressant de les dterminer, ce sont les axes de symtrie ou axes principaux. Nous empruntons la mcanique la notion dinertie. Il y a identit absolue entre moyenne arithmtique (statistique) et centre de gravit (mcanique) variables de position ainsi quentre variance (statistique) et inertie (mcanique). En mcanique la notion dinertie joue sur les corps tournants. Un corps a dautant plus dinertie autour dun axe quil faut lui appliquer dnergie pour le mettre en rotation autour dun axe. De plus, pour la mme quantit dnergie, en faisant passer laxe de rotation sur lensemble de la surface du corps (imaginons un patatode en deux dimensions) la vitesse de rotation passera par un maximum et un minimum. Les positions respectives de laxe correspondront au moment de plus petite et de plus grande inertie, ce seront galement les positions des axes dinertie ou axes principaux.

Ce qui intervient dans linertie cest la masse et le carr de la distance au centre de gravit : I
= MD2. En remplaant la masse par la frquence et la distance par cart linertie devient la

variance lmentaire. De plus, tout corps solide aussi biscornu soit-il se comporte de faon identique un ellipsode dinertie trois axes de symtrie : - grand axe : inertie minimale (tous les points sont proches) ; - petit axe : inertie maximale (tous les points sont loigns) ; - axe moyen : situation intermdiaire.

d1 et d2 sont des projections parallles une axe (rgression) d3 est une projection perpendiculaire l'axe recherch (AFC)

d3 d1 d2 d1 d3 d2

O X

d3 d2

d1

Figure 10 : Diffrentes mthodes de projection

propos des diffrents axes ont insiste sur la distance des points ceux-ci on pose donc le problme de la projection des points sur un axe. Le principe consiste trouver les situations pour lesquelles la somme des distances au carr projete est soit minimale, soit maximale soit intermdiaire. Il existe diffrentes projections (figure A10), en analyse des donnes nous utilisons une projection perpendiculaire laxe, contrairement aux mthodes de rgression linaire, selon une mthode appele ajustement par les moindres carrs. La particularit de lAFC repose sur la distance utilise, celle-ci nest pas euclidienne mais celle du Chi2 comme nous le verrons plus bas.

Trouver les axes principaux dune matrice revient diagonaliser la matrice, elle sera alors de la forme :
Ch 1 0 0 Ja 0 2 0 Cl 0 0 3

Ch Ja Cl

Avec : 1 + 2 + 3 = trace = 0.0511

1, 2 et 3 les valeurs propres du nuage

Y Y' B B'' B'''' O

B'

B''' B'''''

X'

Figure A11 : Diagonalisation dune matrice

La trace est inchange donc la diagonale ne change pas la variance mais on supprime les termes de covariances. La diagonalisation dune matrice est une opration relativement difficile mettre en uvre. Il existe dailleurs diffrentes mthodes dailleurs. Nous prsenterons celles dite de la drage qui a le grand avantage de pouvoir se comprendre facilement graphiquement (figure A11). Avec cette mthode on cherche tendre asymptotiquement vers la direction des axes dinertie. partir dun point quelconque (ici B) la premire transformation donne le point B. On raccourcit OB la dimension du rayon du cercle, on trouve le point B qui est dj plus proche du grand axe. Ce point B subit une nouvelle transformation par la matrice dinertie ce qui donne B. Ce dernier est rduit au

rayon du cercle en B et ainsi de suite jusqu ce que la rduction se situe sur laxe dinertie. La valeur 1 correspond au cumul des carrs des distances des transformations des points. Notons que ce raisonnement stend facilement n dimensions.

La diagonalisation de la matrice issue de la seconde analyse donnerait les mmes valeurs propres cest ce quon appel alors un espace dual. Concrtement cela se traduit par la caractristique de double reprsentativit propre lAFC cest--dire que la projection des individus ou des caractres se fait dans un espace identique, les proximits entre points auront donc une forte signification thmatique comme nous le verrons plus loin. Notons enfin propos de linertie que : inertie totale = inertie explique par laxe + inertie autour de laxe et que les valeurs propres de la matrice dinertie sont les inerties expliques, leur somme est gale la trace elle mme gale linertie totale.

Dans notre exemple la diagonalisation de la matrice nous donne :


Ch 0.0396 0 0 Ja 0 0.0115 0 Cl 0 0 0

Ch Ja Cl

La troisime valeur propre est gale 0 parce que les quatre points J, AM, AF et V sont dans un mme plan. Laxe dinertie de ce dernier, nous lavons dit plus haut, correspond la droite perpendiculaire ce plan. Sa valeur est de 1, il est sans intrt pour lanalyse puisquil nexplique aucune part de la variance, on lappel axe trivial. En revanche, on retrouve bien

1 + 2 = 0.0511 = trace = lien.


Le premier axe explique 0.0396/0.0511 = 77.5% de la variance (ou de linertie) et le second 0.0115/0.0511 = 22.5%. Outre ce calcul, les valeurs propres permettent de dterminer les coordonnes des points dans lespace factoriel. Il sagit dune projection qui sobtient par un produit scalaire pour chaque point et pour chaque axe :

JeunesAxe1 = (0.218*0.0396) + (0.132*0) + (-0.348*0) = 0.0086328 JeunesAxe2 = (0.218*0) + (0.132*0.0115) + (-0.348*0) = 0.001518

Dun point de vue matricielle cela revient multiplier la transpose de la matrice de coordonnes par la matrice diagonalise :

J AF AH V

Ch 0.218 0.076 -0.118 -0.107

Ja 0.132 -0.069 0.070 -0.235

Cl -0.348 -0.023 * 0.068 0.316

Ch Ja Cl

Ch 0.0396 0 0

Ja 0 0.0115 0

Cl 0 0 = 0

J AF AM V

Axe1 0.0086328 0.0030096 -0.0046728 -0.0042372

Axe2 0.001518 -0.0007935 0.00805 -0.0027025

La premire analyse est alors termine. Nous lavons dit plus haut nous nous trouvons dans un cas de relations duales, il est inutile de faire la seconde analyse, les coordonnes des 3 points musique se dduisent immdiatement de celles des quatre points population par les relations :
i1axe1 = (1/Ki1.* 1)*(K1,1V1axe1 + K1,2V2axe1 K1,nVnaxe1) i1axe2 = (1/Ki1.* 2)*(K1,1V1axe2 + K1,2V2axe2 K1,nVnaxe2) i1axek = (1/Ki1.* k)*(K1,1V1axek + K1,2V2axek K1,nVnaxek) ipaxe1 = (1/Kip.* 1)*(Kp,1V1axe1 + Kp,2V2axe1 Kp,nVnaxe1) ipaxe2 = (1/Kip.* 2)*(Kp,1V1axe2 + Kp,2V2axe2 Kp,nVnaxe2) ipaxek = (1/Kip.* k)*(Kp,1V1axek + Kp,2V2axek Kp,nVnaxek)

o :

i1, i2 ip sont les p individus de la srie brute de dpart ; axe1, axe2 axek sont les k axes dinertie ;

1, 2 k sont k valeurs propres ;


Ki,j sont les donnes brutes de la sries ; Vnaxek sont les coordonnes des n variables sur les k axes dinertie.

Par exemple cela donnerait pour le point Ch sur laxe 1 :


Chaxe1 = 1/(401*0.0396)*((69*0.0086328)+(172*0.0030096)-(133*0.0046728)-(27*0.0042372) Chaxe1 = 1/(101*0.19899)*(0.5956632+0.5176512-0.6214824-0.11449044) Chaxe1 = 0.049756219*(0.5956632+0.5176512-0.6214824-0.11449044) Chaxe1 = 0.018775089

En langage savant la formule ci-dessus snonce en disant qu une affinit de rapport 1/ prs, les coordonnes des points du nuage dual sur un axe factoriel sont les coordonnes du barycentre du nuage direct, pondres par limportance relative de la rubrique duale dans chacun dentre eux .

Tous les calculs dtaills plus haut sont totalement transparents pour lutilisateur, de plus ils sont extrmement rapides sur les ordinateurs de la nouvelle gnration. Notons cependant que vue la prcision des rsultats il arrive que, selon le programme utilis, on observe des inversions de coordonnes. Autrement dit ce qui tait positif devient ngatif et inversement. Cela nest daucune importance pour la suite puisque les interprtations en matire dAFC repose sur les positions relatives des points les unes par rapport aux autres.

Graphiquement, les rsultats de lanalyse donneraient le dessin en haut gauche de la figure suivante. Le schma situ en bas droite de la figure met en avant une caractristique importante de lAFC, lquivalence distributionnelle. Imaginons que pour les besoins de ltude on ait besoin galement de distinguer le sexe des catgories vieux et jeunes on obtiendrait alors 6 classes de populations. Si les proportions entre JF et JM se trouvaient tre identique de celles des Jeunes lorigine les deux nouvelles catgories se trouveraient situs exactement au mme point dans lespace factoriel, celui des jeunes de la premire analyse. Cest une proprit importante car elle donne lAFC une grande indpendance par rapports aux nomenclatures en permettant sans difficult la runion de plusieurs classes dont le profil est identique ou voisin. Ce nest videmment pas souvent le cas alors, pourvu quun classe nait pas un poids trop lev par rapport lensemble, se dcomposition sopre en sous-classes dont les points reprsentatifs ont approximativement lancien point comme centre de gravit.

Remarquons dans cet exemple que la quantit totale dinformation a augmente en crant de nouvelles classes, elle est passe de 0.0511 0.058. Cest une consquence du thorme de Huygens : quand on dcompose une masse en deux sous masses, sans changer le centre de gravit, on ajoute linertie totale linertie propre de lhaltre ainsi cre. Une autre consquence sera que plus le nombre de classes est leve moins linertie des axes sera importante, ce qui ne veut pas dire quil npuise pas correctement linertie totale. Mieux vaut donc interprter les valeurs propres et leur taux de dcroissance dans ces cas l.

Avant de conclure cette prsentation de lAFC notons que dautres informations sont fournies par les calculs. On connat dj les valeurs propres, linertie des axes, la masse des variables et les coordonnes sur les axes. On calcule galement la contribution des points pour les diffrents axes ainsi que le cosinus de langle des points par rapport aux axes. La contribution (souvent exprime en pour mille) indique, comme son nom lindique, le rle jou par un point dans la dtermination de laxe. Cest particulirement utile pour linterprtation thmatique, cependant noublions jamais quun poids de forte masse sera attir par le centre de gravit du nuage sa contribution calcule sera rduite par cet effet et, inversement, un point de faible masse mais loign de G aura une contribution exagre. Ceci tient au calcul de linertie qui repose sur le produit de la masse par le carr de la distance au point G. Le cosinus de langle (qui varie entre 1 et +1) permet dinterprter la perspective quon ne visualise pas dans une reprsentation en deux dimensions. Lorsque le cosinus sera faible on peut considrer que le point est proche de laxe, quil joue donc beaucoup dans sa dfinition et, inversement, plus il sen loigne moins son rle sera prdominant dans linterprtation.

La figure A12 prsente graphiquement les rsultats de lAFC. Les points variables et individus sont projets en fonction de leurs coordonnes sur un graphe de type XY (deux dimensions) ou XYZ (trois dimensions). Gnralement on interprte des graphes 2D raliss partir des 3 premiers axes, ceux qui puisent majoritairement linertie. Avec 3 axes on dessine alors 3 plans 1/2, 1/3 et 2/3 partir desquels il faut tenter de reconstruire intellectuellement les trois dimensions du nuage tudis. Certains logiciels permettent une vue 3D interactive intressante pour visualiser la profondeur du nuage mais limite pour une interprtation dtaille.

Axe2 AM Jeunes Ja O Cl Ch AF Axe1

Vieux Axe2

Jeunes M

AM Ja O Axe1 Vieux M Ch AF Vieux F

Jeunes F

Cl

Figure A12 : Reprsentation graphique des rsultats de lAFC

Vous aimerez peut-être aussi