Académique Documents
Professionnel Documents
Culture Documents
Exercice 1
On a rassembl les rsultats de 15 enfants de 10 ans 6 subtests du WISC (scores 0 5). Les variables
observes sont : CUB (Cubes de Kohs), PUZ (Assemblage d'objets), CAL (Calcul mental), MEM (Mmoire
immdiate des chiffres), COM (Comprhension de phrases), VOC (Vocabulaire). Le protocole observ est le
suivant :
WISC CUB PUZ CAL MEM COM VOC
I1 5 5 4 0 1 1
I2 4 3 3 2 2 1
I3 2 1 2 3 2 2
I4 5 3 5 3 4 3
I5 4 4 3 2 3 2
I6 2 0 1 3 1 1
I7 3 3 4 2 4 4
I8 1 2 1 4 3 3
I9 0 1 0 3 1 0
I10 2 0 1 3 1 0
I11 1 2 1 1 0 1
I12 4 2 4 2 1 2
I13 3 2 3 3 2 3
I14 1 0 0 3 2 2
I15 2 1 1 2 3 2
On traite ces donnes par une analyse en composantes principales norme. Les principaux rsultats de
cette ACP sont indiqus ci-dessous :
Corrlations
CUB PUZ CAL MEM COM VOC
CUB 1,0000 0,7320 0,9207 -0,4491 0,3086 0,2735
PUZ 0,7320 1,0000 0,7510 -0,6143 0,2814 0,2850
CAL 0,9207 0,7510 1,0000 -0,3685 0,4077 0,4869
MEM -0,4491 -0,6143 -0,3685 1,0000 0,3032 0,2023
COM 0,3086 0,2814 0,4077 0,3032 1,0000 0,7819
VOC 0,2735 0,2850 0,4869 0,2023 0,7819 1,0000
I1
3
I11
2
I2
I12
1 I10 I9
I5 I6
0
I15I3
Fact. 2 : 30,62%
I13 I14
-1
I4 I7
-2 I8
-3
-4
-5 -4 -3 -2 -1 0 1 2 3 4 5
Active
Fact. 1 : 54,30%
1,0
0,5
PUZ
CUB
CAL
0,0
Fact. 2 : 30,62%
-0,5
VOC
COM MEM
-1,0
La somme des valeurs propres est gale 6. Dans le cas d'une ACP norme telle que celle qui est
effectue ici, cette somme est gale au nombre de variables. Cette valeur correspond galement la
variance du nuage des individus.
b) On choisit de n'tudier que les deux premires composantes principales. Justifier ce choix en analysant le
tableau des valeurs propres.
On peut choisir de ne s'intresser qu'aux valeurs propres dont la contribution la variance est suprieure
la moyenne. Ceci revient tudier les composantes principales correspondant des valeurs propres
suprieures 1. Or, seules les deux premires valeurs propres vrifient cette proprit sur l'exemple fourni.
Les corrlations les plus fortes sont celles correspondant aux coefficients de corrlation les plus proches de
1 ou -1. Ici, le coefficient de corrlation dont la valeur absolue est la plus proche de 1 est celui qui relie CUB
et CAL.
b) Comment s'organisent les signes "+" et les signes "-" dans le tableau des coefficients de corrlation.
Commenter.
La plupart des coefficients de corrlation sont positifs. Autrement dit, un bon rsultat un test est, en rgle
gnral, li de bons rsultats aux autres tests.On note toutefois une exception remarquable : la variable
MEM (mmoire immdiate des chiffres) est corrle ngativement 3 autres variables : CUB, PUZ et CAL.
Mais ce sont les seuls coefficients ngatifs du tableau.
Quel est l'individu le moins bien reprsent par le premier plan principal ? Quel est l'individu le mieux
reprsent ?
Les qualits de reprsentation des individus dans le premier plan factoriel sont obtenues en additionnant les
rsultats des deux colonnes "Cos2" du tableau relatif aux individus. Le sujet le mieux reprsent est I1, avec
une qualit de reprsentation de 0,9885, le plus mal reprsent est I15, avec une qualit de 0,2615.
Les individus envisags ici sont ceux dont la contribution est suprieure 6,67%. Ce sont les individus
suivants :
- +
I4 (16,01%) I9 (16,5%)
I1 (13,43%) I10 (9,66%)
I7 (11,2%) I14 (8,31%)
I5 (6,95%) I6 (7,3%)
Cet axe oppose les individus I4, I1, I7 et I5 d'une part aux individus I9, I10, I14 et I6 d'autre part.
Les sujets du premier groupe obtiennent des scores gnralement plus levs que ceux du 2 groupe,
particulirement sur les variables CUB, PUZ et CAL.
- +
I8 (17,65%) I1 (33,9%)
I7 (8,7%) I11 (15,06%)
I4 (7,73%)
Cet axe oppose les individus I8, I7 et I4 d'une part aux individus I1 et I11 d'autre part. On peut noter que
l'individu I1 explique lui seul plus du tiers de la variance de cet axe.
Les extrmits des vecteurs reprsentant les variables sont toutes trs proches du cercle des corrlations,
ce qui montre que les qualits de reprsentation des variables sont satisfaisantes. D'autre part la dernire
colonne du tableau des rsultats relatifs aux variables montre que la variable la plus mal reprsente est
MEM, avec une qualit qui atteint quand mme 0,816.
b) Quelles sont les variables qui sont corrles positivement avec le premier facteur principal ? Quelles sont
celles qui sont corrles ngativement ? Comment peut-on caractriser cet axe par rapport aux variables de
dpart ?
Les corrlations peuvent tre lues sur le dessin ou sur le tableau des saturations. Seule la variable MEM est
corrle positivement avec le premier axe, toutes les autres sont corrles ngativement. Ainsi, cet axe
oppose le rsultat au test MEM tous les autres tests.
c) Quelles sont les variables qui ont jou un rle dominant dans la formation du deuxime axe.
Les corrlations les plus fortes sont observes pour les variables MEM, COM et VOC. Ces variables sont
toutes trois corrles ngativement avec la variable CP2.
Exercice 2
Une entreprise veut choisir un nom pour un nouveau produit, qui doit paratre de qualit suprieure,
prestigieux, luxueux, convenant un public masculin, connaisseur, raffin, distingu, de niveau socio-
Orly Alezan Corsaire Directoire Ducat Fontenoy Icare Zodiaque Pavois Cocker Escale Hotesse Total
Vieillot 1 2 14 38 18 10 9 5 9 4 0 1 111
Nouveau-riche 20 9 1 11 10 9 1 1 20 9 7 12 110
Sobre-lgant 9 23 1 15 7 11 6 2 7 12 3 17 113
Cocasse 1 3 15 15 6 5 12 18 4 25 2 2 108
Rac 4 33 7 8 3 6 6 4 5 15 5 3 99
Mivre 3 9 1 7 7 5 12 9 6 9 6 13 87
Distingu 11 9 1 17 4 21 6 1 5 4 5 27 111
Vulgaire 4 4 32 2 6 0 9 7 3 10 10 7 94
Pour un homme 9 12 23 4 7 13 5 5 10 5 13 0 106
Pour une femme 9 3 9 8 4 2 6 8 1 6 23 33 112
Pour une 7 5 2 7 11 2 6 11 9 24 10 0 94
petite nature
Total 78 112 106 132 83 84 78 71 79 123 84 115 1145
On traite ce tableau par une mthode d'analyse des donnes multidimensionnelles. Les principaux rsultats
sont rassembls dans les tableaux et graphiques ci-dessous :
Frquences
Orly Alezan Corsaire Directoire Ducat Fontenoy Icare Zodiaque Pavois Cocker Escale Hotesse Total
Vieillot 0,09% 0,17% 1,22% 3,32% 1,57% 0,87% 0,79% 0,44% 0,79% 0,35% 0,00% 0,09% 9,69%
Nouveau-riche 1,75% 0,79% 0,09% 0,96% 0,87% 0,79% 0,09% 0,09% 1,75% 0,79% 0,61% 1,05% 9,61%
Sobre-lgant 0,79% 2,01% 0,09% 1,31% 0,61% 0,96% 0,52% 0,17% 0,61% 1,05% 0,26% 1,48% 9,87%
Cocasse 0,09% 0,26% 1,31% 1,31% 0,52% 0,44% 1,05% 1,57% 0,35% 2,18% 0,17% 0,17% 9,43%
Rac 0,35% 2,88% 0,61% 0,70% 0,26% 0,52% 0,52% 0,35% 0,44% 1,31% 0,44% 0,26% 8,65%
Mivre 0,26% 0,79% 0,09% 0,61% 0,61% 0,44% 1,05% 0,79% 0,52% 0,79% 0,52% 1,14% 7,60%
Distingu 0,96% 0,79% 0,09% 1,48% 0,35% 1,83% 0,52% 0,09% 0,44% 0,35% 0,44% 2,36% 9,69%
Vulgaire 0,35% 0,35% 2,79% 0,17% 0,52% 0,00% 0,79% 0,61% 0,26% 0,87% 0,87% 0,61% 8,21%
Pour un homme 0,79% 1,05% 2,01% 0,35% 0,61% 1,14% 0,44% 0,44% 0,87% 0,44% 1,14% 0,00% 9,26%
Pourune femme 0,79% 0,26% 0,79% 0,70% 0,35% 0,17% 0,52% 0,70% 0,09% 0,52% 2,01% 2,88% 9,78%
Pour une petite 0,61% 0,44% 0,17% 0,61% 0,96% 0,17% 0,52% 0,96% 0,79% 2,10% 0,87% 0,00% 8,21%
nature
Total 6,81% 9,78% 9,26% 11,53% 7,25% 7,34% 6,81% 6,20% 6,90% 10,74% 7,34% 10,04% 100 %
Frquences lignes
Orly Alezan Corsair Directoir Ducat Fonteno Icare Zodiaqu Pavois Cocker Escale Hotess Total
e e y e e
Vieillot 0,90% 1,80% 12,61% 34,23% 16,22% 9,01% 8,11% 4,50% 8,11% 3,60% 0,00% 0,90% 100
%
Nouveau- 18,18 8,18% 0,91% 10,00% 9,09% 8,18% 0,91% 0,91% 18,18% 8,18% 6,36% 10,91% 100
riche % %
Sobre-lgant 7,96% 20,35 0,88% 13,27% 6,19% 9,73% 5,31% 1,77% 6,19% 10,62 2,65% 15,04% 100
% % %
Cocasse 0,93% 2,78% 13,89% 13,89% 5,56% 4,63% 11,11% 16,67% 3,70% 23,15 1,85% 1,85% 100
% %
Rac 4,04% 33,33 7,07% 8,08% 3,03% 6,06% 6,06% 4,04% 5,05% 15,15 5,05% 3,03% 100
% % %
Mivre 3,45% 10,34 1,15% 8,05% 8,05% 5,75% 13,79% 10,34% 6,90% 10,34 6,90% 14,94% 100
% % %
Distingu 9,91% 8,11% 0,90% 15,32% 3,60% 18,92% 5,41% 0,90% 4,50% 3,60% 4,50% 24,32% 100
%
Vulgaire 4,26% 4,26% 34,04% 2,13% 6,38% 0,00% 9,57% 7,45% 3,19% 10,64 10,64% 7,45% 100
% %
Pour un homme 8,49% 11,32 21,70% 3,77% 6,60% 12,26% 4,72% 4,72% 9,43% 4,72% 12,26% 0,00% 100
% %
Pour une femme 8,04% 2,68% 8,04% 7,14% 3,57% 1,79% 5,36% 7,14% 0,89% 5,36% 20,54% 29,46% 100
%
Pour une 7,45% 5,32% 2,13% 7,45% 11,70% 2,13% 6,38% 11,70% 9,57% 25,53 10,64% 0,00% 100
1
Dans la version d'origine de cet exercice (Benzcri, 1980), le produit dont il est question est une cigarette, mais
est-il encore "politiquement correct" de btir un exercice sur ce thme ?
F.-G. Carpentier - 2006 Page 5
PSR83B - Introduction aux analyses multidimensionnelles 2005/2006
petite nature % %
Total 6,81% 9,78% 9,26% 11,53% 7,25% 7,34% 6,81% 6,20% 6,90% 10,74 7,34% 10,04% 100
% %
Frquences colonnes
Orly Alezan Corsaire Directoire Ducat Fontenoy Icare Zodiaque Pavois Cocker Escale Hotesse Total
Vieillot 1,28% 1,79% 13,21% 28,79% 21,69% 11,90% 11,54% 7,04% 11,39% 3,25% 0,00% 0,87% 9,69%
Nouveau-riche 25,64% 8,04% 0,94% 8,33% 12,05% 10,71% 1,28% 1,41% 25,32% 7,32% 8,33% 10,43% 9,61%
Sobre-lgant 11,54% 20,54% 0,94% 11,36% 8,43% 13,10% 7,69% 2,82% 8,86% 9,76% 3,57% 14,78% 9,87%
Cocasse 1,28% 2,68% 14,15% 11,36% 7,23% 5,95% 15,38% 25,35% 5,06% 20,33% 2,38% 1,74% 9,43%
Rac 5,13% 29,46% 6,60% 6,06% 3,61% 7,14% 7,69% 5,63% 6,33% 12,20% 5,95% 2,61% 8,65%
Mivre 3,85% 8,04% 0,94% 5,30% 8,43% 5,95% 15,38% 12,68% 7,59% 7,32% 7,14% 11,30% 7,60%
Distingu 14,10% 8,04% 0,94% 12,88% 4,82% 25,00% 7,69% 1,41% 6,33% 3,25% 5,95% 23,48% 9,69%
Vulgaire 5,13% 3,57% 30,19% 1,52% 7,23% 0,00% 11,54% 9,86% 3,80% 8,13% 11,90% 6,09% 8,21%
Pour un homme 11,54% 10,71% 21,70% 3,03% 8,43% 15,48% 6,41% 7,04% 12,66% 4,07% 15,48% 0,00% 9,26%
Pour une femme 11,54% 2,68% 8,49% 6,06% 4,82% 2,38% 7,69% 11,27% 1,27% 4,88% 27,38% 28,70% 9,78%
Pour une 8,97% 4,46% 1,89% 5,30% 13,25% 2,38% 7,69% 15,49% 11,39% 19,51% 11,90% 0,00% 8,21%
petite nature
Total 100% 100% 100% 100% 100% 100, 100% 100% 100% 100% 100% 100% 100%
Taux de liaison
Orly Alezan Corsaire Directoire Ducat Fontenoy Icare Zodiaque Pavois Cocker Escale Hotesse
Vieillot -0,868 -0,816 0,362 1,970 1,237 0,228 0,190 -0,274 0,175 -0,665 -1,000 -0,910
Nouveau-riche 1,669 -0,164 -0,902 -0,133 0,254 0,115 -0,867 -0,853 1,635 -0,238 -0,133 0,086
Sobre-lgant 0,169 1,081 -0,904 0,151 -0,145 0,327 -0,221 -0,715 -0,102 -0,011 -0,638 0,498
Cocasse -0,864 -0,716 0,500 0,205 -0,234 -0,369 0,631 1,688 -0,463 1,155 -0,748 -0,816
Rac -0,407 2,408 -0,236 -0,299 -0,582 -0,174 -0,110 -0,348 -0,268 0,410 -0,312 -0,698
Mivre -0,494 0,058 -0,876 -0,302 0,110 -0,217 1,025 0,668 0,000 -0,037 -0,060 0,488
Distingu 0,455 -0,171 -0,903 0,328 -0,503 1,579 -0,207 -0,855 -0,347 -0,665 -0,386 1,422
Vulgaire -0,375 -0,565 2,677 -0,815 -0,119 -1,000 0,405 0,201 -0,537 -0,010 0,450 -0,259
Pour un homme 0,246 0,157 1,344 -0,673 -0,089 0,672 -0,308 -0,239 0,367 -0,561 0,672 -1,000
Pour une femme 0,180 -0,726 -0,132 -0,380 -0,507 -0,757 -0,214 0,152 -0,871 -0,501 1,799 1,934
Pour une 0,093 -0,456 -0,770 -0,354 0,614 -0,710 -0,063 0,887 0,388 1,377 0,450 -1,000
petite nature
Valeurs propres
petite nature
Pourunefemme
0,8
Escale
Corsaire
0,4
-0,4 Directoire
Vieillot
-0,6
Dimension 2
-0,8
Coord.L.
-1,0 -0,8 -0,6 -0,4 -0,2 0,0 0,2 0,4 0,6 0,8 1,0
Coord.C.
Dimension 1; Valeur Propre : ,18208 (29,92 % d'Inertie)
1) Quelle est la mthode d'analyse utilise ici ? Pourquoi utilise-t-on cette mthode ?
La mthode utilise ici est une analyse factorielle des correspondances. Cette mthode permet d'tudier des
donnes prsentes sous forme de tableau de contingence.
2) a) Dans le tableau des frquences lignes, on lit 20,35% l'intersection de la ligne "sobre-lgant" et de la
colonne "alezan". Comment a t obtenue cette valeur ? Que signifie-t-elle ?
Les frquences lignes sont obtenues en divisant l'effectif d'une cellule par l'effectif de la ligne
correspondante. Ainsi, on a ici : 20,35% = 23/113.
Ce sont les profils colonnes qui doivent tre utiliss ici. Alors que le profil colonne moyen est relativement
uniforme (frquences de 7,60% 9,87%), le profil de la modalit "Corsaire" fait apparatre des frquences
trs faibles (4 frquences moins de 1%) et des frquences leves, avec notamment "Vulgaire", plus de
30%. Ce profil est donc trs loign du profil moyen.
3) a) La premire valeur indique dans le tableau des taux de liaison est -0,868. Indiquer le calcul qui a
permis d'obtenir cette valeur.
Le taux de liaison est obtenu partir de la frquence (0,09%) et des frquences marginales de la ligne
(9,69%) et de la colonne (6,81%) l'aide du calcul suivant :
0,0009 0,0969 0,0681
t= = 0,863
0,0969 0,0681
b) Au vu du tableau des taux de liaison, indiquer une modalit ligne et une modalit colonne qui "s'attirent".
Indiquer une modalit ligne et une modalit colonne qui "se repoussent".
Il existe un taux de liaison positif lev entre "Orly" et "Nouveau-riche", ce qui montre que ces deux
modalits s'attirent. Au contraire, le taux de liaison ngatif entre "Orly" et "Vieillot" montre que ces modalits
se repoussent.
b) Quel est le taux de liaison maximum du tableau ? Comment pourrait-on exprimer d'une autre faon le
rsultat correspondant ce taux de liaison.
Le taux maximum (2,677) est observ pour le couple de modalits (Vulgaire, Corsaire). Il signifie que la
frquence de ce couple de modalits dpasse de 267% la frquence attendue sous hypothse
d'indpendance des lignes et colonnes.
4) Le coefficient Phi-2 de ce tableau vaut 0,60855. Relier ce rsultat aux valeurs propres d'une part, au khi-2
du tableau d'autre part.
On sait que ce coefficient est gal la somme des valeurs propres. Il est reli au khi-2 par la relation Phi2 =
Khi2/N. On vrifie, sur les tableaux ci-dessus, que : 0,60855 = 696,79/1145.
5) Au vu du tableau des valeurs propres, combien de variables factorielles faudrait-il tudier dans le cadre
d'une tude complte des donnes observes ?
L'AFC fournit ici 10 valeurs propres, soit une moyenne de 10% d'inertie associe chaque axe. D'autre part,
on observe une brusque diminution de l'inertie associe partir du 6 axe. Autrement dit, la mthode de la
moyenne, aussi bien que la mthode du coude, nous conduiraient ici tudier les 5 premiers axes.
6) a) En utilisant le tableau des rsultats relatifs aux lignes, calculer la distance du point reprsentant la
modalit "Nouveau-riche" l'origine du repre, dans l'espace de dimension 3 dfini par les 3 premiers axes
factoriels.
OH 2
La qualit de reprsentation d'un point M est le rapport , o H dsigne la projection du point M dans
OM 2
le sous-espace retenu pour la reprsentation.
La qualit de reprsentation de "Nouveau-riche" dans l'espace des trois premiers facteurs est 0,38. Le carr
0,2148
de la distance dans l'espace de dimension 10 est donc : D = = 0,5652 d'o D=0,7518.
2
0,38
d) Mmes questions pour le point reprsentant la modalit "Sobre-lgant".
La qualit de reprsentation de "Sobre-lgant" dans l'espace des trois premiers facteurs est 0,853. Le carr
0,2516
de la distance dans l'espace de dimension 10 est donc : D' = = 0,2950 d'o D'=0,5431.
2
0,853
e) Dans la reprsentations en 3 dimensions, "Nouveau-riche" est plus prs du profil moyen que "Sobre-
lgant". En est-il de mme dans la ralit, c'est--dire dans l'espace de dimension 10 ?
On constate que, dans l'espace de dimension 3, "Nouveau-riche" est plus prs de l'origine que "Sobre-
lgant", alors que dans l'espace de dimension 10, c'est l'inverse qui se produit. Mais, la qualit de
reprsentation de "Nouveau-riche" dans l'espace de dimension 3 est nettement moins bonne que celle de
"Sobre-lgant".
Le nombre d'attributs est de 11. Le seuil envisag correspond donc 9,09% de contribution l'inertie du
premier axe.
- +
Distingu (23,7%) Vulgaire (21,2%)
Nouveau-riche (10,0%) Cocasse (19,6%)
On voit que cet axe oppose essentiellement les attributs antinomiques distingu / vulgaire.
9) Faire une synthse des deux tudes prcdentes en dcrivant les rsultats obtenus dans le premier plan
factoriel.
L'tude des deux premiers axes (et du graphique), permet dj de cerner trois zones :
- Les marques "Zodiaque", "Corsaire" lies des attributs tels que "vulgaire" et "cocasse" ;
- Une forte liaison entre "Escale" et "Pour une femme", laquelle s'ajoutent des marques telles que
"Htesse" ou "Orly", qui sont galement lies "distingu";
- Des marques telles que "Directoire", et dans une moindre mesure, "Pavois" ou "Ducat", lies
l'attribut "vieillot".
10) A votre avis, quelle est la marque qui a finalement t retenue par l'entreprise ?
Compte tenu du cahier des charges pos au dpart (produit qui doit paratre de qualit suprieure,
prestigieux, luxueux, convenant un public masculin, connaisseur, raffin, distingu, de niveau socio-
conomique lev...), aucune des marques cites dans l'analyse prcdente ne convient. La zone la plus
intressante du graphique est ici celle contenant les points "distingu", "nouveau-riche", "sobre lgant",
"Fontenoy", "Alezan". Mais "Alezan" n'est pas assez li "distingu", et c'est finalement la marque
"Fontenoy" qui a t retenue.