Vous êtes sur la page 1sur 7

Universit de Nantes

Master 1 MIM

Mai 2007

Examen d'Analyse de donnes


Session 1 dure 3 heures
Les documents sont interdits. Les calculatrices sont autorises.

Exercice 1: - Etude dun tableau laide dune ACP (7 points)


A 2
B 1
C 0

Soit le tableau T = D 2
E 1

F 0
x
quantitatives x, y, z

0
0
1

1 dcrivant pour les 6 individus A,B,,F les valeurs prises par les variables
0 1

1 0
y z
1
1
0
0

1/ Construction de la matrice des corrlations


a. Calculer la moyenne, la variance et les cart-type des variables.
b. Dterminer le tableau centr rduit.
1 0 0
c. En dduire que la matrice des corrlations est M= 0 1 1
0 1 1
d. Interprter cette matrice.
2/ Ajustement du nuage des individus
a. Dterminer les valeurs propres de M.
b. Interprter ces valeurs propres en terme dinertie. En dduire le % dinertie projet sur chaque axe.
c. Dterminer un vecteur propre unitaire associ 1 et 2.
d. Quelle est la signification des axes dfinis par ces vecteurs?
3/ Reprsentation des individus
a. Calculer les composantes principales F1 et F2.
b. Quelle est la signification de F1 et F2 ?
c. Placer les individus dans le plan (u1,u2) (prendre pour unit 4cm)
4/ Reprsentation des variables
a. Calculer les facteurs principaux G1 et G2.
b. Quelle est la signification de G1 et G2 ?
c. Placer les variables dans le plan (v1,v2) et tracer le cercle des corrlations.

Exercice 2 : Analyse de documents (7 points)


Une entreprise veut choisir un nom pour un nouveau produit, qui doit paratre de qualit suprieure,
prestigieux, luxueux, convenant un public masculin, connaisseur, raffin, distingu, de niveau socioconomique lev...
L'entreprise hsite entre 12 marques (cf 1re ligne du tableau ci-dessous). Pour faire un choix entre ces
marques, un chantillon de clients potentiels a t interrog. Onze attributs leur taient proposs (cf. 1re
colonne du tableau). Pour chaque attribut, la personne interroge devait dsigner une ou plusieurs
marques auxquelles l'attribut se rapportait le mieux.
Les rsultats obtenus sont les suivants :
Vieillot
Nouveauriche
Sobrelgant
Cocasse
Rac
Mivre
Distingu
Vulgaire
Pour un
homme
Pour une
femme
Pour une
petite
nature

Total

Orly Alezan Corsaire Directoire Ducat Fontenoy Icare Zodiaque Pavois Cocker Escale Hotesse Total
1
2
14
38
18
10
9
5
9
4
0
1
111
20
9
1
11
10
9
1
1
20
9
7
12
110
9

23

15

11

12

17

113

1
4
3
11
4
9

3
33
9
9
4
12

15
7
1
1
32
23

15
8
7
17
2
4

6
3
7
4
6
7

5
6
5
21
0
13

12
6
12
6
9
5

18
4
9
1
7
5

4
5
6
5
3
10

25
15
9
4
10
5

2
5
6
5
10
13

2
3
13
27
7
0

108
99
87
111
94
106

23

33

112

11

11

24

10

94

78

112

106

132

83

84

78

71

79

123

84

115

1145

On traite ce tableau par une mthode d'analyse des donnes multidimensionnelles. Les principaux
rsultats sont rassembls dans les tableaux et graphiques ci-dessous :
1. Frquences
Orly
Vieillot
Nouveau-riche
Sobre-lgant
Cocasse
Rac
Mivre
Distingu
Vulgaire
Pour un homme
Pourune femme
Pour une petite
nature
Total

0,09%
1,75%
0,79%
0,09%
0,35%
0,26%
0,96%
0,35%
0,79%
0,79%
0,61%

Alezan Corsaire Directoire Ducat Fontenoy Icare


0,17%
0,79%
2,01%
0,26%
2,88%
0,79%
0,79%
0,35%
1,05%
0,26%
0,44%

1,22%
0,09%
0,09%
1,31%
0,61%
0,09%
0,09%
2,79%
2,01%
0,79%
0,17%

6,81% 9,78%

9,26%

3,32%
0,96%
1,31%
1,31%
0,70%
0,61%
1,48%
0,17%
0,35%
0,70%
0,61%

1,57%
0,87%
0,61%
0,52%
0,26%
0,61%
0,35%
0,52%
0,61%
0,35%
0,96%

11,53% 7,25%

0,87%
0,79%
0,96%
0,44%
0,52%
0,44%
1,83%
0,00%
1,14%
0,17%
0,17%

0,79%
0,09%
0,52%
1,05%
0,52%
1,05%
0,52%
0,79%
0,44%
0,52%
0,52%

7,34% 6,81%

Zodiaqu
e
0,44%
0,09%
0,17%
1,57%
0,35%
0,79%
0,09%
0,61%
0,44%
0,70%
0,96%

Pavois Cocker Escale Hotesse Total


0,79%
1,75%
0,61%
0,35%
0,44%
0,52%
0,44%
0,26%
0,87%
0,09%
0,79%

0,35%
0,79%
1,05%
2,18%
1,31%
0,79%
0,35%
0,87%
0,44%
0,52%
2,10%

0,00%
0,61%
0,26%
0,17%
0,44%
0,52%
0,44%
0,87%
1,14%
2,01%
0,87%

0,09%
1,05%
1,48%
0,17%
0,26%
1,14%
2,36%
0,61%
0,00%
2,88%
0,00%

9,69%
9,61%
9,87%
9,43%
8,65%
7,60%
9,69%
8,21%
9,26%
9,78%
8,21%

6,20% 6,90% 10,74% 7,34% 10,04%

100 %

2. Frquences lignes

Vieillot
Nouveau-riche
Sobre-lgant
Cocasse
Rac
Mivre
Distingu
Vulgaire
Pour un
homme
Pour une
femme
Pour une petite
nature
Total

Orly

Alezan Corsaire Directoire Ducat

0,90%
18,18%
7,96%
0,93%
4,04%
3,45%
9,91%
4,26%
8,49%

1,80%
8,18%
20,35%
2,78%
33,33%
10,34%
8,11%
4,26%
11,32%

12,61%
0,91%
0,88%
13,89%
7,07%
1,15%
0,90%
34,04%
21,70%

8,04%

2,68%

8,04%

7,14%

3,57%

1,79%

5,36%

7,45%

5,32%

2,13%

7,45% 11,70%

2,13%

6,38% 11,70%

9,57% 25,53% 10,64%

6,81%

9,78%

9,26%

7,34%

6,81%

6,90% 10,74%

34,23% 16,22%
10,00% 9,09%
13,27% 6,19%
13,89% 5,56%
8,08% 3,03%
8,05% 8,05%
15,32% 3,60%
2,13% 6,38%
3,77% 6,60%

11,53%

7,25%

Fonteno Icare
y
9,01% 8,11%
8,18% 0,91%
9,73% 5,31%
4,63% 11,11%
6,06% 6,06%
5,75% 13,79%
18,92% 5,41%
0,00% 9,57%
12,26% 4,72%

Zodiaqu Pavois
e
4,50% 8,11%
0,91% 18,18%
1,77% 6,19%
16,67% 3,70%
4,04% 5,05%
10,34% 6,90%
0,90% 4,50%
7,45% 3,19%
4,72% 9,43%
7,14%

6,20%

0,89%

Cocker Escale
3,60% 0,00%
8,18% 6,36%
10,62% 2,65%
23,15% 1,85%
15,15% 5,05%
10,34% 6,90%
3,60% 4,50%
10,64% 10,64%
4,72% 12,26%

Hotesse Total
0,90%
10,91%
15,04%
1,85%
3,03%
14,94%
24,32%
7,45%
0,00%

100%
100%
100%
100%
100%
100%
100%
100%
100%

5,36% 20,54% 29,46% 100%


0,00% 100%

7,34% 10,04% 100%

3. Frquences colonnes
Vieillot
Nouveauriche
Sobrelgant
Cocasse
Rac
Mivre
Distingu
Vulgaire
Pour un
homme
Pour une
femme
Pour une
petite
nature
Total

Orly
Alezan Corsaire Directoire Ducat Fontenoy Icare
Zodiaque Pavois Cocker Escale Hotesse Total
1,28% 1,79% 13,21%
28,79% 21,69% 11,90% 11,54%
7,04% 11,39% 3,25% 0,00% 0,87% 9,69%
25,64% 8,04%
0,94%
8,33% 12,05% 10,71% 1,28%
1,41% 25,32% 7,32% 8,33% 10,43% 9,61%
11,54% 20,54%

0,94%

11,36%

8,43%

13,10%

7,69%

1,28% 2,68%
5,13% 29,46%
3,85% 8,04%
14,10% 8,04%
5,13% 3,57%
11,54% 10,71%

14,15%
6,60%
0,94%
0,94%
30,19%
21,70%

11,36%
6,06%
5,30%
12,88%
1,52%
3,03%

7,23%
3,61%
8,43%
4,82%
7,23%
8,43%

5,95% 15,38%
7,14% 7,69%
5,95% 15,38%
25,00% 7,69%
0,00% 11,54%
15,48% 6,41%

2,82%

8,86%

9,76%

3,57% 14,78% 9,87%

25,35% 5,06% 20,33% 2,38% 1,74% 9,43%


5,63% 6,33% 12,20% 5,95% 2,61% 8,65%
12,68% 7,59% 7,32% 7,14% 11,30% 7,60%
1,41% 6,33% 3,25% 5,95% 23,48% 9,69%
9,86% 3,80% 8,13% 11,90% 6,09% 8,21%
7,04% 12,66% 4,07% 15,48% 0,00% 9,26%

11,54%

2,68%

8,49%

6,06%

4,82%

2,38%

7,69%

11,27%

8,97%

4,46%

1,89%

5,30% 13,25%

2,38%

7,69%

15,49% 11,39% 19,51% 11,90%

100%

100%

100%

100%

100,

100%

100%

100%

1,27%

100%

4,88% 27,38% 28,70% 9,78%

100%

100%

4. Valeurs propres
Nombre
de Dims.

1
2
3
4
5
6
7
8
9
10

Valeurs Propres et Inertie de toutes les Dimensions


Inertie Totale = ,60855 Chi2 = 696,79 dl = 110 p = 0,0000
ValProp.
%age
%age
Chi2
Inertie
Cumul
0,1821
29,9210
29,9210
208,4852
0,1330
21,8484
51,7694
152,2368
0,1043
17,1421
68,9115
119,4437
0,0812
13,3400
82,2515
92,9514
0,0641
10,5317
92,7832
73,3831
0,0212
3,4817
96,2649
24,2602
0,0111
1,8232
98,0881
12,7041
0,0089
1,4610
99,5491
10,1800
0,0026
0,4338
99,9829
3,0223
0,0001
0,0171
100,0000
0,1192

0,00% 8,21%

100%

100%

5. Rsultats relatifs aux lignes


NomLigne

Vieillot
Nouveauriche
Sobre-lgant
Cocasse
Rac
Mivre
Distingu
Vulgaire
Pour un
homme
Pour une
femme
Pour une
petite nature

Coordonnes Ligne et Contributions l'Inertie


Standardisation : Profils ligne et colonne
Coord Coord Coord Masse
.
.
.
N F 1
F.2
F3
1 0,266 -0,572 0,662 0,097
2 -0,436 -0,157 -0,007 0,096
3
4
5
6
7
8
9

Cos2

Ctr

Cos2

Ctr

Cos2

Ctr

0,144
0,089

F1
F1
F2
F2
F.3
F3
0,038 0,078 0,238
0,362 0,408
0,486
0,100 0,337 0,018
0,043 0,000
0,000

0,099
0,094
0,086
0,076
0,097
0,082
0,093

0,048
0,095
0,101
0,028
0,099
0,123
0,068

0,090
0,196
0,000
0,003
0,237
0,212
0,031

0,567
0,616
0,001
0,036
0,714
0,517
0,139

0,035
0,010
0,047
0,001
0,000
0,183
0,012

0,159
0,023
0,103
0,005
0,000
0,325
0,038

0,035
0,001
0,411
0,001
0,064
0,001
0,010

0,127
0,001
0,701
0,009
0,110
0,001
0,026

0,183

0,098

0,133

0,053

0,118

0,447

0,732

0,031

0,040

0,292 -0,129 -0,218

0,082

0,072

0,039

0,160

0,010

0,031

0,037

0,089

-0,409 -0,216 -0,194


0,614 -0,118 0,025
-0,031 -0,270 -0,704
-0,091 0,033 -0,044
-0,667 0,014 0,262
0,686 0,544 0,026
0,249 0,131 -0,108

10 -0,313
11

Inertie

0,779

6. Rsultats relatifs aux colonnes


Nom Col.

Orly
Alezan
Corsaire
Directoire
Ducat
Fontenoy
Icare
Zodiaque
Pavois
Cocker
Escale
Hotesse

Coordonnes Colonne et Contributions l'Inertie


Standardisation : Profils ligne et colonne
Coord. Coord. Coord. Masse
N F 1
F.2
F3
1 -0,452
0,101 -0,080
0,068
2 -0,262 -0,267 -0,723
0,098
3
0,808
0,393
0,125
0,093
4 -0,034 -0,482
0,484
0,115
5
0,160 -0,288
0,261
0,072
6 -0,395 -0,270
0,152
0,073
7
0,267
0,010
0,055
0,068
8
0,537
0,114 -0,038
0,062
9 -0,116 -0,305 -0,027
0,069
10
0,322 -0,117 -0,339
0,107
11 -0,035
0,676 -0,080
0,073
12 -0,724
0,552
0,214
0,100

Inertie
0,055
0,134
0,174
0,100
0,033
0,060
0,026
0,060
0,048
0,078
0,073
0,160

Ctr
F1
0,076
0,037
0,332
0,001
0,010
0,063
0,027
0,098
0,005
0,061
0,001
0,289

Cos2
F1
0,419
0,083
0,572
0,002
0,094
0,312
0,310
0,492
0,032
0,235
0,002
0,540

Ctr
F2
0,005
0,053
0,107
0,202
0,045
0,040
0,000
0,006
0,048
0,011
0,252
0,230

Cos2
F2
0,021
0,086
0,135
0,439
0,302
0,146
0,000
0,022
0,220
0,031
0,754
0,314

Ctr
F.3
0,004
0,490
0,014
0,259
0,047
0,016
0,002
0,001
0,000
0,118
0,005
0,044

Cos2
F3
0,013
0,627
0,014
0,442
0,248
0,046
0,013
0,003
0,002
0,260
0,011
0,047

Trac 2D des Coordonnes Ligne & Colonne ; Dimension : 1 x 2


Table d'Entre (Lignes x Colonnes) : 11 x 12
Standardisation : Profils ligne et colonne
1,0
Pourunefemme

0,8

Escale

0,6

Hotesse

Vulgaire
Corsaire

0,4
0,2

Pourunhomme Zodiaque

Orly
Mivre

Distingu

Icare

0,0
Nouveau-riche
Sobre-lgant
Fontenoy
Alezan

-0,2

Cocker
Cocasse
Pourunepetitenature
Rac
Pavois

-0,4

Ducat

Directoire
Vieillot

-0,6
Dimension 2; Valeur Propre : ,13296 (21,85 % d'Inertie)

-0,8
-1,0

-0,8

-0,6

-0,4

-0,2

0,0

0,2

0,4

0,6

0,8

1,0

Coord.L.
Coord.C.

Dimension 1; Valeur Propre : ,18208 (29,92 % d'Inertie)

1) a) Quelle est la mthode d'analyse utilise ici ? Pourquoi utilise-t-on cette mthode ?
b) Quelle information nous apporte le test du Khi deux prsent en 4.
2) a) Dans le tableau des frquences lignes, on lit 20,35% l'intersection de la ligne "sobre-lgant" et de
la colonne "alezan". Comment a t obtenue cette valeur ? Que signifie-t-elle ?
b) Comparer qualitativement le profil de la marque "Corsaire" au profil moyen.
3) a) Au vu du tableau des valeurs propres, combien de variables factorielles faudrait-il tudier dans le
cadre d'une tude complte des donnes observes ?
b) Quel rsultat manque-t-il pour aider au choix des axes ?
c) Dans cette tude, on se limite aux trois premiers axes. Quel pourcentage d'inertie est expliqu par
ces trois axes?
4) a) Rappeler la dfinition de la notion de qualit de reprsentation d'un point.
b) Les points sont-ils bien reprsents dans le plan F1-F2?
5) Etude de la premire variable factorielle
a) On considre le nuage des attributs. Quels sont les individus dont la contribution est suprieure la
moyenne ? Pour chacun d'eux, prciser le signe de la coordonne correspondante. Comment peut-on
interprter cet axe en termes d'opposition entre attributs.
b) Mme question pour le nuage des marques envisages.
6) Mener une tude analogue pour la deuxime variable.
7) Faire une synthse des deux tudes prcdentes en dcrivant les rsultats obtenus dans le premier plan
factoriel.
8) A votre avis, quelle est la marque qui a finalement t retenue par l'entreprise ?

Exercice 3 : Classification (6 points)


Cinq objets sont reprsents en grandeur nature. La distance utilise entre les objets est la distance
euclidienne (mesure en mm au double-dcimtre).

I. Construction d'une CAH


1/ Construire le tableau de distance. Les distances seront exprimes en mm (arrondir au mm prs).
2/ Effectuer une CAH sur ce tableau en utilisant comme critre d'agrgation celui du "saut
minimal".
a. Construire tous les tableaux intermdiaires
b. Construire le dendrogramme rsultant.
c. Construire le tableau des distances ultramtriques correspondant.
d. Quelle est la partition qui vous semble prfrable. En dduire les groupes.

II Classification l'aide de centres mobiles


Construire une partition en deux classes des objets l'aide de la mthode des centres mobiles.
On choisira comme premiers centres mobiles les objets 1 et 3. Dcrire sur les diffrentes figures les
tapes successives.

Etape 1

Etape 2

Etape 3

Etape 4