Vous êtes sur la page 1sur 16

ISFA 2me anne 2003-2004 - Analyse des donnes Thorie

Le sujet comprend 5 questions indpendantes trs simples et un problme 15 questions.


vitez les rponses sans justification et le remplissage. Merci dutiliser lespace imparti pour vos rponses.

Pour les 5 premires questions on considre la matrice A :


1
1
A=
1

0
1
1

1.
Donner l'inertie autour de l'origine des 4 points de dfinis par A avec la pondration uniforme et la
mtrique canonique.

2.
Donner les axes principaux de l'ACP norme de ce tableau.

3.
Donner les lments du triplet de l'analyse des correspondances de A.

4.
Donner les valeurs propres de o est la transpose de A.

5.
Donner les valeurs singulires de A.
------------------------------------------------------------------------------------------------------------------------Les donnes qui font l'objet du problme sont listes en annexe. Elles forment deux tableaux dits cte
cte. Le premier, appel tab1 a 94 lignes et 9 colonnes. Le second, appel tab2 , a 94 lignes et 16
colonnes. Les 94 lignes sont les 94 dpartements de la France continentale (Figure 1).
Le premier tableau donne les rsultats du premier tour des lections prsidentielles de 1988. Les
candidats sont dsigns par des lettres minuscules :
a
F. Mitterand
e
A. Lajoinie

b
J. Chirac
f
A. Waechter

c
R. Barre
g
P. Juquin

d
J.M. Le Pen
h
A. Laguillier

i
P. Boussel

Le second donne les rsultats du premier tour des lections prsidentielles de 2002. Les candidats sont
dsigns par des lettres majuscules :
A
J. Chirac
E
A. Laguiller
I
O. Besancenot
M
C.Taubira
CI.

B
J.M. Le Pen
F
P. Chevnement
J
A. Madelin
N
C. Lepage

C
L.
G
J.
K
R.
O
C.

Jospin
Saint Josse
Hue
Boutin

D
F.
H
N.
L
B.
P
D.

Bayrou
Mamre
Mgret
Gluksten

Les donnes sont dites dans l'annexe en pour mille arrondi l'entier le plus proche et conserves avec
cette prcisions pour tous les calculs ce qui est exprim dans R par :
(apply(tab1,1,sum)==1000)
[1] TRUE

ISFA 2 / D. Chessel / Janvier 2004

nonc - Corrig /

...

/exos/exov.pdf

all(apply(tab2,1,sum)==1000)
[1] TRUE

Le premier tableau formait un exemple de rfrence dans le logiciel Cartographie-2D de Argo


Infographie S.A., aujourd'hui disparu. Le second tableau a t calcul partir des informations
disponibles sur le site du Ministre de l'Intrieur :

On
peut considrer que F. Mitterand (PS), J. Chirac (RPR), R. Barre (UDF), J.M. Le Pen (FN) et A.
Laguillier (LO) sont des personnalits bien connues. Pour mmoire, on rappelle que A. Lajoinie tait le
candidat du PCF, A. Waechter le reprsentant du mouvement cologiste, P. Juquin tait communiste
dissident et P. Boussel un autre reprsentant de l'extrme gauche (MPPT).
Les moyennes par colonnes dans chacun des tableaux sont :
(tab1,2,mean)
a
b
c
d
343.064 202.670 164.681 137.606

e
67.106

f
38.638

g
21.670

h
20.574

i
3.989

E
58.447
P
4.926

F
53.830

G
51.053

H
50.553

I
44.957

apply(tab2,2,mean)
A
B
C
196.106 169.543 157.149
L
M
N
23.660 19.713 18.479

D
67.298
O
11.915

J
37.691

K
34.681

6.
Donner la somme des moyennes des variables de chaque tableau.

ISFA 2 / D. Chessel / Janvier 2004

nonc - Corrig /

...

/exos/exov.pdf

7.
Les variances des variables de chaque tableau sont :
apply(tab1,2,var)*93/94
a
b
c
d
1578.507 1580.966 1058.515 1760.579

e
868.350

f
110.295

g
36.604

h
14.500

i
1.138

E
106.694
O
13.057

F
311.865
P
0.686

G
690.178

H
91.481

I
47.232

apply(tab2,2,var)*93/94
A
B
1022.010 1886.674
K
L
183.068
64.990

C
657.488
M
41.098

D
207.252
N
13.526

J
79.320

On s'intresse ici la variabilit spatiale (entre dpartements) du pourcentage des voies obtenues. Les
donnes centres sont cartographies et donnent les figures 2 et 3. Chaque carr reprsente l'cart entre
le pourcentage obtenu dans le dpartement et le pourcentage moyen. Ce carr est blanc si l'cart est
ngatif, noir si il est positif, et la surface du carr est proportionnelle la valeur absolue de l'cart.
L'chelle est la mme pour toutes les cartes.
Combien vaut le plus grand cart ngatif observ pour F. Mitterrand en 1988 et o se produit-il ? Mme
question pour J.M. Le Pen en 2002 ? Combien vaut le plus grand cart positif pour J. Chirac en 1988 et
o se produit-il ? Mme question pour J.P. Chevnement en 2002.

8.
Rdiger un commentaire bref et concentr pouvant servir de lgende aux figures 2 et 3.

9.
On appelle tab3 le tableau 94 lignes et 25 colonnes form par la juxtaposition de tab1 et tab2. On
peut faire : A : l'ACP de tab1 centre
B : l'ACP de tab1 norme
C : l'ACP de tab2 centre
D : l'ACP de tab2 norme
E : l'ACP de tab3 centre
F : l'ACP de tab3 norme.
A laquelle de ces analyses correspond chacun des graphes de valeurs propres (numrots de 1 6 dans
le cartouche) reprsents dans la figure 4 ?

10.
A est la matrice 94-9 centre par colonne issue du premier tableau, B est la matrice centre 94-16 issue
du second tableau. Donner un majorant aussi petit que possible du rang de ces deux matrices.

11.
C la matrice centre 94-24 issue du troisime tableau. Donner un majorant aussi petit que possible des
rangs de cette troisime matrice.

12.
Numriquement, les valeurs singulires de C valent :
svd(scalewt(tab3,scale=F))$d
[1]
[8]
[15]
[22]

6.886e+02
1.169e+02
3.116e+01
8.811e+00

5.252e+02
9.887e+01
2.946e+01
4.229e+00

4.134e+02
8.426e+01
2.632e+01
1.415e-13

2.650e+02 2.424e+02 2.049e+02 1.772e+02


6.511e+01 5.748e+01 3.938e+01 3.367e+01
2.381e+01 2.071e+01 1.586e+01 1.144e+01
2.551e-14

Donner le rang des matrices de covariances associes aux matrices A, B et C.

13.
On utilise maintenant uniquement des ACP centres. La premire coordonne des lignes de l'ACP
centre de A est cartographie gauche sur la figure 6. On appelle cette variable Acoo1. La premire
coordonne des lignes de l'ACP centre de B est cartographie droite sur la figure 6. On appelle cette
ISFA 2 / D. Chessel / Janvier 2004

nonc - Corrig /

...

/exos/exov.pdf

variable Bcoo1.
Le nuage bivari de Acoo1 et Bcoo1 est trac avec la droite de rgression de Y/X. On donne la
premire valeur propre de l'ACP centre de A, savoir 2773 et la premire valeur propre de l'ACP
centre de B, savoir 2698. Quelle est la corrlation entre ces deux variables ? Choisir cette valeur dans
la srie de propositions ci-dessous qui contient la valeur exacte :
-1.302, -0.9832, -0.8032,-0.5392, -0.3082, -0.0832,
0.0023, 0.0832, 0.3082, 0.8032, 0.9832, 1.302, 130.2

14.
Donner l'quation de la droite de rgression de Bcco1 sur Acoo1.

15.
Donner l'quation de la droite de rgression de Acco1 sur Bcoo1 et tracer cette droite sur la figure.

16.
Donner l'quation de l'axe principal de ce nuage bivari et placer cet axe sur la figure.

17.
Les deux ACP faites avec la fonction dudi.pca s'appelent respectivement pca1 et pca2. Le
premier axe principal de pca1 est dfini par :
a
0.532

b
c
d
0.335 -0.136 -0.760

e
f
0.052 -0.075

g
h
0.022 0.029

i
0.001

Le premier axe principal de pca2 est dfini par :


A
B
C
D
E
F
0.379 -0.816 0.305 0.000 0.023 -0.131
L
M
N
O
P
-0.135 0.020 0.001 0.009 -0.001

G
H
0.228 0.011

I
J
0.067 -0.026

K
0.065

Pour chaque vecteur donner la somme des composantes et la somme des carrs des composantes.

18.
Reprsenter graphiquement ces scores numriques des candidats et interprter. On pourra commenter en
mme temps, le rsultat numrique suivant :
((pca1$eig/sum(pca1$eig))[1:7],dig=3)
[1] 0.396 0.296 0.224 0.067 0.012 0.004 0.001

round((pca2$eig/sum(pca2$eig))[1:7],dig=3)
[1] 0.498 0.189 0.122 0.069 0.053 0.024 0.019

19.
On donne dans la figure 5 les cartes des variables des deux ACP (plans 1-2 des deux premires
composantes principales. On retrouve l'information lie au facteur 1. Commenter la position relative des
points sur la seconde dimension en mme temps que la valeur :
cor(pca1$li[,2],pca2$li[,2])
[1] -0.7812

20.
On utilise :
x1=tab1$a+tab1$e+tab1$f+tab1$g+tab1$h+tab1$i
y1=tab1$b+tab1$c
z1=tab1$d
tri1=(cbind.data.frame(x1,y1,z1))
names(tri1)=c("Gauche","Droite","ED")
x2=tab2$C+tab2$E+tab2$F+tab2$H+tab2$I+tab2$K+tab2$M+tab2$P
y2=tab2$A+tab2$D+tab2$J+tab2$N+tab2$O
ISFA 2 / D. Chessel / Janvier 2004

nonc - Corrig /

...

/exos/exov.pdf

z2=tab2$G+tab2$L+tab2$B
triangle.biplot(tri1,tri2)

Donner une lgende.

ISFA 2 / D. Chessel / Janvier 2004

nonc - Corrig /

...

/exos/exov.pdf

Annexes
D1
D2
D3
D4
D5
D6
D7
D8
D9
D10
D11
D12
D13
D14
D15
D16
D17
D18
D19

D21
D22
D23
D24
D25
D26
D27
D28
D29
D30
D31
D32
D33
D34
D35
D36
D37
D38
D39
D40

D41
D42
D43
D44
D45
D46
D47
D48
D49
D50
D51
D52
D53
D54
D55
D56
D57
D58
D59
D60

314
395
303
313
291
244
306
372
414
337
401
336
270
374
318
414
365
333
289

191
172
195
189
206
243
200
173
182
205
176
258
148
199
375
196
202
187
392

212
133
150
162
198
150
190
142
104
178
103
185
139
182
115
153
181
166
48

161
134
101
172
137
242
129
151
103
144
137
89
264
111
71
89
112
116
59

44
90
181
64
65
62
80
82
105
65
103
45
112
45
57
70
60
118
137

41
33
30
47
53
30
41
36
35
35
31
39
29
41
24
32
37
32
24

18
14
21
32
28
15
29
17
32
13
26
23
23
20
18
20
20
21
32

358
382
348
349
350
316
365
357
357
291
404
401
389
311
376
376
375
339
334
421

221
189
282
238
215
183
197
193
209
154
168
203
194
173
209
199
183
166
188
210

160
172
100
121
156
171
164
176
196
146
147
144
156
137
204
147
188
169
174
150

4
4
4
3
4
2
5
4
4
4
5
3
2
5
3
4
2
4
3

172
188
209
164
173
220
173
179
143
209
150
222
169
195
309
196
203
207
342

219
212
141
166
144
260
168
229
151
217
198
121
224
142
111
137
134
158
88

127
154
160
136
132
122
142
162
237
137
214
163
140
158
144
177
161
147
164

77
53
64
59
69
68
68
56
41
62
43
71
58
70
55
58
62
59
33

48
82
63
55
49
38
53
73
55
56
54
49
49
74
50
69
60
69
56

61
47
52
59
59
48
56
42
47
47
50
50
55
48
44
44
45
49
39

40
41
44
90
73
24
77
39
84
50
70
82
39
69
93
74
92
55
62

51
36
39
56
67
48
52
39
53
37
40
48
51
53
33
50
52
40
32

39
48
47
51
55
26
51
44
56
36
45
49
33
48
43
54
46
43
44

52
32
34
37
52
48
33
29
20
41
24
42
39
39
28
33
40
35
20

21
39
81
44
34
30
42
34
52
32
48
29
48
23
28
38
32
65
69

35
26
18
28
28
25
26
36
16
27
25
16
50
20
18
19
19
22
12

19
12
15
21
24
15
19
11
19
15
15
19
17
21
14
18
22
18
14

22
14
15
18
23
18
19
13
13
18
12
19
16
22
16
18
18
16
14

h i

139 39 41 18 19 5
83 76 41 28 25 4
78 112 25 28 23 4
98 113 32 28 18 3
144 35 49 22 26 3
167 64 46 30 19 4
140 57 34 16 22 5
154 45 34 16 20 5
99 43 43 28 22 3
206 121 33 30 18 1
132 59 37 30 20 3
107 60 38 24 20 3
123 63 30 22 20 3
199 90 33 35 17 5
86 28 44 21 26 6
113 84 29 21 26 5
122 50 35 20 22 5
161 68 46 28 18 5
145 56 53 20 25 5
90 69 23 20 15 2

190
203
262
216
187
159
193
202
220
151
152
179
188
150
213
212
197
153
173
192

180
117
112
122
190
208
196
191
108
249
166
133
142
230
105
153
145
183
183
105

153
193
182
174
146
139
139
144
185
138
212
199
181
161
178
165
164
160
134
219

76
64
45
52
63
69
65
68
75
61
64
64
67
56
79
53
70
68
71
70

58
67
60
57
55
49
69
59
64
51
55
49
59
50
67
66
66
58
58
48

355
304
300
368
318
388
336
268
326
338
346
352
336
351
351
349
333
445
367
365

194
179
210
198
210
238
185
269
221
233
205
196
241
156
181
196
163
170
150
177

182
185
214
199
183
121
160
216
243
209
172
156
234
180
184
194
167
124
156
141

191
169
204
188
197
191
175
247
221
254
206
199
258
184
197
226
190
173
177
183

184
217
184
115
194
108
189
136
117
133
193
224
119
181
203
149
237
162
194
228

128 64 31
174 70 41
141 45 40
100 40 43
149 60 37
83 71 44
154 85 35
116 49 34
95 27 41
108 28 43
140 58 40
156 54 42
82 22 41
148 68 42
150 45 45
128 43 38
199 41 48
97 96 28
152 103 29
167 73 33

19
23
23
24
18
30
23
26
16
15
14
14
16
24
14
28
14
18
15
16

h i
15
25
15
18
18
12
20
23
21
19
18
22
13
23
19
22
21
23
16

h i
22
20
23
24
20
21
18
17
26
22
20
24
23
26
26
21
30
18
23
24

5
4
4
4
5
4
4
5
5
4
5
6
5
5
4
3
5
4
5
4

ISFA 2 / D. Chessel / Janvier 2004

146 75 61
134 80 56
128 85 58
180 79 63
141 71 52
176 50 57
157 67 48
128 75 46
150 100 60
137 66 66
138 77 69
131 57 62
144 84 55
162 64 76
143 73 66
167 66 57
145 65 71
201 52 65
168 66 72
137 59 69

69 33 50 44 41 22 26 19 21
44 39 61 57 39 48 11 20 20
47 70 34 50 26 55 16 15 13
45 78 46 52 28 62 21 17 16
91 29 52 46 37 18 31 17 19
60 51 58 45 38 31 29 21 20
47 52 44 47 37 29 29 19 19
49 53 43 39 43 23 27 20 19
48 35 66 59 41 29 10 23 20
52 53 43 39 33 53 31 17 15
58 38 69 47 32 31 18 24 20
44 108 46 46 27 35 17 22 16
48 79 62 45 30 33 15 20 18
53 58 55 40 34 41 24 20 15
46 34 71 54 51 21 11 25 24
43 75 37 47 32 44 21 16 17
56 47 53 45 47 28 20 21 21
68 27 70 45 44 36 27 21 23
73 40 55 53 42 29 31 17 20
39 121 42 43 25 45 12 14 13
F

O P
12
9
13
11
13
7
16
9
9
11
8
16
8
12
9
10
9
11
7

5
7
5
5
5
3
5
5
4
5
4
4
4
6
5
5
5
6
4

O P
12
12
8
9
14
19
9
14
12
9
10
11
9
9
16
13
14
12
15
9

6
5
5
5
5
4
6
6
5
5
4
4
4
4
5
6
6
5
6
3

O P

48 66 43 42 37 33 24 17 18 10 5
61 32 50 44 41 34 29 16 18 14 5
54 49 46 52 35 24 26 17 16 16 6
51 45 70 55 42 25 15 22 25 19 6
53 49 47 36 42 30 30 20 21 12 5
55 101 54 54 29 46 15 30 19 10 5
41 93 45 43 30 41 26 17 14 10 4
48 83 44 47 43 33 17 19 16 14 4
44 45 62 47 46 19 18 21 23 22 5
48 79 40 48 39 19 18 17 19 12 5
47 35 47 39 43 27 29 15 19 11 5
45 51 43 48 38 25 29 15 17 10 6
39 38 57 53 49 16 16 18 22 26 6
57 21 54 48 35 37 27 19 19 11 5
45 45 45 45 36 23 28 15 19 12 5
42 39 58 51 45 27 11 20 23 14 5
46 13 52 43 33 21 34 15 17 12 6
53 50 39 49 31 59 21 15 14 10 6
46 36 48 42 34 49 26 13 14 10 5
52 32 44 41 36 33 32 19 18 11 6

nonc - Corrig /

...

/exos/exov.pdf

D61
D62
D63
D64
D65
D66
D67
D68
D69
D70
D71
D72
D73
D74
D75
D76
D77
D78
D79
D80

D81
D82
D83
D84
D85
D86
D87
D88
D89
D90
D91
D92
D93
D94
D95

341
413
342
338
379
314
282
295
293
374
376
381
304
272
295
390
330
294
375
367

234
145
196
245
184
178
176
171
174
201
206
193
209
225
316
168
199
245
212
169

193
139
175
181
156
134
186
181
220
155
172
181
181
228
136
161
151
185
211
148

365
364
255
294
323
379
379
354
331
368
330
291
329
315
332

191
204
199
167
246
218
221
192
200
173
193
247
146
193
180

147
137
162
152
241
164
110
174
172
139
158
165
111
140
145

h i

118 30 40 17 23 4
114 116 27 14 27 5
116 71 40 32 23 5
107 50 34 23 19 3
99 98 32 31 18 3
205 94 32 24 16 3
219 13 94 9 18 3
218 15 93 8 17 2
180 54 38 22 15 4
138 46 41 16 23 6
111 65 33 16 19 2
93 62 36 22 27 5
152 59 50 22 19 4
155 32 54 16 15 3
134 36 36 28 16 3
112 87 34 21 24 3
178 63 38 19 18 4
151 47 38 20 16 4
75 32 45 18 27 5
138 101 29 18 26 4

234
166
190
187
163
170
185
181
181
180
192
213
180
186
240
191
197
226
224
176

182
184
136
104
123
209
234
235
193
223
178
150
198
208
94
162
189
147
93
163

h i

148 62 39 23 21 4
152 59 39 21 20 4
251 71 28 19 12 3
231 78 37 20 16 5
87 27 39 14 22 1
93 58 38 23 23 4
78 114 31 40 23 4
149 39 48 14 25 5
157 63 36 17 18 6
168 45 53 21 29 4
150 69 43 34 19 4
148 69 37 24 16 3
198 135 33 25 18 5
156 110 38 27 16 5
181 79 38 22 18 5

181
177
213
167
249
215
218
192
200
142
191
239
161
194
188

168
201
235
258
118
111
112
209
210
225
160
119
177
143
181

187
156
121
126
148
173
197
142
136
99
168
167
179
172
163

60
58
61
57
83
66
46
64
64
51
71
89
52
72
68

132 70 64
175 49 83
170 71 77
178 131 52
200 77 56
166 61 53
112 120 47
108 91 52
140 88 45
134 53 55
169 64 58
166 62 74
131 71 49
114 83 45
200 79 30
168 60 79
149 65 56
150 88 42
181 80 69
139 64 80

37 56
53 64
63 38
38 93
44 90
52 58
45 10
63 10
67 16
87 47
52 41
47 37
63 30
57 23
66
5
47 37
64 22
65 16
41 67
42 121

44
38
51
57
47
44
60
60
61
39
42
53
63
72
74
49
54
58
59
37

44
47
58
50
54
43
34
35
36
47
48
51
44
38
34
51
39
31
54
44

40
29
34
24
23
32
46
41
56
34
47
36
49
62
65
32
40
54
36
26

20
54
37
30
55
48
9
11
25
22
34
33
31
17
22
46
30
23
20
45

21
22
20
10
14
24
39
50
25
34
27
21
28
24
10
27
31
20
13
22

17
11
20
18
23
16
18
17
24
15
16
18
20
21
38
19
29
26
21
12

20
11
18
15
17
13
21
23
24
15
15
20
25
32
25
17
21
27
19
16

57 48
52 45
45 53
45 49
57 39
71 45
75 53
68 55
56 52
55 194
54 73
38 65
60 64
47 69
52 66

66
84
48
60
64
73
52
32
42
22
16
8
8
9
14

49
46
44
47
51
57
44
45
42
43
62
58
61
63
56

46
42
30
37
44
52
55
51
42
40
38
30
38
36
35

29
29
42
36
46
32
26
39
39
24
39
59
35
49
44

35
29
30
31
18
31
56
21
31
18
34
34
63
54
40

24
27
32
39
16
15
18
28
35
40
21
17
25
19
22

18
24
15
18
18
21
18
16
17
14
34
34
52
41
38

16
15
17
17
23
19
16
19
18
16
24
25
14
20
20

1988
F. Mitterand
e
A. Lajoinie

b
J. Chirac
f
A. Waechter

c
R. Barre
g
P. Juquin

d
J.M. Le Pen
h
A. Laguillier

i
P. Boussel

2002
J. Chirac
A. Laguiller
O. Besancenot
M
C. Taubira

B
J.M. Le Pen
F
P. Chevnement
J
A. Madelin
N
C. Lepage

C
L.
G
J.
K
R.
O
C.

Jospin
Saint Josse
Hue
Boutin

ISFA 2 / D. Chessel / Janvier 2004

D
F.
H
N.
L
B.
P
D.

Bayrou
Mamre
Mgret
Gluksten

nonc - Corrig /

...

/exos/exov.pdf

O P
14
9
11
9
10
7
15
18
15
10
12
13
12
14
15
9
9
23
17
8

5
5
6
4
4
4
5
5
4
5
5
6
6
4
3
6
5
4
6
5

O P
12
11
10
9
21
13
9
14
10
12
10
15
6
8
8

4
4
4
4
5
6
5
5
6
5
5
3
5
4
5

Figure 1 : 94 dpartements prsents dans l'analyse.

Figure 2 : Cartographie des rsultats de l'lection de 1988 aprs centrage.


ISFA 2 / D. Chessel / Janvier 2004

nonc - Corrig /

...

/exos/exov.pdf

Figure 3 : Cartographie des rsultats de l'lection de 2002 aprs centrage.


ISFA 2 / D. Chessel / Janvier 2004

nonc - Corrig /

...

/exos/exov.pdf

1 2 3
4 5 6
Figure 4. Graphes des valeurs propres de 6 ACP (Analyses en Composantes Principales).

Figure 5 : Cartes factorielles des variables de deux ACP centres.


ISFA 2 / D. Chessel / Janvier 2004

nonc - Corrig /

...

/exos/exov.pdf

Figure 6 : Cartographie des coordonnes de deux ACP centres.

ISFA 2 / D. Chessel / Janvier 2004

nonc - Corrig /

...

/exos/exov.pdf

ISFA 2me anne 2003-2004 - Analyse des donnes - Thorie Solution

1. Par dfinition :

1
1
1
1
3
(12 + 02 ) + (12 + 12 ) + (12 + 12 ) + ( 02 + 12 ) =
2
4
4
4
4

2. Les poids des lignes valent 1/4. Les moyennes valent 3/4. Les variances valent

4 . La matrice de

corrlation est :
1

1 3 2 2 2 2 4 3

R=
=

2 0
1 2 2
2
3

Les axes principaux sont les deux vecteurs propres.

0 2
2

2
2
3
2

2
2
2

3. En suivant les dfinitions :

0
0
1 6 0
1 1
0 13 0

0 0
0
1 2 0

DI =
DJ =
P
=
0

0
0 0
0 13 0
0 1 2

0
0 1 6
0
1 1

3 2
T
AT A =
qui a les valeurs propres 5 et 1. Donc AA a les valeurs propres
2 3
5, 1 et 0 (valeur propre associe un sous-espace propre de dimension 2).

4. Il faut diagonaliser

5. Par dfinition, les racines des valeurs propres de la prcdente, soit


6. La somme vaut 1000. En effet, comme x = 1000 :

5 et 1.

j =1 ij

p
j =1

xj =

1 p
n
1 n
x = i =11000 = 1000

j =1 i =1 ij
n
n

7. Examiner les cartes pour retrouver la position ou examiner le tableau.


Mitterrand dans les Alpes Maritimes, en 1988 : -99.
Le Pen dans la Corrze en 2002 : -81.5
Chirac dans la Corrze en 1988 : +189.3
Chevnement dans le Territoire de Belfort en 2002 : +140.2

8. La figure donne la carte des carts au rsultat moyen de chaque candidat dans chaque dpartement.
En gnral, ces cartes sont structures et donne des indications sur les tendances rgionales en
faveur ou en dfaveur des candidats. On peut comparer les cartes d'une mme lection, les cartes des
candidats homologues des deux lections, toutes les cartes entre elles. Des faits marquants : les
bastions (la Nivre de F. Mitterrand, la Corrze de J. Chirac, le territoire de Belfort de J.P.
Chevnement, l'apparition de l'cologisme en Alsace), les composantes rgionales fortes (le SudOuest des chasseurs pour Saint-Josse, le dficit des socialistes dans l'Est et le Sud-Est, les rgions
traditionnelles du communisme des mines Nord-Centre-Sud, l'installation de l'extrme droite sur le
pourtour mditerranen, en Alsace, autour de Paris et Lyon) et la grande fracture de l'est pour
l'extrme droite contre l'ouest pour la gauche.

ISFA 2 / D. Chessel / Janvier 2004

nonc - Corrig /

...

/exos/exov.pdf

9. Les valeurs propres comprises entre 0 et 25 sont celles d'ACP normes (inertie totale = trace =
nombre de variables). Le nombre de valeurs propres ne peut dpasser le nombre de variables,
respectivement 9 pour tab1, 16 pour tab2 et 25 pour tab3. Il n'y a alors qu'une possibilit, dans
l'ordre F A B D C E.

10. Les rangs ne peuvent dpasser le nombre de colonnes (respectivement 9 et 16). Mais pour A, la

somme par lignes est nulle (1000-1000, voire question 1). On a A19 = 094 et le rang est major par

8. Pour B, la somme par lignes est nulle (mme argument). On a B1


15.

16

= 094 et le rang est major par

11. Par juxtaposition C = A B . Si u est le vecteur 25 composantes dfinies, dans l'ordre, par 1 (9
fois) et 0 (16 fois) et si v est le vecteur 25 composantes dfinies, dans l'ordre, par 0 (9 fois) et 1 (16
fois) , u et v sont indpendants (orthogonaux) et vrifient Cu = Cv = 094 . Le rang est au plus gal

23.
12. On sait que le rang d'un tableau et le rang de la matrice de covariances associe sont les mmes.
On sait que les carrs des valeurs singulires sont proportionnelles aux valeurs propres, car :
1
1
1
X = UDVT C = XT X = VDUT UDV T = VD 2V T =V VT
n
n
n
Donc C a 23 valeurs propres non nulles et est de rang 23. Alors B est de rang 15 et A est de rang 8
(sinon le rang de C serait strictement infrieur 23).

13. La corrlation est manifestement positive et on peut liminer les valeurs ngatives. Elle est borne
par 1 (c'est un cosinus), elle est leve (au moins 0.5) mais pas caricaturale (moins de 0.95). Il reste
la valeur 0.8032.
Pour refaire la figure de base :
plot(Acoo1,Bcoo1,pch=20,cex=1.5)
abline(h=0,v=0)
abline(lm(Bcoo1~Acoo1),lwd=2)

14. L'quation de la droite de Y/X est

y = ax (les coordonnes sont des variables centres) avec :

ISFA 2 / D. Chessel / Janvier 2004

nonc - Corrig /

...

/exos/exov.pdf

a=

cov ( x, y ) corr ( x, y ) var ( y ) 0.8032 2698


=
=
= 0.7923
var ( x )
2773
var ( x )

car les variances des coordonnes sont les valeurs propres.

15. L'quation de la droite de Y/X est

x = ay donc y =

1
x avec :
a

var ( y )
var ( y )
2698
=
=
= 1.228
cov ( x, y ) corr ( x, y ) var ( x ) 0.8032 2773

a=

16. Les deux variables sont centres et l'axe principal est port par le premier vecteur propre de la matrice de
covariances. La covariance est :

cov ( x, y ) = corr ( x, y ) * var ( x ) var ( y ) = 0.8032* 2773 * 2698 = 2197 .

La matrice de covariances est :

var ( x ) cov ( x , y ) 2773 2197


=

cov ( x, y ) var ( y ) 2197 2698

.C =

La premire valeur propre de cette matrice est :


2
1
= var ( x ) + var ( y ) + 4 cov 2 ( x, y ) + ( var ( x ) var ( y ) )

1
2773 + 2698 + 4* 2197 2 + 752 = 4933
2

Le premier vecteur propre vrifie 2773x + 2197 y = 4932 * x et la pente vaut

4932 2773
= 0.983 .
2197

Pour refaire la figure


abline(c(0,1.228),lwd=2,col="red")
abline(c(0,0.983),lwd=3,col="blue",lty=2)

ISFA 2 / D. Chessel / Janvier 2004

nonc - Corrig /

...

/exos/exov.pdf

17. La somme des composantes est nulle. En effet, d'aprs la question 4, 1

est vecteur propre pour 0,


donc les axes principaux lui sont orthogonaux, donc la somme des composantes d'un axe principal
est nulle. La somme des carrs des composantes est gale 1, car il s'agit de vecteurs unitaires.
9

sum(pca1$c1[,1])
[1] -3.563e-16

sum(pca1$c1[,1]^2)
[1] 1

sum(pca2$c1[,1])
[1] -2.516e-16

sum(pca2$c1[,1]^2)
[1] 1

18.Les deux scores des dpartements sont trs lis (question 8). Les coefficients des variables sont
donc associs. On peut les reprsenter par un dotchart :

La coordonne exprime l'opposition Le Pen contre Chirac-Mitterand dans le premier cas, Le Pen contre
Jospin-Chirac dans le second. C'est la mme carte et la mme signification politique. On a augment le
nombre de candidats mais cette opposition qui prend en compte 40% du rsultat en 1988 reprsente 50%
en 2002. Saint Josse est le seul des candidats de seconde importance prendre une place marque dans
ce schma. Ceci est li la rgionalisation commune dans le Sud-Ouest du candidat des chasseurs et du
candidat socialiste. La position spatiale commune induit une covariance qui n'est pas forcment le
rsultat d'une alliance. La carte de l'opinion d'extrme droite se renforce entre les deux lections.

19. On

observe une inversion des positions relatives Mitterand-Chirac et Chirac-Jospin.


Mathmatiquement, ceci n'a aucune signification car la position dans un sens ou dans l'autre
d'un axe principal ou d'une composante principale est alatoire. La corrlation ngative entre les
deux coordonnes de rang 2 a donc exactement la mme signification que la corrlation positive ente
les deux premires coordonnes. Noter l'association renforce Saint-Josse-Jospin (Sud-Ouest) qui
recouvre une dichotomie gauche-droite classique (particulirement simple en 1988 sous la forme
Barre-Chirac contre Mitterand-Lajoinie).

ISFA 2 / D. Chessel / Janvier 2004

nonc - Corrig /

...

/exos/exov.pdf

20. Reprsentation triangulaire de deux tableaux de rsultats lectoraux aprs simplification trois
composantes. Le premier contient par dpartement les scores de Mitterand+Lajoinie+Waechter+
Juquin+ Laguillier+ Boussel appel Gauche, les scores de Chirac+Barre appel Droite et les
scores de Le Pen appel ED. Le second contient les scores de Jospin+Laguiller+Chevnement
+Mamre+Besancenot+Hue+Taubira+
Gluksten appel
Gauche,
les
scores
de
Chirac+Bayrou+Madelin+Lepage+ Boutin appel Droite et les scores de Le Pen+Saint
Josse+Mgret appel ED. On peut discuter de ce regroupement qui reprend les associations les
plus courantes. Chaque dpartement est alors reprsent par un point (rsultat de 1988) et un vecteur
dont l'extrmit est le rsultat de 2002. Globalement l'volution est gnrale et sans ambigut.
Ou bien, si on se veut un peu plus technique :
Reprsentation triangulaire double de deux tableaux 94 lignes et 3 colonnes. Un point de coordonnes
(x, y, z) est reprsent par son profil (x/s, y/s, z/s) o s=x+y+z. Seule une partie de la reprsentation
dfinie par les trois vecteurs de la base canonique (1,0,0), (0,1,0) et (0,0,1) est utilise. C'est le plus petit
triangle quilatral de la grille du triangle (unit 0.1) qui contient tous les points (en haut et gauche, le
triangle gris). La variable x varie entre 30 et 80%, la variable y entre 20 et 70% et la variable z entre 0 et
50%. Le point 57 (Nivre) a un profil voisin de (0.6, 0.3, 0.1). Si on retourne aux donnes, on a
exactement (la ligne 57 correspond D58) :
D58 445 170 124 97 96 28 18 18 4
donc 1000-294-97 294 97 donc 609 294 97 donc (0.609, 0.294, 0.097). La Nivre est le fief de F.
Mitterand lu en 1988. L'extrmit du vecteur reprsente de la mme manire le rsultat de 2002. Par
exemple pour D58
A
B
C
173 162 201

D E
52 65

F
53

G H I J K L M N O P
50 39 49 31 59 21 15 14 10 6

donc 487 280 233 ou (0.487, 0.280, 0.233). L'extrme droite a gagn plus de 13% des voix exprimes
essentiellement au dtriment de la gauche. Il semble que ce soit le cas gnral.

ISFA 2 / D. Chessel / Janvier 2004

nonc - Corrig /

...

/exos/exov.pdf