Vous êtes sur la page 1sur 24

Application ADD CAS AUTOMOBILES

Analyse en
composantes
principales
ACP
1
Application ADD CAS AUTOMOBILES
Objecti ! mes"rer la satisaction #es
in#i$i#"s par rapport % &"el&"es attrib"ts #e
le"rs $oit"res 'La $itesse( Le conort( La s)c"rit)(
La ten"e #e ro"te( L*espace( L*est+)ti&"e( La
consommation( La poll"tion L*entretien,-
Statisti&"es #escripti$es !
Interpr)tation !
Avec une moyenne de 3,31, lespace de
la voiture reprsente la caractristique

Moyenne
Ecart.
type n analyse
La $itesse /(01 2(132 240
Le conort /(/5 (403 240
La s)c"rit) /(55 (627 240
La ten"e #e
ro"te
/(52 (655 240
L*espace /(/2 (403 240
L*est+)ti&"e /(31 2(113 240
La
consommation
/(51 2(287 240
La poll"tion /(55 (357 240
L*entretien /(/0 (846 240
2
Application ADD CAS AUTOMOBILES
qui satisfait le moins les possesseurs de
voitures de lchantillon contrairement
lesthtique de la voiture qui avec une
moyenne de 3,9 est la caractristique qui
leur procure le plus de satisfaction.
On remarque galement lasence dune
grande dispersion chose qui implique une
certaine homognisation quant au
degr de satisfaction des individus
interrogs par rapport au! attriuts de
leurs voitures "# satisfaction moyenne
ne dpassant pas 3,9 $
Matrice #e corr)lation !

La
$ite
sse
Le
conor
t
La
s)c"rit)
La
ten"e
#e
ro"te
L*esp
ace
L*est+
)ti&"
e
La
conso
mmati
on
La
poll"tion
L*entre
tien
La $itesse
2(1
11
(505 (862 (808
(
50
3
(404 .(254 (134 .(157
Le conort
(
505
2(11
1
(523 (5/8
(
63
8
(547 (126 (186 .(158
La s)c"rit)
(
862
(523 2(111 (405
(
52
8
(881 .(273 (712 (118
La ten"e #e
ro"te
(
808
(5/8 (405
2(11
1
(
55
3
(870 .(16/ (758 (1/6
L*espace
(
503
(638 (528 (553
2(1
11
(531 .(155 (112 .(162
L*est+)ti&"e
(
404
(547 (881 (870
(
53
1
2(111 .(280 (147 (10/
La
consommatio
n
.(2
54
(126 .(273 .(16/
.(1
55
.(280 2(111 (273 (283
La poll"tion
( (186 (712 (758 ( (147 (273 2(111 (70/
3
Application ADD CAS AUTOMOBILES
134
11
2
L*entretien
.(1
57
.(158 (118 (1/6
.(1
62
(10/ (283 (70/ 2(111
Interpr)tation !
%a matrice de corrlation nous permet de
dceler les variales forte corrlation
pouvant &tre regroupes
%a matrice de corrlation ne comporte
pas asse' de valeurs leves pour parler
de(et de taille.
%a plupart des variales prsentent de
fortes corrlations, une analyse en
composantes principales sav)re donc
intressante. *n e(et pour pouvoir
e!traire une composante, celle+ci devrait
comporter des variales su,samment
intercorrles.
*!emple - les variales . confort et
espace / sont fortement corrles avec
une corrlation gale 0.192 "# en e(et
plus la voiture est spacieuse plus le
confort est garanti .
In#ice 9MO et test #e Bartlett !
3esure de prcision de
l4chantillonnage de 5aiser+3eyer+Ol6in.
(45/
4
Application ADD CAS AUTOMOBILES
7est de sphricit
de 8artlett
5hi+deu!
appro!im
461(23
3
99%
/0
:igni;cation de
8artlett
(111
Interpr)tation !
%indice 53O tant gal 0,<=3 est
moyennement fort ce qui implique que
les corrlations partielles ne sont pas
trop importantes par rapport au!
corrlations simples "# la suppression
de variales initiales ne sav)re pas
ncessaire
%e test de sphricit de 8A>7%*77 - %a
valeur du 6hi deu! est
appro!imativement leve et la
signi;cation de 8A>7%*77 est proche de
0 "# les variales sont su,samment
corrles.
:ariance totale e;pli&")e !
5
Application ADD CAS AUTOMOBILES
Composante
:ale"rs propres initiales
E;traction Sommes #es carr)s
#es acte"rs reten"s
Total
< #e la
$ariance < c"m"l)s Total
< #e la
$ariance < c"m"l)s
2
3,<91 =?,191 =?,191 3,<91 =?,191 =?,191
7
1,=19 12,<@3 2<,9@1 1,=19 12,<@3 2<,9@1
/
1,13@ 1?,@?3 <0,21= 1,13@ 1?,@?3 <0,21=
5
,<9@ 1,1=@ <9,=?9
8
,<?0 1,003 1<,=3?
0
,2<@ @,39@ 93,1?1
4
,?32 ?,@13 9@,==1
6
,??0 ?,==2 91,11@
3
,100 1,11= 100,000
3thode d4e!traction - Analyse en composantes
principales.
Interpr)tation !
9ans le taleau de la variance totale
e!plique on ne retient que les valeurs
propres qui sont suprieures 1, dans ce
cas elles correspondent au! trois
premi)res composantes qui quivalent
plus de <0A de variance cumule
e!plique.
%a premi)re valeur propre reprsente
elle seule =?A de variance e!plique car
elle reprsente le plus de variales et
donc dtient la plus grande part
dinformations.
3algr la rduction de 9 variales 3
composantes la richesse de ces derni)res
6
Application ADD CAS AUTOMOBILES
en terme dinformations retenues
dpasse <0A.
1 2 3 4 5 6 7 8 9
Numro de composant
0
1
2
3
4
V
a
l
e
u
r

p
r
o
p
r
e
Graphique des valeurs propres
Interpr)tation !
%es valeurs propres rcupres Busquau
coude correspondent au nomre da!es
retenus.
7
Application ADD CAS AUTOMOBILES
Cependant on ne retiendra que les ?
premi)res composantes pour une
reprsentation avec deu! a!es parce que
leurs valeurs propres sont suprieures 1.
Matrice #es composantes 'a-
Composante
2 7 /
La $itesse (628 .(15/ .(233
Le conort (407 .(256 (8/7
La s)c"rit) (437 (2/4 .(742
La ten"e #e ro"te (435 (238 .(718
L*espace (403 .(772 (537
L*est+)ti&"e (618 .(12/ .(208
La consommation .(254 (502 (056
La poll"tion (265 (455 .(132
L*entretien .(114 (47/ (1/7
M)t+o#e #*e;traction ! Analyse en composantes
principales,
a / composantes e;traites,
Interpr)tation !
%a matrice des composantes nous permet de
vri;er que le point est ien reprsent
graphiquement, et ceci grDce au! trois
composantes 1 E ? et 3 pour ce il faut les lever
au carr et leur somme doit &tre infrieur 1.
la variale . vitesse / -
8
Application ADD CAS AUTOMOBILES
0,112FG0,0=3FG0,199F" 0,<0 H 1
variale . confort / -
0,<@?FG0,1=1FG0,23?F" 0,11 H1
%es deu! variales sont ien reprsentes
graphiquement donc leurs points sont proches
du cercle de corrlation.
%a premi)re composante est e!plique par les
variales suivantes . vitesse, confort,
scurit, tenue de route, esthtique, espace /,
et la ?
)me
composante regroupe les variales
. pollution et entretien / en;n la 3
)me

composante e!plique par une seule
variale - la consommation.
Dia=ramme !
9
Application ADD CAS AUTOMOBILES
REGR factor score 1 for
analysis 5
-4,00000
-3,00000
-2,00000
-1,00000
0,00000
1,00000
2,00000
3,00000
R
E
G
R

f
a
c
t
o
r

s
c
o
r
e



2

f
o
r

a
n
a
l
y
s
i
s

5
Quelle est la
marque de votre
voiture ?
Renault
Peueot
!itro"n
#ol$s%aen
&iat
&ord
'o(ota
)*+
*er,edes
-.el
#olvo
/utre
Interpr)tation !
%es individus sont regroups autour de
lorigine de la!e qui reprsente la moyenne
de lchantillon, il est par consquent di,cile
de distinguer les di(rents groupes.
Cependant on peut dduire quelques
conclusions -
>enault est la voiture qui procure le plus
de satisfaction ses possesseurs
contrairement la marque ;at.
Toyota s>a$?re la $oit"re &"i r)pon# le
moins a"; e;i=ences atten#"es par les
consommate"rs repr)sent)es ici % tra$ers
la 7
?me
composante % sa$oir la poll"tion
et l>entretien
10
Application ADD CAS AUTOMOBILES
Interpr)tation !
IrDce ce diagramme nous constatons que
les variales sont su,samment proches par
rapport au! a!es qui les reprsentent, une
rotation nest donc pas ncessaire.
@"alit) #e repr)sentation !
Initial E;traction
La $itesse
1,000 ,<0@
Le conort
1,000 ,11@
La s)c"rit)
1,000 ,<?0
La ten"e #e ro"te
1,000 ,<11
11
-1,0
-0,5
0,0
0,5
1,0
-1,0
-0,5
0,0
0,5
1,0
C
o
m
p
o
s
a
n
t
e

2
-1,0
-0,5
0,0
0,5
1,0
vitesse
,on0ort
se,urite
tenue1de
es.a,e
est2etiq
,onsomma
.ollutio
.er01ent
Diaramme de composantes
Application ADD CAS AUTOMOBILES
L*espace
1,000 ,11?
L*est+)ti&"e
1,000 ,@<2
La consommation
1,000 ,@23
La poll"tion
1,000 ,292
L*entretien
1,000 ,2?=
M)t+o#e #*e;traction ! Analyse en composantes
principales,
Interpr)tation !
%es e!tractions sont otenues grDce la sommation
des cosF des trois composantes, aussi elles nous
permettent de vri;er la onne reprsentation des
variales. Ainsi plus la valeur de le!traction est proche
de 1, plus la variale qui lui correspond est mieu!
reprsente.
Analyse typolo=i&"e
AT
12
Application ADD CAS AUTOMOBILES
Matrice #e pro;imit) !
Oservation Jnput du ;chier matrice

%a
vitesse
%e
confort
%a
sc
urit

%a
tenu
e de
route
%4esp
ace
%4esthti
que
%a
con
som
mat
ion
%a
pollutio
n
%4entreti
en
%a vitesse
,000 11<,=<9
1=@,
@31
12?,
11@
11@,
001
11,@11
=01
,=<
1
31@,03
1
3@=,2=?
13
Application ADD CAS AUTOMOBILES
%e confort
11<,=<9 ,000
?03,
=@0
19<,
2<9
3@,1
2@
11=,<?<
3=3
,@9
?
3?9,22
9
3@2,@==
%a scurit
1=@,@31 ?03,=@0 ,000
1?,<
@9
?0=,
21?
12<,39@
392
,03
@
?<9,<=
0
3=1,132
%a tenue de
route 12?,11@ 19<,2<9
1?,<
@9
,000
193,
010
1@2,1<=
3<1
,19
1
?@=,?=
?
33@,<@1
%4espace
11@,001 3@,12@
?0=,
21?
193,
010
,000 1<1,=13
3@2
,31
@
3=9,11
?
3<1,=9?
%4esthtique
11,@11 11=,<?<
12<,
39@
1@2,
1<=
1<1,
=13
,000
=0=
,29
1
3?=,10
9
3?<,901
%a
consommatio
n
=01,=<1 3=3,@9?
392,
03@
3<1,
191
3@2,
31@
=0=,291
,
000
30=,11
@
?9=,113
%a pollution
31@,031 3?9,229
?<9,
<=0
?@=,
?=?
3=9,
11?
3?=,109
30=
,11
@
,000 ?2<,90@
%4entretien
3@=,2=? 3@2,@==
3=1,
132
33@,
<@1
3<1,
=9?
3?<,901
?9=
,11
3
?2<,90
@
,000
Cette matrice rv)le les distances
e!istantes entre les di(rentes
variales, par consquent plus la
distance entre deu! variales est faile
plus on peut facilement les agrger.
On peut par e!emple agrger . 7enue
de route / avec . scurit /, aussi
. lesthtique / avec . la vitesse / et
m&me . lespace / avec . le confort /.
14
Application ADD CAS AUTOMOBILES
C+aAne #es a=r)=ations
*tap
e
>egroupement
de classes
Coe,cie
nts
*tape
d4apparition
de la classe
*tape
suivant
e

Classe
1
Classe
?
Class
e 1
Class
e ?
1 ? 2 11,=?1 0 0 <
? 1 @ 29,?3< 0 0 =
3 3 = 100,@?? 0 0 =
= 1 3 ?12,0=9 ? 3 <
2 1 9 3==,00? 0 0 @
@ < 1 200,@13 0 2 1
< 1 ? @<1,<=@ = 1 1
1
1 <
102=,=<
?
< @ 0
9ans cette tape on a rasseml selon un
ordre croissant les variales qui ont une faile
distance.
9ans ltape de lapparition de la classe ;gure
la derni)re phase oK sont apparus les groupes
pour la derni)re fois.
15
Application ADD CAS AUTOMOBILES
%e dendogramme met en vidence la composition
des di(rentes classes, ainsi que lordre dans lequel
elles ont t formes.
%ors de la lecture du dendogramme on doit ien
reprer ou lire le gain dinertie intra classe pour trouver
le seuil idal.
9ans ce cas la il est intressant de faire une coupe
entre la @)me et la <)me tape, vu quon note un saut
tr)s important apr)s ce niveau l.
16
Application ADD CAS AUTOMOBILES
ABO:A !
Avec la septi)me partition

Somme
#es
carr)s ##l
Moyenn
e #es
carr)s C
Si=niDca
tion
La $itesse Jnter+
groupes
10?,232 @ 1<,019 ?<,?9? ,000
Jntra+
groupes
102,1?3 1@9 ,@?@
7otal ?01,321 1<2
Le conort Jnter+
groupes
<1,01? @ 13,01= 1@,3@9 ,000
Jntra+
groupes
?2,=@= 1@9 ,121
7otal 103,2=2 1<2
La
s)c"rit)
Jnter+
groupes
22,=11 @ 9,?32 ?@,022 ,000
Jntra+
groupes
29,901 1@9 ,32=
7otal 112,31? 1<2
La ten"e
#e ro"te
Jnter+
groupes
@0,@2= @ 10,109 ?@,<=0 ,000
Jntra+
groupes
@3,191 1@9 ,3<1
7otal 1?=,2=2 1<2
L*espace Jnter+
groupes
<<,?00 @ 1?,1@< 1?,193 ,000
Jntra+
groupes
?@,?3? 1@9 ,122
7otal 103,=3? 1<2
L*est+)ti&
"e
Jnter+
groupes
1=,010 @ 1=,013 ?2,1<3 ,000
Jntra+
groupes
9=,0<9 1@9 ,22<
7otal 1<1,129 1<2
La
consomma
tion
Jnter+
groupes
9=,=@3 @ 12,<== 19,?92 ,000
Jntra+
groupes
13<,192 1@9 ,11@
17
Application ADD CAS AUTOMOBILES
7otal ?3?,321 1<2
La
poll"tion
Jnter+
groupes
1@,3<1 @ 1=,392 32,??@ ,000
Jntra+
groupes
@9,0@1 1@9 ,=09
7otal 122,=3? 1<2
L*entretie
n
Jnter+
groupes
13,992 @ ?,33? 1,1@< ,000
Jntra+
groupes
==,=2= 1@9 ,?@3
7otal 21,==9 1<2
18
Application ADD CAS AUTOMOBILES
Avec la huiti)me partition -

:omme
des
carrs ddl
3oyenne
des
carrs L
:igni;cati
on
%a vitesse Jnter+
groupes
11@,293 < 1@,@2@ 30,=93 ,000
Jntra+
groupes
91,<@2 1@1 ,2=@
7otal ?01,321 1<2
%e confort Jnter+
groupes
<1,013 < 11,122 <3,29< ,000
Jntra+
groupes
?2,=@3 1@1 ,12?
7otal 103,2=2 1<2
%a scurit Jnter+
groupes
@=,@00 < 9,??9 30,2<3 ,000
Jntra+
groupes
20,<1? 1@1 ,30?
7otal 112,31? 1<2
%a tenue de
route
Jnter+
groupes
<3,1<0 < 10,223 3=,912 ,000
Jntra+
groupes
20,@<@ 1@1 ,30?
7otal 1?=,2=2 1<2
%4espace Jnter+
groupes
<<,?33 < 11,033 <0,<20 ,000
Jntra+
groupes
?@,199 1@1 ,12@
7otal 103,=3? 1<2
%4esthtique Jnter+
groupes
91,<=9 < 13,10< ?2,=13 ,000
Jntra+
groupes
1@,=10 1@1 ,21=
7otal 1<1,129 1<2
%a
consommati
on
Jnter+
groupes 92,231 < 13,@=1 1@,<29 ,000
Jntra+
groupes
13@,1?0 1@1 ,11=
7otal ?3?,321 1<2
%a pollution Jnter+
groupes
1<,12< < 1?,221 31,?0= ,000
Jntra+
groupes
@<,2<= 1@1 ,=0?
7otal 122,=3? 1<2
19
Application ADD CAS AUTOMOBILES
%4entretien Jnter+
groupes
1=,210 < ?,0<3 <,9?@ ,000
Jntra+
groupes
=3,939 1@1 ,?@?
7otal 21,==9 1<2
%a variale . entretien / se distingue par la
faile valeur de son ;sher qui est gale
<.9?@
20
Application ADD CAS AUTOMOBILES
ClassiDcation en n")es
#ynami&"es !

Centres #e classes initia";


Classe
2 7 / 5 8 0 4 6
Escore! La
$itesse
+,23@
<<
+
1,=20
30
+
1,=20
30
+
?,3@3
1=
+,23@
<<
+
?,3@3
1=
+,23@
<<
1,?90
30
Escore! Le
conort
,
1@1<2
,
1@1<2
+
3,01@
13
+,=30
11
+
1,<?3
20
+
3,01@
13
+,=30
11
?,12=
31
Escore! La
s)c"rit)
+,210
2<
+
1,<12
2?
+
1,<12
2?
+
?,9?0
=<
1,199
33
+
?,9?0
=<
,
@9=31
,
@9=31
Escore! La
ten"e #e ro"te
+,=<3
11
+
?,13?
00
+,=<3
11
+
?,13?
00
,
<0@33
+
?,13?
00
+,=<3
11
1,112
<1
Escore!
L*espace
,
90@01
,
90@01
+
3,002
2?
+,39<
<9
,
90@01
+
1,<01
@@
+,39<
<9
?,?09
9=
Escore!
L*est+)ti&"e
,
1010<
+
1,11@
<1
+
1,11@
<1
+
?,110
@1
1,09=
9<
+,19?
1?
+,19?
1?
1,09=
9<
Escore! La
consommation
,
21<<2
,
21<<2
+
?,012
<1
,
21<<2
+,320
10
,
21<<2
1,312
29
+
1,?1<
9=
Escore! La
poll"tion
+,=<0
?2
+
1,231
33
+,=<0
?2
+
?,29?
=?
+
1,231
33
+
?,29?
=?
1,@21
91
+,=<0?
2
Escore!
L*entretien
?,1=1
?9
+,@19
31
1,110
9@
+
=,010
0@
+,@19
31
+,@19
31
+,@19
31
+,@193
1
Ce sont des coordonns des centres initiau!, ils
permettent de connaMtre le point de dpart de
lalgorithme.
Jl est ncessaire de voir le centre de classes ;nales
pour pouvoir faire une interprtation.
21
Application ADD CAS AUTOMOBILES
Fistori&"e #es it)rations
Jtration Changements dans les centres de classes
1 ? 3 = 2 @ < 1
1
?,0<2 ?,=31 1,<?3 ,000 ?,=0= ?,033
1,1
?1
?,0=0
?
,?<@ ,=19 ,@=1 ,000 ,@?0 ,929
,
3@
=
,1<@
3
,1=0 ,1<2 ,313 ,000 ,311 ,21<
,
?0
9
,11@
=
,?11 ,199 ,31< ,000 ,199 ,313
,
??
<
,021
2
,02@ ,112 ,<?2 ,000 ,0<9 ,3?@
,
13
<
,000
@
,000 ,0@= ,000 ,000 ,1=0 ,000
,
00
0
,0@?
<
,000 ,000 ,000 ,000 ,000 ,000
,
00
0
,000
%a convergence otenue est due l4asence ou la
quasi+asence de modi;cations dans les centres de
classes. %a modi;cation asolue ma!imale des
coordonnes d4un centre est ,000. %4itration en cours
est <. %a distance minimale entre les centres initiau!
est =,===.
22
Application ADD CAS AUTOMOBILES
Centre #e classes Dna"; !
Classe
2 7 / 5 8 0 4 6
Escore! La
$itesse
,
1<
1?
?
+,@
=?
1<
+
1,<2=
11
+
?,3@
31=
,
2?
90
3
+
1,21
011
+,20
=1=
,
1332=
Escore! Le
conort
,
3=
=<
0
+,?
11
<3
+
1,931
9=
+,=3
011
+,2
31
29
+
?,09
?13
+,31
=<1
1,031
0?
Escore! La
s)c"rit)
,
0@
1<
1
+,<
11
@=
+
1,313
1<
+
?,9?
0=<
,
@=
=1
<
+
1,3<
1?2
+,33
1==
,
1039?
Escore! La
ten"e #e
ro"te
,
01
<1
3
+,1
3@
0?
+
1,0@?
13
+
?,13
?00
,
3@
?3
3
+
1,31
22<
+,30
=@?
,
1@<1<
Escore!
L*espace
,
31
93
=
+,?
9<
=9
+
1,<01
@@
+,39
<<9
+,3
9<
<9
+
?,0<
=19
+,23
<=9
1,0?=
@1
Escore!
L*est+)ti&
"e
,
=?
=0
9
+,<
39
91
+
1,??=
1?
+
?,11
0@1
,
=3
?3
<
+
1,11
@<1
+,@<
91=
,
<<1<3
Escore! La
consomma
tion
,
30
0<
9
,
32
01
2
+
?,012
<1
,
21<
<2
+,=
??
=?
,
@=1
<?
,
<3=
<1
+,2=<3
3
Escore! La
poll"tion
,
32
?0
9
+
1,1
@=
0=
+,11@2
@
+
?,29
?=?
,
01
@0
1
+,=<
0?2
1,0
0<@
1
+,13?@
=
Escore!
L*entretie
n
1,1
10
9@
+,3
23
11
,
?=2<9
+
=,01
00@
+,@
91
=1
+,1?
200
,
?=2
<9
+,201=
0
On peut constater que les donnes positives
signi;ent que le groupe est caractris par des valeurs
fortes.
23
Application ADD CAS AUTOMOBILES
*!emple - 9ans le premier cas on retient la
vitesse avec la pollution.
Bombre #*obser$ations #ans
c+a&"e classe
Classe 1 =0,000
? ?@,000
3 @,000
= 1,000
2 ?=,000
@ <,000
< ?1,000
1 ==,000
Nalides 1<@,000
3anquantes ?<,000
24