Vous êtes sur la page 1sur 7

ENCG Settat Professeur R.

Jahidi

Examen d’analyse des données


(documents non autorisés)

Exercice 1 : On a croisé lors d’une étude sur le comportement des touristes les variables
dépenses séjour et modes d’hébergement. Quelles conclusions tirés vous de l’analyse qui a
été faite ?
Résultats de l’analyse AFC :
Tableau des correspondances

Quel est votre mode d'hébergement ?


dépenses sejour Hôtel Camping Location / gîte Famille / amis Marge active
-1500 8 21 14 38 81
[1500,3000[ 7 31 40 52 130
[3000,4500[ 26 8 13 17 64
[4500,6000[ 7 2 7 7 23
[6000,10000[ 10 1 7 7 25
[10000,15000[ 2 2 2 0 6
+15000 2 0 6 2 10
Marge active 62 65 89 123 339

Résumé

Valeur singulière de
Proportion d'inertie confiance
Corrélatio
Valeur Pris en n
Dimension singulière Inertie Khi-deux Sig. compte Cumulé Ecart-type 2
1 ,402 ,161 ,776 ,776 ,051 -,002
2 ,190 ,036 ,174 ,950 ,056
3 ,102 ,010 ,050 1,000
Total ,208 70,511 ,000a 1,000 1,000
a. 18 degrés de liberté

Caractéristiques des points lignesa

Score dans la
dimension Contribution
De point à inertie de
dimension De dimension à inertie de point
dépenses sejour Masse 1 2 Inertie 1 2 1 2 Total
-1500 ,239 -,450 -,467 ,030 ,121 ,273 ,655 ,333 ,989
[1500,3000[ ,383 -,509 ,226 ,044 ,247 ,103 ,912 ,085 ,997
[3000,4500[ ,189 ,888 -,307 ,063 ,371 ,094 ,944 ,054 ,997
[4500,6000[ ,068 ,583 ,245 ,010 ,057 ,021 ,885 ,074 ,959
[6000,10000[ ,074 ,974 ,131 ,029 ,174 ,007 ,958 ,008 ,966
[10000,15000[ ,018 ,582 ,217 ,011 ,015 ,004 ,223 ,015 ,237
+15000 ,029 ,455 1,792 ,021 ,015 ,498 ,119 ,872 ,991
Total actif 1,000 ,208 1,000 1,000
a. Normalisation principale symétrique

Caractéristiques des points colonnesa

Score dans la
dimension Contribution
De point à inertie de
Quel est votre mode dimension De dimension à inertie de point
d'hébergement ? Masse 1 2 Inertie 1 2 1 2 Total
Hôtel ,183 1,278 -,263 ,122 ,743 ,067 ,980 ,020 ,999
Camping ,192 -,568 -,340 ,035 ,154 ,116 ,716 ,122 ,838
Location / gîte ,263 -,009 ,727 ,027 ,000 ,730 ,000 ,997 ,997
Famille / amis ,363 -,337 -,214 ,024 ,103 ,087 ,679 ,129 ,808
Total actif 1,000 ,208 1,000 1,000
a. Normalisation principale symétrique

1
Points de lignes pour dépenses
Symétrique Normalisation
2,0
+15000

1,5

1,0

,5
[1500,3000[ [1[0
4500,
0 6
1000
5 [0[
Dimension 2

[6000,10000[

0,0
[3000,4500[
-1500
-,5
-,6 -,2 ,2 ,6 1,0
-,4 -,0 ,4 ,8
Dimension 1

Points de colonnes pour Quel est votre mode


Symétrique Normalisation

,8 Location / gîte

,6

,4

,2

0,0
Famille / amis
-,2 Hôtel
Camping
-,4
-1,0 -,5 0,0 ,5 1,0 1,5

Dimension 1

Points de ligne et de colonne

Symétrique Normalisation
2,0
+15000

1,5

1,0
Location / gîte

,5
[1500,3000[ [1[0
405 00,1
650 00 [0[
[6000,10000[

0,0 Quel est votre mode


Famille / amis
C amping [3000,4500H
[ ôtel d'hébergement ?
-1500
-,5 dépenses sejour
-1,0 -,5 0,0 ,5 1,0 1,5

Dimension 1

2
Exercice 2 : Afin de comparer différentes marques d’eaux, on a fait une analyse de leur
composition en calcium, magnésium, potassium, bicarbonates, sulfates, sodium et nitrates. En
analysant les résultats d’une ACP sur ces données, quelles conclusions pouvez-vous en tirer ?
Résultats de l’analyse ACP :
Matrice de corrélation

Calcium Magnésium Potassium Bicarbonates Sulfates Sodium Nitrates


Calcium 1,000 ,374 ,478 ,861 ,073 ,540 ,031
Magnésium ,374 1,000 ,195 ,557 -,401 ,332 ,298
Potassium ,478 ,195 1,000 ,563 -,053 ,932 -,274
Bicarbonates ,861 ,557 ,563 1,000 -,093 ,653 ,103
Sulfates ,073 -,401 -,053 -,093 1,000 -,158 -,512
Sodium ,540 ,332 ,932 ,653 -,158 1,000 -,218
Nitrates ,031 ,298 -,274 ,103 -,512 -,218 1,000

Interprétation :
la matrice de corrélation permet d’identifier les variables qui ont une forte corrélation entre elles, ce qui
nous permet de les regroupés en dimensions homogènes.
D’après le tableau, on peut constater l’existence des fortes corrélations comme celle entre le SODIUM et le
Potassium d’une valeur de 0,932 .Cependant on remarque que la plupart des corrélations sont faible, alors
les variables sont hétérogènes.
Indice KMO et test de Bartlett

Mesure de précision de l'échantillonnage de Kaiser-


Meyer-Olkin. ,643

Test de sphéricité de Khi-deux approximé 26,309


Bartlett ddl 21
Signification de Bartlett ,195
Interprétation :
L’indice de KMO : on a un KMO de 0,643 qui est supérieur à 0,5 ce qui implique une analyse de
composante principale intéressante, alors la suppression de certaines variables initiales ne s’avère pas
nécessaire.
Test de Barlett : On a une valeur faible de khi-deux (26,309) et une signification de Bartlett qui n’est pas
très proche de 0, alors il ya une faible corrélation entre les variables .
Qualité de représentation

Initial Extraction
Calcium 1,000 ,658
Magnésium 1,000 ,639
Potassium 1,000 ,776
Bicarbonates 1,000 ,829
Sulfates 1,000 ,615
Sodium 1,000 ,829
Nitrates 1,000 ,751
Méthode d'extraction : Analyse en composantes principales.

Interprétation :
On a des valeurs d’extraction qui sont proche de 1 avec des pourcentages qui varient entre 60% et
80% donc les variables sont bien représentées
.
Variance totale expliquée

Composante Valeurs propres initiales

3
% de la
Total variance % cumulés
1
2 1,814
3 ,941 13,438 86,232
4 ,534 7,627 93,859
5 ,277 3,957 97,816
6 ,101 1,447 99,263
7 ,052 ,737 100,000
Méthode d'extraction : Analyse en composantes principales.

Interprétation :
Dans le tableau de la variable totale expliquée on ne retient que les valeurs propres qui sont supérieures à 1. Et vue que le
total des Valeurs propres initiales des composantes est généralement ordonné d’une façon décroissante ça implique que la première
composante est supérieure à la deuxième composante qui est de son tour supérieur à 1.Alors on va retenir les 2 premières
composantes.

Le % cumulés de la composante 2 est « 86,232-13,438= 72,794 ».


Alors malgré la réduction des variables de 7 variables à 2 composantes principales, la richesse de ces dernières en termes
d’information retenus dépasse les 70%.

4
Matrice des composantes(a)

Composante
1 2
Calcium ,809 -,055
Magnésium ,583 ,546
Potassium ,808 -,350
Bicarbonates ,906 ,084
Sulfates -,191 -,760
Sodium ,880 -,232
Nitrates -,010 ,866
Méthode d'extraction : Analyse en composantes principales.
a 2 composantes extraites.

Interprétation :

La matrice des composantes nous permet de vérifier les variables est bien représenté graphiquement
Pour faire ce ci il faut les lever au carré et leur somme doit être inférieure à 1

Exemple : « Calcium » : 0,809²+ (-0,055)² =0,658 < 1 =>la variable est bien représenté

D’après le tableau, la première composantes est expliquée par les variables suivantes « Calcium, Potassium,
Bicarbonates, et Sodium » et la deuxième est expliquée par « Sulfates et Nitrates » alors que la variable
« Magnésium » explique les deux à la fois.

Diagramme de composantes

1,0
Nitrates

Magnésium
0,5
Composante 2

Bicarbonates

0,0
Calcium
Sodium
Potassium

-0,5

Sulfates

-1,0

-1,0 -0,5 0,0 0,5 1,0


Composante 1

Interprétation
Grace à ce diagramme nous constatons que tous variables sont proches par rapport aux axes qui les
représentent sauf la variable Magnésium. Alors une rotation s’avère nécessaire.

5
qualité de représentation des individus

marque Cos²_1 Cos²_2 QUALITE

Perrier ,12 ,05 ,17


Ain Saltan ,09 ,72 ,81
Ain Saiss ,01 ,56 ,57
Sidi Ali ,65 ,18 ,83
Sidi Harazem ,03 ,02 ,05
Oulmes ,79 ,06 ,85
Badoit ,82 ,00 ,82
Vittel ,19 ,55 ,74
Evian ,56 ,03 ,59

Interprétation
La qualité est obtenue grâce à la sommation de deux composantes, le résultat nous a donné des valeurs proches
à 1. Ce qui implique une bonne représentation des pays.
Cependant Perrier(0,17) et Sidi Harazem(0,05) sont mal représentées

6
Carte des individus

2,00000
Ain Saltan
REGR factor score 2 for analysis 1

Ain Saiss
1,00000

Evian Badoit
0,00000
Sidi Harazem
Perrier
Oulmes

Sidi Ali
-1,00000

Vittel

-2,00000

-1,00000 0,00000 1,00000 2,00000


REGR factor score 1 for analysis 1

Interprétation

On distingue les regroupements suivants :


Les marques qui ont une composition importantes en Nitrates : Ain saltan et Ain saiss
Les marques qui ont une composition importantes en sulfates : Sidi Ali et Vittel
Les marques qui ont une composition importantes en Magnésium : Evian , Sidi Harazem, et Perrier
Les marques qui ont une composition importantes en Bicarbonates, Sodium, Potassium, et Calcium :
Badoit et Oulmes.

AT

Exercice 3 : Une banque locale Z désire s'associer avec une importante banque internationale,
déjà implantée dans le pays. Quatre banques A, B, C, D sont candidates à cette association.
Pour augmenter les chances de réussite de l'association, Z a le souci (parmi d'autres critères de
décision) de s'allier avec un organisme ayant une image voisine de la sienne.
Une étude d'image, auprès de 5 échantillons de 500 clients des différentes banques, permet
d'obtenir le tableau suivant, donnant le pourcentage de clients interrogés plutôt d'accord pour
caractériser les banques existantes et Z, selon 2 attributs : proche de ses clients et offrant des
services de qualité.

Proche de ses clients Offrants des services de qualité


A 43 68
B 65 65
C 60 63
D 55 43
Z 63 58

a) Procédez à une classification ascendante hiérarchique des 5 banques.


Vous utiliserez, comme indice d’agrégation entre 2 groupes de banques, le saut minimum.
b) Quel conseil allez-vous donner à la banque Z suite aux résultats de votre classification.
7

Vous aimerez peut-être aussi