Vous êtes sur la page 1sur 3

ENSEA / ISE1 M&E 2023 / 2h DEVOIR 1 : ANALYSE DES DONNEES

Nom …………………………………………………………………… Série M |__| E |__|


Questions de cours (10pts)
1) En se référant à la ressemblance entre individus en ACP, justifier l’intérêt de travailler avec les
variables centrées réduites (ce qui est encore équivalent à utiliser la matrice des inverses des variances
comme produit scalaire ? 1x2=2pts :
i) Pourquoi utiliser les distances ? :
Des individus qui se ressemblent ont les mêmes valauers à peu pres. Et en dimension grande, c’est a mis en forme : Taquets de tabulation : 12,75
la distance qui peut le montrer ……..…………………………………………………………..…… cm,Gauche
……………………….………………………………………………………………………………………. a mis en forme : Espace Avant : 0 pt, Après : 0 pt
Pourquoi réduire ? Pour éliminer l’effet des échelles et des unités
….……………………………………………………………………………………….
……………………….………………………………………………………………………………………. a mis en forme : Espace Après : 6 pt

2) Selon la notion d’information sur l’axe, est-il possible d’avoir un individu qui a une forte DISTO, mais
pas de aucune forte contribution fortes Contributions sur au moins un axe en ACP ? Justifier.
1+0,5=1,5pt
Réponse Oui |__| Non |_X_| Justifier : Forte DISTO entraine au moins une forte coordonnée sur
un axe, donc forte contribution sur cet axe
………………………..…………….………….…………
……………………….……………………………………………………………………………………….
……………………….……………………………………………………………………………………….
3) On considère une analyse des données de sondage. Les réponses aux « item » ou dimensions
(questions) sont données sur une échelle croissante de 1 à 5 avec : 1 = Très mauvais ; 2 = Mauvais ; 3 =
Moyen ; 4 = Assez bien et 5 = Très bien. On rappelle qu’en statistique, ce type de variables peuvent à la
fois être utilisées comme « quantitatives » avec calculs des moyennes, corrélations, etc., mais aussi
comme qualitatives « liaison selon l’approche Khi deux). Par conséquent, il est possible avec de telles
variables, de faire une ACP (en les considérant comme données quantitatives) mais aussi une AFC ou une
ACM (considération comme variables qualitatives) 1x3=3pts
i) Quel est l’intérêt d’opter pour une ACP ? : Rechercher des relations linéaires :
……………………………………………………………….
……………………….……………………………………………………………………………………….
ii) Quel est l’intérêt d’opter pour une ACM ? : Rechercher des relations, même si elles ne sont pas
linéaires …………………………………………………………….
……………………….……………………………………………………………………………………….
……………………….……………………………………………………………………………………….
iii) Les résultats des deux approches seront-elles identiques ? Oui |__| Non |_X_|Justifier …ça ne mesure
pas le même type de relation……………
……………………….……………………………………………………………………………………….
4) Couramment en science, lorsqu’on veut déterminer le poids d’une variable quantitative dans une base
de données quantitatives, on fait une ACP, et on utilise les coordonnées des variables sur le premier axe
comme le « poids ». 1,5pt Comment cela se justifie ? C’est celle qui explique le mieux la plus grande
information
Plus grande coordonnée = plus grande influence sur la plus grande
information…………………………….………………….……
……………………………………………………………………………………………………………….

On écrira uniquement dans les espaces réservés. DES PHRASES SIMPLES COURTES Tiotsop
ENSEA / ISE1 M&E 2023 / 2h DEVOIR 1 : ANALYSE DES DONNEES
Nom …………………………………………………………………… Série M |__| E |__|
……………………………………………………………………………………………………………….
5) En pensant à la notion de valeurs extrêmes, expliquez l’intérêt de rechercher les points ayant de fortes
DISTO et de fortes contributions en ACP 2pts Pour prévenir leurs biais sur la tendance générale
………………………….…………………………………
………………….…………………………………………………………………………………………… a mis en forme : Espace Après : 0 pt, Interligne : 1,5
ligne

Exercice 2 : (10pts) : Pour comprendre les différences entre eaux vendues en bouteilles, un chimiste
souhaite réalise une ACP en utilisant les compositions chimiques des eaux (quantitatives)
1) Combien d’axes sont suffisantes pour l’analyse (utiliser l’histogramme) 1pt Réponse
…Deux……………
Justifier …Les critères du cumul et de Kaiser sont satisfaits. Pas de coude au 3ème. a mis en forme : Exposant
e………………………..................................................................................................................
………………………….................................................................................................................................
HISTOGRAMME DES 8 PREMIERES VALEURS PROPRES
NUME| VAL PRO|% |% Cumul| |
+---+--------+------+-------+--------------------------------------------------------------------------------+
| 1 | 3.8168 |47.71 | 47.71|********************************************************************************|
| 2 | 2.0681 |25.85 | 73.56|******************************************** |
| 3 | 0.9728 |12.16 | 85.72|********************* |
| 4 | 0.7962 | 9.95 | 95.67|***************** |
| 5 | 0.1792 | 2.24 | 97.91|**** |
| 6 | 0.0924 | 1.16 | 99.07|** |
| 7 | 0.0741 | 0.93 | 100.00|** |
| 8 | 0.0004 | 0.00 | 100.00|* |

2) On donne les caractéristiques chimiques (valeurs pour les variables) d’une eau qu’on nommera
« ISE1 ». En utilisant le graphique des variables, et en comparant les caractéristiques chimiques de l’eau
ISE 1 avec les valeurs moyennes, des variables, dans quelle zone peut on placer ce point (marque d’eau) ?
Nord Est |_X_| Nord Ouest |__| Sud Est |__| Sud Ouest |__| 2Pts
Justifier …ISE1 a de faibles valeurs pour les caractéristiques biens représentées (CA et MG par
exemples) ………….……………………………………………………………………………………….
……………………….……………………………………………………………………………………….
STATISTIQUES. SUR VARIABLES. variables Eau ISE1
--------+------------------+-------+ CA 44,8
| NUM . IDEN - LIBELLE EFF |MOYENNE| MG 6,1
+--------------------------+-------+ NA 8,9
| 4 . C6 - CA 57 102.46 | K 1,9
| 5 . C7 - MG 57 25.86 |
SUL 3,8
| 6 . C8 - NA 57 93.85 |
| 7 . C9 - K 57 11.09 | HCO3 156,2
| 8 . C10 - SUL 57 135.66 | CL 17
| 9 . C11 - NO3 57 3.83 |
| 10 . C12 - HCO3 57 442.17 |
| 11 . C13 - CL 57 52.47 |
+--------------------+------+------+

3) Voici les résultats pour une eau particulière ARVIE qui est l’individu le plus original. Interpréter 2pts
selon les COS² et les signes des coordonnées, ARVIE est au NORD OUEST : Très fortes valeurs de
NA, K MG et HCO et valeurs inférieures à la moyenne pour CA et SUL.
……………………….............................................................................................................................
..........................................................................................................................................................................
..........................................................................................................................................................................
INDIVIDUS | COORDONNEES | CONTRIBUTIONS | COSINUS CARRES |
|----------------------------+-------------------------------+--------------------------+--------------------------|
|IDENTIFICATEUR P.REL DISTO | AXE1 AXE2 AXE3 AXE4 AXE5 | AXE1 AXE2 AXE3 AXE4 AXE5| AXE1 AXE2 AXE3 AXE4 AXE5 |

On écrira uniquement dans les espaces réservés. DES PHRASES SIMPLES COURTES Tiotsop
ENSEA / ISE1 M&E 2023 / 2h DEVOIR 1 : ANALYSE DES DONNEES
Nom …………………………………………………………………… Série M |__| E |__|
| ARVIE 1.75 52.52 | -6.51 2.67 0.10 0.35 -1.25 | 19.5 6.1 0.0 0.3 15.4 | 0.81 0.14 0.00 0.00 0.03 |
|----------------------------+-------------------------------+--------------------------+--------------------------|

4) A partir du graphique, donner le sens de chaque axe 1x2=2pts


Axe 1 : Illustre la teneur en NA, K MG, HCO, et un peu en CL
.............................................................................................................................................................
Axe 2 : Illustre la teneur en SUL et CA
.............................................................................................................................................................
5) Pour chaque axe, donnez les modalités interprétables 1x2=2pts
Axe 1 : Toutes
.............................................................................................................................................................
Axe 2 : G et P
.............................................................................................................................................................
COORDONNEES ET VALEURS-TEST DES MODALITES AXES 1 A 5
+-----------------------------------------+- valeurs Test (V.Test) -------+------Coordonnées-------------------+----+
| 2 . TYPE 1 2 3 4 5 1 2 3 4 5 | a mis en forme : Justifié, Espace Avant : 3 pt
| AB_1 - C4=M 38 38.00 | -2.5 -0.5 -1.2 -0.7 0.4 | -0.46 -0.07 -0.11 -0.06 0.01 |0.23|
| AB_2 - C4=S 19 19.00 | 2.5 0.5 1.2 0.7 -0.4 | 0.92 0.13 0.22 0.11 -0.03 |0.94|
+----------------------------------------+-------------------------------+------------------------------------+----+
| 3 . PG |
| AC_1 - C5=G 16 16.00 | -3.5 2.7 -0.5 -1.8 0.3 | -1.44 0.82 -0.11 -0.34 0.03 |2.89|
| AC_2 - C5=P 41 41.00 | 3.5 -2.7 0.5 1.8 -0.3 | 0.56 -0.32 0.04 0.13 -0.01 |0.44|
+----------------------------------------+-------------------------------+------------------------------------+----+

6) Caractérisez l’eau ARVIE selon les modalités .Type = M, et PG=G (eau minérale gazeuse)
..........................................................................................
………………………….................................................................................................................................

On écrira uniquement dans les espaces réservés. DES PHRASES SIMPLES COURTES Tiotsop

Vous aimerez peut-être aussi