Vous êtes sur la page 1sur 9

Institut Supérieur des Études Technologiques de Mahdia

Département Technologies de l'informatique


Épreuve : Analyse de données
NOM : ……………………………….
Enseignante : Afifa Khélifa
Date : 7 Janvier 2023 PRENOM ……………………………
Durée : 1H30
Calculatrice autorisée CLASSE: IOT2.1
Feuille de réponse
Numéro de compostage (Administration)
Note : /20

………………………………………………………………………………………………………………………………………………………….......................
Lisez attentivement l’énoncé puis répondez aux questions demandées sur la feuille de réponse

Exercice 1 : K-Means (7 points)


On se propose de regrouper les élèves suivants selon leurs notes en deux matières : Arabe
(Note1) et Mathématiques (Note2). Le tableau suivant résume les résultats de 10 élèves.

Question1
Appliquez l’algorithme de K-Means (2 itérations) pour regrouper les élèves en 4 groupes.

Utilisez la distance de Manhattan : d(ei, ej) = |Note1i – Note1j| + |Note2i – Note2j|


Les centres initiaux correspondent aux élèves Mohamed, Rania, Samia et Rim.
Itération1

Elève C1 (…,….) C2 (…,….) C3 (…,…..) C4 (…,…..) Groupe


e1 (17,19) …………. …………. …………. …………. ………….
e2 (7,18) …………. …………. …………. …………. ………….
e3 (16,17) …………. …………. …………. …………. ………….
e4 (15, 5) …………. …………. …………. …………. ………….
e5 (16,7) …………. …………. …………. …………. ………….
e6 (17,6) …………. …………. …………. …………. ………….
e7 (6,7) …………. …………. …………. …………. ………….
e8 (18,18) …………. …………. …………. …………. ………….
e9 (5,16) …………. …………. …………. …………. ………….
e10 (7,7) …………. …………. …………. …………. ………….

Page 1/8
NE RIEN ECRIRE ICI

………………………………………………………………………………………………………………………………………………………….......

Itération2

Elève C1 (…,….) C2 (…,….) C3 (…,…..) C4 (…,…..) Groupe


e1 (17,19) …………. …………. …………. …………. ………….
e2 (7,18) …………. …………. …………. …………. ………….
e3 (16,17) …………. …………. …………. …………. ………….
e4 (15, 5) …………. …………. …………. …………. ………….
e5 (16,7) …………. …………. …………. …………. ………….
e6 (17,6) …………. …………. …………. …………. ………….
e7 (6,7) …………. …………. …………. …………. ………….
e8 (18,18) …………. …………. …………. …………. ………….
e9 (5,16) …………. …………. …………. …………. ………….
e10 (7,7) …………. …………. …………. …………. ………….

Question2
Est-il nécessaire d’effectuer d’autres itérations pour obtenir le résultat final de la
classification ? Pourquoi ?

…………………………………………………………………………………………………
…………………………………………………………………………………………………
…………………………………………………………………………………………………
Question3
Dessinez le résultat final en utilisant les prénoms des élèves dans les partitions

2 /8
NE RIEN ECRIRE ICI

………………………………………………………………………………………………………………………………………………………….......

Question4
Interprétez le résultat final en définissant les caractéristiques de chaque partition.

Groupe Moyenne Moyenne Interprétation


de Note1 de Note2
G1
G2
G3
G4
Question5
Classez les élèves suivants selon leurs notes.

Numéro Note1 Note2 Groupe Explication


e11 8 8
e12 18.5 20
e13 18.5 5.5

Exercice 2 : Regroupement Hiérarchique (5 points)

On se propose d’effectuer une classification hiérarchique en utilisant le diamètre maximal


(complete link). La matrice des distances est donnée dans le tableau suivant :

A B C D E F
A 0
B 0.5 0
C 1 2 0
D 1.25 2.5 0.75 0
E 1.5 4 2.75 3.75 0
F 1.75 2.75 3 3.25 4 0

3 /8
NE RIEN ECRIRE ICI

………………………………………………………………………………………………………………………………………………………….......

Question1
Exécutez 4 itérations de l’algorithme CAH en utilisant la méthode de complete link en
remplissant les tableaux par les calculs et les résultats intermédiaires puis dessinez le
dendrogramme résultat.

Itération1 Itération2

…. …. …. ….
…. …. …. …. ….
…. 0
…. 0
…. 0
…. 0
…. 0
…. 0
…. 0
…. 0
…. 0

Résultat itération1 : Résultat itération2 :


……………………………………………………… ………………………………………………

Itération3 Itération4
……………….. ……..
…. …. ….
……………….
…. 0
0 ………………
….
…. 0

Résultat itération3 : Résultat itération4 :


……………………………………………………… ………………………………………………

4 /8
NE RIEN ECRIRE ICI

………………………………………………………………………………………………………………………………………………………….......

Dendrogramme

Exercice 3 : ACP (5 points)

Pour mieux connaître ses clients et particulièrement leur solvabilité lorsqu’ils demandent un
prêt, une banque a étudié un échantillon de clients en fonction de quatre variables : l’âge, le
revenu annuel, le patrimoine, et l’emprunt obtenu. Les clients ont été classés en trois
groupes : mauvais payeurs (groupe 1), risque moyen (groupe 2), sans problèmes (groupe 3).
Question1
En utilisant le résultat donné en annexe1 du script R suivant, remplir le tableau suivant :

Pourcentage cumulé de la variance si on retient 2 composantes ……………………………………………….


Les 2 variables les plus corrélées avec la composante 1 ……………………………………………….
Les 2 variables les plus représentées par la composante 1 ……………………………………………….
La variable la plus représentée par la composante 2 ……………………………………………….
Les 2 individus les plus représentés par la composante 1 ……………………………………………….
Les 2 individus les plus contributifs à la composante 2 ……………………………………………….

5 /8
NE RIEN ECRIRE ICI

………………………………………………………………………………………………………………………………………………………….......

Question2
En utilisant le biplot suivant, déterminez les caractéristiques de clients appartenant au groupe 1
(mauvais payeurs)

…………………………………………………………………………………………………………………………………………………………….
……………………………………………………………………………………………………………………………………………………………
……………………………………………………………………………………………………………………………………………………………

Exercice 4 : AFC (3 points)

L’objectif de cet exercice est de rechercher une éventuelle association entre l’orientation
politique des individus et leurs catégories socio-professionnelle. Le résultat de l’enquête est
donné dans le tableau de contingence suivant :

6 /8
NE RIEN ECRIRE ICI

………………………………………………………………………………………………………………………………………………………….......

Question1
En utilisant les informations sur la qualité de la représentation des modalités données dans
l’annexe2, interprétez le graphique suivant qui représente le résultat de l’analyse factorielle de
correspondances appliquée sur le tableau de contingence.

Réponse
………………………………………………………………………………………………………………………………………………
………………………………………………………………………………………………………………………………………………
………………………………………………………………………………………………………………………………………………
………………………………………………………………………………………………………………………………………………
Annexe1

7 /8
NE RIEN ECRIRE ICI

………………………………………………………………………………………………………………………………………………………….......

Annexe2

8 /8
NE RIEN ECRIRE ICI

………………………………………………………………………………………………………………………………………………………….......

9 /8

Vous aimerez peut-être aussi