Académique Documents
Professionnel Documents
Culture Documents
TP4 Visusalisation
TP4 Visusalisation
Partie I. Théorie
Exercise 1.
Exercise 2.
Supposons que nous ayons un jeu de données X contenant 2 000 objets, 15 variables et que la classe
(étiquette) soit disponible. Nous voulons le visualiser en 2 DIMENSIONS.
- Quel modèle de réduction de dimensionnalité est préférable d'utiliser car l'étiquette est
DISPONIBLE ?
- Donner l'algorithme de cette méthode et l'expliquer.
Exercise 3.
Quel modèle utiliser si le jeu de données contient des distances entre des villes en Europe ? Décrivez le
modèle.
Partie II. Pratique.
fig,ax=plt.subplots(8,8,figsize=(6, 6))
for i, axi in enumerate(ax.flat):
axi.imshow(digits.images[i], cmap='binary')
axi.set(xticks=[], yticks=[])
Cet exemple s'applique à The Olivetti faces dataset différentes méthodes de décomposition matricielle non
supervisée (réduction de dimension) du module sklearn.decomposition
1. Préparation du jeu de données - Chargement et prétraitement du jeu de données des visages Olivetti.
import logging
rng = RandomState(0)
n_row, n_col = 2, 3
n_components = n_row * n_col
image_shape = (64, 64)