Vous êtes sur la page 1sur 3

ESI-SBA - ECOLE SUPERIEURE EN

INFORMATIQUE 08-MAI-1945
Apprentissage automatique et fouille de données | n.dif@esi-sba.dz

Fiche TP1
Partie 1

- Installer la version 3.8.5 de WEKA.


- Explorer les méthodes de
prétraitement, d’apprentissage, et
d’évaluation.

- La fenêtre est composée de plusieurs types d’interfaces, vous commencez par le type
Explorer.
- La figure 2 présente l’interface explorer qui est composée de plusieurs fenêtres : de
prétraitement, de classification, de clustering, d’association, de sélection d’attributs, et
de visualisation.
- Pour commencer l’apprentissage, charger la base d'apprentissage à partir de openfile,
le dossier d’installation de WEKA contient un sous dossier (Data) composé d’un
ensemble de benchmarks (fichier d’une extension arff), sélectionner un benchmark (par
exemple weather.nominal.arff : la base d’apprentissage Jouer au Tennis vu en cours).
- L’onglet de prétraitement est composé de 6 parties : 1. La partie de chargement de
dataset, 2. La partie de choix du filtre de prétraitement, 3. La partie qui contient des
informations générales sur la base : nom, nombre d’attributs et d’instances, 4. La partie
qui contient des informations concernant l’attribut sélectionné dans la partie 5, 5. La
partie qui contient les attributs de la base, et donne la possibilité de les supprimer
manuellement, 6. La partie qui contient la distribution des valeurs de la classe sur les
valeurs de l’attribut sélectionné.
- La partie 2 du filtre représenté sur la figure 3 contient un ensemble de méthode de
prétraitement : sélection d’attributs, discrétisation, rééchantillonnage (resample),
équilibrer les classes (ClassBalancer)

DR. N. DIF.

1
Figure 2. L’interface explorer de WEKA.

Figure 3. Les filtres de prétraitement sur WEKA.

- L’onglet de classification (Figure 4) représente plusieurs parties : 1. La partie de


sélection de l’algorithme d’apprentissage, 2. La partie de sélection de la
technique d’évaluation, 3. La partie contenant des informations sur les
performances de l’algorithme, ainsi que le modèle généré (la règle de
classification en cas de OneRule).

Devoir
Dans un rapport, comparez et discutez les performances obtenues sur
différents benchmarks en variant dans les paramètres suivants :

DR. N. DIF.

1
- La méthode de prétraitement
- L’algorithme d’apprentissage
- La méthode d’évaluation

Figure 4. L’onglet de classification sur WEKA.

DR. N. DIF.

Vous aimerez peut-être aussi