Académique Documents
Professionnel Documents
Culture Documents
INFORMATIQUE 08-MAI-1945
Apprentissage automatique et fouille de données | n.dif@esi-sba.dz
Fiche TP1
Partie 1
- La fenêtre est composée de plusieurs types d’interfaces, vous commencez par le type
Explorer.
- La figure 2 présente l’interface explorer qui est composée de plusieurs fenêtres : de
prétraitement, de classification, de clustering, d’association, de sélection d’attributs, et
de visualisation.
- Pour commencer l’apprentissage, charger la base d'apprentissage à partir de openfile,
le dossier d’installation de WEKA contient un sous dossier (Data) composé d’un
ensemble de benchmarks (fichier d’une extension arff), sélectionner un benchmark (par
exemple weather.nominal.arff : la base d’apprentissage Jouer au Tennis vu en cours).
- L’onglet de prétraitement est composé de 6 parties : 1. La partie de chargement de
dataset, 2. La partie de choix du filtre de prétraitement, 3. La partie qui contient des
informations générales sur la base : nom, nombre d’attributs et d’instances, 4. La partie
qui contient des informations concernant l’attribut sélectionné dans la partie 5, 5. La
partie qui contient les attributs de la base, et donne la possibilité de les supprimer
manuellement, 6. La partie qui contient la distribution des valeurs de la classe sur les
valeurs de l’attribut sélectionné.
- La partie 2 du filtre représenté sur la figure 3 contient un ensemble de méthode de
prétraitement : sélection d’attributs, discrétisation, rééchantillonnage (resample),
équilibrer les classes (ClassBalancer)
DR. N. DIF.
1
Figure 2. L’interface explorer de WEKA.
Devoir
Dans un rapport, comparez et discutez les performances obtenues sur
différents benchmarks en variant dans les paramètres suivants :
DR. N. DIF.
1
- La méthode de prétraitement
- L’algorithme d’apprentissage
- La méthode d’évaluation
DR. N. DIF.