Vous êtes sur la page 1sur 6

Rapport de travaux

pratiques : Data Mining

IDSD2
NOUHAILA NAHIRI
3/2/2023
Introduction

Ce rapport est dédié à l'analyse et à l'utilisation de l'outil Weka pour l'apprentissage


automatique. Weka est une suite logicielle open-source qui fournit des algorithmes
d'apprentissage automatique, des outils de prétraitement des données, ainsi que des
outils de visualisation et d'exploration des données. Elle est utilisée dans de
nombreux domaines, notamment la science des données, la bioinformatique,
l'analyse financière, la reconnaissance de formes, data mining, etc.

Dans le cadre de ce rapport, nous allons explorer les principales fonctionnalités de


Weka, notamment comment charger des données, explorer et visualiser les données,
prétraiter les données en utilisant des filtres, entraîner et évaluer des modèles
d'apprentissage automatique, et ajuster les paramètres du modèle. Nous allons
également comparer différents algorithmes d'apprentissage automatique en termes
de précision, de temps d'exécution et de complexité.
1. Données

1) Pour ouvrir le fichier on a suivi les étapes ci-dessous :


2) Cliquer sur l'onglet "Explorer" situé dans la barre d'outils en haut de la fenêtre
principale de Weka. Cela ouvrira une nouvelle fenêtre.
3) Dans la nouvelle fenêtre, on clique sur le bouton "Open File" situé dans le coin
supérieur gauche.
4) Parcourez jusqu'au répertoire "data" et sélectionnez le fichier "iris.arff" .
5) Une fois que on a sélectionné le fichier, on clique sur le bouton "Ouvrir" pour charger
les données dans Weka.

Figure 1 : le fichier iris.arff

On constate d’après ce qu’on a dans la figure ci-dessus que le fichier iris.arff contient et 150
instances, et 5 attributs qui sont numérotés dans l’ordre suivant :

1) sepallength
2) sepalwidth
3) petallength
4) petalwidth
5) class

2. Filtres non-supervisés sur les données

Les filtres non supervisés dans Weka sont des outils qui permettent d'effectuer des
opérations plus simples sur les données. Ces opérations incluent la suppression manuelle
d'attributs, la modification d'attributs en utilisant des formules mathématiques, ainsi que la
centralisation et la reduction des données.
a. Remove :
Permet de supprimer des attributs.

b. Standardise :
Standardise les attributs des données de telle sorte que leur variance soit égale à 1.

c. Normalize :
Permet de normaliser les données en les mettant à l'échelle sur une plage donnée.
3. Classification
La classification est l’apprentissage supervisé. Les algorithmes de classification prennent en
entrée un ensemble de données étiquetées et renvoient des modèles qui permettent de classer
de nouvelles données non étiquetées Par défaut le classifieur choisi est ZeroR. Il s’agit du
classifieur qui choisit la classe majoritaire.

Figure 2: les résultats de ZeroR


Les résultats de cet algorithme ne sont pas précis, car on 100 instances qui sont mal
classifiées.

 Java48
Voici L’arbre:

Vous aimerez peut-être aussi