Vous êtes sur la page 1sur 8

Datamining ou

Fouille de Données
(Résumé)

1
Définition de la Fouille de Données
• Processus inductif, itératif et interactif de découverte de motifs
intéressants à partir de grandes quantités de données.

• Extraction de connaissances intéressantes (règles, régularités,


patterns, contraintes) à partir de méga bases de données.

Autres appellations proches


1- ECD (Extraction de Connaissances à partir de Données)
2- KDD (Knowledge Discovery from Databases)

2
Quelques Applications
Processus d’aide à la décision (assisté par ordinateur) basé sur les
données.

Médecine, Finance, Militaire, Web, Astronomie,…

3
Place du Datamining dans le processus l’ECD

Datamining: étape clé dans


l’extraction de connaissances
Evaluation de patterns

Data Mining

Données intéressantes

Data Warehouse Sélection

Nettoyage de données

Intégration

Bases de données ou fichiers


4
Caractère Multidisciplinaire du Datamining

Technologie BD Statistique

Apprentissage Data Mining Visualisation

Théorie de l’information Autres


Disciplines

5
Fonctionnalités du datamining

Classification et Prédiction régression et classification supervisée


(Bayes, SVM, k-PPV)
Analyse de groupes (clusters) classification non supervisée
Analyse d’exceptions (Outlier detection) :objets non conformes à
la tendance générale. Une exception peut être considérée
comme du bruit mais aussi comme une information pertinente.
Règles d’association: corrélation et causalité
Analyse de séquences et de déviation: analyse de régression, de
caractère séquentiel ou de périodicité

6
Quelques systèmes de DM
1. Intelligent miner d’IBM (couplé avec le SGBD DB2)
 Classification, association, régression, analyse de séquences,
regroupement .
2. Entreprise miner de SAS
 Multiples outils d’analyse statistique, classification, …
3. Mine set de Silicon graphics.
 Classification, association et divers outils statistiques. Très
puissant en terme de visualisation
4. Clémentine de SPSS.
 En plus des fonctionnalités classiques, l’utilisateur peut y
rajouter ses propres algorithmes
5. DBMiner de DBMiner technologie.
 Il se distingue par le fait qu’il incorpore les fonctionnalités
d’OLAP.

7
WEKA: Waikato Environment for Knowledge Analysis
• Logiciel gratuit disponible sur le web:
http://www.cs.waikato.ac.nz/ml/weka/

• Plate forme logicielle en Java tournant sous :


• Windows
• Linux

• Facile à prendre en main

Vous aimerez peut-être aussi