Académique Documents
Professionnel Documents
Culture Documents
Ali BERRICHI,
ali.berrichi@gmail.com, ali.berrichi@univ-boumerdes.dz
Bureau: Bloc 5, N° 206 ou bien LIMOSE N° 03
Département d’informatique, Faculté des Sciences, UMBBoumerdes.
Présentation
1. Le programme
2. Quelques Références et sites web
- Data Mining et Statistique Décisionnelle, Éditions Technip,
2005, 3ème édition 2010.
- Data Mining: Concepts and Techniques, Jiawei Han
Micheline Kamber, 2006.
•http://www-users.cs.umn.edu/~kumar/
•http://www.lifl.fr/~talbi/Cours-Data-Mining.pdf
•http://www.kdnuggets.com/
•http://data.mining.free.fr/
[2]
Chapitre 1.
Introduction générale
3
1. Motivation (Pourquoi le Data Mining) ?
5
2. Quelques (Définitions) du Data Mining
• DEFINITION 1: Extraction non triviale d’informations implicites,
inconnues auparavant et potentiellement utiles, à partir des données.
8
4. Exemples de Domaines d’Applications :
Intelligence artificielle
Statistique (ADD), Apprentissage Automatique,
DataBase
Systems
10
5. Origines du data Mining
Challenges (défis)
BIG 5V
DATA Volume Vélocité Véracité Variété Valeur
Formation d’ingénieur + Stage + SQL + Métriques + Langages de
DATA programmation + Communication
SCIENCE
“In the same way that past Federal investments in information-technology R&D
led to dramatic advances in supercomputing and the creation of the Internet, the
initiative we are launching today promises to transform our ability to use Big Data
for scientific discovery, environmental and biomedical research, education, and
national security,” said Dr. John P. Holdren, Assistant to the President and Director
of the White House Office of Science and Technology Policy.
Unveil = Dévoiler. Glean = Obtenir, découvrir , extraire.
12
6. Le processus de data mining
• Data Mining = Partie intégrante de KDD (Knowledge
Discovery in Databases)
• KDD = L'ensemble du processus de conversion des
données brutes en informations utiles (Figure ci-dessous)
Feature selection
Dimensionality reduction
Normalization Visualization
Etc. Pattern interpretation
Processus KDD
13
6. Le processus de data mining
14
6. Le processus de data mining
• Post-traitement :
- Par exemple, dans les applications industrielles, les idées
offertes par les résultats de DM peuvent être intégrées avec
les outils de gestion (de campagne de promotion).
16
6. Processus (Simplifié) du data mining
Format, Type ? Technique ?
1 2 3 Tâche ?
1
2
Données DATA MINING
3 d’apprentissage Type de
représentation ?
Modèles,
Patterns
17