Vous êtes sur la page 1sur 29

Introduction au

Datamining
Concepts et techniques

BOUSSAIDI Abdellah
CHAB Ismal
ESI, 06/04/2009

Problme?

? ?

connaissances
Montagne de donnes

Datamini
ng

Quoi

Comment

Jusquou

Quoi?
Le datamining est un processus de
dcouverte de connaissances

connaissances
Datamining

Bases de donnes et Datawarehouses

Pourquoi?

Description

Prdiction

Exemples dapplication
Segmentation des clients
Dterminer le panier de la mnagre
Dtection de Fraude

Champs dapplication

Avantages
Renforcer la position
comptitive de
lentreprise

Transformer des masses de


donnes en information utile

Identifier les
investissements
les plus
profitables et les
moins couteux.

Identifier les facteurs


qui dterminent le
comportement du
client ;

Meilleu
re
prise

Quoi

Comment

Jusquou

Le datamining est un processus itratif

Application du processus de datamining :

Les Tlcoms

Formaliser le problme
Problmatique:
Segmentation des clients
Taux de turn-over

Collecte de donnes
Informations clients
(nom, prnom,
ge, profession..etc.);
Dure dappel par client;
Heures dappels;
Appels non aboutis;
etc.

Prtraitement des donnes


Attnuer le bruit
Enlever les informations non pertinentes

Slectionner les donnes utiles


Mieux vaut tout prendre !
ACPetc.

Estimer le modle
Slectionner le modle adquat

SVM

rgression

Mthodes
Statistique

Meta
heuristique

Arbres
De dcision

16

Google Confidential

Logique
Floue

Rseaux
Baysiens

Rseaux
De Neurones

Estimer le modle
Implmenter la technique appropri
SVM
Validation

Logique
Floue

Vrification

Rseaux

Baysiens

Rechan

Mthodes
Dapprentissage

17

Google Confidential

Rseaux
De Neurones

Estimer le modle
Estimation

De lerreur

Implmentation

Techniques
De datamining

18

Google Confidential

logiciel

Interprter le modle
et tirer les conclusions

19

Google Confidential

s
t
a
s u lt

Interprter le modle
et tirer les conclusions

Quoi

Comment

Jusquou

Le text mining

Le Text Mining

Text
Text Mining
Mining
Process
Process

Pourquoi?

80%
de linformation enregistre,

Quoi

Comment

Jusquou

Logiciels de datamining
Poids lourds
SAS
SPSS Clementine
Weka (Open-source)

Tendance : datamining dans la base de donnes


Oracle Darwin Suite
SQL Server Analysis Services

Limites du datamining
Effort considrable de dveloppement.
Etat inappropri des donnes.

Perspectives
Analyse de plus de donnes dans un
minimum de temps
Exploration

plus

approfondie

donnes
Datamining pour les PMEs.
Datamining domestique

des

Conclusion
Donnes

Datamining

Merci pour
votre
attention

Vous aimerez peut-être aussi