Académique Documents
Professionnel Documents
Culture Documents
Résumé
1
CHAPITRE 1 : Introduction générale
Introduction
Nous sommes submergés de données, la quantité de données et dans nos vie
semble de plus en croissante et il n’y a pas de fin en vue. Des ordinateurs omnipré-
sents rendent trop facile d’enregistrer des données choses qui, nous aurions saccagé.
Le Word Wide Web (www) nous submerge de données, pendant ce temps, tous les
choix que nous faisons est d’enregistrer les données. Nous pourrions tous témoigner
de l’écart croissant entre la production de données et notre compréhension de celui-
ci. Comme le volume des données augmente, inexorablement, la proportion de ce que
les gens comprennent diminue de façon alarmante.les informations cachées derrière
ces données sont potentiellement utiles et qui sont rarement explicite.
La tâche principale du data mining est de chercher ces informations que nous
l’appelons « connaissance » dans les données enregistrés, le plus souvent dans les
bases de données BDD historiques, et ce, pour le processus d’aide à la décision.
2
CHAPITRE 1 : Introduction générale
Apprentissage
Définition 1 : Acquérir des connaissances sur quelque chose par l’étude, l’expé-
rience ou l’enseignement.
Apprentissage Automatique
Définition : Domaine d’étude qui permette aux ordinateurs la capacité d’ap-
prendre sans être explicitement programmés.
3
CHAPITRE 1 : Introduction générale
Exemples
Crédit Scoring (Banques , les assurences,..ect) : Désigne un ensemble d’outils et
méthodes d’aide à la décision utilisé pour évaluer automatiquement la solvabilité d’un
client ainsi que le risque de non rembourrassent des prêts.
4
CHAPITRE 1 : Introduction générale
Exemple : Text mining Dans le Text Mining, Les données en entrées sont
sous une forme textuelle, comment les transformer sous forme d’une matrice ?
L’un des solution les plus simple est décrit dans la figure 1.1
5
CHAPITRE 1 : Introduction générale
Table de décision
Les tables de décision sont utilisés pour classer des nouveaux exemples, où les
colonnes représentent les attributs qui décide et les lignes indiquent les cas de teste
6
CHAPITRE 1 : Introduction générale
possible classer par ordre (Voir la figure 1.3). Pour classer les exemples il faut par-
courir le tableau en testant les valeurs sur les attributs jusqu’à ce qu’on trouve la
bonne classe.
Arbre de décision
L’arbre de décision est utilisé pour classer des nouveaux exemples non étique-
tés (non classer), il comporte un nœud racine de départ, un ensemble de nœuds
de parcours, des feuilles et des arcs, les nœuds représentent les attributs, les arcs
représentes les valeurs de teste sur l’attribut de départ et les feuilles indiques les
classes (Voir la figure 1.4).
Règles de classification
Les règles de classification sont utilisées pour classer des nouveaux exemples, la
forme générale d’une règle soit :
Règles d’association
Les règles d’association cherchent les associations (les liens) importantes entre
les attributs. Ils ont comme forme :
Si (teste sur attribut(s)) alors Attribut(s).
7
CHAPITRE 1 : Introduction générale
Prédiction numérique
Dans le cas d’une prédiction numérique l’objectif consiste à trouver une fonction
sur les attributs :
(f (x, y, ..) = z).
Clustering