Académique Documents
Professionnel Documents
Culture Documents
Ali BERRICHI,
ali.berrichi@gmail.com, ali.berrichi@univ-boumerdes.dz
Bureau: Bloc 5, N° 206 ou bien LIMOSE N° 03
Département d’informatique, Faculté des Sciences, UMBBoumerdes.
7. Les données
7.1 Définitions
• Les données : une collection Id Refund Marital Taxable
d’objets et leurs attributs. Un Status Income Cheat
entité ou instance.
2
7. Les données
7.2 Types de données
– Distinction = et ≠
– L’ordre <, ≤, > et ≥.
– Addition : + et –
– Multiplication : * et /
- Exemples:
numéros d'identification des étudiants, couleur des yeux,
codes postaux.
Le type Intervalle
• La différence entre les valeurs de l’attribut a un sens, i.e une unité de
mesure existe. L’origine de mesure est arbitraire.
Exemples:
– les dates du calendrier (Par exemple, au lieu de traiter la date d'ouverture d’un
compte bancaire, nous traitons l'ancienneté qui est la différence entre la date
d'aujourd'hui et la date d’ouverture du compte),
6
7. Les données
Dans de nombreuses études de DM les attributs sont divisés en deux types seulement:
• Attributs Discrets/continus
– Attributs Discrets
- Ont un nombre fini ou infini dénombrable, souvent représentés avec des variables entières.
- Exemples : code postal, le nombre de…, l’ensemble des mots dans une collection de
documents
– Attributs Continus
- Ont des nombres réels comme valeurs des attributs
- Exemples : température, hauteur ou poids
• Variables Catégorielles/Continues
- Variables Catégorielles ayant des valeurs nominales, binaires et ordinales
- Variables Continues correspondant aux variables entières, intervalle ou ratio.
7
8. Les tâches du data Mining (I)
• Méthodes prédictives (supervisées)
- Prédire la valeur inconnue ou future d’un attribut particulier en se
basant sur les valeurs des autres attributs (détection de SPAM,
détection d’intrusions).
- L’attribut à prédire : attribut cible ou variable dépendante.
8
8. Les tâches du data Mining (II)