Académique Documents
Professionnel Documents
Culture Documents
Cours Fouille de Données Partie2
Cours Fouille de Données Partie2
Cours Fouille de Données Partie2
• Quoi ?
Rechercher des informations
• Laquelle ?
Les informations précieuses et utiles (corrélation, pattern,
tendances, ...)
• Ou ?
Dans les grandes quantités de données stockes par les SI
• Comment ?
En utilisant les statistiques, IA, Reconnaissance des formes,
...etc.
Introduction
Ingénierie et recherche scientifique moderne
• Surveiller suffisamment un système
Datamining
• Les motifs fréquents (fréquent itemsets) sont des motifs ou patterns qui
apparaissent fréquemment dans un ensemble de données.
Exemples :
• Ensemble d'items fréquent : le lait et le pain qui apparaissent souvent dans
une base de transactions dans un supermarché.
• Ensemble de pages web visitées souvent ensemble,
• Symptômes souvent lies chez des patients,
Trouver de tels motifs représente une Tâche importante dans le Data mining
Exemple de règles d'association pour l'analyse du panier de la ménagère :
• SI un client achète des plantes ALORS il achète des engrais
• SI un client achète une télévision, ALORS il achètera une caméra dans un an
BD formelle
• BD relationnelle booléenne,
• La recherche des motifs fréquents
• définie par un triplet (O; P;R)
– O est un ensemble ni d'objets.
– P est un ensemble fini de propriétés.
– R est une relation sur O x P qui permet d'indiquer si un objet x a
une propriété p (note x R p) ou non.