Académique Documents
Professionnel Documents
Culture Documents
Partie III
Populaire en raison de leur structure simple et intuitive, qui les rend facilement
compréhensibles et similaires aux schémas logiques typiques du raisonnement
Data Mining humain.
▪ Détection de fraude
• Le lait n'est jamais acheté avec du soda JO Nett. Vitre Lait Soda Détergent
ou un détergent.
JO 4 1 1 2 2
Nett. Vitre 1 2 1 1 0
Tableau de cooccurrence indique le nombre Lait 1 1 1 0 0
de fois où une paire de produits a été Soda 2 1 0 3 1
achetée ensemble Détergent 1 0 0 1 2
Karima Ben Slimane IHECSo 6
Construire les règles d’association
Partie III
Ces observations sont des exemples d'associations et peuvent
Data Mining suggérer une règle formelle comme:
"Si un client achète du soda, alors le client achète également
Data Mining pour du jus d'orange."
la relation client Nous chercherons donc a emmètre des règles du type :
- Règle d’association
si Condition, alors Résultat.
Ou encore
si Antécédent, alors Conséquent
Data Mining pour ▪ Des règles triviales expliquent les relations qui sont connues (ou devraient être
la relation client connues) pour exister.
▪ Des règles inexplicables n'ont tout simplement aucun sens. Les règles
- Règle d’association inexplicables ont souvent un faible soutien.
Les règles visant à extraire des connaissances pour une analyse de l'intelligence
d'affaires devraient être non triviales et interprétables, de sorte qu'elles
puissent potentiellement être utiles pour les travailleurs du savoir et faciles à
traduire en plans d'action concrets.
Karima Ben Slimane IHECSo 8
Les mesures des règles d’association
Partie III
Il existe deux mesures de règles d'association: Le support, la confiance
Règle si A alors B : A->B
Data Mining • Le support : indique la fréquence à laquelle la règle est trouvée dans les données de
transaction. Un indicateur de « fiabilité » de la règle
Data Mining pour
la relation client
- Règle d’association • La confiance : dit combien de fois lorsque la partie «si» est vraie que la partie
«alors» est également vraie. Un indicateur de « précision » de la règle
Partie III JO 4 1 1 2 2
Nett. Vitre 1 2 1 1 0
Lait 1 1 1 0 0
Data Mining Soda 2 1 0 3 1
Détergent 1 0 0 1 2
Data Mining pour
la relation client Calculer Support et Confiance pour chacune des règles suivantes:
Règle 1: si Soda alors Détergent
Règle 2: si JO alors Soda
- Règle d’association
Règle 3: si Soda alors JO
Règle 4: Si JO alors Nettoyant à vitre
Règle 5: Si Nettoyant à vitre alors JO
Support(Règle2)=Support(JO-Soda)=2/5
Support(Règle3)=Support(Soda-JO)=2/5
Confiance(Règle2)=Support(JO-Soda)/support(JO)=(2/5)/(4/5)=50% Retenir la règle 3 que la règle 2
Confiance(Règle3)=Support(Soda-JO)/Support(Soda)=(2/5)/(3/5)=67%
Data Mining
- Règle d’association
- Règle d’association
Data Mining pour ▪ La mise en œuvre de toutes les règles en entreprise exigera des coûts
la relation client et des efforts, avec un certain potentiel de gains.
- Règle d’association ▪ Les règles les plus strictes, avec les taux de support et de confiance les
plus élevés, devraient être utilisées en premier, et les autres devraient
être progressivement mises en œuvre plus tard.