Vous êtes sur la page 1sur 16

Règles d’association

Partie III
Populaire en raison de leur structure simple et intuitive, qui les rend facilement
compréhensibles et similaires aux schémas logiques typiques du raisonnement
Data Mining humain.

Dans plusieurs domaines d'application:


Data Mining pour
la relation client ▪ Analyse du panier de marché (panier de la ménagère)
▪ Exploration Web (web mining).
- Règle d’association
▪ Achats avec une carte de crédit.

▪ Détection de fraude

Karima Ben Slimane IHECSo 1


Règles d’association
Partie III
Analyse du panier de marché (panier de la ménagère)
▪ Lorsqu'un client effectue un achat la transaction est enregistrée par le système
Data Mining d'information du commerçant.
▪ Pour chaque transaction enregistrée, une liste des articles achetés est stockée avec
Data Mining pour le prix, l'heure et le lieu de la transaction.
la relation client ▪ Identifier les règles récurrentes qui relient l'achat d'un produit, ou d'un groupe de
produits, à l'achat d'un autre produit, ou groupe de produits.
- Règle d’association «un client qui achète des céréales pour petit-déjeuner achètera également du lait
avec une probabilité de 0,68».
Très utiles pour les responsables marketing dans la planification des initiatives
promotionnelles ou la définition de l'assortiment et de l'emplacement des produits
sur les rayons.

Karima Ben Slimane IHECSo 2


Règles d’association
Partie III
Exploration Web (web mining)
▪ la liste des pages visitées au cours d'une session est enregistrée comme une
Data Mining transaction, éventuellement assortie d'un numéro de séquence et de l'heure de la
visite.
▪ d'identifier des motifs réguliers éventuellement cachés dans les données qui
Data Mining pour
permettent d'associer une ou plusieurs pages en cours de visualisation à des visites
la relation client sur d'autres pages.
«si une personne visite le site timesonline.co.uk, elle visitera également le site
- Règle d’association economist.com dans un délai d’une semaine avec une probabilité de 0,87».
▪ Des règles d'association de ce type peuvent influencer la structure des liens entre
les pages, afin de faciliter la navigation et de recommander des chemins de
navigation spécifiques, ou de placer des bannières publicitaires et autres messages
promotionnels.

Karima Ben Slimane IHECSo 3


Les données du panier de la ménagère
Partie III
Les données du panier de la ménagère décrivent ce que les
Data Mining clients achètent.

Data Mining pour Nous avons trois niveaux d’informations :


la relation client
1. La commande qui est l'événement de l'achat;
- Règle d’association 2. Les items qui sont les éléments de l'achat
3. Le client qui connecte les commandes au fil du temps.

Karima Ben Slimane IHECSo 4


Construire les règles d’association
Partie III

Les règles d'association commencent par des transactions contenant


Data Mining
un ou plusieurs produits ou offres de services et quelques
Data Mining pour informations rudimentaires sur la transaction .
la relation client
Objectifs :
- Règle d’association 1) Mettre en évidence les produits achetés ensemble
2) Transcrire la connaissance sous forme de règle d’association

Karima Ben Slimane IHECSo 5


Ce simple tableau de cooccurrence met Construire les règles d’association
déjà en évidence certains modèles
simples:

• Le jus d'orange et le soda sont plus


susceptibles d'être achetés ensemble
que les deux autres articles.

• Le détergent n'est jamais acheté avec


du nettoyant pour vitres ou du lait.

• Le lait n'est jamais acheté avec du soda JO Nett. Vitre Lait Soda Détergent
ou un détergent.
JO 4 1 1 2 2
Nett. Vitre 1 2 1 1 0
Tableau de cooccurrence indique le nombre Lait 1 1 1 0 0
de fois où une paire de produits a été Soda 2 1 0 3 1
achetée ensemble Détergent 1 0 0 1 2
Karima Ben Slimane IHECSo 6
Construire les règles d’association
Partie III
Ces observations sont des exemples d'associations et peuvent
Data Mining suggérer une règle formelle comme:
"Si un client achète du soda, alors le client achète également
Data Mining pour du jus d'orange."
la relation client Nous chercherons donc a emmètre des règles du type :

- Règle d’association
si Condition, alors Résultat.
Ou encore
si Antécédent, alors Conséquent

Karima Ben Slimane IHECSo 7


Les catégories des règles d’association
Partie III
Les règles ainsi générées se répartissent en trois catégories.

▪ Des règles utiles expliquent une relation peut-être inattendue.


Data Mining
▪ Ce type de règles apportent une connaissance importante car nouvelle.

Data Mining pour ▪ Des règles triviales expliquent les relations qui sont connues (ou devraient être
la relation client connues) pour exister.

▪ Des règles inexplicables n'ont tout simplement aucun sens. Les règles
- Règle d’association inexplicables ont souvent un faible soutien.

Les règles visant à extraire des connaissances pour une analyse de l'intelligence
d'affaires devraient être non triviales et interprétables, de sorte qu'elles
puissent potentiellement être utiles pour les travailleurs du savoir et faciles à
traduire en plans d'action concrets.
Karima Ben Slimane IHECSo 8
Les mesures des règles d’association
Partie III
Il existe deux mesures de règles d'association: Le support, la confiance
Règle si A alors B : A->B
Data Mining • Le support : indique la fréquence à laquelle la règle est trouvée dans les données de
transaction. Un indicateur de « fiabilité » de la règle
Data Mining pour
la relation client

- Règle d’association • La confiance : dit combien de fois lorsque la partie «si» est vraie que la partie
«alors» est également vraie. Un indicateur de « précision » de la règle

« Bonne » règle = règle avec un support et une confiance élevée


Karima Ben Slimane IHECSo 9
JO Nett. Vitre Lait Soda Détergent

Partie III JO 4 1 1 2 2
Nett. Vitre 1 2 1 1 0
Lait 1 1 1 0 0
Data Mining Soda 2 1 0 3 1
Détergent 1 0 0 1 2
Data Mining pour
la relation client Calculer Support et Confiance pour chacune des règles suivantes:
Règle 1: si Soda alors Détergent
Règle 2: si JO alors Soda
- Règle d’association
Règle 3: si Soda alors JO
Règle 4: Si JO alors Nettoyant à vitre
Règle 5: Si Nettoyant à vitre alors JO

Karima Ben Slimane IHECSo 10


JO Nett. Vitre Lait Soda Détergent
Règle 1: si Soda alors Détergent
JO 4 1 1 2 2 Il faut tester toutes les combinaisons : 2 tests
Nett. Vitre 1 2 1 1 0 par itemset
Règle 2: si JO alors Soda
Lait 1 1 1 0 0 Règle 3: si Soda alors JO
Soda 2 1 0 3 1 Règle 4: Si JO alors Nettoyant à vitre
Détergent 1 0 0 1 2 Règle 5: Si Nettoyant à vitre alors JO

Support (Règle 1)=Support(Soda-Détergent)=1/5


Confiance(Règle1)=Support(Soda-Détergent)/Support(Soda)=(1/5)/(3/5)=33%

Support(Règle2)=Support(JO-Soda)=2/5
Support(Règle3)=Support(Soda-JO)=2/5
Confiance(Règle2)=Support(JO-Soda)/support(JO)=(2/5)/(4/5)=50% Retenir la règle 3 que la règle 2
Confiance(Règle3)=Support(Soda-JO)/Support(Soda)=(2/5)/(3/5)=67%

Support(Règle4)=Support(JO-Nettoyant à vitre )=1/5=Support(Règle5)


Confiance(Règle4)=Support(JO-Nettoyant à vitre )/support(JO)=(1/5)/(4/5)=25%
Confiance(Règle5)=Support(Nettoyant à vitre-JO)/support(Nettoyant à vitre)=(1/5)/(2/5)=50%
Retenir laKarima
règleBen5 Slimane
que la IHECSo
règle 4 11
Partie III Généralisation

• On peut généraliser à toutes les combinaisons d'un nombre quelconque d'articles,


Data Mining ainsi
• pour 3 articles, on cherche à générer des règles de la forme « si X et Y alors Z »

Data Mining pour Exemple:


la relation client Fréquence d’apparition de X et Y et Z= 5% -> support(X,Y,Z)=0,05
Fréquence d’apparition de X et Y=15% -> support(X,Y)=0,15
Confiance(XYZ)=Support(XYZ)/support(X,Y)=0,05/0,15=0,33
- Règle d’association

Karima Ben Slimane IHECSo 12


L’algorithme Apriori (1994)
Partie III
L’algorithme fondateur de génération automatique de règles
Data Mining d'association.

Data Mining pour Cet algorithme se décompose en deux étapes :


la relation client
1. Recherche de sous-ensembles fréquents (support)
- Règle d’association 2. Recherche de règles d’association (confiance) à partir
des sous-ensembles retenus

Karima Ben Slimane IHECSo 13


Extraction des règles
Partie III

Data Mining

Data Mining pour


la relation client

- Règle d’association

Karima Ben Slimane IHECSo 14


Indicateur de pertinence des règles
Partie III
• Lift : indique à quel point la règle est meilleure pour prédire la partie
Data Mining «alors» par rapport à l'absence de règle.

Data Mining pour


la relation client 𝑳𝒊𝒇𝒕(𝑨 → 𝑩) =
𝑪𝒐𝒏𝒇𝒊𝒂𝒏𝒄𝒆(𝑨𝑩)
=
𝒔𝒖𝒑𝒑𝒐𝒓𝒕(𝑨𝑩)
𝒔𝒖𝒑𝒑𝒐𝒓𝒕(𝑩) 𝒔𝒖𝒑𝒑𝒐𝒓𝒕 𝑨 𝒔𝒖𝒑𝒑𝒐𝒓𝒕(𝑩)

- Règle d’association

Une règle est intéressante lorsque l'amélioration est supérieure à 1.

Karima Ben Slimane IHECSo 15


Règles d’association
Partie III
Conclusion
Data Mining ▪ Le nombre de règles d'association dépend des besoins de l'entreprise.

Data Mining pour ▪ La mise en œuvre de toutes les règles en entreprise exigera des coûts
la relation client et des efforts, avec un certain potentiel de gains.

- Règle d’association ▪ Les règles les plus strictes, avec les taux de support et de confiance les
plus élevés, devraient être utilisées en premier, et les autres devraient
être progressivement mises en œuvre plus tard.

Karima Ben Slimane IHECSo 16

Vous aimerez peut-être aussi