Association Rules Mining Presentation

Les Règles d’association
Data Mining
Réalisé par:
Benbetka Mohamed ElAmine
Ouadi Souhaib
Plan de cours
Data Mining
Data Mining definition
C’est l’exploration et la découverte de modèles, de tendances, de corrélations

ou relations cachées dans de grands ensembles de données. En utilisant de
diverses techniques, machine Learning et des systèmes de bases de données.
L’objectif est d’extraire des informations et des connaissances exploitables et

des idées précieuses à partir de données brutes pour faciliter ma prise de
decision et les previsions.
Les Règles
d’Association
Les Règles d’Association definition
• Les règles d’association sont des instructions « si-alors », dont l’objectif

est de chercher / identifier la probabilité de relation entre les éléments
dans une bas de données
• En science des données. Les règles d’association sont utilisées pour

trouver des corrélations est cooccurrences entre les données
• L’utilisation des règles d’association est parfois appelée « association

rules mining » ou « mining associations »
Domaines
d'application
Domaines d'application
Prescription de Conception de Divertissement
médicaments : l’expérience utilisateur
• Des services comme Netflix et
• découvrir des • Recueillir des données sur Spotify peuvent utiliser des règles
combinaisons de la façon dont les visiteurs d’association pour leurs moteurs
médicaments souvent utilisent un site web de recommandation de contenu.
prescrites ensemble. • Analyser les données sur le
• Utiliser des associations
dans les données pour comportement des utilisateurs
optimiser l’interface du site pour détecter des références
web. fréquentes.
 permettre aux médecins de
prendre des décisions plus
éclairées sur les  Maximiser l’utilité du site  Organiser les contenus de
traitements pour des en analysant où les manière à mettre en avant les
conditions spécifiques. utilisateurs ont tendance à contenus les plus intéressants
cliquer pour un utilisateur donné
Fonctionnement
Des Règles
d’association
Fonctionnement Des Règles d’association
• L’extraction des règles d’association, à un niveau de

base, implique l’utilisation de modèles d’apprentissage
automatique pour analyser les données afin de trouver
des schémas, ou des cooccurrences, dans une base de
données.
Elle permet d’identifier les associations fréquentes qui

sont elles mêmes les règles d’association.
Une Règle d’association comporte deux parties :
Un Antécédent X (SI) Un Conséquent Y (ALORS)

• Un antécédent une un • Un conséquent est un
ensemble d’éléments ensemble d’éléments qui est en
combinaison avec l’antécédent
La combinaison entre l’antécédent et le conséquent est en terme de

Cooccurrence et non pas de causalité
Remarque !
• Les règles d’association sont créées en recherchant dans les donnés des
schémas fréquents de « Si-ALORS » en utilisant les critères de « support »
et de « confiance »pour identifier les relation les plus importantes.

• Les Règles d’association sont calculées à partir d’un jeux de données, en
utilisant deux ou plusieurs éléments.
• Si les règles sont construites à partir de l’analyse de tous les élément
possibles, il peut y avoir tellement de règles que les règles n’ont que peu
de sens
Mesures de l’efficacité des règles d’association :
Le Support (Support) La confiance (Confidence)

• Fait référence à la fréquence • Fait référence au nombre de fois
d’apparition d’une règle dans le qu’une règle s’avère être vraie
jeu de données exploité. réellement
′
𝑁𝑒𝑚𝑏𝑟𝑒 𝑑 𝑜𝑐𝑐𝑢𝑟𝑒𝑛𝑐𝑒𝑠 𝑑𝑒 𝑋 ∪𝑌 𝑁𝑒𝑚𝑏𝑟𝑒 𝑑 ′ 𝑜𝑐𝑐𝑢𝑟𝑒𝑛𝑐𝑒𝑠 𝑑𝑒 𝑋 ∪ 𝑌
¿ ′ ¿
𝑁𝑒𝑚𝑏𝑟𝑒 𝑇𝑜𝑡𝑎𝑙 𝑑 𝑒𝑛𝑟𝑒𝑔𝑖𝑠𝑡𝑟𝑒𝑚𝑒𝑛𝑡 𝑁𝑒𝑚𝑏𝑟𝑒 𝑑 ′ 𝑜𝑐𝑐𝑢𝑟𝑒𝑛𝑐𝑒𝑠 𝑑𝑒 𝑋
Remarque !
• Une règle peut présenté une forte corrélation dans un ensemble

de données, on parle dans ce cas de support élevé, mais de
confiance faible.
• À l’inverse, une règle peut ne pas démarquer mais elle apparaît

très fréquemment dans un ensemble, dans ce cas, c’est une
confiance élevée et un support faible.
La conviction L’élévation (Lift)
• La conviction mesure à quel • L'élévation (Lift) est une

point Y est dépendante de X mesure utilisée pour évaluer
l'intérêt et la force d'une
règle
Algorithmes
Algorithmes
Il existe plusieurs algorithmes pour extraire des règles d'association à partir de
bases de données transactionnelles. Chaque algorithme a ses propres avantages,
inconvénients et domaines d'application. Comprennent :
• AIS (Artificial immune system)
• SETM
• Apriori
• Fp-Growth
•…
Algorithmes
Algorithme Apriori (1994):
Principe : L'algorithme Apriori est basé sur le principe d'anti-monotonie, qui

dit que si un ensemble d'items est fréquent, alors tous ses sous-ensembles
doivent également être fréquents.
Fonctionnement : Il génère des ensembles candidats de taille supérieure en

combinant des ensembles fréquents de taille inférieure, puis filtre les
ensembles candidats non fréquents.
Avantages : Facile à comprendre, largement utilisé, efficace pour les bases

de données de taille modérée.
Inconvénients : Peut générer un grand nombre de candidats, coûteux en

termes de calcul.
Algorithmes




termes de calcul.
Algorithmes




termes de calcul.
Algorithmes




termes de calcul.
Algorithmes
1
Etapes d’application
d’Apriori
• L'algorithme commence par identifier tous les items individuels

et les considère comme candidats fréquents de taille 1.
• Ensuite, il génère des ensembles candidats de taille supérieure

en combinant des ensembles fréquents de taille inférieure.
Algorithmes
2
d’Apriori
• Pour chaque ensemble candidat, l'algorithme analyse la base
de données pour compter le nombre d'occurrences de cet
ensemble (support).
• Les ensembles candidats dont le support est supérieur à un
seuil
Avantages prédéfini
: Facile (appelé
à comprendre, largementseuil de support)
utilisé, efficace sont considérés
pour les bases
comme fréquents.
termes de calcul.
Algorithmes
3
d’Apriori
• À partir des ensembles fréquents, l'algorithme génère des

règles d'association en évaluant toutes les combinaisons
possibles.
• Pour chaque règle générée, l'algorithme calcule la confiance

et filtre
de données de tailleles règles ne répondant pas au seuil
modérée. de confiance
défini.
termes de calcul.
Exemples en
Supply chain
Exemples en Supply chain
Optimisation dans la Gestion des stocks
En analysant les historiques on peut identifier des schémas de commandes.

•
Par exemple, dans un entrepôt, l'algorithme pourrait découvrir que lorsqu'un certain produit est
commandé en grande quantité, un autre produit spécifique est souvent également commandé dans la
même période.
•
En utilisant ces règles d'association, les entreprises peuvent ajuster leurs politiques de stockage ou de
promotion pour maximiser les ventes ou minimiser les coûts.
•
Cela peut se traduire par :
• des améliorations dans la disposition des entrepôts
• des stratégies de réapprovisionnement
• des offres groupées de produits pour augmenter l'efficacité opérationnelle et la satisfaction client.
Optimisation de la Disposition des Produits
• Données :
• Base de données des transactions de clients, enregistrant les produits
achetés ensemble.
• Objectif :
• Optimiser la disposition des produits dans les rayons pour stimuler les
ventes croisées.
Étapes :
• Extraction des Règles d'Association.
• Identification des Règles Pertinentes:
• Sélection des règles ayant une confiance élevée et un support significatif pour s'assurer de
la fiabilité et de la pertinence des règles.
• Analyse des Règles :
• Examen des règles pour identifier les associations fréquentes entre les produits.
• Application dans les Magasins :
• Par exemple, si les règles montrent que les clients achètent souvent des chips avec des
sodas, ces produits peuvent être placés à proximité l'un de l'autre dans le rayon.
• Suivi des Performances :
• Analyse des données pour évaluer l'impact des changements sur les ventes croisées et la
satisfaction client.
Exemple d’application dans un supermarché
• Par exemple, une chaîne de supermarchés peut constater que lorsqu'elle

réapprovisionne certains articles saisonniers, comme des parasols et les
articles aquatiques pour la saison estivale , les ventes de ces derniers
augmentent également. Cette association pourrait conduire à une
planification plus précise des stocks et à des promotions croisées pour ces
articles pendant la saison estivale.
Résultats Potentiels :
• Augmentation des ventes croisées entre les produits associés.
• Amélioration de l'expérience d'achat et satisfaction des clients.
• Optimisation de l'espace dans les rayons.
• Minimisation des cout logistique.

Merci pour votre attention
? Des questions

Association Rules Mining Presentation

Transféré par

Informations du document

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

Association Rules Mining Presentation

Transféré par

Droits d'auteur :

Formats disponibles

Les Règles d’association

C’est l’exploration et la découverte de modèles, de tendances, de corrélations

L’objectif est d’extraire des informations et des connaissances exploitables et

• Les règles d’association sont des instructions « si-alors », dont l’objectif

• En science des données. Les règles d’association sont utilisées pour

• L’utilisation des règles d’association est parfois appelée « association

• L’extraction des règles d’association, à un niveau de

Elle permet d’identifier les associations fréquentes qui

Une Règle d’association comporte deux parties :

Un Antécédent X (SI) Un Conséquent Y (ALORS)

La combinaison entre l’antécédent et le conséquent est en terme de

schémas fréquents de « Si-ALORS » en utilisant les critères de « support »

et de « confiance »pour identifier les relation les plus importantes.

Mesures de l’efficacité des règles d’association :

Le Support (Support) La confiance (Confidence)

• Une règle peut présenté une forte corrélation dans un ensemble

• À l’inverse, une règle peut ne pas démarquer mais elle apparaît

La conviction L’élévation (Lift)

• La conviction mesure à quel • L'élévation (Lift) est une

• AIS (Artificial immune system)

Principe : L'algorithme Apriori est basé sur le principe d'anti-monotonie, qui

Fonctionnement : Il génère des ensembles candidats de taille supérieure en

Avantages : Facile à comprendre, largement utilisé, efficace pour les bases

Inconvénients : Peut générer un grand nombre de candidats, coûteux en

Principe : L'algorithme Apriori est basé sur le principe d'anti-monotonie, qui

Fonctionnement : Il génère des ensembles candidats de taille supérieure en

Avantages : Facile à comprendre, largement utilisé, efficace pour les bases

Inconvénients : Peut générer un grand nombre de candidats, coûteux en

Principe : L'algorithme Apriori est basé sur le principe d'anti-monotonie, qui

Fonctionnement : Il génère des ensembles candidats de taille supérieure en

Avantages : Facile à comprendre, largement utilisé, efficace pour les bases

Inconvénients : Peut générer un grand nombre de candidats, coûteux en

Principe : L'algorithme Apriori est basé sur le principe d'anti-monotonie, qui

Fonctionnement : Il génère des ensembles candidats de taille supérieure en

Avantages : Facile à comprendre, largement utilisé, efficace pour les bases

Inconvénients : Peut générer un grand nombre de candidats, coûteux en

• L'algorithme commence par identifier tous les items individuels

• Ensuite, il génère des ensembles candidats de taille supérieure

• À partir des ensembles fréquents, l'algorithme génère des

• Pour chaque règle générée, l'algorithme calcule la confiance

En analysant les historiques on peut identifier des schémas de commandes.

• Par exemple, une chaîne de supermarchés peut constater que lorsqu'elle

• Augmentation des ventes croisées entre les produits associés.

• Amélioration de l'expérience d'achat et satisfaction des clients.

• Optimisation de l'espace dans les rayons.

• Minimisation des cout logistique.

Vous aimerez peut-être aussi