Vous êtes sur la page 1sur 31

Les Règles d’association

Data Mining

Réalisé par:
Benbetka Mohamed ElAmine
Ouadi Souhaib
Plan de cours
Data Mining
Data Mining definition

C’est l’exploration et la découverte de modèles, de tendances, de corrélations


ou relations cachées dans de grands ensembles de données. En utilisant de
diverses techniques, machine Learning et des systèmes de bases de données.

L’objectif est d’extraire des informations et des connaissances exploitables et


des idées précieuses à partir de données brutes pour faciliter ma prise de
decision et les previsions.
Les Règles
d’Association
Les Règles d’Association definition

• Les règles d’association sont des instructions « si-alors », dont l’objectif


est de chercher / identifier la probabilité de relation entre les éléments
dans une bas de données

• En science des données. Les règles d’association sont utilisées pour


trouver des corrélations est cooccurrences entre les données

• L’utilisation des règles d’association est parfois appelée « association


rules mining » ou « mining associations »
Domaines
d'application
Domaines d'application
Prescription de Conception de Divertissement
médicaments : l’expérience utilisateur
• Des services comme Netflix et
• découvrir des • Recueillir des données sur Spotify peuvent utiliser des règles
combinaisons de la façon dont les visiteurs d’association pour leurs moteurs
médicaments souvent utilisent un site web de recommandation de contenu.
prescrites ensemble. • Analyser les données sur le
• Utiliser des associations
dans les données pour comportement des utilisateurs
optimiser l’interface du site pour détecter des références
web. fréquentes.
 permettre aux médecins de
prendre des décisions plus
éclairées sur les  Maximiser l’utilité du site  Organiser les contenus de
traitements pour des en analysant où les manière à mettre en avant les
conditions spécifiques. utilisateurs ont tendance à contenus les plus intéressants
cliquer pour un utilisateur donné
Fonctionnement
Des Règles
d’association
Fonctionnement Des Règles d’association

• L’extraction des règles d’association, à un niveau de


base, implique l’utilisation de modèles d’apprentissage
automatique pour analyser les données afin de trouver
des schémas, ou des cooccurrences, dans une base de
données.

Elle permet d’identifier les associations fréquentes qui


sont elles mêmes les règles d’association.
Fonctionnement Des Règles d’association

Une Règle d’association comporte deux parties :

Un Antécédent X (SI) Un Conséquent Y (ALORS)


• Un antécédent une un • Un conséquent est un
ensemble d’éléments ensemble d’éléments qui est en
combinaison avec l’antécédent

La combinaison entre l’antécédent et le conséquent est en terme de


Cooccurrence et non pas de causalité
Fonctionnement Des Règles d’association
Remarque !

• Les règles d’association sont créées en recherchant dans les donnés des

schémas fréquents de « Si-ALORS » en utilisant les critères de « support »

et de « confiance »pour identifier les relation les plus importantes.


• Les Règles d’association sont calculées à partir d’un jeux de données, en
utilisant deux ou plusieurs éléments.
• Si les règles sont construites à partir de l’analyse de tous les élément
possibles, il peut y avoir tellement de règles que les règles n’ont que peu
de sens
Fonctionnement Des Règles d’association

Mesures de l’efficacité des règles d’association :

Le Support (Support) La confiance (Confidence)


• Fait référence à la fréquence • Fait référence au nombre de fois
d’apparition d’une règle dans le qu’une règle s’avère être vraie
jeu de données exploité. réellement


𝑁𝑒𝑚𝑏𝑟𝑒 𝑑 𝑜𝑐𝑐𝑢𝑟𝑒𝑛𝑐𝑒𝑠 𝑑𝑒 𝑋 ∪𝑌 𝑁𝑒𝑚𝑏𝑟𝑒 𝑑 ′ 𝑜𝑐𝑐𝑢𝑟𝑒𝑛𝑐𝑒𝑠 𝑑𝑒 𝑋 ∪ 𝑌
¿ ′ ¿
𝑁𝑒𝑚𝑏𝑟𝑒 𝑇𝑜𝑡𝑎𝑙 𝑑 𝑒𝑛𝑟𝑒𝑔𝑖𝑠𝑡𝑟𝑒𝑚𝑒𝑛𝑡 𝑁𝑒𝑚𝑏𝑟𝑒 𝑑 ′ 𝑜𝑐𝑐𝑢𝑟𝑒𝑛𝑐𝑒𝑠 𝑑𝑒 𝑋
Fonctionnement Des Règles d’association
Remarque !

• Une règle peut présenté une forte corrélation dans un ensemble


de données, on parle dans ce cas de support élevé, mais de
confiance faible.

• À l’inverse, une règle peut ne pas démarquer mais elle apparaît


très fréquemment dans un ensemble, dans ce cas, c’est une
confiance élevée et un support faible.
Fonctionnement Des Règles d’association

La conviction L’élévation (Lift)

• La conviction mesure à quel • L'élévation (Lift) est une


point Y est dépendante de X mesure utilisée pour évaluer
l'intérêt et la force d'une
règle
Algorithmes
Algorithmes
Il existe plusieurs algorithmes pour extraire des règles d'association à partir de
bases de données transactionnelles. Chaque algorithme a ses propres avantages,
inconvénients et domaines d'application. Comprennent :

• AIS (Artificial immune system)

• SETM

• Apriori

• Fp-Growth

•…
Algorithmes
Algorithme Apriori (1994):

Principe : L'algorithme Apriori est basé sur le principe d'anti-monotonie, qui


dit que si un ensemble d'items est fréquent, alors tous ses sous-ensembles
doivent également être fréquents.

Fonctionnement : Il génère des ensembles candidats de taille supérieure en


combinant des ensembles fréquents de taille inférieure, puis filtre les
ensembles candidats non fréquents.

Avantages : Facile à comprendre, largement utilisé, efficace pour les bases


de données de taille modérée.

Inconvénients : Peut générer un grand nombre de candidats, coûteux en


termes de calcul.
Algorithmes
Algorithme Apriori (1994):

Principe : L'algorithme Apriori est basé sur le principe d'anti-monotonie, qui


dit que si un ensemble d'items est fréquent, alors tous ses sous-ensembles
doivent également être fréquents.

Fonctionnement : Il génère des ensembles candidats de taille supérieure en


combinant des ensembles fréquents de taille inférieure, puis filtre les
ensembles candidats non fréquents.

Avantages : Facile à comprendre, largement utilisé, efficace pour les bases


de données de taille modérée.

Inconvénients : Peut générer un grand nombre de candidats, coûteux en


termes de calcul.
Algorithmes
Algorithme Apriori (1994):

Principe : L'algorithme Apriori est basé sur le principe d'anti-monotonie, qui


dit que si un ensemble d'items est fréquent, alors tous ses sous-ensembles
doivent également être fréquents.

Fonctionnement : Il génère des ensembles candidats de taille supérieure en


combinant des ensembles fréquents de taille inférieure, puis filtre les
ensembles candidats non fréquents.

Avantages : Facile à comprendre, largement utilisé, efficace pour les bases


de données de taille modérée.

Inconvénients : Peut générer un grand nombre de candidats, coûteux en


termes de calcul.
Algorithmes
Algorithme Apriori (1994):

Principe : L'algorithme Apriori est basé sur le principe d'anti-monotonie, qui


dit que si un ensemble d'items est fréquent, alors tous ses sous-ensembles
doivent également être fréquents.

Fonctionnement : Il génère des ensembles candidats de taille supérieure en


combinant des ensembles fréquents de taille inférieure, puis filtre les
ensembles candidats non fréquents.

Avantages : Facile à comprendre, largement utilisé, efficace pour les bases


de données de taille modérée.

Inconvénients : Peut générer un grand nombre de candidats, coûteux en


termes de calcul.
Algorithmes

1
Etapes d’application
d’Apriori

• L'algorithme commence par identifier tous les items individuels


et les considère comme candidats fréquents de taille 1.

• Ensuite, il génère des ensembles candidats de taille supérieure


en combinant des ensembles fréquents de taille inférieure.
Algorithmes

2
Etapes d’application
d’Apriori
• Pour chaque ensemble candidat, l'algorithme analyse la base
de données pour compter le nombre d'occurrences de cet
ensemble (support).
Fonctionnement : Il génère des ensembles candidats de taille supérieure en
combinant des ensembles fréquents de taille inférieure, puis filtre les
ensembles candidats non fréquents.
• Les ensembles candidats dont le support est supérieur à un
seuil
Avantages prédéfini
: Facile (appelé
à comprendre, largementseuil de support)
utilisé, efficace sont considérés
pour les bases
de données de taille modérée.
comme fréquents.
Inconvénients : Peut générer un grand nombre de candidats, coûteux en
termes de calcul.
Algorithmes

3
Etapes d’application
d’Apriori

• À partir des ensembles fréquents, l'algorithme génère des


règles d'association en évaluant toutes les combinaisons
possibles.
Fonctionnement : Il génère des ensembles candidats de taille supérieure en
combinant des ensembles fréquents de taille inférieure, puis filtre les
ensembles candidats non fréquents.

• Pour chaque règle générée, l'algorithme calcule la confiance


Avantages : Facile à comprendre, largement utilisé, efficace pour les bases
et filtre
de données de tailleles règles ne répondant pas au seuil
modérée. de confiance
défini.
Inconvénients : Peut générer un grand nombre de candidats, coûteux en
termes de calcul.
Exemples en
Supply chain
Exemples en Supply chain
Optimisation dans la Gestion des stocks

En analysant les historiques on peut identifier des schémas de commandes.



Par exemple, dans un entrepôt, l'algorithme pourrait découvrir que lorsqu'un certain produit est
commandé en grande quantité, un autre produit spécifique est souvent également commandé dans la
même période.

En utilisant ces règles d'association, les entreprises peuvent ajuster leurs politiques de stockage ou de
promotion pour maximiser les ventes ou minimiser les coûts.

Cela peut se traduire par :
• des améliorations dans la disposition des entrepôts
• des stratégies de réapprovisionnement
• des offres groupées de produits pour augmenter l'efficacité opérationnelle et la satisfaction client.
Exemples en Supply chain
Optimisation de la Disposition des Produits

• Données :
• Base de données des transactions de clients, enregistrant les produits
achetés ensemble.

• Objectif :
• Optimiser la disposition des produits dans les rayons pour stimuler les
ventes croisées.
Exemples en Supply chain
Étapes :
• Extraction des Règles d'Association.
• Identification des Règles Pertinentes:
• Sélection des règles ayant une confiance élevée et un support significatif pour s'assurer de
la fiabilité et de la pertinence des règles.
• Analyse des Règles :
• Examen des règles pour identifier les associations fréquentes entre les produits.
• Application dans les Magasins :
• Par exemple, si les règles montrent que les clients achètent souvent des chips avec des
sodas, ces produits peuvent être placés à proximité l'un de l'autre dans le rayon.
• Suivi des Performances :
• Analyse des données pour évaluer l'impact des changements sur les ventes croisées et la
satisfaction client.
Exemples en Supply chain
Exemple d’application dans un supermarché

• Par exemple, une chaîne de supermarchés peut constater que lorsqu'elle


réapprovisionne certains articles saisonniers, comme des parasols et les
articles aquatiques pour la saison estivale , les ventes de ces derniers
augmentent également. Cette association pourrait conduire à une
planification plus précise des stocks et à des promotions croisées pour ces
articles pendant la saison estivale.
Exemples en Supply chain
Résultats Potentiels :

• Augmentation des ventes croisées entre les produits associés.

• Amélioration de l'expérience d'achat et satisfaction des clients.

• Optimisation de l'espace dans les rayons.

• Minimisation des cout logistique.


Merci pour votre attention
? Des questions

Vous aimerez peut-être aussi