Vous êtes sur la page 1sur 21

Génie logistique et transport

Business intiligence

Les régles
d’association

Année universitaire:2022/2023
Plan de présentation
Algorithmes et
Data mining outils
01 Introduction Apriori,AprioriTID,DHP,
03
Définition data mining Partition…

Les régles
d’association Exemples en ICL
02 Définition Exemple de panier de
04
Domaines d’utilisation marché
Introduction

Depuis quelques années, on assiste à une forte augmentation dans le nombre et dans le volume des
informations mémorisées par des bases de données scientifiques, économiques, financières,
administratives, médicales…etc. Ces méga bases de données sont peu exploitées, alors qu’elles cachent
des connaissances décisives face au monde extérieur. Pour combler ce besoin, une nouvelle industrie est
née, le Data Mining ou bien la fouille de données.
C'est quoi le data mining?
Le Data Mining est l’ensemble des techniques
qui consiste à identifier à partir d'un important
volume de données brutes, des connaissances
originales auparavant inconnues. Par exemple
elles permettent de trouver les tendances qui se
dégagent dans les ventes d’un supermarché. La
connaissance de telles informations peut
permettre au supermarché d’élaborer des
stratégies commerciales ou de marketing en
direction de ses clients. LA figure suivante
montre le Data Mining comme une étape dans
le processus de découverte de la connaissance.

Figure 1: Le processus de Data Mining


C'est quoi le data mining?

Data Mining

Descriptive Prédictive
Extrapoler des nouvelles
Mettre en évidence des information
informations à partir de données
présente
existantes

Techniques descriptives Techniques prédictives

• Visualisation •Classification Régression


• Regroupement • •Association
Association •Régression
Les règles d’association
● Les règles d'association étudient la
fréquence des items (items=un ensemble
d’attributs) qui se produisent dans la base
de données transactionnelle, elle est basée
sur deux seuil.

● Autrement dit, l’association consiste à


trouver quelles valeurs des variables vont
ensemble.

● Les règles d’association sont de la forme :


AB[s,c], où A représente l’antécédent de
la règle et B la conséquence.
Les règles d’association
Exemple1 :
Elle pourrait être utile pour le directeur d’OurVideoStore pour savoir quels films sont souvent
loués ensemble ou s’il y a un rapport entre l’allocation de certains types de films et l’achat de
popcorn.
Par exemple la règle d’association suivantes :
RentType(X, "jeu") ˄ Age(X, "13-19") → Buys(X, "pop") [ s=2%, c=55% ]
Indiquerait que 2% des transactions considérées sont des clients âgés entre 13 et 19 quilouent un
jeu et achètent popcorn, et une certitude de 55% que les clients adolescents qui louent un jeu
achètent également popcorn.

Exemple2 :
Si on dispose d’une base de données contenant des informations sur la population d’un pays, la
règle associative suivante peut être extraite :
(Age>25) ˄ (Revenu>5000) → (modèle_voiture=tourisme)
Cette règle associe l’âge et le revenu d’un individu au type de la voiture qu’il peut posséder.
Domaines d’application
Marketing et planification commercial
Placement des articles achetés fréquemment ensemble, organisation des catalogues,
choix des articles en promotion, …etc.
Réseaux de télécommunication
Filtrage des alarmes non informatives, identification des causes d’anomalies,
prédiction des anomalies, …etc.
Recherche médicale
aide au diagnostic et définition de traitement, identification de population à risque vis-à-
vis de certaines maladies.
Le domaine industriel
prévision des ventes, surveillance des unités de production, diagnostic et analyse des
pannes, contrôle de qualité, etc.
Multimédia
analyse d’imagerie, prévision météorologique, aide aux enquêtes, etc.
Algorithmes, approches et outils :
Les algorithmes des recherche de règles d’association peuvent être scindées en deux étapes :
● Recherche des itemsets (motifs) fréquents:

● Génération de règles d’association

● Algorithmes Apriori:
L'algorithme APRIORI est ll’algorithme le plus connu dans les règles d’association, il
utilise une approche itérative par niveaux pour générer les itemsets fréquents.
Processus d’algorithme Apriori
Algorithmes AprioriTid
Afin de réduire le nombre de parcours important de la base de transactions d'APRIORI, les
mêmes auteurs d'APRIORI ont proposé l'algorithme APRIORI-TID (Apriori Transaction
Identifier). Cette variante génère les candidats en utilisant la même stratégie, mais elle diffère
dans le calcul du support des itemsets candidats.

L’algorithme APRIORI-TID diminue la taille de la base de données progressivement. Au lieu de


faire une passe lors de l’examen de chaque niveau du treillis des itemsets, toute la base de
données est mise en mémoire, et pour chaque niveau du treillis, les transactions sont
représentées par les k itemsets qu’elle contient.
Autres Algorithmes

DHP Sampling
Sert à diminuer le nombre Effectue la génération des
d’itemsets candidats générés. itemsets sur un échantillon de la
base.

Partition DIC-Dynamic
Autorise la parallélisassions du Propose une diminution du nombre
processus d’extraction de balayages nécessaires

OCD FP-Growth
réalisent un nombre de balayages du
contexte égal à la taille des plus Suit une structure de données compacte
longs itemsets fréquents (Frequent-Pattern tree) qui apporte une
solution au problème de la fouille de
motifs fréquents dans une grande BDD
Algorithmes d’extraction des règles

GEN- GEN-
OPUS
REGLE RULES,GUHA…
(Agrawal & Al, 1994) (Webb, G.I. (1995))
Exemples de panier de ménagère

● Le panier du ménagère décrit un ensemble d'achats effectué au supermarché. Les règles


d'association permet de découvrir la régularités dans l'ensemble de transactions comme par
exemple: Si fromage alors vin rouge, etc.
● Ces règles permettent par exemple au gérant de proposer des bons de réductions
significatifs sur les achats futurs des clients !!
● On prend comme exemple se panier:

TID Items
1 {Pain, Lait}
2 {Pain, Couche, Lingettes, Ouefs}
3 {Lait, Couche, Lingettes, Coca}
4 {Pain, Lait, Couche, Lingettes}
5 {Pain, Lait, Couche, Coca}
Exemples de panier de ménagère

● Passant par la présentation binaires des données:


Tran Pain Lait Couche Lingette Coca Ouefs
Prod
T1 1 1 0 0 0 0
T2 1 0 1 1 0 1
T3 0 1 1 1 1 0
T4 1 1 1 1 0 0
T5 1 1 1 0 1 0

minSup=0,4
minConf=60%
Exemples de panier de ménagère

● Considérons la règle {lait, couches} → {pain}:


Le support du l'ensemble (lait, pain, couches) étant égal à 2,
nombre total du transaction est égal à 5,
le support de la règle est égal 2/5 =0.4,………………………………..
la confiance de cette règle est 2/3=0.67 (67%) ……………..

● Étant donné un ensemble de transactions T, le but de l'extraction de règles d'association est


de trouver toutes les règles ayant :

● Ici toutes les règles d’association possibles pour cet exemple:


{Lait, Couche} → {Lingettes} (s=0,4, c=0,67)
{Lait, Lingettes} → {Couche} (s=0,4, c=1,0)
{Couche, Lingettes} → {Lait} (s=0.4, c=0.67)
Exemples de panier de ménagère
{Lingettes} → {Lait, Couche} (s=0,4, c=0,67)
{Couche} → {Lait, Lingettes} (s=0,4, c=0,5)
{Lait} → {Couche, Lingettes} (s=0.4, c=0.5)

● On remarque que :
les éléments sont les mêmes mais leur ordre change
le support = 0,4 le même mais la confiance change
● Donc ,il faut décomposer la proche en deux:
- Génération des itemset fréquents dont:

- Génération des règles de haute confiance à partir de chaque ensemble des éléments
fréquents dont:
Exemples de panier de ménagère
Exemples de panier de ménagère
Références

- Fouille des règles d’association guidée par des ontologies et des


schémas de règles : Application au domaine de la production
SONATRACH / AVAL. (2011). [Mémoire du diplôme magistere].
Université des Sciences et de la Technologie d’Oran « Mohamed
Boudiaf » .

- DATA MINING DISTRIBUÉ SUR LES GRILLES DE DONNÉES :


APPLICATION DE RÈGLES D’ASSOCIATION. (2017). [Thèse de
doctorat]. Université des Sciences et de la Technologie d’Oran «
Mohamed Boudiaf » .

- GÉNÉRATION DES RÈGLES D'ASSOCIATION: TREILLIS DE


CONCEPTS DENSES (ALAIN BOULANGER)
Merci pour
votre attention

Vous aimerez peut-être aussi