Les Règles D'associations

Génie logistique et transport
Business intiligence
Les régles
d’association
Année universitaire:2022/2023
Plan de présentation
Algorithmes et
Data mining outils
01 Introduction Apriori,AprioriTID,DHP,
03
Définition data mining Partition…
Les régles
d’association Exemples en ICL
02 Définition Exemple de panier de
04
Domaines d’utilisation marché
Introduction
Depuis quelques années, on assiste à une forte augmentation dans le nombre et dans le volume des
informations mémorisées par des bases de données scientifiques, économiques, financières,
administratives, médicales…etc. Ces méga bases de données sont peu exploitées, alors qu’elles cachent
des connaissances décisives face au monde extérieur. Pour combler ce besoin, une nouvelle industrie est
née, le Data Mining ou bien la fouille de données.
C'est quoi le data mining?
Le Data Mining est l’ensemble des techniques
qui consiste à identifier à partir d'un important
volume de données brutes, des connaissances
originales auparavant inconnues. Par exemple
elles permettent de trouver les tendances qui se
dégagent dans les ventes d’un supermarché. La
connaissance de telles informations peut
permettre au supermarché d’élaborer des
stratégies commerciales ou de marketing en
direction de ses clients. LA figure suivante
montre le Data Mining comme une étape dans
le processus de découverte de la connaissance.
Figure 1: Le processus de Data Mining

C'est quoi le data mining?
Data Mining
Descriptive Prédictive
Extrapoler des nouvelles
Mettre en évidence des information
informations à partir de données
présente
existantes
Techniques descriptives Techniques prédictives
• Visualisation •Classification Régression

• Regroupement • •Association
Association •Régression
Les règles d’association
● Les règles d'association étudient la
fréquence des items (items=un ensemble
d’attributs) qui se produisent dans la base
de données transactionnelle, elle est basée
sur deux seuil.
● Autrement dit, l’association consiste à

trouver quelles valeurs des variables vont
ensemble.
● Les règles d’association sont de la forme :

AB[s,c], où A représente l’antécédent de
la règle et B la conséquence.
Les règles d’association
Exemple1 :
Elle pourrait être utile pour le directeur d’OurVideoStore pour savoir quels films sont souvent
loués ensemble ou s’il y a un rapport entre l’allocation de certains types de films et l’achat de
popcorn.
Par exemple la règle d’association suivantes :
RentType(X, "jeu") ˄ Age(X, "13-19") → Buys(X, "pop") [ s=2%, c=55% ]
Indiquerait que 2% des transactions considérées sont des clients âgés entre 13 et 19 quilouent un
jeu et achètent popcorn, et une certitude de 55% que les clients adolescents qui louent un jeu
achètent également popcorn.
Exemple2 :
Si on dispose d’une base de données contenant des informations sur la population d’un pays, la
règle associative suivante peut être extraite :
(Age>25) ˄ (Revenu>5000) → (modèle_voiture=tourisme)
Cette règle associe l’âge et le revenu d’un individu au type de la voiture qu’il peut posséder.
Domaines d’application
Marketing et planification commercial
Placement des articles achetés fréquemment ensemble, organisation des catalogues,
choix des articles en promotion, …etc.
Réseaux de télécommunication
Filtrage des alarmes non informatives, identification des causes d’anomalies,
prédiction des anomalies, …etc.
Recherche médicale
aide au diagnostic et définition de traitement, identification de population à risque vis-à-
vis de certaines maladies.
Le domaine industriel
prévision des ventes, surveillance des unités de production, diagnostic et analyse des
pannes, contrôle de qualité, etc.
Multimédia
analyse d’imagerie, prévision météorologique, aide aux enquêtes, etc.
Algorithmes, approches et outils :
Les algorithmes des recherche de règles d’association peuvent être scindées en deux étapes :
● Recherche des itemsets (motifs) fréquents:
● Génération de règles d’association
● Algorithmes Apriori:
L'algorithme APRIORI est ll’algorithme le plus connu dans les règles d’association, il
utilise une approche itérative par niveaux pour générer les itemsets fréquents.
Processus d’algorithme Apriori
Algorithmes AprioriTid
Afin de réduire le nombre de parcours important de la base de transactions d'APRIORI, les
mêmes auteurs d'APRIORI ont proposé l'algorithme APRIORI-TID (Apriori Transaction
Identifier). Cette variante génère les candidats en utilisant la même stratégie, mais elle diffère
dans le calcul du support des itemsets candidats.
L’algorithme APRIORI-TID diminue la taille de la base de données progressivement. Au lieu de

faire une passe lors de l’examen de chaque niveau du treillis des itemsets, toute la base de
données est mise en mémoire, et pour chaque niveau du treillis, les transactions sont
représentées par les k itemsets qu’elle contient.
Autres Algorithmes
DHP Sampling
Sert à diminuer le nombre Effectue la génération des
d’itemsets candidats générés. itemsets sur un échantillon de la
base.
Partition DIC-Dynamic
Autorise la parallélisassions du Propose une diminution du nombre
processus d’extraction de balayages nécessaires
OCD FP-Growth
réalisent un nombre de balayages du
contexte égal à la taille des plus Suit une structure de données compacte
longs itemsets fréquents (Frequent-Pattern tree) qui apporte une
solution au problème de la fouille de
motifs fréquents dans une grande BDD
Algorithmes d’extraction des règles
GEN- GEN-
OPUS
REGLE RULES,GUHA…
(Agrawal & Al, 1994) (Webb, G.I. (1995))
Exemples de panier de ménagère
● Le panier du ménagère décrit un ensemble d'achats effectué au supermarché. Les règles

d'association permet de découvrir la régularités dans l'ensemble de transactions comme par
exemple: Si fromage alors vin rouge, etc.
● Ces règles permettent par exemple au gérant de proposer des bons de réductions
significatifs sur les achats futurs des clients !!
● On prend comme exemple se panier:
TID Items
1 {Pain, Lait}
2 {Pain, Couche, Lingettes, Ouefs}
3 {Lait, Couche, Lingettes, Coca}
4 {Pain, Lait, Couche, Lingettes}
5 {Pain, Lait, Couche, Coca}
● Passant par la présentation binaires des données:

Tran Pain Lait Couche Lingette Coca Ouefs
Prod
T1 1 1 0 0 0 0
T2 1 0 1 1 0 1
T3 0 1 1 1 1 0
T4 1 1 1 1 0 0
T5 1 1 1 0 1 0
minSup=0,4
minConf=60%
● Considérons la règle {lait, couches} → {pain}:

Le support du l'ensemble (lait, pain, couches) étant égal à 2,
nombre total du transaction est égal à 5,
le support de la règle est égal 2/5 =0.4,………………………………..
la confiance de cette règle est 2/3=0.67 (67%) ……………..
● Étant donné un ensemble de transactions T, le but de l'extraction de règles d'association est

de trouver toutes les règles ayant :
● Ici toutes les règles d’association possibles pour cet exemple:

{Lait, Couche} → {Lingettes} (s=0,4, c=0,67)
{Lait, Lingettes} → {Couche} (s=0,4, c=1,0)
{Couche, Lingettes} → {Lait} (s=0.4, c=0.67)
{Lingettes} → {Lait, Couche} (s=0,4, c=0,67)
{Couche} → {Lait, Lingettes} (s=0,4, c=0,5)
{Lait} → {Couche, Lingettes} (s=0.4, c=0.5)
● On remarque que :
les éléments sont les mêmes mais leur ordre change
le support = 0,4 le même mais la confiance change
● Donc ,il faut décomposer la proche en deux:
- Génération des itemset fréquents dont:
- Génération des règles de haute confiance à partir de chaque ensemble des éléments
fréquents dont:
Références
- Fouille des règles d’association guidée par des ontologies et des

schémas de règles : Application au domaine de la production
SONATRACH / AVAL. (2011). [Mémoire du diplôme magistere].
Université des Sciences et de la Technologie d’Oran « Mohamed
Boudiaf » .
- DATA MINING DISTRIBUÉ SUR LES GRILLES DE DONNÉES :

APPLICATION DE RÈGLES D’ASSOCIATION. (2017). [Thèse de
doctorat]. Université des Sciences et de la Technologie d’Oran «
Mohamed Boudiaf » .
- GÉNÉRATION DES RÈGLES D'ASSOCIATION: TREILLIS DE

CONCEPTS DENSES (ALAIN BOULANGER)
Merci pour
votre attention

Les Règles D'associations

Transféré par

Informations du document

Titre original

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

Les Règles D'associations

Transféré par

Droits d'auteur :

Formats disponibles

Génie logistique et transport

Figure 1: Le processus de Data Mining

Techniques descriptives Techniques prédictives

• Visualisation •Classification Régression

● Autrement dit, l’association consiste à

● Les règles d’association sont de la forme :

● Génération de règles d’association

L’algorithme APRIORI-TID diminue la taille de la base de données progressivement. Au lieu de

● Le panier du ménagère décrit un ensemble d'achats effectué au supermarché. Les règles

● Passant par la présentation binaires des données:

● Considérons la règle {lait, couches} → {pain}:

● Étant donné un ensemble de transactions T, le but de l'extraction de règles d'association est

● Ici toutes les règles d’association possibles pour cet exemple:

- Fouille des règles d’association guidée par des ontologies et des

- DATA MINING DISTRIBUÉ SUR LES GRILLES DE DONNÉES :

- GÉNÉRATION DES RÈGLES D'ASSOCIATION: TREILLIS DE

Vous aimerez peut-être aussi