Académique Documents
Professionnel Documents
Culture Documents
Business intiligence
Les régles
d’association
Année universitaire:2022/2023
Plan de présentation
Algorithmes et
Data mining outils
01 Introduction Apriori,AprioriTID,DHP,
03
Définition data mining Partition…
Les régles
d’association Exemples en ICL
02 Définition Exemple de panier de
04
Domaines d’utilisation marché
Introduction
Depuis quelques années, on assiste à une forte augmentation dans le nombre et dans le volume des
informations mémorisées par des bases de données scientifiques, économiques, financières,
administratives, médicales…etc. Ces méga bases de données sont peu exploitées, alors qu’elles cachent
des connaissances décisives face au monde extérieur. Pour combler ce besoin, une nouvelle industrie est
née, le Data Mining ou bien la fouille de données.
C'est quoi le data mining?
Le Data Mining est l’ensemble des techniques
qui consiste à identifier à partir d'un important
volume de données brutes, des connaissances
originales auparavant inconnues. Par exemple
elles permettent de trouver les tendances qui se
dégagent dans les ventes d’un supermarché. La
connaissance de telles informations peut
permettre au supermarché d’élaborer des
stratégies commerciales ou de marketing en
direction de ses clients. LA figure suivante
montre le Data Mining comme une étape dans
le processus de découverte de la connaissance.
Data Mining
Descriptive Prédictive
Extrapoler des nouvelles
Mettre en évidence des information
informations à partir de données
présente
existantes
Exemple2 :
Si on dispose d’une base de données contenant des informations sur la population d’un pays, la
règle associative suivante peut être extraite :
(Age>25) ˄ (Revenu>5000) → (modèle_voiture=tourisme)
Cette règle associe l’âge et le revenu d’un individu au type de la voiture qu’il peut posséder.
Domaines d’application
Marketing et planification commercial
Placement des articles achetés fréquemment ensemble, organisation des catalogues,
choix des articles en promotion, …etc.
Réseaux de télécommunication
Filtrage des alarmes non informatives, identification des causes d’anomalies,
prédiction des anomalies, …etc.
Recherche médicale
aide au diagnostic et définition de traitement, identification de population à risque vis-à-
vis de certaines maladies.
Le domaine industriel
prévision des ventes, surveillance des unités de production, diagnostic et analyse des
pannes, contrôle de qualité, etc.
Multimédia
analyse d’imagerie, prévision météorologique, aide aux enquêtes, etc.
Algorithmes, approches et outils :
Les algorithmes des recherche de règles d’association peuvent être scindées en deux étapes :
● Recherche des itemsets (motifs) fréquents:
● Algorithmes Apriori:
L'algorithme APRIORI est ll’algorithme le plus connu dans les règles d’association, il
utilise une approche itérative par niveaux pour générer les itemsets fréquents.
Processus d’algorithme Apriori
Algorithmes AprioriTid
Afin de réduire le nombre de parcours important de la base de transactions d'APRIORI, les
mêmes auteurs d'APRIORI ont proposé l'algorithme APRIORI-TID (Apriori Transaction
Identifier). Cette variante génère les candidats en utilisant la même stratégie, mais elle diffère
dans le calcul du support des itemsets candidats.
DHP Sampling
Sert à diminuer le nombre Effectue la génération des
d’itemsets candidats générés. itemsets sur un échantillon de la
base.
Partition DIC-Dynamic
Autorise la parallélisassions du Propose une diminution du nombre
processus d’extraction de balayages nécessaires
OCD FP-Growth
réalisent un nombre de balayages du
contexte égal à la taille des plus Suit une structure de données compacte
longs itemsets fréquents (Frequent-Pattern tree) qui apporte une
solution au problème de la fouille de
motifs fréquents dans une grande BDD
Algorithmes d’extraction des règles
GEN- GEN-
OPUS
REGLE RULES,GUHA…
(Agrawal & Al, 1994) (Webb, G.I. (1995))
Exemples de panier de ménagère
TID Items
1 {Pain, Lait}
2 {Pain, Couche, Lingettes, Ouefs}
3 {Lait, Couche, Lingettes, Coca}
4 {Pain, Lait, Couche, Lingettes}
5 {Pain, Lait, Couche, Coca}
Exemples de panier de ménagère
minSup=0,4
minConf=60%
Exemples de panier de ménagère
● On remarque que :
les éléments sont les mêmes mais leur ordre change
le support = 0,4 le même mais la confiance change
● Donc ,il faut décomposer la proche en deux:
- Génération des itemset fréquents dont:
- Génération des règles de haute confiance à partir de chaque ensemble des éléments
fréquents dont:
Exemples de panier de ménagère
Exemples de panier de ménagère
Références