Académique Documents
Professionnel Documents
Culture Documents
Exemple: Chercher des associations entre produits sur les tickets de caisse
Soit la base de données suivante de 5 transactions (tickets)
T1 = { 𝟏, 𝟐, 𝟑, 𝟒, 𝟓}
𝟏 = / 𝟐 = / 𝟑 = / 𝟒 = / 𝟓 =
Ensemble des items
5
𝟏 = / 𝟐 = / 𝟑 = / 𝟒 = / 𝟓 =
Un ensemble d’items X de cardinalité k est appelé un k-itemset
1-itemset : Ensemble de descripteurs
X = {x1=A, x2=B, x3=C, x4=D, x5=E}
2-itemset : Ensemble de descripteurs
X = {x1=AB, x2=AC, x3=AD, x4=AE, x5=BC, x6=BD, x7=BE, x8=CD, x9=CE, x10=DE}
3-itemset : Ensemble de descripteurs
X = {x1 = ABC, x2 = ABD, …}
Calcul de support
6
2- Est-ce que les items et sont fréquents? (sans faire le calcul de support)
Application de la forme R : →
et sont des items disjoints ( = )
Conséquent Antécédent
Condition Résultat
x → y
"Puisque j’achète une pizza, il me faut aussi une Coca-Cola "
Une règle d’association traduit une cooccurrence et non une causalité
La force d’une règle d’association est mesurée en utilisant
son Support, supp( → )
et sa Confiance, conf( → )
R: → [ %, %]
Règles d’association
13
17
Algorithme Apriori : Exemple
18
Exemple :
Déterminer l’ensemble d’item fréquents associés à la base de transactions
suivantes : , 𝟐 , 𝟑 , 𝟒 avec Smin=40%
1
𝟏{
𝟏
=0.75 =0.5 =0.75 =0.25
𝟏
{
1 2
𝟐{
=0.25 =0.5 =0.5
𝟐
{
{
Sélection des règles d’association pertinentes
19
Exemple :
Déterminer les règles d’association pertinentes associées à la base de transactions
suivantes : , 𝟐 , 𝟑 , 𝟒 sachant que l’ensemble des
items fréquents ={ , } et Confmin=70%
R: R:
R: R:
0.666 (66.6%) 1 (100%)
Éliminer R2
21
NB. Des règles avec un haut degré de confiance ne sont pas nécessairement
intéressantes
Exemple : , 𝟐 , 𝟑 , 𝟒