Académique Documents
Professionnel Documents
Culture Documents
A priori
Hicham BEHJA
Règles d’association
2
Règles d’association : un
exemple
" Un client qui achète du poisson et du citron a tendance à acheter du persil".
4
Support-Confiance-Intérêt
● Sa forme: Si condition alors conclusion
5
Définitions formelles
● L = {i1,i2,… im} un ensemble d’attributs
● La règle d’association, X ⇒ Y
– X ⊆ T, Y ⊆ T, X ∩ Y = ∅
est au moins définie par deux mesures de qualité: support et la confiance
6
Définition du problème
● Etant donné un ensemble de transactions D, nous
souhaitons trouver toutes les règles d’association ayant un
support et une confiance supérieurs aux seuils minimaux
prédéfinis par l’utilisateur (minsup et minconf)
● Deux sous-problèmes :
1. Trouver tout les itemsets ayant un support supérieur ou égal à
minsup : FIS
7
Algorithme à priori
● Principe:
– générer les ensembles d’items
– calculer leur fréquence
– garder ceux dont la fréquence dépasse un certain seuil
– générer les règles à partir de ces ensembles
– garder celles dont la fiabilité dépasse un certain seuil
● Propriété:
– Tous sous ensemble d’un ensemble fréquent est fréquent
– Tous sur ensemble d’un ensemble non fréquent est non fréquent
8
Algorithme a priori –Génération
des candidats
● Principe pour générer un ensemble d’items de taille k:
– le construire itérativement à partir d’un ensemble de taille 1
– Prenons un ensemble fréquent de taille k-1, noté Lk-1.
– On construit l’ensemble candidat Ck en prenant la jointure de Lk-1avec lui-même.
● Cette jointure correspond à l’ensemble des unions d’ensembles ayant seulement un élément différent.
– On obtient Lk en éliminant de Ck tous les ensembles d’items pour lesquels il existe un
sous-ensemble n’appartenant pas à Lk-1, ou bien dont la fréquence n’est pas assez élevée.
● Algorithme :
9
Exemple de génération des
candidats
● Considérons les ensembles de 3 items suivants:
S={(A,B,C),(A,B,D),(A,C,D),(A,C,E),(B,C,D)}
10
Extraction des règles
● A partir de (A,B,C) on peut construire 6
règles avec le même support mais pas la
même confiance:
– A B,C
– B A,C
– C A,B
– A,B C
– A,C B
– B,C A
11