Vous êtes sur la page 1sur 26

Exercice 1

1. Calculer le support des itemsets


ID client ID Items
suivants en traitant chacun des
transaction
1 1001 {A, D, E} ID de transaction comme un
1 1024 {A, B, C, E} panier de la ménagère :
2 1012 {A, B, D, E}
{E} , {B, D} et {B, D, E}
2 1031 {A, C, D, E}
3 1015 {B, C, E}
Support ({E})=8/10
3 1022 {B, D, E}
Support ({BD}) =2/10
4 1029 {C, D} Support ({BDE})= 2/10
4 1040 {A, B, C}
5 1033 {A, D, E}
5 1038 {A, B, E}
Exercice 1 2. Calculer la confiance pour les règles d’association suivantes :
a. {B, D} → {E}
Support ({E})=0,8 b. {E} → {B, D}
Support ({BD}) =0,2
Support ({BDE})= 0,2
𝑺𝒖𝒑𝒑𝒐𝒓𝒕 (𝑩𝑫𝑬) 𝟎, 𝟐
𝑪𝒐𝒏𝒇𝒊𝒂𝒏𝒄𝒆 𝑩𝑫 → 𝑬 = = =𝟏
𝑺𝒖𝒑𝒑𝒐𝒓𝒕( 𝑩𝑫 ) 𝟎, 𝟐

𝑺𝒖𝒑𝒑𝒐𝒓𝒕 (𝑩𝑫𝑬) 𝟎, 𝟐
𝑪𝒐𝒏𝒇𝒊𝒂𝒏𝒄𝒆 𝑬 → 𝑩𝑫 = = = 𝟎, 𝟐𝟓
𝑺𝒖𝒑𝒑𝒐𝒓𝒕( 𝑬 ) 𝟎, 𝟖

3. Peut on dire que si un consommateur « achète les articles B et D alors il achète l’article E » est
symétrique à la décision « s’il achète E alors il achète B et D ».

=> Non puisqu’ils n’ont pas la même confiance


4. Pour chacun des cas suivants, déterminer si les règles 2.a et 2.b sont à retenir :
a. Le support minimum est de 0,2 et la confiance minimale est 0,7.
b. Le support minimum est de 0,3 et la confiance minimale est 0,9.

𝑺𝒖𝒑𝒑𝒐𝒓𝒕 (𝑩𝑫𝑬)
Support ({E})=0,8 𝑪𝒐𝒏𝒇𝒊𝒂𝒏𝒄𝒆 𝑩𝑫 → 𝑬 = =𝟏
𝑺𝒖𝒑𝒑𝒐𝒓𝒕( 𝑩𝑫 )
Support ({BD}) =0,2
Support ({BDE})= 0,2 𝑺𝒖𝒑𝒑𝒐𝒓𝒕 (𝑩𝑫𝑬)
𝑪𝒐𝒏𝒇𝒊𝒂𝒏𝒄𝒆 𝑬 → 𝑩𝑫 = = 𝟎, 𝟐𝟓
𝑺𝒖𝒑𝒑𝒐𝒓𝒕( 𝑬 )

Le support minimum est de 0,2 et la confiance minimale est 0,7

=> Retenir la règle si BD alors E

Le support minimum est de 0,3 et la confiance minimale est 0,9.

=> Aucune des deux règle n’est à retenir


Exercice 2 Etablir les règles d’association à trois items en appliquant
l’algorithme Apriori à ce jeu de données.
Transactions Le support minimum et la confiance minimale sont respectivement 33 %
1 A D B C et 50 %.
2 A C D F
3 B C F
4 A B C 𝑺𝒖𝒑𝒑𝒐𝒓𝒕 𝑨𝑩 =
𝑵𝒐𝒎𝒃𝒓𝒆 𝒅𝒆 𝒕𝒓𝒂𝒏𝒔𝒂𝒄𝒕𝒊𝒐𝒏𝒔 𝒄𝒐𝒎𝒑𝒐𝒓𝒕𝒂𝒏𝒕 𝒍𝒆𝒔 𝒊𝒕𝒆𝒎𝒔 𝑨 𝒆𝒕 𝑩
5 B C E
𝑵𝒐𝒎𝒃𝒓𝒆 𝒅𝒆 𝒕𝒓𝒂𝒏𝒔𝒂𝒄𝒕𝒊𝒐𝒏𝒔 𝒕𝒐𝒕𝒂𝒍𝒆𝒔
6 A B C E
7 A E
8 A B C
9 B C D E 𝑺𝒖𝒑𝒑𝒐𝒓𝒕(𝑨𝑩)
𝑪𝒐𝒏𝒇𝒊𝒂𝒏𝒄𝒆 𝑨𝑩 =
10 A C B 𝒔𝒖𝒑𝒑𝒐𝒓𝒕(𝑨)
11 A B C
12 A B E F
L’algorithme Apriori (1994)
Partie III
L’algorithme fondateur de génération automatique de règles
Data Mining d'association.

Data Mining pour Cet algorithme se décompose en deux étapes :


la relation client
1. Recherche de sous-ensembles fréquents (support)
- Règle d’association 2. Recherche de règles d’association (confiance) à partir
des sous-ensembles retenus

5
Etape 1: Déterminer les itemsets fréquents Support minimum est 0,33

Transactions 1-itemset Support


1 A D B C {A} 9/12=0,75
2 A C D F {B} 10/12=0,83
3 B C F {C} 10/12=0,83
4 A B C {D} 3/12=0,25
5 B C E {E} 5/12=0,41
6 A B C E {F} 3/12=0,25
7 A E
8 A B C Les itemsets fréquents sont alors : {A}, {B}, {C}, et {E}
9 B C D E
10 A C B Jointures possibles:
11 A B C - {AB}, {AC}, {AE},
12 A B E F - {BC}, {BE}
- {CE}
Etape 1: Déterminer les itemsets fréquents Support minimum est 0,33

2-itemset Support
Transactions
{AB} 7/12=0,58
1 A D B C
{AC} 7/12=0,58
2 A C D F
{AE} 3/12=0,25
3 B C F
{BC} 9/12=0,75
4 A B C
{BE} 4/12=0,33
5 B C E
{CE} 3/12=0,25
6 A B C E
7 A E
8 A B C Les itemsets fréquents sont alors :
9 B C D E - {AB}, {AC}
10 A C B - {BC}, {BE}
11 A B C
12 A B E F Jointures possibles:
{ABC}, {BCE}
Etape 1: Déterminer les itemsets fréquents Support minimum est 0,33

Transactions 3-itemset Support


1 A D B C {ABC} 6/12=0,5
2 A C D F {BCE} 3/12=0,25
3 B C F
4 A B C
5 B C E
6 A B C E
L’itemsets fréquents sont alors :
7 A E
- {ABC}
8 A B C
Jointures possibles:
9 B C D E Il n’y a plus de jointure possible
10 A C B
11 A B C
12 A B E F
Etape 2: Déterminer les règles d’association Confiance min est 0,5

3-itemset Support
{ABC} 6/12=0,5

Les différentes règles possibles :


- si AB alors C
- si C alors AB
- si AC alors B
- si B alors AC
- si BC alors A
- si A alors BC
Etape 2: Déterminer les règles d’association Confiance min est 0,5

1-itemset Support 2-itemset Support 3-itemset Support


{A} 9/12=0,75 {AB} 7/12=0,58 {ABC} 6/12=0,5
{B} 10/12=0,83 {AC} 7/12=0,58
{C} 10/12=0,83 {BC} 9/12=0,75
{E} 5/12=0,41 {BE} 4/12=0,33

Règle: si AB alors C
𝑺𝒖𝒑𝒑𝒐𝒓𝒕 (𝑨𝑩𝑪) 𝟎, 𝟓
𝑪𝒐𝒏𝒇𝒊𝒂𝒏𝒄𝒆 𝑨𝑩 → 𝑪 = = = 𝟎, 𝟖𝟔 > 𝟎, 𝟓
𝑺𝒖𝒑𝒑𝒐𝒓𝒕( 𝑨𝑩 ) 𝟎, 𝟓𝟖

Règle si C alors AB

𝑺𝒖𝒑𝒑𝒐𝒓𝒕 (𝑨𝑩𝑪) 𝟎, 𝟓
𝑪𝒐𝒏𝒇𝒊𝒂𝒏𝒄𝒆 𝑪 → 𝑨𝑩 = = = 𝟎, 𝟔 > 𝟎, 𝟓
𝑺𝒖𝒑𝒑𝒐𝒓𝒕( 𝑪 ) 𝟎, 𝟖𝟑
Etape 2: Déterminer les règles d’association Confiance min est 0,5

1-itemset Support 2-itemset Support 3-itemset Support


{A} 9/12=0,75 {AB} 7/12=0,58 {ABC} 6/12=0,5
{B} 10/12=0,83 {AC} 7/12=0,58
{C} 10/12=0,83 {BC} 9/12=0,75
{E} 5/12=0,41 {BE} 4/12=0,33

Règle: si AC alors B
𝑺𝒖𝒑𝒑𝒐𝒓𝒕 (𝑨𝑩𝑪) 𝟎, 𝟓
𝑪𝒐𝒏𝒇𝒊𝒂𝒏𝒄𝒆 𝑨𝑪 → 𝑩 = = = 𝟎, 𝟖𝟔 > 𝟎, 𝟓
𝑺𝒖𝒑𝒑𝒐𝒓𝒕( 𝑨𝑪 ) 𝟎, 𝟓𝟖

Règle si B alors AC

𝑺𝒖𝒑𝒑𝒐𝒓𝒕 (𝑨𝑩𝑪) 𝟎, 𝟓
𝑪𝒐𝒏𝒇𝒊𝒂𝒏𝒄𝒆 𝑩 → 𝑨𝑪 = = = 𝟎, 𝟔 > 𝟎, 𝟓
𝑺𝒖𝒑𝒑𝒐𝒓𝒕( 𝑩 ) 𝟎, 𝟖𝟑
Etape 2: Déterminer les règles d’association Confiance min est 0,5

1-itemset Support 2-itemset Support 3-itemset Support


{A} 9/12=0,75 {AB} 7/12=0,58 {ABC} 6/12=0,5
{B} 10/12=0,83 {AC} 7/12=0,58
{C} 10/12=0,83 {BC} 9/12=0,75
{E} 5/12=0,41 {BE} 4/12=0,33

Règle: si BC alors A
𝑺𝒖𝒑𝒑𝒐𝒓𝒕 (𝑨𝑩𝑪) 𝟎, 𝟓
𝑪𝒐𝒏𝒇𝒊𝒂𝒏𝒄𝒆 𝑩𝑪 → 𝑪 = = = 𝟎, 𝟔𝟕 > 𝟎, 𝟓
𝑺𝒖𝒑𝒑𝒐𝒓𝒕( 𝑩𝑪 ) 𝟎, 𝟕𝟓

Règle si A alors BC

𝑺𝒖𝒑𝒑𝒐𝒓𝒕 (𝑨𝑩𝑪) 𝟎, 𝟓
𝑪𝒐𝒏𝒇𝒊𝒂𝒏𝒄𝒆 𝑨 → 𝑩𝑪 = = = 𝟎, 𝟔𝟕 > 𝟎, 𝟓
𝑺𝒖𝒑𝒑𝒐𝒓𝒕( 𝑨 ) 𝟎, 𝟕𝟓
Etape 2: Déterminer les règles d’association Confiance min est 0,5

3-itemset Support
{ABC} 6/12=0,5

Conclusion : Les 6 règles vérifient un ratio de confiance >=0,5


Les différentes règles à retenir :
- si AB alors C
- si C alors AB
- si AC alors B
- si B alors AC
- si BC alors A
- si A alors BC
Exercice 3

Le tableau suivant résume des données de 5 items : A, B, C, D et E ; et 4 transactions :

A B C D E
1 0 1 1 0
0 1 1 0 1
1 1 1 0 0
0 1 0 0 1

Les 0 et les 1 représentent respectivement l’absence ou la présence d’un item dans la transaction. La
première transaction contient donc les items A, C et D alors que les items B et E sont absents.
Nous allons prendre les paramètres suivants : 0,25 pour le support minimum et 0,80 pour la confiance
minimum.
Appliquer t l’algorithme Apriori pour ce jeu de données.
Exercice 3

A B C D E Id transactions Items
1 0 1 1 0 1000 A, C, D
0 1 1 0 1 1001 B, C, E
1 1 1 0 0 1002 A, B, C
0 1 0 0 1 1003 B, E

𝑵𝒐𝒎𝒃𝒓𝒆 𝒅𝒆 𝒕𝒓𝒂𝒏𝒔𝒂𝒄𝒕𝒊𝒐𝒏𝒔 𝒄𝒐𝒎𝒑𝒐𝒓𝒕𝒂𝒏𝒕 𝒍𝒆𝒔 𝒊𝒕𝒆𝒎𝒔 𝑨 𝒆𝒕 𝑩


𝑺𝒖𝒑𝒑𝒐𝒓𝒕 𝑨𝑩 =
𝑵𝒐𝒎𝒃𝒓𝒆 𝒅𝒆 𝒕𝒓𝒂𝒏𝒔𝒂𝒄𝒕𝒊𝒐𝒏𝒔 𝒕𝒐𝒕𝒂𝒍𝒆𝒔

𝑺𝒖𝒑𝒑𝒐𝒓𝒕(𝑨𝑩)
𝑪𝒐𝒏𝒇𝒊𝒂𝒏𝒄𝒆 𝑨𝑩 =
𝒔𝒖𝒑𝒑𝒐𝒓𝒕(𝑨)
Etape 1: Déterminer les itemsets fréquents Support minimum est 0,25

A B C D E 1-itemset Support
{A} 2/4=0,5
1 0 1 1 0
{B} 3/4=0,75
0 1 1 0 1
{C} 3/4=0,75
1 1 1 0 0
{D} 1/4=0,25
0 1 0 0 1
{E} 2/4=0,5

Les itemsets fréquents sont alors : {A}, {B}, {C}, {D} et {E}

Jointures possibles:
- {AB}, {AC}, {AD}, {AE},
- {BC}, {BD}, {BE}
- {CD}, {CE}
- {DE}
Etape 1: Déterminer les itemsets fréquents Support minimum est 0,25

2-itemset Support
A B C D E
{AB} 1/4=0,25
1 0 1 1 0
{AC} 2/4=0,5
{AD} 1/4=0,25 0 1 1 0 1
{AE} 0 1 1 1 0 0
{BC} 2/4=0,5 0 1 0 0 1
{BD} 0
{BE} 2/4=0,5 Les itemsets fréquents sont alors :
{CD} 1/4=0,25 - {AB}, {AC}, {AD}
- {BC}, {BE}
{CE} 1/4=0,25
- {CD}, {CE}
{DE} 0
Jointures possibles:
- {ABC}, {ABD}, {ACD},
- {BCE}
- {CDE}
Etape 1: Déterminer les itemsets fréquents Support minimum est 0,25

3-itemset Support A B C D E
{ABC} 1/4=0,25 1 0 1 1 0
{ABD} 0 0 1 1 0 1
{ACD} 1/4=0,25 1 1 1 0 0
{BCE} 1/4=0,25 0 1 0 0 1
{CDE} 0

Les itemsets fréquents sont alors :


- {ABC}, {ACD},
- {BCE}

Jointures possibles: il n’y a plus de jointure possible


Etape 2: Déterminer les règles d’association Confiance min est 0,8

A B C D E 1-itemset Support
1 0 1 1 0 {A} 0,5
0 1 1 0 1 {B} 0,75
1 1 1 0 0 {C} 0,75
0 1 0 0 1 {D} 0,25
{E} 0,5
2-itemset Support
{AB} 0,25
{AC} 0,5
3-itemset Support
{AD} 0,25
{ABC} 0,25
{BC} 0,5
{ACD} 0,25
{BE} 0,5
{BCE} 0,25
{CD} 0,25
{CE} 0,25
Etape 2: Déterminer les règles d’association Confiance min est 0,8

Calculer la confiance pour chacune des règles


2-itemset Support
{AB} 0,25 Règle 1: si A alors B
{AC} 0,5 𝑺𝒖𝒑𝒑𝒐𝒓𝒕 (𝑨𝑩) 𝟎, 𝟐𝟓
𝑪𝒐𝒏𝒇𝒊𝒂𝒏𝒄𝒆 𝑹𝟏 = = = 𝟎, 𝟓 < 𝟎, 𝟖
{AD} 0,25 𝑺𝒖𝒑𝒑𝒐𝒓𝒕( 𝑨 ) 𝟎, 𝟓
{BC} 0,5
{BE} 0,5 Règle 2: si B alors A
{CD} 0,25 𝑺𝒖𝒑𝒑𝒐𝒓𝒕 (𝑨𝑩) 𝟎, 𝟐𝟓
𝑪𝒐𝒏𝒇𝒊𝒂𝒏𝒄𝒆 𝑹𝟐 = = = 𝟎, 𝟑𝟑 < 𝟎, 𝟖
{CE} 0,25 𝑺𝒖𝒑𝒑𝒐𝒓𝒕( 𝑩 ) 𝟎, 𝟕𝟓

Règle 3: si A alors C
1-itemset Support
𝑺𝒖𝒑𝒑𝒐𝒓𝒕 (𝑨𝑪) 𝟎, 𝟓
{A} 0,5 𝑪𝒐𝒏𝒇𝒊𝒂𝒏𝒄𝒆 𝑹𝟑 = = = 𝟏 > 𝟎, 𝟖
𝑺𝒖𝒑𝒑𝒐𝒓𝒕( 𝑨 ) 𝟎, 𝟓
{B} 0,75
{C} 0,75 Règle 4: si C alors A
{D} 0,25 𝑺𝒖𝒑𝒑𝒐𝒓𝒕 (𝑨𝑪) 𝟎, 𝟓
𝑪𝒐𝒏𝒇𝒊𝒂𝒏𝒄𝒆 𝑹𝟒 = = = 𝟎, 𝟔𝟕 < 𝟎, 𝟖
{E} 0,5 𝑺𝒖𝒑𝒑𝒐𝒓𝒕( 𝑪 ) 𝟎, 𝟕𝟓
Etape 2: Déterminer les règles d’association Confiance min est 0,8

Itemsets fréquents Règle Confiance

{AB} Si A alors B 0,5


Si B alors A 0,33
{AC} Si A alors C 1
Si C alors A 0,67
{AD} Si A alors D 0,5
Si D alors A 1
{BC} Si B alors C 0,67
Si C alors B 0,67
{BE} Si B alors E 0,67
Si E alors B 1
{CD} Si C alors D 0,33
Si D alors C 1
{CE} Si E alors C 0,33
Si c alors E 0,5
Etape 2: Déterminer les règles d’association Confiance min est 0,8

3-itemset Support
{ABC} 0,25 Règle: si AB alors C
{ACD} 0,25 𝑺𝒖𝒑𝒑𝒐𝒓𝒕 (𝑨𝑩𝑪) 𝟎, 𝟐𝟓
𝑪𝒐𝒏𝒇𝒊𝒂𝒏𝒄𝒆 𝑨𝑩 → 𝑪 = = = 𝟏 > 𝟎, 𝟖
{BCE} 0,25 𝑺𝒖𝒑𝒑𝒐𝒓𝒕( 𝑨𝑩 ) 𝟎, 𝟐𝟓

Règle si C alors AB

2-itemset Support 𝑺𝒖𝒑𝒑𝒐𝒓𝒕 (𝑨𝑩𝑪) 𝟎, 𝟐𝟓


𝑪𝒐𝒏𝒇𝒊𝒂𝒏𝒄𝒆 𝑪 → 𝑨𝑩 = = = 𝟎, 𝟑𝟑 < 𝟎, 𝟖
{AB} 0,25 𝑺𝒖𝒑𝒑𝒐𝒓𝒕( 𝑪 ) 𝟎, 𝟕𝟓
{AC} 0,5
{AD} 0,25
{BC} 0,5
{BE} 0,5
{CD} 0,25
{CE} 0,25
Etape 2: Déterminer les règles d’association Confiance min est 0,8

Pour {ABC}

Itemsets fréquents Règle Confiance

Si A alors BC 0,5
Si B alors AC 0,33
{ABC} Si C alors AB 0,33
Si BC alors A 0,5
Si AC alors B 0,5
Si AB alors C 1
Etape 2: Déterminer les règles d’association Confiance min est 0,8

Pour {ACD}

Itemsets fréquents Règle Confiance

Si A alors CD 0,5
Si C alors AD 0,33
{ACD} Si D alors AC 1
Si CD alors A 1
Si AD alors C 1
Si AC alors D 0,5
Etape 2: Déterminer les règles d’association Confiance min est 0,8

Pour {BCE}

Itemsets fréquents Règle Confiance

Si B alors CE 0,33
Si C alors BE 0,33
{BCE} Si E alors BC 0,5
Si CE alors B 1
Si BE alors C 0,5
Si BC alors E 0,5
Etape 2: Déterminer les règles d’association Confiance min est 0,8

Les règles à retenir


• De {AC} : si A alors C
• De {AD} : si D alors A
• De {BE}: si E alors B
• De {CD}: si D alors C
• De {ABC}: si AB alors C
• De {BCE}: si CE alors B
• De {ACD}:
si D alors AC
si CD alors A
si AD alors C

Vous aimerez peut-être aussi