Presentasi sedang didownload. Silahkan tunggu

Presentasi sedang didownload. Silahkan tunggu

Chapter 10 ALGORITME for ASSOCIATION RULES

Presentasi serupa


Presentasi berjudul: "Chapter 10 ALGORITME for ASSOCIATION RULES"— Transcript presentasi:

1 Chapter 10 ALGORITME for ASSOCIATION RULES
Market Basket Analysis Apriori Case Definition Sulidar Fitri, M.Sc

2 REFERENCES Budi Santosa. Data Mining: Teknik Pemanfaatan Data Untuk Keperluan Bisnis Graha Ilmu Yogyakarta Jiawei Han and Micheline Kamber. Data Mining: Concepts and Techniques Department of Computer Science University of Illinois at Urbana-Champaign. Ian H. Witten, Eibe Frank, Mark A. Hall. Data Mining Practical Machine Learning Tools and Techniques Third Edition Elsevier WEKA

3 INTNRODUCTION DATA MINING TOPIK
Proses untuk menemukan dataset baru pada dataset yang sangat besar. TOPIK ASSOCIATION RULES (ATURAN ASOSIASI) FREQUENT ITEMSETS

4 ATURAN ASOSIASI Menggunakan algoritme klasik : IF - THEN

5 ATURAN ASOSIASI Analisis Afinitas = “apa bersama apa”
Bisa digunakan untuk menentukan kebiasaan “ suatu produk apa akan dibeli bersama apa” Market Basket Analysis Contoh: Studi transaksi di supermarket Jika membeli Susu Bayi makan akan membeli Sabun Mandi

6 ATURAN ASOSIASI DALAM TRANSAKSI
Menemukan asosiasi produk dalam database transaksi suatu supermarket. (database Market Basket) Contoh Kasus: Para manajer ingin mengetahui kelompok items apa yang sering dibeli untuk membuat layout katalog belanja. Solusi: Gunakan aturan asosiasi dalam hubungan “if-then” atau “jika-maka”. Aturan tersebut dihitung dari data yang sifatnya probabilistic berdasarkan data market basket

7 KASUS Suatu toko yang menjual pakaian olah raga, sedang melakukan promosi padapenjualan topi. Jika seorang pelanggan membeli lebih dari satu macam topi dari 6 pilihan yang ada akan mendapat diskon. Manajer toko tersebut ingin melihat warna apa yang dibeli bersama oleh pelanggan, mengumpulkan data dan menyimpan dalam database.

8 Data items Topi tersebut berupa:
Catatan transaksi pembelian

9 Ide dari Aturan Asosiasi:
Periksa semua kemungkinan “IF - THEN” Pilih yang paling mungkin (most likely) sebagai indicator dari hubungan ketergantungan antar item. Antecedent =“Jika” dan consequent = “maka” Kemungkinan aturan: “Jika Merah, maka Putih ” {Merah, Putih} = {Biru}

10 Secara praktis, Hanya kombinasi yang terjadi dengan frekuensi yang sangat tinggi yang akan diperhatikan itu yang disebut: FREQUENT ITEM SET

11 FREQUENT ITEM SET Berhubungan dengan SUPPORT
SUPPORT: jumlah transaksi yang mengandung item Support digunakan untuk mengukur seberapa tingkat dukungan data terhadap validitas aturan yang dikembangkan. Dinyatakan dalam prosentase (%) Contoh: {Merah, Putih} adalah 4/10 atau 40%

12 Mengukur Aturan yang Kuat

13 Contoh Confidence Suatu supermarket memiliki titik transaksi. Dari jml tersebut ada 1000 transaksi yang mengandung jeruk dan obat flu. Dari 1000 transaksi ada 800 yang mengandung mie instant. Aturan asosiasi jika jeruk dan obat flu dibeli maka mie instant juga dibeli pada belanja yang bersamaan => Support= 800/ Confidence = 800/1000

14 SUPPORT: Peluang transaksi yang dipilih secara random dari database akan mengandung semua item dalam antecendent maupun consequent atau P (antecedent dan consequent).

15 P (consequent | antecedent)
P (consequent | antecedent)

16 Lift Ratio

17 Susunlah aturan asosiasi dari set item {merah, putih, hijau} !!

18 Jika kita Terapkan syarat minimum confidence 75%, maka hanya aturan 2,3, dan 6 yang akan memenuhi

19 Ada beberapa algoritme yang sudah dikembangkan mengenai aturan asosiasi, namun ada satu algoritme klasik yang sering dipakai yaitu algoritma apriori (Shmueli et al., 2007)

20 Apriori: A Candidate Generation-and-Test Approach
Apriori pruning principle: If there is any itemset which is infrequent, its superset should not be generated/tested! (Agrawal & Mannila, et KDD’ 94) Method: Initially, scan DB once to get frequent 1-itemset Generate length (k+1) candidate itemsets from length k frequent itemsets Test the candidates against DB Terminate when no frequent or candidate set can be generated April 10, 2017 Data Mining: Concepts and Techniques

21 The Apriori Algorithm—An Example
Supmin = 2 Itemset sup {A} 2 {B} 3 {C} {D} 1 {E} Database TDB Itemset sup {A} 2 {B} 3 {C} {E} L1 C1 Tid Items 10 A, C, D 20 B, C, E 30 A, B, C, E 40 B, E 1st scan C2 Itemset sup {A, B} 1 {A, C} 2 {A, E} {B, C} {B, E} 3 {C, E} C2 Itemset {A, B} {A, C} {A, E} {B, C} {B, E} {C, E} L2 2nd scan Itemset sup {A, C} 2 {B, C} {B, E} 3 {C, E} C3 L3 Itemset {B, C, E} 3rd scan Itemset sup {B, C, E} 2 April 10, 2017 Data Mining: Concepts and Techniques

22 Any Queries ?


Download ppt "Chapter 10 ALGORITME for ASSOCIATION RULES"

Presentasi serupa


Iklan oleh Google