Presentasi sedang didownload. Silahkan tunggu

Presentasi sedang didownload. Silahkan tunggu

Data Mining © Sulidar Fitri, Ms.C STMIK AMIKOM Yogyakarta Chapter 10 ALGORITME for ASSOCIATION RULES Sulidar Fitri, M.Sc Market Basket Analysis Apriori.

Presentasi serupa


Presentasi berjudul: "Data Mining © Sulidar Fitri, Ms.C STMIK AMIKOM Yogyakarta Chapter 10 ALGORITME for ASSOCIATION RULES Sulidar Fitri, M.Sc Market Basket Analysis Apriori."— Transcript presentasi:

1 Data Mining © Sulidar Fitri, Ms.C STMIK AMIKOM Yogyakarta Chapter 10 ALGORITME for ASSOCIATION RULES Sulidar Fitri, M.Sc Market Basket Analysis Apriori Case

2 Data Mining © Sulidar Fitri, Ms.C STMIK AMIKOM Yogyakarta REFERENCES Budi Santosa. Data Mining: Teknik Pemanfaatan Data Untuk Keperluan Bisnis Graha Ilmu Yogyakarta Jiawei Han and Micheline Kamber. Data Mining: Concepts and Techniques Department of Computer Science University of Illinois at Urbana-Champaign. Ian H. Witten, Eibe Frank, Mark A. Hall. Data Mining Practical Machine Learning Tools and Techniques Third Edition Elsevier WEKA

3 Data Mining © Sulidar Fitri, Ms.C STMIK AMIKOM Yogyakarta INTNRODUCTION DATA MINING – Proses untuk menemukan dataset baru pada dataset yang sangat besar. TOPIK – ASSOCIATION RULES (ATURAN ASOSIASI) – FREQUENT ITEMSETS

4 Data Mining © Sulidar Fitri, Ms.C STMIK AMIKOM Yogyakarta Menggunakan algoritme klasik : IF - THEN ATURAN ASOSIASI

5 Data Mining © Sulidar Fitri, Ms.C STMIK AMIKOM Yogyakarta ATURAN ASOSIASI Analisis Afinitas = “apa bersama apa” Bisa digunakan untuk menentukan kebiasaan “ suatu produk apa akan dibeli bersama apa” Market Basket Analysis Contoh: – Studi transaksi di supermarket – Jika membeli Susu Bayi makan akan membeli Sabun Mandi

6 Data Mining © Sulidar Fitri, Ms.C STMIK AMIKOM Yogyakarta ATURAN ASOSIASI DALAM TRANSAKSI Menemukan asosiasi produk dalam database transaksi suatu supermarket. (database Market Basket) Contoh Kasus: – Para manajer ingin mengetahui kelompok items apa yang sering dibeli untuk membuat layout katalog belanja. Solusi: – Gunakan aturan asosiasi dalam hubungan “if-then” atau “jika-maka”. – Aturan tersebut dihitung dari data yang sifatnya probabilistic berdasarkan data market basket

7 Data Mining © Sulidar Fitri, Ms.C STMIK AMIKOM Yogyakarta KASUS Suatu toko yang menjual pakaian olah raga, sedang melakukan promosi padapenjualan topi. Jika seorang pelanggan membeli lebih dari satu macam topi dari 6 pilihan yang ada akan mendapat diskon. Manajer toko tersebut ingin melihat warna apa yang dibeli bersama oleh pelanggan, mengumpulkan data dan menyimpan dalam database.

8 Data Mining © Sulidar Fitri, Ms.C STMIK AMIKOM Yogyakarta Data items Topi tersebut berupa: Catatan transaksi pembelian

9 Data Mining © Sulidar Fitri, Ms.C STMIK AMIKOM Yogyakarta Ide dari Aturan Asosiasi: Periksa semua kemungkinan “IF - THEN” Pilih yang paling mungkin (most likely) sebagai indicator dari hubungan ketergantungan antar item. Antecedent =“Jika” dan consequent = “maka” Kemungkinan aturan: – “Jika Merah, maka Putih ” – {Merah, Putih} = {Biru}

10 Data Mining © Sulidar Fitri, Ms.C STMIK AMIKOM Yogyakarta Secara praktis, Hanya kombinasi yang terjadi dengan frekuensi yang sangat tinggi yang akan diperhatikan itu yang disebut: FREQUENT ITEM SET

11 Data Mining © Sulidar Fitri, Ms.C STMIK AMIKOM Yogyakarta FREQUENT ITEM SET Berhubungan dengan SUPPORT SUPPORT: jumlah transaksi yang mengandung item Support digunakan untuk mengukur seberapa tingkat dukungan data terhadap validitas aturan yang dikembangkan. Dinyatakan dalam prosentase (%) Contoh: – {Merah, Putih} adalah 4/10 atau 40%

12 Data Mining © Sulidar Fitri, Ms.C STMIK AMIKOM Yogyakarta Mengukur Aturan yang Kuat

13 Data Mining © Sulidar Fitri, Ms.C STMIK AMIKOM Yogyakarta Contoh Confidence Suatu supermarket memiliki titik transaksi. Dari jml tersebut ada 1000 transaksi yang mengandung jeruk dan obat flu. Dari 1000 transaksi ada 800 yang mengandung mie instant. Aturan asosiasi jika jeruk dan obat flu dibeli maka mie instant juga dibeli pada belanja yang bersamaan => – Support= 800/ – Confidence = 800/1000

14 Data Mining © Sulidar Fitri, Ms.C STMIK AMIKOM Yogyakarta SUPPORT: Peluang transaksi yang dipilih secara random dari database akan mengandung semua item dalam antecendent maupun consequent atau P (antecedent dan consequent).

15 Data Mining © Sulidar Fitri, Ms.C STMIK AMIKOM Yogyakarta P (consequent | antecedent)

16 Data Mining © Sulidar Fitri, Ms.C STMIK AMIKOM Yogyakarta Lift Ratio

17 Data Mining © Sulidar Fitri, Ms.C STMIK AMIKOM Yogyakarta Susunlah aturan asosiasi dari set item {merah, putih, hijau} !!

18 Data Mining © Sulidar Fitri, Ms.C STMIK AMIKOM Yogyakarta Jika kita Terapkan syarat minimum confidence 75%, maka hanya aturan 2,3, dan 6 yang akan memenuhi

19 Data Mining © Sulidar Fitri, Ms.C STMIK AMIKOM Yogyakarta Ada beberapa algoritme yang sudah dikembangkan mengenai aturan asosiasi, namun ada satu algoritme klasik yang sering dipakai yaitu algoritma apriori (Shmueli et al., 2007)

20 April 9, 2015Data Mining: Concepts and Techniques20 Apriori: A Candidate Generation-and-Test Approach Apriori pruning principle: If there is any itemset which is infrequent, its superset should not be generated/tested! (Agrawal & Mannila, et KDD’ 94) Method: Initially, scan DB once to get frequent 1-itemset Generate length (k+1) candidate itemsets from length k frequent itemsets Test the candidates against DB Terminate when no frequent or candidate set can be generated

21 April 9, 2015Data Mining: Concepts and Techniques21 The Apriori Algorithm—An Example Database TDB 1 st scan C1C1 L1L1 L2L2 C2C2 C2C2 2 nd scan C3C3 L3L3 3 rd scan TidItems 10A, C, D 20B, C, E 30A, B, C, E 40B, E Itemsetsup {A}2 {B}3 {C}3 {D}1 {E}3 Itemsetsup {A}2 {B}3 {C}3 {E}3 Itemset {A, B} {A, C} {A, E} {B, C} {B, E} {C, E} Itemsetsup {A, B}1 {A, C}2 {A, E}1 {B, C}2 {B, E}3 {C, E}2 Itemsetsup {A, C}2 {B, C}2 {B, E}3 {C, E}2 Itemset {B, C, E} Itemsetsup {B, C, E}2 Sup min = 2

22


Download ppt "Data Mining © Sulidar Fitri, Ms.C STMIK AMIKOM Yogyakarta Chapter 10 ALGORITME for ASSOCIATION RULES Sulidar Fitri, M.Sc Market Basket Analysis Apriori."

Presentasi serupa


Iklan oleh Google