Presentasi sedang didownload. Silahkan tunggu

Presentasi sedang didownload. Silahkan tunggu

Firman Ardiansyah, S.Kom, M.Si. Imas S. Sitanggang, S.Si., M.Kom

Presentasi serupa


Presentasi berjudul: "Firman Ardiansyah, S.Kom, M.Si. Imas S. Sitanggang, S.Si., M.Kom"— Transcript presentasi:

1 Firman Ardiansyah, S.Kom, M.Si. Imas S. Sitanggang, S.Si., M.Kom
PEMBENTUKAN MINIMAL NON-REDUNDANT ASSOCIATION RULES MENGGUNAKAN FREQUENT CLOSED ITEMSETS PADA DATA TRANSAKSI SWALAYAN Oleh: Risa Maisarah (G ) Pembimbing: Firman Ardiansyah, S.Kom, M.Si. Imas S. Sitanggang, S.Si., M.Kom

2 Latar Belakang Masalah: Aturan tidak relevan Association rules mining
Data Mining Tumpukan data Organisasi Aturan asosiasi Keuntungan Keputusan Masalah: Aturan tidak relevan Association rules mining Jumlah aturan asosiasi banyak Aturan berulang

3 Latar Belakang ”Sebuah aturan asosiasi dikatakan berulang jika terdapat aturan asosisi lain yang memberikan informasi yang sama sehingga aturan asosiasi tersebut menjadi tidak efektif ” (Bastide et al 2000). Contoh: Aturan Asosiasi Support Confidence A → B 33 % 66 % A → B, C A → B, C, E A, B, C → E 30 % 100 % Aturan asosiasi yang tampil Data bersifat dense (padat) Aturan tidak relevan Aturan asosiasi berulang Solusi: Mining minimal non-redundant association rules berdasarkan konsep closure dalam Galois connection Minimal non-redundant association rules

4 Tujuan Menerapkan konsep closure dari Galois connection untuk membentuk generators dan frequent closed itemsets menggunakan algoritma Close. Membentuk minimal non-redundant association rules menggunakan generators dan frequent closed itemsets. Membandingkan hasil dan waktu eksekusi pada mining minimal non-redundant association rules dengan mining association rules dalam penelitian sebelumnya (Widodo 2004).

5 Ruang Lingkup Menggunakan konsep closure dalam Galois connection untuk mendapatkan minimal non-redundant association rules. Menggunakan data transaksi yang sama dengan penelitian Widodo (2004), yaitu data transaksi pembelian barang di Sinar Mart Swalayan selama 2 bulan (1 Maret 2004 – 21 Mei 2004). Manfaat Diharapkan dapat memberikan minimal non-redundant association rules yang paling relevan dan berguna serta mudah dipahami oleh pengguna.

6 Data Mining Proses ekstraksi informasi atau pola yang penting dalam basis data berukuran besar. Association rule mining digunakan untuk mencari hubungan menarik diantara item-item dalam suatu himpunan data Ukuran objektif yang dapat digunakan untuk menemukan aturan asosiasi X → Y adalah: Support adalah persentase kombinasi item dalam basis data Confidence merupakan nilai persentase dari hubungan antar item dalam aturan asosiasi. Support = Confidence =

7 Mining Minimal Non-Redundant Association Rules
Bastide et al. (2000): Aturan Asosiasi Support Confidence A → B 33 % 66 % A → B, C 80 % A → B, C, E 26 % generators frequent closed itemsets Exact association rules Approximate association rules

8 Galois Connection Suatu hubungan antara dua item berbeda yang saling berhubungan satu sama lain dalam sebuah aplikasi Pasangan aplikasi (f, g) Galois connection TID A B C D E 1 2 3 4 5 Hubungan antara dua item berbeda karena memiliki kesamaan Konsep closure Galois closure operator itemset C dalam dataset D adalah closed itemset jika dan hanya jika h(C) = C. Closed itemset yang paling minimal mengandung itemset I untuk h(I), h(I) disebut closure dari I. Closed itemset lattice ABCDE 1 ACD 2 ABCE Closed itemset C adalah frequent closed itemset jika support(C) ≥ minsup. 3 AC 3 BCE 4 C 4 BE

9 Lift Pencarian aturan asosiasi yang tidak menyesatkan yaitu mencari nilai korelasi antar data itemsets atau disebut juga dengan lift. korelasi antara pembelian A dan B dapat ditulis sebagai: corrA,B = atau Lift = P(B|A)/P(B) Hasil nilai korelasi : Nilai corrA,B < 1 Korelasi negatif Nilai corrA,B > 1 Korelasi Positif Nilai corrA,B = 1 Tidak berkorelasi

10 Metode Penelitian Metode penelitian (Berdasarkan KDD dari Han & Kamber, 2006): 1. Praproses Data Pembersihan data Integrasi data Seleksi data Transformasi data Hasil penelitian sebelumnya (Widodo, 2004) 2. Data Mining Pembentukan generators danfrequent closed itemsets Pembentukan minimal non-redundant association rules 3. Evaluasi Pola Lift 4. Presentasi Pengetahuan Aturan asosiasi, support confidence dan lift Tabel

11 Metode Penelitian Lingkungan Pengembangan Sistem: 1. Perangkat Keras
Processor: Intel Pentium IV, 2.4 Ghz Memori: 256 MB RAM Harddisk : kapaisitas 80 GB Monitor, keyboard dan mouse 2. Perangkat Lunak Sistem operasi: Microsoft Windows XP DBMS: Microsoft Access Bahasa Pemrograman: Visual Basic 6.0 Perancangan Basis Data: Basis data pada penelitian Widodo (2004) dengan beberapa perubahan untuk kepentingan implementasi Algoritma Close, Algoritma Gen-GB, dan Algoritma Gen-RI.

12 Hasil Penelitian Penelitian ini melakukan perbandingan antara proses mining minimal non-redundant association rules dengan mining association rules pada penelitian sebelumnya (Widodo 2004). Dilakukan di lingkungan sistem dan data transaksi yang sama. 4 nilai minsup dan 11 nilai mincof yang akan dicobakan pada kedua sistem sama. Minsup: 5 %, 2 %, 1 %, dan 0,5 % dari transaksi Mincof : 75 %, 70 %, 65 %, 60 %, 55 %, 50 %, 45 %, 40 %, %, 20 %, dan 10 %.

13 Perbandingan 1 Parameter Minsup (%) 5 2 1 0,5 Kandidat FC1 35 FC1 13 19 24 30 Kandidat FC2 78 171 276 435 FC2 11 37 87 Kandidat FC3 - 93 407 FC3 34 Kandidat FC4 22 FC4 Parameter Minsup (%) 5 2 1 0,5 Kandidat 1-itemset 35 Large 1-itemset 13 19 24 30 Kandidat 2-itemset 78 171 276 435 Large 2-itemset 11 37 87 Kandidat 3-itemset - 93 407 Large 3-itemset 34 Kandidat 4-itemset 23 Large 4-itemset Pembentukan frequent closed itemsets (FC) (algoritma Close) Pembentukan large itemset (algoritma Apriori) Semakin tinggi nilai minsup, maka semakin kecil jumlah FC dan large itemset yang diperoleh dari masing-masing kandidat

14 Perbandingan 1 Grafik waktu eksekusi
Waktu untuk dua proses pruning dalam algoritma Close menjadi tidak berguna. Waktu eksekusi algoritma Close lebih lama dibandingkan waktu eksekusi algoritma Apriori Semakin kecil nilai minsup maka semakin besar waktu eksekusi untuk algoritma Close dan Apriori.

15 Perbandingan 2 Mininimal Non-Redundant Association Rules
Mincof (%) Minsup (%) 5 2 1 0,5 75 70 65 4 60 3 10 55 15 50 8 25 45 26 40 39 30 19 73 20 14 44 128 77 226 Mincof (%) Minsup (%) 5 2 1 0,5 75 70 65 60 3 55 4 50 8 45 9 40 6 15 30 7 22 20 16 39 10 11 34 71 Mininimal Non-Redundant Association Rules Aturan Asosiasi (Penelitian Widodo 2004)

16 Perbandingan 2 Grafik waktu eksekusi pembentukan Minimal Non-Redundant Association Rules (MNRAA) dan Aturan Asosiasi (AA) Rataan perbedaan 9 detik Rataan perbedaan 40,45 detik Rataan perbedaan 192 detik ( 3,5 menit) Rataan perbedaan 1035 detik ( 17,25 menit)

17 Perbandingan 2 Grafik total waktu eksekusi Mining Minimal Non-Redundant Association Rules (MNRAA) dan Mining Association Rules (AA) Rataan perbedaan 17 detik Rataan perbedaan 12,5 detik Rataan perbedaan 59 detik Rataan perbedaan 579 detik (9,65 menit)

18 Perbandingan 2 Minimal non-redundant association rules dengan nilai confidence terbesar Minsup (%) Aturan Asosiasi Support(%) Confidence (%) 5 susu → snack 6,54 44,64 2 pasta gigi → sabun 2,67 53,64 1 susu, permen → snack 1,21 70,44 0,5 susu, pelengkap roti → snack 0,7 78,67 Aturan asosiasi dengan nilai confidence terbesar Minsup (%) Aturan Asosiasi Support (%) Confidence (%) 5 susu → snack 6,54 44,64 2 1 susu, permen → snack 1,21 70,44 0,5

19 Hasil Perbandingan Algoritma Apriori
Waktu lama dan sumberdaya komputasi yang besar. Itemset lattice Algoritma Close Closed itemset lattice Mengurangi waktu dan sumberdaya komputasi. Data transaksi tidak padat Korelasi data lemah Keunggulan Algoritma Close tidak terlihat 2. Generators dan frequent closed itemsets yang dihasilkan algoritma Close sangat mempengaruhi pembentukan minimal non-redundant association rules.

20 Hasil Perbandingan 3. Aturan asosiasi (Penelitian sebelumnya)
Aturan asosiasi tidak berulang Waktu eksekusi lama Aturan asosiasi tidak berulang dan menarik Minimal non-redundant association rules Waktu eksekusi sebentar Data transaksi tidak padat Aturan asosiasi berulang tidak terbentuk Keunggulan mining minimal non-redundant association rules tidak terlihat secara keseluruhan 4. Keunggulan mining non-redundant association rules hanya terlihat pada pembentukan minimal non-redundant association rules saja.

21 Kesimpulan & Saran Kesimpulan:
Algoritma Close menggunakan teknik pruning terhadap closed itemset lattice Algoritma Close lebih unggul dibandingkan algoritma Apriori dalam efisiensi waktu eksekusi dan penggunaan sumberdaya komputasi. Mining minimal non-redundant association rules menghasilkan aturan asosiasi yang lebih baik dibandingkan dengan mining association rules. Keunggulan mining minimal non-redundant association rules: Aturan asosiasi tidak berulang dan relevan. Aturan asosasi mengandung semua informasi di dalam basis data. Efisiensi waktu eksekusi dan penggunaan sumberdaya komputasi.

22 Kesimpulan & Saran Mining minimal non-redundant association rules menampilkan kinerja terbaik pada data yang bersifat padat dan berkorelasi tinggi. Data transaksi dalam penelitian ini memiliki sifat data yang tidak padat dan berkorelasi rendah, sehingga membutuhkan waktu eksekusi lebih lama untuk Algoritma Close. Saran: Penggunaan data yang bersifat padat dan memiliki korelasi tinggi, sehingga mining minimal non-redundant association rules dapat memperlihatkan keunggulannya. Dikembangkan dengan menggunakan algoritma lain untuk membentuk generators dan frequent closed itemsets yang lebih sedikit pada data yang bersifat jarang.

23 TERIMA KASIH . . .


Download ppt "Firman Ardiansyah, S.Kom, M.Si. Imas S. Sitanggang, S.Si., M.Kom"

Presentasi serupa


Iklan oleh Google