Firman Ardiansyah, S.Kom, M.Si. Imas S. Sitanggang, S.Si., M.Kom

Slides:



Advertisements
Presentasi serupa
MODUL 10 APRIORI.
Advertisements

HOVER (Hotel Service Server)
Membangun sistem informasi berbasis
Kemajuan teknologi informasi & komunikasi memungkinkan sebuah perusahaan untuk memperoleh dan menyimpan data transaksional dan demografi secara.
Algoritma A priori.
Market Basket Analysis
Chapter 10 ALGORITME for ASSOCIATION RULES
Data Mining.
APLIKASI PENERIMAAN MURID BARU SDN MEKARSARI 06 MENGGUNAKAN MICROSOFT VISUAL BASIC 6.0 DAN MICROSOFT ACCESS Nama : Dian Kurnianingsih NPM : UNIVERSITAS.
Pertemuan XIV FUNGSI MAYOR Assosiation. What Is Association Mining? Association rule mining: –Finding frequent patterns, associations, correlations, or.
Market Basket Analysis - #3
APLIKASI PENJUALAN TOKO KOSMETIK DAN BEAUTY SUPPORT Wilasari,
Association Rules.
Association Rule (Apriori Algorithm)
ANALISIS KELAYAKAN DAN PROPOSAL SISTEM
Membangun Website E-Commerce Di Butik Muslim Sifa Collection
Pertemuan 13 C A N D I D A T E M A T R I X.
PRIHANDOKO S.Kom, MIT, PDH
Dosen Pengampu : Edhy Sutanta, ST.,M.Kom.. Hoby Renang Badminton Traveling.
DATA MINING (Machine Learning)
Association Rules (Kaidah Asosiasi)
ANALISIS ASOSIASI BAGIAN 1
ANALISIS ASOSIASI.
ANALISIS ASOSIASI BAGIAN 2
Association Rule Ali Ridho Barakbah Mata kuliah Data Mining.
SEMINAR TUGAS AKHIR 16 JULY 2008
Oleh: Tri Endah Wijayanti G
ANALISIS ASOSIASI BAGIAN 1
Fernissa .F. (G ) Dosen Pembimbing : Shelvie Nidya Neyman S.Kom, M.Si
OLEH : HANDAYANI RETNO SUMINAR G PEMBIMBING :
ANALISIS KELAYAKAN.
Disusun Oleh: AVE ABDI SARAGIH
ALGORITMA A PRIORI Wahyu Nurjaya WK, S.T., M.Kom.
Pengembangan Sistem Informasi Manajemen Akademik Berbasis Web
Oleh: Aditya Nugroho G Dibimbing Oleh: Ir. Agus Buono, M.Si., M.Kom.
FIKRI FADLILLAH, S.T., MMSI
PERANCANGAN PROGRAM PENJUALAN OBAT SECARA
Oleh: Ineza Nur Oktabroni (G )
Penambahan Operasi OLAP dan Fungsi Agregat pada Temporal Data Warehouse Tanaman Pangan Kabupaten Karo Oleh : Karina Gusriani – G Pembimbing : Ibu.
MUHAMMAD RAFI MUTTAQIN G
Konsep delphi Pertemuan Ke-1 & 2.
Martin Budi G Di Bawah Bimbingan Rindang Karyadin, S.T., M.Kom.
Imas S Sitanggang, S.Si, M.Kom
PEMBUATAN POHON KEPUTUSAN
Pembuatan Situs SMP Insan Kamil Bogor
Assocation Rule Data Mining.
ANALISIS ASOSIASI BAGIAN 1
THE DECISION ANALYSIS PHASE
Nama Anggota Kelompok: Erna Fatayati (G ) Dirman Hafiz (G )
ANALISA ASOSIASI DATA MINING.
Data Mining Junta Zeniarja, M.Kom, M.CS
Business Intelligent Ramos Somya, S.Kom., M.Cs.
.: ALGORITMA APRIORI :. DSS - Wiji Setiyaningsih, M.Kom
ANALISIS KERANJANG PASAR MENGGUNAKAN ALGORTIMA PREDICTIVE Ninditya Kharisma, for further detail, please visit
Deteksi Spatial Outliers pada Data hasil PILKADA Kota Bogor
APLIKASI DATA MINING MENGGUNAKAN ATURAN ASOSIASI
TUGAS AKHIR PERANCANGAN PROGRAM PENJUALAN DAN PEMBELIAN BARANG ELEKTRONIK SECARA TUNAI PERANCANGAN PROGRAM PENJUALAN DAN PEMBELIAN BARANG ELEKTRONIK.
ANALISIS KELAYAKAN.
Sekilas Tentang Komputer
ANALISIS ASOSIASI APRIORI.
ANALISIS KELAYAKAN.
SISTEM INFORMASI PELAYANAN JASA LAUNDRY PADA RUMAH CUCI LAUNDRY BANDUNG Oleh : Windi Astuti
Presentasi Penelitian Tugas Akhir
Oleh: Wahyu Dwi Suryanto G
MODUL 10 APRIORI.
ASSOCIATION RULE DAN PENERAPANNYA
PEMBUATAN APLIKASI SIRKULASI BARANG DI KONVEKSI WAHANA COLLECTION (KOWACI) CIANJUR KERJA PRAKTEK Asri Rahayu FAKULTAS TEKNIK TEKNIK INFORMATIKA.
Textbooks. Association Rules Association rule mining  Oleh Agrawal et al in  Mengasumsikan seluruh data categorical.  Definition - What does.
ALGORITMA DAN PEMROGRAMAN 2B
ASSOCIATION RULES APRIORI.
Transcript presentasi:

Firman Ardiansyah, S.Kom, M.Si. Imas S. Sitanggang, S.Si., M.Kom PEMBENTUKAN MINIMAL NON-REDUNDANT ASSOCIATION RULES MENGGUNAKAN FREQUENT CLOSED ITEMSETS PADA DATA TRANSAKSI SWALAYAN Oleh: Risa Maisarah (G64103009) Pembimbing: Firman Ardiansyah, S.Kom, M.Si. Imas S. Sitanggang, S.Si., M.Kom

Latar Belakang Masalah: Aturan tidak relevan Association rules mining Data Mining Tumpukan data Organisasi Aturan asosiasi Keuntungan Keputusan Masalah: Aturan tidak relevan Association rules mining Jumlah aturan asosiasi banyak Aturan berulang

Latar Belakang ”Sebuah aturan asosiasi dikatakan berulang jika terdapat aturan asosisi lain yang memberikan informasi yang sama sehingga aturan asosiasi tersebut menjadi tidak efektif ” (Bastide et al 2000). Contoh: Aturan Asosiasi Support Confidence A → B 33 % 66 % A → B, C A → B, C, E A, B, C → E 30 % 100 % Aturan asosiasi yang tampil Data bersifat dense (padat) Aturan tidak relevan Aturan asosiasi berulang Solusi: Mining minimal non-redundant association rules berdasarkan konsep closure dalam Galois connection Minimal non-redundant association rules

Tujuan Menerapkan konsep closure dari Galois connection untuk membentuk generators dan frequent closed itemsets menggunakan algoritma Close. Membentuk minimal non-redundant association rules menggunakan generators dan frequent closed itemsets. Membandingkan hasil dan waktu eksekusi pada mining minimal non-redundant association rules dengan mining association rules dalam penelitian sebelumnya (Widodo 2004).

Ruang Lingkup Menggunakan konsep closure dalam Galois connection untuk mendapatkan minimal non-redundant association rules. Menggunakan data transaksi yang sama dengan penelitian Widodo (2004), yaitu data transaksi pembelian barang di Sinar Mart Swalayan selama 2 bulan (1 Maret 2004 – 21 Mei 2004). Manfaat Diharapkan dapat memberikan minimal non-redundant association rules yang paling relevan dan berguna serta mudah dipahami oleh pengguna.

Data Mining Proses ekstraksi informasi atau pola yang penting dalam basis data berukuran besar. Association rule mining digunakan untuk mencari hubungan menarik diantara item-item dalam suatu himpunan data Ukuran objektif yang dapat digunakan untuk menemukan aturan asosiasi X → Y adalah: Support adalah persentase kombinasi item dalam basis data Confidence merupakan nilai persentase dari hubungan antar item dalam aturan asosiasi. Support = Confidence =

Mining Minimal Non-Redundant Association Rules Bastide et al. (2000): Aturan Asosiasi Support Confidence A → B 33 % 66 % A → B, C 80 % A → B, C, E 26 % generators frequent closed itemsets Exact association rules Approximate association rules

Galois Connection Suatu hubungan antara dua item berbeda yang saling berhubungan satu sama lain dalam sebuah aplikasi Pasangan aplikasi (f, g) Galois connection TID A B C D E 1 2 3 4 5 Hubungan antara dua item berbeda karena memiliki kesamaan Konsep closure Galois closure operator itemset C dalam dataset D adalah closed itemset jika dan hanya jika h(C) = C. Closed itemset yang paling minimal mengandung itemset I untuk h(I), h(I) disebut closure dari I. Closed itemset lattice ABCDE 1 ACD 2 ABCE Closed itemset C adalah frequent closed itemset jika support(C) ≥ minsup. 3 AC 3 BCE 4 C 4 BE

Lift Pencarian aturan asosiasi yang tidak menyesatkan yaitu mencari nilai korelasi antar data itemsets atau disebut juga dengan lift. korelasi antara pembelian A dan B dapat ditulis sebagai: corrA,B = atau Lift = P(B|A)/P(B) Hasil nilai korelasi : Nilai corrA,B < 1 Korelasi negatif Nilai corrA,B > 1 Korelasi Positif Nilai corrA,B = 1 Tidak berkorelasi

Metode Penelitian Metode penelitian (Berdasarkan KDD dari Han & Kamber, 2006): 1. Praproses Data Pembersihan data Integrasi data Seleksi data Transformasi data Hasil penelitian sebelumnya (Widodo, 2004) 2. Data Mining Pembentukan generators danfrequent closed itemsets Pembentukan minimal non-redundant association rules 3. Evaluasi Pola Lift 4. Presentasi Pengetahuan Aturan asosiasi, support confidence dan lift Tabel

Metode Penelitian Lingkungan Pengembangan Sistem: 1. Perangkat Keras Processor: Intel Pentium IV, 2.4 Ghz Memori: 256 MB RAM Harddisk : kapaisitas 80 GB Monitor, keyboard dan mouse 2. Perangkat Lunak Sistem operasi: Microsoft Windows XP DBMS: Microsoft Access 2003 Bahasa Pemrograman: Visual Basic 6.0 Perancangan Basis Data: Basis data pada penelitian Widodo (2004) dengan beberapa perubahan untuk kepentingan implementasi Algoritma Close, Algoritma Gen-GB, dan Algoritma Gen-RI.

Hasil Penelitian Penelitian ini melakukan perbandingan antara proses mining minimal non-redundant association rules dengan mining association rules pada penelitian sebelumnya (Widodo 2004). Dilakukan di lingkungan sistem dan data transaksi yang sama. 4 nilai minsup dan 11 nilai mincof yang akan dicobakan pada kedua sistem sama. Minsup: 5 %, 2 %, 1 %, dan 0,5 % dari 23.631 transaksi Mincof : 75 %, 70 %, 65 %, 60 %, 55 %, 50 %, 45 %, 40 %, 30 %, 20 %, dan 10 %.

Perbandingan 1 Parameter Minsup (%) 5 2 1 0,5 Kandidat FC1 35 FC1 13 19 24 30 Kandidat FC2 78 171 276 435 FC2 11 37 87 Kandidat FC3 - 93 407 FC3 34 Kandidat FC4 22 FC4 Parameter Minsup (%) 5 2 1 0,5 Kandidat 1-itemset 35 Large 1-itemset 13 19 24 30 Kandidat 2-itemset 78 171 276 435 Large 2-itemset 11 37 87 Kandidat 3-itemset - 93 407 Large 3-itemset 34 Kandidat 4-itemset 23 Large 4-itemset Pembentukan frequent closed itemsets (FC) (algoritma Close) Pembentukan large itemset (algoritma Apriori) Semakin tinggi nilai minsup, maka semakin kecil jumlah FC dan large itemset yang diperoleh dari masing-masing kandidat

Perbandingan 1 Grafik waktu eksekusi Waktu untuk dua proses pruning dalam algoritma Close menjadi tidak berguna. Waktu eksekusi algoritma Close lebih lama dibandingkan waktu eksekusi algoritma Apriori Semakin kecil nilai minsup maka semakin besar waktu eksekusi untuk algoritma Close dan Apriori.

Perbandingan 2 Mininimal Non-Redundant Association Rules Mincof (%) Minsup (%) 5 2 1 0,5 75 70 65 4 60 3 10 55 15 50 8 25 45 26 40 39 30 19 73 20 14 44 128 77 226 Mincof (%) Minsup (%) 5 2 1 0,5 75 70 65 60 3 55 4 50 8 45 9 40 6 15 30 7 22 20 16 39 10 11 34 71 Mininimal Non-Redundant Association Rules Aturan Asosiasi (Penelitian Widodo 2004)

Perbandingan 2 Grafik waktu eksekusi pembentukan Minimal Non-Redundant Association Rules (MNRAA) dan Aturan Asosiasi (AA) Rataan perbedaan 9 detik Rataan perbedaan 40,45 detik Rataan perbedaan 192 detik ( 3,5 menit) Rataan perbedaan 1035 detik ( 17,25 menit)

Perbandingan 2 Grafik total waktu eksekusi Mining Minimal Non-Redundant Association Rules (MNRAA) dan Mining Association Rules (AA) Rataan perbedaan 17 detik Rataan perbedaan 12,5 detik Rataan perbedaan 59 detik Rataan perbedaan 579 detik (9,65 menit)

Perbandingan 2 Minimal non-redundant association rules dengan nilai confidence terbesar Minsup (%) Aturan Asosiasi Support(%) Confidence (%) 5 susu → snack 6,54 44,64 2 pasta gigi → sabun 2,67 53,64 1 susu, permen → snack 1,21 70,44 0,5 susu, pelengkap roti → snack 0,7 78,67 Aturan asosiasi dengan nilai confidence terbesar Minsup (%) Aturan Asosiasi Support (%) Confidence (%) 5 susu → snack 6,54 44,64 2 1 susu, permen → snack 1,21 70,44 0,5

Hasil Perbandingan Algoritma Apriori Waktu lama dan sumberdaya komputasi yang besar. Itemset lattice Algoritma Close Closed itemset lattice Mengurangi waktu dan sumberdaya komputasi. Data transaksi tidak padat Korelasi data lemah Keunggulan Algoritma Close tidak terlihat 2. Generators dan frequent closed itemsets yang dihasilkan algoritma Close sangat mempengaruhi pembentukan minimal non-redundant association rules.

Hasil Perbandingan 3. Aturan asosiasi (Penelitian sebelumnya) Aturan asosiasi tidak berulang Waktu eksekusi lama Aturan asosiasi tidak berulang dan menarik Minimal non-redundant association rules Waktu eksekusi sebentar Data transaksi tidak padat Aturan asosiasi berulang tidak terbentuk Keunggulan mining minimal non-redundant association rules tidak terlihat secara keseluruhan 4. Keunggulan mining non-redundant association rules hanya terlihat pada pembentukan minimal non-redundant association rules saja.

Kesimpulan & Saran Kesimpulan: Algoritma Close menggunakan teknik pruning terhadap closed itemset lattice Algoritma Close lebih unggul dibandingkan algoritma Apriori dalam efisiensi waktu eksekusi dan penggunaan sumberdaya komputasi. Mining minimal non-redundant association rules menghasilkan aturan asosiasi yang lebih baik dibandingkan dengan mining association rules. Keunggulan mining minimal non-redundant association rules: Aturan asosiasi tidak berulang dan relevan. Aturan asosasi mengandung semua informasi di dalam basis data. Efisiensi waktu eksekusi dan penggunaan sumberdaya komputasi.

Kesimpulan & Saran Mining minimal non-redundant association rules menampilkan kinerja terbaik pada data yang bersifat padat dan berkorelasi tinggi. Data transaksi dalam penelitian ini memiliki sifat data yang tidak padat dan berkorelasi rendah, sehingga membutuhkan waktu eksekusi lebih lama untuk Algoritma Close. Saran: Penggunaan data yang bersifat padat dan memiliki korelasi tinggi, sehingga mining minimal non-redundant association rules dapat memperlihatkan keunggulannya. Dikembangkan dengan menggunakan algoritma lain untuk membentuk generators dan frequent closed itemsets yang lebih sedikit pada data yang bersifat jarang.

TERIMA KASIH . . .