Presentasi sedang didownload. Silahkan tunggu

Presentasi sedang didownload. Silahkan tunggu

Textbooks. Association Rules Association rule mining  Oleh Agrawal et al in  Mengasumsikan seluruh data categorical.  Definition - What does.

Presentasi serupa


Presentasi berjudul: "Textbooks. Association Rules Association rule mining  Oleh Agrawal et al in  Mengasumsikan seluruh data categorical.  Definition - What does."— Transcript presentasi:

1 Textbooks

2 Association Rules

3 Association rule mining  Oleh Agrawal et al in 1993.  Mengasumsikan seluruh data categorical.  Definition - What does Association Rule Mining mean?  Association rule mining is a procedure which is meant to find frequent patterns, correlations, associations, or causal structures from data sets found in various kinds of databases such as relational databases, transactional databases, and other forms of data repositories. Given a set of transactions, association rule mining aims to find the rules which enable us to predict the occurrence of a specific item based on the occurrences of the other items in the transaction.  Market Basket Analysis untuk menemukan keterkaitan antara item-item yang dibeli oleh customer Bread  Milk [sup = 5%, conf = 100%] 3

4 Association Rules  Adalah proses mendeteksi kumpulan atribut-atribut yang muncul bersamaan (co-occur) dalam frekuensi yang sering, dan membentuk sejumlah kaidah dari kumpulan-kumpulan tersebut.  Contoh : 90% orang yang berbelanja di suatu supermarket yang membeli roti juga membeli selai, dan 60% dari semua orang yang berbelanja membeli keduanya.

5 Definisi Association Rules  Menurut Piatetsky-Shapiro, Gregory (1991), Association rule learning adalah metode pembelajaran berbasis aturan untuk menemukan hubungan yang menarik antara variabel dalam database besar. Hal ini dimaksudkan untuk mengidentifikasi aturan kuat yang ditemukan di database menggunakan beberapa ukuran yang menarik

6 Definisi Association Rules  Association rule mining adalah analisa dari kebiasaan belanja konsumen dengan mencari asosiasi dan korelasi antara item-item berbeda yang diletakkan konsumen dalam keranjang belanjaannya(Yang, 2003)  Contoh Association rule misalnya: "70% dari orang-orang yang membeli mie, juice dan saus akan membeli juga roti tawar".  Dengan kemajuan teknologi, data penjualan dapat disimpan dalam jumlah besar yang disebut dengan “basket data."  Aturan asosiasi yang didefinisikan pada basket data tersebut, dapat digunakan untuk menganalisa data dalam rangka :  keperluan desain katalog promosi,  proses pembuatan keputusan bisnis,  segmentasi konsumen dan  target pemasaran.

7 Definisi Algoritma Apriori  Apriori is an algorithm for frequent item set mining and association rule learning over transactional databases. It proceeds by identifying the frequent individual items in the database and extending them to larger and larger item sets as long as those item sets appear sufficiently often in the database (Agrawal and Srikat, 1994).association rule learningdatabases  Ide utamanya: The apriori property (downward closure property): subsets dari frequent itemset juga frequent itemsets 7

8 Definisi Algoritma Apriori  Algoritma Apriori adalah salah satu algoritma yang melakukan pencarian frequent itemset dengan menggunakan teknik association rule (Erwin, 2009). Algoritma Apriori menggunakan pengetahuan frekuensi atribut yang telah diketahui sebelumnya untuk memproses informasi selanjutnya. Pada algoritma Apriori menentukan kandidat yang mungkin muncul dengan cara memperhatikan minimum support dan minimum confidence. Support adalah nilai pengunjung atau persentase kombinasi sebuah item dalam database.  Apriori adalah salah satu pendekatan yang sering digunakan pada Frequent Itemset Mining. Prinsip Apriori adalah jika sebuah itemset infrequent, maka itemset yang infrequent tidak perlu lagi diexplore supersetnya sehingga jumlah kandidat yang harus diperiksa menjadi berkurang. 8

9 Definisi Algoritma Apriori  Algoritma Apriori merupakan salah satu algoritma yang digunakan di dalam memecahkan persoalan association rule mining.  Yang mengolah suatu database transaksi dengan setiap transaksi adalah suatu himpunan item-item. Kemudian mencari seluruh kaidah apriori yang memenuhi kendala minimum support dan minimum confidence yang diberikan user.  Algoritma Apriori dapat digunakan untuk menemukan tren bisnis dengan menganalisa transaksi konsumen.

10 Algoritma FP-Growth  Algoritma FP-Growth merupakan pengembangan dari algoritma Apriori. Sehingga kekurangan dari algoritma Apriori diperbaiki oleh algoritma FP-Growth (Kusrini dan E. T. Luthfi. (2009).  Frequent Pattern Growth (FP-Growth) adalah salah satu alternatif algoritma yang dapat digunakan untuk menentukan himpunan data yang paling sering muncul (frequent itemset) dalam sebuah kumpulan data.

11 Algoritma FP-Growth  Pada algoritma Apriori diperlukan generate candidate untuk mendapatkan frequent itemsets. Akan tetapi, di algoritma FP-Growth generate candidate tidak dilakukan karena FP-Growth menggunakan konsep pembangunan tree dalam pencarian frequent itemsets. Hal tersebutlah yang menyebabkan algoritma FP-Growth lebih cepat dari algoritma Apriori.  Karakteristik algoritma FP-Growth adalah struktur data yang digunakan adalah tree yang disebut dengan FP-Tree. Dengan menggunakan FP-Tree, algoritma FP-Growth dapat langsung mengekstrak frequent itemset dari FP-Tree.  Penggalian itemset yang frequent dengan menggunakan algoritma FP-Growth akan dilakukan dengan cara membangkitkan struktur data tree atau disebut dengan FP-Tree.

12 Algoritma FP-Growth ilustrasi

13 Algoritma FP-Growth ilustrasi Our client is named Mario and here we have his transactions: TMario= [ [beer, bread, butter, milk], [beer, milk, butter], [beer, milk, cheese], [beer, cheese, bread], [beer, butter, diapers, cheese] ] Step 1: The first step is we count all the items in all the transactions TMario= [ beer: 5, bread: 2, butter: 3, milk: 3, cheese: 3, diapers: 1]

14 Algoritma FP-Growth ilustrasi Step 2: Next we apply the threshold we had set previously. For this example let's say we have a threshold of 30% so each item has to appear at least twice. TMario= [ beer: 5, bread: 2, butter: 3, milk: 3, cheese: 3, diapers: 1] Step 3: Now we sort the list according to the count of each item. T MarioSorted = [ beer: 5, butter: 3, milk: 3, cheese: 3, bread: 2]

15 Algoritma FP-Growth Step 4: Now we build the tree. We go through each of the transactions and add all the items in the order they appear in our sorted list.

16 Algoritma FP-Growth Transaction 2: [beer, milk, butter]

17 Algoritma FP-Growth Transaction 3=[beer, milk, cheese]

18 Algoritma FP-Growth Transaction 4=[beer, cheese, bread]

19 Algoritma FP-Growth Transaction 5=[beer, cheese, diapers]

20 Algoritma FP-Growth Step 5: In order to get the associations now we go through every branch of the tree and only include in the association all the nodes whose count passed the threshold.

21 Algoritma FP-Growth Step 5: In order to get the associations now we go through every branch of the tree and only include in the association all the nodes whose count passed the threshold.


Download ppt "Textbooks. Association Rules Association rule mining  Oleh Agrawal et al in  Mengasumsikan seluruh data categorical.  Definition - What does."

Presentasi serupa


Iklan oleh Google