Presentasi sedang didownload. Silahkan tunggu

Presentasi sedang didownload. Silahkan tunggu

Association Rules. CS583, Bing Liu, UIC 2 Association rule mining Oleh Agrawal et al in 1993. Banyak dipelajari oleh komunitas peneliti data mining. Mengasumsikan.

Presentasi serupa


Presentasi berjudul: "Association Rules. CS583, Bing Liu, UIC 2 Association rule mining Oleh Agrawal et al in 1993. Banyak dipelajari oleh komunitas peneliti data mining. Mengasumsikan."— Transcript presentasi:

1 Association Rules

2 CS583, Bing Liu, UIC 2 Association rule mining Oleh Agrawal et al in Banyak dipelajari oleh komunitas peneliti data mining. Mengasumsikan seluruh data categorical. Market Basket Analysis untuk menemukan keterkaitan antara item-item yang dibeli oleh customer Bread  Milk [sup = 5%, conf = 100%]

3 CS583, Bing Liu, UIC 3 The model: data I = {i 1, i 2, …, i m }: sekumpulan items. Transaction t :  t sekumpulan item dan t  I. Transaction Database T: sekumpulan transaksi T = {t 1, t 2, …, t n }.

4 CS583, Bing Liu, UIC 4 Transaksi data : data supermarket Transaksi keranjang pasar (Market basket transactions): t1: {bread, cheese, milk} t2: {apple, eggs, salt, yogurt} … tn: {biscuit, eggs, milk} Konsep:  An item: item dalam keranjang  I: sekumpulan dari seluruh item yang dijual di toko  transaction: item yang dibeli  transactional dataset: sekumpulan transaksi

5 CS583, Bing Liu, UIC 5 Transaction data: a set of documents Dokumen text. Masing masing dokumen menyatakan keranjang dari kosa kata doc1: Student, Teach, School doc2: Student, School doc3: Teach, School, City, Game doc4: Baseball, Basketball doc5: Basketball, Player, Spectator doc6: Baseball, Coach, Game, Team doc7: Basketball, Team, City, Game

6 CS583, Bing Liu, UIC 6 The model: rules Transaksi t berisi X, sekumpulan item-item (itemset) dalam I, jika X  t. Association rule adalah implikasi dari bentuk X  Y, dimana X, Y  I, dan X  Y =  Itemset adalah sekumpulan items.  misalkan., X = {milk, bread, cereal} adalah itemset. k-itemset adalah itemset dengan k items.  Misal, {milk, bread, cereal} adalah 3-itemset

7 CS583, Bing Liu, UIC 7 Rule strength measures Support:  sup = Pr(X  Y). Confidence:  conf = Pr(Y | X) Association rule adalah pola kejadian dimana dari keadaan dimana X terjadi, Y terjadi dengan probabilitas tertentu

8 CS583, Bing Liu, UIC 8 Support and Confidence Support count: Support count dari itemset X, dinyatakan dengan X.count, dalam data set T adalah jumlah dari transaksi dalam T yang berisi X. Diasumsikan T memiliki n transaksi: Maka,

9 CS583, Bing Liu, UIC 9 Tujuan Tujuan : Mencari aturan –aturan yang memenuhi ketentuan user minimum support (minsup) dan minimum confidence (minconf).

10 CS583, Bing Liu, UIC 10 Contoh Data transaksi Asumsi: minsup = 30% minconf = 80% Contoh frequent itemset: {Chicken, Clothes, Milk} [sup = 3/7] Association rules dari itemset: Clothes  Milk, Chicken [sup = 3/7, conf = 3/3] …… Clothes, Chicken  Milk, [sup = 3/7, conf = 3/3] t1:Beef, Chicken, Milk t2:Beef, Cheese t3:Cheese, Boots t4:Beef, Chicken, Cheese t5:Beef, Chicken, Clothes, Cheese, Milk t6:Chicken, Clothes, Milk t7:Chicken, Milk, Clothes

11 CS583, Bing Liu, UIC 11 Apriori algorithm Ada dua tahapTwo steps:  Menemukan seluruh itemsets yang memiliki minimum support (frequent itemsets, juga disebut large itemsets).  Gunakan frequent itemsets untuk menghasilkan rule-rule (aturan-aturan). Misalkan frequent itemset {Chicken, Clothes, Milk} [sup = 3/7] dan salah satu aturan dari frequent itemset Clothes  Milk, Chicken [sup = 3/7, conf = 3/3]

12 CS583, Bing Liu, UIC 12 Step 1: Mining all frequent itemsets frequent itemset adalah itemset dengan support-nya ≥ minsup. Ide utamanya: The apriori property (downward closure property): subsets dari frequent itemset juga frequent itemsets AB AC AD BC BD CD A B C D ABC ABD ACD BCD

13 CS583, Bing Liu, UIC 13

14 CS583, Bing Liu, UIC 14

15 CS583, Bing Liu, UIC 15

16 CS583, Bing Liu, UIC 16

17 L2 CS583, Bing Liu, UIC 17 Lakukan prunning (I2,I3,I5) Tidak masuk C3 karena karena (i3,I5) tidak masuk L2)

18 CS583, Bing Liu, UIC 18 L3

19 CS583, Bing Liu, UIC 19

20 CS583, Bing Liu, UIC 20

21 CS583, Bing Liu, UIC 21


Download ppt "Association Rules. CS583, Bing Liu, UIC 2 Association rule mining Oleh Agrawal et al in 1993. Banyak dipelajari oleh komunitas peneliti data mining. Mengasumsikan."

Presentasi serupa


Iklan oleh Google