Presentasi sedang didownload. Silahkan tunggu

Presentasi sedang didownload. Silahkan tunggu

Association Rules.

Presentasi serupa


Presentasi berjudul: "Association Rules."— Transcript presentasi:

1 Association Rules

2 Association rule mining
Oleh Agrawal et al in 1993. Banyak dipelajari oleh komunitas peneliti data mining. Mengasumsikan seluruh data categorical. Market Basket Analysis untuk menemukan keterkaitan antara item-item yang dibeli oleh customer Bread  Milk [sup = 5%, conf = 100%] CS583, Bing Liu, UIC

3 The model: data I = {i1, i2, …, im}: sekumpulan items. Transaction t :
t sekumpulan item dan t  I. Transaction Database T: sekumpulan transaksi T = {t1, t2, …, tn}. CS583, Bing Liu, UIC

4 Transaksi data : data supermarket
Transaksi keranjang pasar (Market basket transactions): t1: {bread, cheese, milk} t2: {apple, eggs, salt, yogurt} … … tn: {biscuit, eggs, milk} Konsep: An item: item dalam keranjang I: sekumpulan dari seluruh item yang dijual di toko transaction: item yang dibeli transactional dataset: sekumpulan transaksi CS583, Bing Liu, UIC

5 Transaction data: a set of documents
Dokumen text. Masing masing dokumen menyatakan keranjang dari kosa kata doc1: Student, Teach, School doc2: Student, School doc3: Teach, School, City, Game doc4: Baseball, Basketball doc5: Basketball, Player, Spectator doc6: Baseball, Coach, Game, Team doc7: Basketball, Team, City, Game CS583, Bing Liu, UIC

6 The model: rules Transaksi t berisi X, sekumpulan item-item (itemset) dalam I, jika X  t. Association rule adalah implikasi dari bentuk X  Y, dimana X, Y  I, dan X Y =  Itemset adalah sekumpulan items. misalkan., X = {milk, bread, cereal} adalah itemset. k-itemset adalah itemset dengan k items. Misal, {milk, bread, cereal} adalah 3-itemset CS583, Bing Liu, UIC

7 Rule strength measures
Support: sup = Pr(X  Y). Confidence: conf = Pr(Y | X) Association rule adalah pola kejadian dimana dari keadaan dimana X terjadi , Y terjadi dengan probabilitas tertentu CS583, Bing Liu, UIC

8 Support and Confidence
Support count: Support count dari itemset X, dinyatakan dengan X.count, dalam data set T adalah jumlah dari transaksi dalam T yang berisi X. Diasumsikan T memiliki n transaksi: Maka, CS583, Bing Liu, UIC

9 Tujuan Tujuan : Mencari aturan –aturan yang memenuhi ketentuan user minimum support (minsup) dan minimum confidence (minconf). CS583, Bing Liu, UIC

10 Contoh Data transaksi Asumsi: Contoh frequent itemset:
t1: Beef, Chicken, Milk t2: Beef, Cheese t3: Cheese, Boots t4: Beef, Chicken, Cheese t5: Beef, Chicken, Clothes, Cheese, Milk t6: Chicken, Clothes, Milk t7: Chicken, Milk, Clothes Contoh Data transaksi Asumsi: minsup = 30% minconf = 80% Contoh frequent itemset: {Chicken, Clothes, Milk} [sup = 3/7] Association rules dari itemset: Clothes  Milk, Chicken [sup = 3/7, conf = 3/3] … … Clothes, Chicken  Milk, [sup = 3/7, conf = 3/3] CS583, Bing Liu, UIC

11 Apriori algorithm Ada dua tahapTwo steps: Misalkan frequent itemset
Menemukan seluruh itemsets yang memiliki minimum support (frequent itemsets, juga disebut large itemsets). Gunakan frequent itemsets untuk menghasilkan rule-rule (aturan-aturan). Misalkan frequent itemset {Chicken, Clothes, Milk} [sup = 3/7] dan salah satu aturan dari frequent itemset Clothes  Milk, Chicken [sup = 3/7, conf = 3/3] CS583, Bing Liu, UIC

12 Step 1: Mining all frequent itemsets
frequent itemset adalah itemset dengan support-nya ≥ minsup. Ide utamanya: The apriori property (downward closure property): subsets dari frequent itemset juga frequent itemsets ABC ABD ACD BCD AB AC AD BC BD CD A B C D CS583, Bing Liu, UIC

13 CS583, Bing Liu, UIC

14 CS583, Bing Liu, UIC

15 CS583, Bing Liu, UIC

16 CS583, Bing Liu, UIC

17 L2 Lakukan prunning (I2,I3,I5) Tidak masuk C3 karena karena (i3,I5) tidak masuk L2) CS583, Bing Liu, UIC

18 L3 CS583, Bing Liu, UIC

19 CS583, Bing Liu, UIC

20 CS583, Bing Liu, UIC

21 CS583, Bing Liu, UIC


Download ppt "Association Rules."

Presentasi serupa


Iklan oleh Google