Presentasi sedang didownload. Silahkan tunggu

Presentasi sedang didownload. Silahkan tunggu

PENDAHULUAN Teori rough set adalah sebuah teknik matematik yang dikembangkan oleh Pawlack pada tahun 1980. Teknik ini digunakan untuk menangani masalah.

Presentasi serupa


Presentasi berjudul: "PENDAHULUAN Teori rough set adalah sebuah teknik matematik yang dikembangkan oleh Pawlack pada tahun 1980. Teknik ini digunakan untuk menangani masalah."— Transcript presentasi:

1

2 PENDAHULUAN Teori rough set adalah sebuah teknik matematik yang dikembangkan oleh Pawlack pada tahun Teknik ini digunakan untuk menangani masalah Uncertainty, Imprecision dan Vagueness dalam aplikasi Artificial Intelligence (AI). Ianya merupakan teknik yang efisien untuk Knowledge Discovery in Database (KDD) proses dan Data Mining. Secara umum, teori rough set telah digunakan dalam banyak applikasi seperti medicine, pharmacology, business, banking, engineering design, image processing dan decision analysis.

3 REPRESENTASI DATA DALAM ROUGH SET Rough set menawarkan dua bentuk representasi data yaitu Information Systems (IS) dan Decision Systems (DS). Definisi Information Systems: Sebuah Information Systems (IS) adalah pasangan IS={U,A}, dimana U={e 1, e 2,…, e m } dan A={a 1, a 2, …, a n } yang merupakan sekumpulan example dan attribute kondisi secara berurutan. Definisi diatas memperlihatkan bahwa sebuah Information Systems terdiri dari sekumpulan example, seperti {e 1, e 2, …, e m } dan attribute kondisi, seperti {a 1, a 2, …, a n }. Sebuah Information Systems yang sederhana diberikan dalam table-1.

4 ExampleStudiesEducation….Works E1E1 PoorSMU…Poor E2E2 SMU…Good E3E3 ModerateSMU…Poor E4E4 ModerateDiploma…Poor E5E5 SMU…Poor E6E6 SMU…Poor E7E7 ModerateDiploma…Poor E8E8 GoodMSc…Good E9E9 MSc…Good E 10 GoodMSc…Good ….……… E 99 PoorSMU…Good E 100 ModerateDiploma…Poor Tabel-1: Information Systems ObjectObject

5 Tabel-1 memperlihatkan sebuah Information Systems yang sederhana. Dalam Information System, tiap-tiap baris merepresentasikan objek sedangkan column merepresentasikan attribute. Ianya terdiri dari m objek, seperti E 1, E 2,…, E m, dan n attribute seperti Studies, Education, …., Works. Dalam banyak applikasi, sebuah outcome dari pengklasifikasian diketahui yang direpresentasikan dengan sebuah Decision Attribute, C={C 1, C 2, …, C p }. Maka Information Systems (IS) menjadi IS=(U,{A,C}). Decision Systems (DS) yang sederhana diperlihatkan pada tabel-2.

6 ExampleStudiesEducation….WorksIncome (D) E1E1 PoorSMU…PoorNone E2E2 PoorSMU…GoodLow E3E3 ModerateSMU…PoorLow E4E4 ModerateDiploma…PoorLow E5E5 PoorSMU…PoorNone E6E6 PoorSMU…PoorNone E7E7 ModerateDiploma…PoorLow E8E8 GoodMSc…GoodMedium E9E9 GoodMSc…GoodMedium E 10 GoodMSc…GoodHigh ….……… E 99 PoorSMU…GoodLow E 100 ModerateDiploma…PoorLow Tabel-2: Decision System

7 Tabel-2 memperlihatkan sebuah Decision Systems yang sederhana. Ianya terdiri dari m objek, seperti E 1, E 2, …, E m, dan n attribute, seperti Studies, Education, …, Works dan Income (D). Dalam tabel ini, n-1 attribute, Studies, Education, …, Works, adalah attribute kondisi, sedangkan Income adalah decision attribute.

8 Discerning Object Discern objek baik indiscernibility, equivalence class dan discernibility matrix adalah konsep penting dalam teori rough set. Indiscerniblity relation Definisi Indiscerniblity: Diberikan sebuah Decision Systems, DS{U,(A, C)}, indiscernibility didefinisikan sebagai sekumpulan objek yang mempunyai nilai decision yang sama.

9 Equivalence Class Equivalence class adalah mengelompokan objek-objek yang sama untuk attribute A  (U, A). Diberikan Decision Systems pada tabel- 2, kita dapat memperoleh equivalence class (EC 1 -EC 5 ) seperti digambarkan pada tabel-3. ClassStudies(A)Education (B) Works(C)IncomeNum_obj EC 1 PoorSMUPoorNone50 EC 2 PoorSMUGoodLow5 EC 3 ModerateSMUPoorLow30 EC 4 ModerateDiplomaPoorLow10 EC 5,1 GoodMScGoodMedium4 EC 5,2 GoodMScGoodHigh1

10 Class EC 5 adalah sebuah indeterminacy yang memberikan 2 (dua) keputusan yang berbeda. Situasi ini dapat ditangani dengan teknik data cleaning. Kolom yang paling kanan mengindikasikan jumlah objek yang ada dalah Decision System untuk class yang sama. Contoh dalam tabel-3 disederhanakan kedalam numerical representation. Tabel-4 memperlihatkan numerical representation dari equivalence class dari tabel-3. ClassStudies (A)Education (B) Works(C)IncomeNum_obj EC EC EC EC EC 5, EC 5,

11 Discernibility Matrix Definisi Discerniblity Matrix: Diberikan sebuah IS A=(U,A) and B  A, discernibility matrix dari A adalah MB, dimana tiap-tiap entry MB(I,j) tediri dari sekumpulan attribute yang berbeda antara objek X i dan X j. Tabel-5 memperlihatkan discerniblity matrix dari tabel-4. EC 1 EC 2 EC 3 EC 4 EC 5 EC 1 xCAAbAbc EC 2 CXAcAbcAb EC 3 AAcxBAbc EC 4 AbAbcBx EC 5 AbcAbAbc X

12 Discernibility Matrix Modulo D Diberikan sebuah DS A=(U,A{d{) dan subset dari attribute B  A, discernibility matrix modulo D dari A, MBd, didefinisikan seperti berikut dimana MB(I,j) adalah sekumpulan attribute yan berbeda antara objek X i dan X j dan juga berbeda attribute keputusan. EC 1 EC 2 EC 3 EC4EC5 EC 1 XCAABABC EC 2 CXXXAB EC 3 AXXXABC EC 4 ABXXXABC EC 5 ABCABABC X

13 Reduct Reduct adalah penyeleksian attribut minimal (interesting attribute) dari sekumpulan attribut kondisi dengan menggunakan Prime Implicant fungsi Boolean. Kumpulan dari semua Prime Implicant mendeterminasikan sets of reduct. Discernibility matrix modulo D pada tabel-5 dapat ditulis sebagai formula CNF seperti diperlihatkan pada tabel-6. ClassCNF of Boolean FunctionPrime ImplicantReducts E1E1 c  a  (a  b)  (a  b  c)acac {a,c} E2E2 c  (a  b)c (a  b) {a,c}, {b,c} E3E3 a  (a  b  c) a{a} E4E4 (a  b)  (a  b  c)abab {a}, {b} E5E5 (a  b  c)  (a  b)(a  b) {a}, {b}

14 Generating Rules The major process of discovering knowledge in database is the extraction of rules from the decision system. The rough set method in generating decision rules from the decision table is based on the reduct set computation. Figure-1 shows the rules generation process using reducts and equivalence classes.

15 A 1C3  d 1 A 1 c 1  d 2, b 2 c 1  d 2 A 2  d 2 B 3  d 2 A 3  d 3, a 3  d 4 B 5  d 3, b 5  d 4 [E 1,{a,c}] [E 2, {a,c}, {b,c} [E 3, {a}] [E 4, {a},{b}] [E5, {a}, {b} ClassABCDec E 1 E 2 E 3 E 4 E 5,1 E 5, Reduct Equivalence Classes Rules


Download ppt "PENDAHULUAN Teori rough set adalah sebuah teknik matematik yang dikembangkan oleh Pawlack pada tahun 1980. Teknik ini digunakan untuk menangani masalah."

Presentasi serupa


Iklan oleh Google