ROUGH SET THEORY AND DATA MINING Dr. Sarjon Defit.

Slides:



Advertisements
Presentasi serupa
KNOWLEGDE DISCOVERY in DATABASE (KDD)
Advertisements

Aplikasi Basis Data.
ARTIFICIAL INTELLIGENCE
Outline Materi Hubungan antara Comp. Vision, Grafika Komputer, Pengolahan Citra, dan Pengenalan Pola (Pattern Recognition) Domain Computer Vision Processing.
BASIS DATA LANJUTAN.
Ujian Akhir Semester (UAS)
Pertemuan 3 Analisa Domain
Pertemuan : 8 Basis Data Terapan
Data Mining.
Konsep Database. S D L C Strategy and Analysis Design Build n Document Transition Production.
Analisis dan Perancangan Sistem
APLIKASI TEKNOLOGI INFORMASI
Data Warehouse dan Data Mining
Pertemuan XIV FUNGSI MAYOR Assosiation. What Is Association Mining? Association rule mining: –Finding frequent patterns, associations, correlations, or.
Perancangan Basis Data
PENDAHULUAN 1.  Merupakan aktivitas manajemen untuk merealisasikan tahapan Database Aplication Lifecycle secara efektif dan efesien. 2.
Database Management System
TUGAS SISTEM INFORMASI MANAJEMEN
Membuat File Database & Tabel
Data Warehouse dan Data Mining
Penambangan data Pertemuan 2.
Model Data Relasional.
Pert. 16. Menyimak lingkungan IS/IT saat ini
Text Mining and Information Retrieval
Intelegensia Buatan Silabus Perkembangan AI
Object oriented analyst and design
DATAWAREHOUSING & BUSINESS INTELLIGENT <<Pertemuan – 12>>
Pertemuan 5 Struktur dan Hubungan Antara Class dan Object
Kuliah I Ricky Maulana Fajri, M.Sc
Data dan Informasi Daurat Sinaga, M.Kom.
Membuat File Database & Tabel
BAHASA PEMROGRAMAN.
Sejarah Psikologi Kognitif Sains
TIM ASISTEN PENGOLAHAN DATA PERIKANAN 2017
Data Mining.
Pendahuluan Dr. Suyanto, S.T., M.Sc. HP/WA:
Chapter 10 Manajemen Database
Disiplin Ilmu, Metode Penelitian, Computing Method
Pertemuan 10 Basis data (database).
Business Intelligent Ramos Somya, S.Kom., M.Cs.
ANALISIS DAN PERANCANGAN SISTEM
Pertemuan 1 Konsep Umum Pengetahuan
RELASI Sub-bab 7.1.
ANALYSIS.
M0414 Analisa Sistem Informasi
Sejarah Psikologi Kognitif Sains
KELOMPOK 6 Nama Kelompok: Lulus Irmawati ( )
Associasion Rule dengan RapidMiner
MATERI PERKULIAHAN KECERDASAN BUATAN
Mata Kuliah Analisa Perancangan Sistem Informasi
PROGRAM STUDI SISTEM INFORMASI TEKNIK INFORMATIKA
Analisis Multidimensional
PRODI MIK | FAKULTAS ILMU-ILMU KESEHATAN
Aljabar Relational IK203 Sistem Basis Data Pertemuan #4
Artificial Intelligence
Defri Kurniawan DATA dan INFORMASI Defri Kurniawan
SISTEM INFORMASI MANAJEMEN
Global E-Business and Collaboration
KLASIFIKASI.
Associasion Rule dengan RapidMiner
Model Data Relasional.
Konsep Database.
Model Boolean dan Advanced Boolean
Rekayasa Perangkat Lunak
KLASIFIKASI.
APLIKASI TEKNOLOGI INFORMASI. Pendahuluan ATI Penawaran Produk & Jasa telah tanpa batas negara dan geografis TI dipercaya dapat memperbaiki kinerja individu.
Konsep Aplikasi Data Mining
Konsep dan Aplikasi Data Mining
Konsep Aplikasi Data Mining
Object oriented analyst and design
Transcript presentasi:

ROUGH SET THEORY AND DATA MINING Dr. Sarjon Defit

PENDAHULUAN Teori rough set adalah sebuah teknik matematik yang dikembangkan oleh Pawlack pada tahun 1980. Teknik ini digunakan untuk menangani masalah Uncertainty, Imprecision dan Vagueness dalam aplikasi Artificial Intelligence (AI). Ianya merupakan teknik yang efisien untuk Knowledge Discovery in Database (KDD) proses dan Data Mining. Secara umum, teori rough set telah digunakan dalam banyak applikasi seperti medicine, pharmacology, business, banking, engineering design, image processing dan decision analysis.

REPRESENTASI DATA DALAM ROUGH SET Rough set menawarkan dua bentuk representasi data yaitu Information Systems (IS) dan Decision Systems (DS).   Definisi Information Systems: Sebuah Information Systems (IS) adalah pasangan IS={U,A}, dimana U={e1, e2,…, em} dan A={a1, a2, …, an} yang merupakan sekumpulan example dan attribute kondisi secara berurutan. Definisi diatas memperlihatkan bahwa sebuah Information Systems terdiri dari sekumpulan example, seperti {e1, e2, …, em} dan attribute kondisi, seperti {a1, a2, …, an}. Sebuah Information Systems yang sederhana diberikan dalam table-1.

Tabel-1: Information Systems Example Studies Education …. Works E1 Poor SMU … E2 Good E3 Moderate E4 Diploma E5 E6 E7 E8 MSc E9 E10   E99 E100 Object

Tabel-1 memperlihatkan sebuah Information Systems yang sederhana Tabel-1 memperlihatkan sebuah Information Systems yang sederhana. Dalam Information System, tiap-tiap baris merepresentasikan objek sedangkan column merepresentasikan attribute. Ianya terdiri dari m objek, seperti E1, E2,…, Em, dan n attribute seperti Studies, Education, …., Works. Dalam banyak applikasi, sebuah outcome dari pengklasifikasian diketahui yang direpresentasikan dengan sebuah Decision Attribute, C={C1, C2, …, Cp}. Maka Information Systems (IS) menjadi IS=(U,{A,C}). Decision Systems (DS) yang sederhana diperlihatkan pada tabel-2.

Tabel-2: Decision System Example Studies Education …. Works Income (D) E1 Poor SMU … None E2 Good Low E3 Moderate E4 Diploma E5 E6 E7 E8 MSc Medium E9 E10 High   E99 E100

Tabel-2 memperlihatkan sebuah Decision Systems yang sederhana Tabel-2 memperlihatkan sebuah Decision Systems yang sederhana. Ianya terdiri dari m objek, seperti E1, E2, …, Em, dan n attribute, seperti Studies, Education, …, Works dan Income (D). Dalam tabel ini, n-1 attribute, Studies, Education, …, Works, adalah attribute kondisi, sedangkan Income adalah decision attribute.

Indiscerniblity relation Discerning Object   Discern objek baik indiscernibility, equivalence class dan discernibility matrix adalah konsep penting dalam teori rough set. Indiscerniblity relation Definisi Indiscerniblity: Diberikan sebuah Decision Systems, DS{U,(A, C)}, indiscernibility didefinisikan sebagai sekumpulan objek yang mempunyai nilai decision yang sama.

Equivalence Class   Equivalence class adalah mengelompokan objek-objek yang sama untuk attribute A  (U, A). Diberikan Decision Systems pada tabel-2, kita dapat memperoleh equivalence class (EC1-EC5) seperti digambarkan pada tabel-3. Class Studies(A) Education (B) Works(C) Income Num_obj EC1 Poor SMU None 50 EC2 Good Low 5 EC3 Moderate 30 EC4 Diploma 10 EC5,1 MSc Medium 4 EC5,2 High 1

Class EC5 adalah sebuah indeterminacy yang memberikan 2 (dua) keputusan yang berbeda. Situasi ini dapat ditangani dengan teknik data cleaning. Kolom yang paling kanan mengindikasikan jumlah objek yang ada dalah Decision System untuk class yang sama.   Contoh dalam tabel-3 disederhanakan kedalam numerical representation. Tabel-4 memperlihatkan numerical representation dari equivalence class dari tabel-3. Class Studies (A) Education (B) Works(C) Income Num_obj EC1 1 2 3 50 EC2 5 EC3 30 EC4 10 EC5,1 4 EC5,2

Discernibility Matrix   Definisi Discerniblity Matrix: Diberikan sebuah IS A=(U,A) and B  A, discernibility matrix dari A adalah MB, dimana tiap-tiap entry MB(I,j) tediri dari sekumpulan attribute yang berbeda antara objek Xi dan Xj. Tabel-5 memperlihatkan discerniblity matrix dari tabel-4.   EC1 EC2 EC3 EC4 EC5 x C A Ab Abc X Ac B

Discernibility Matrix Modulo D   Diberikan sebuah DS A=(U,A{d{) dan subset dari attribute B  A, discernibility matrix modulo D dari A, MBd, didefinisikan seperti berikut dimana MB(I,j) adalah sekumpulan attribute yan berbeda antara objek Xi dan Xj dan juga berbeda attribute keputusan.   EC1 EC2 EC3 EC4 EC5 X C A AB ABC  

CNF of Boolean Function Reduct   Reduct adalah penyeleksian attribut minimal (interesting attribute) dari sekumpulan attribut kondisi dengan menggunakan Prime Implicant fungsi Boolean. Kumpulan dari semua Prime Implicant mendeterminasikan sets of reduct. Discernibility matrix modulo D pada tabel-5 dapat ditulis sebagai formula CNF seperti diperlihatkan pada tabel-6.   Class CNF of Boolean Function Prime Implicant Reducts E1 ca(ab) (abc) ac {a,c} E2 c (ab) c (ab) {a,c}, {b,c} E3 a (abc) a {a} E4 (ab) (abc) ab {a}, {b} E5 (abc)  (ab) (ab)

Generating Rules   The major process of discovering knowledge in database is the extraction of rules from the decision system. The rough set method in generating decision rules from the decision table is based on the reduct set computation. Figure-1 shows the rules generation process using reducts and equivalence classes.

Class A B C Dec E1 E2 E3 E4 E5,1 E5,2 1 2 3 5 4 [E1,{a,c}] [E2, {a,c}, {b,c} [E3, {a}] [E4, {a},{b}] [E5, {a}, {b} Reduct Equivalence Classes A1C3  d1 A1c1  d2, b2c1  d2 A2  d2 B3  d2 A3  d3, a3  d4 B5  d3, b5  d4 Rules