Knowledge Discovery in Databases

Slides:



Advertisements
Presentasi serupa
Data Mining.
Advertisements

KNOWLEGDE DISCOVERY in DATABASE (KDD)
Data Mining S2 Kom.
Aplikasi Basis Data.
Pengantar Ver dok: 0.4 / Sept 2011
OLAP - PERTEMUAN 8 – OLAP.
Pertemuan-1.
BASIS DATA LANJUTAN.
Data Mining Definisi Data Mining Kemampuan Data Mining :
Rekayasa Web 04. Kebutuhan Aplikasi Web
Data Warehouse dan Decision Support
Perancangan Basis Data MI 1133
Data Warehouse, Data Mart, OLAP, dan Data Mining
Pengenalan Data Warehouse
Pengenalan Datawarehouse
Data Warehousing Sistem Basis Data Lanjut Prepared by: MT. Wilson
M ANAJEMEN D ATA “Pengaksesan Data”. P ENDAHULUAN Selama beberapa waktu, teknologi informasi berkonsentrasi pada pembangunan sistem bermisi kritis,- sistem.
Data Mining.
Data Warehouse dan Data Mining
SISTEM INFORMASI Pertemuan 5.
Manajemen Sumber Daya Data
Pengenalan Datawarehouse
Pertemuan X DATA MINING
12 Oktober 2006Data Mining : Konsep dan Teknologi1 Aplikasi dan Kecenderungan dalam Data Mining ■Aplikasi data mining ■Sistem produk dan protetipe riset.
1 Pertemuan > > Matakuliah: >/ > Tahun: > Versi: >
Konsep dan Teknik Data Mining
PENGANTAR DATA MINING.
Pengenalan Data Mining
A rsitektur dan M odel D ata M ining. Arsitektur Data Mining.
Informasi Dalam Praktik
DATA MINING (Machine Learning)
DATA MINING 25 Januari 2008.
INTRODUCTION OF DATA WAREHOUSE
Peran dan Manfaatnya sebagai Decission Support System (DSS)
Data Warehouse dan Data Mining
Penambangan data Pertemuan 2.
KECERDASAN BISNIS Data Warehouse, Data Mart, OLAP, dan Data Mining
Data dan Informasi Daurat Sinaga, M.Kom.
Data Warehouse, Data Mart, OLAP, dan Data Mining
Data Mining.
Konsep Data Mining Ana Kurniawati.
Pengantar DATA MINING • Mengapa data mining? Apa data mining?
DATA MART Pertemuan ke-3.
Topik Database : 1. Sistem Basis Data 2. ER Model
KECERDASAN BISNIS (Data Warehouse, Data Mart, OLAP, dan Data Mining)
Aplikasi Business Intelligence & Data Mining
Business Intelligent Ramos Somya, S.Kom., M.Cs.
KNOWLEGDE DISCOVERY in DATABASE (KDD)
The Data Warehouse and The ODS
BUSINESS INTELLIGENCE
KELOMPOK 6 Nama Kelompok: Lulus Irmawati ( )
INTRODUCTION OF DATA WAREHOUSE
INTRODUCTION OF DATA WAREHOUSE
DATA MART Nama Kelompok 3 : -Ulfha -Yuli -Sandi. Data mart adalah suatu bagian pada data warehouse yang mendukung pembuatan laporan dan analisa data pada.
Introduction to Soft computing
BASIS DATA TERDISTRIBUSI
Analisis Multidimensional
Oleh : Rahmat Robi Waliyansyah, M.Kom.
Database Server & Terdistribusi
Data Mining 1 S2 Kom.
SISTEM PERENCANAAN SUMBER DAYA PERUSAHAAN
Pengantar Data Mining (DM)
DATABASES AND DATA WAREHOUSES
BUSINESS INTELLIGENCE
Business Performance Management (BPM) Kompetensi
OLTP & ETL Data integration.
Database Server & Terdistribusi
Pertemuan 1 & 2 Pengantar Data Mining 12/6/2018.
Konsep Data Mining Ana Kurniawati.
Data Mining.
Transcript presentasi:

Knowledge Discovery in Databases Pertemuan-3 Knowledge Discovery in Databases

Data Mining: Suatu Proses KDD – Data mining—inti dari proses penemuan pengetahuan Evaluasi Pola Data Mining Task-relevant Data Pemilihan Data Warehouse Pembersihan Data Integrasi Data Databases

Langkah--Langkah dari Proses KDD (1) Pemahaman domain Pembuatan suatu data set target Pembersihan/preprocessing data Reduksi/proyeksi data Pemilihan tugas DM 1 2 3 4 5

Langkah--Langkah dari Proses KDD (2) Pemilihan Algoritma DM Data mining: Pencarian Evaluasi pola Penyajian pengetahuan Penggunaan pengetahuan yang diperoleh 6 7 8 9 10

Ciri Khas Proses KDD 2 3 1 Seleksi Raw Database Berdasarkan waktu data Eval. of interes- tingness Database Operasional Input data Preprocessing Data mining Postprocessing Hasil--Hasil Bersih Benar Fokus 2 1 3 Pola berguna yg terpilih Utilisasi

Analisa statistik, query, dan pelaporan Data Warehouses / Data Marts Utilisasi Peningkatan potensi untuk mendukung keputusan bisnis Pembuatan keputusan Penyajian Data Teknik Visualisasi Data Mining Penemuan informasi Eksplorasi data Analisa statistik, query, dan pelaporan Data Warehouses / Data Marts OLAP, MDA Sumber data End User Business Analyst Data DBA Kertas, Files, Penyedia informasi, Sistem database, OLTP

Sistem Data Mining Mesin data mining Antarmuka user grafis (GUI) Arsitektur: Sistem Data Mining Antarmuka user grafis (GUI) Evaluasi Pola Mesin data mining Database atau data warehouse server Pembersihan & integrasi data Data Basis pengetahuan Penyaringan Databases Warehouse

Rantai Nilai Keputusan Promosikan produk A di Z. • Kirim iklan ke keluarga dengan profil P • Jual silang layanan B ke klien C Pengetahuan • Sebanyak Y produk A digunakan di Z • Customer dari kelas Y menggunakan x% dari C • Informasi selama periode D • X tinggal di Z • S berumur Y tahun • X dan S pindah • W punya uang di Z Data • Data customer • Simpanan data • Data grafis • Data geografis

Fungsionalitas Data Mining • Konsep deskripsi: karakterisasi & diskriminasi – Generalisasi, rangkuman, dan karakteristik data kontras • Daerah kering vs. Daerah basah • Asosiasi (korelasi dan hubungan sebab akibat) 3/52

Fungsionalitas Data Mining • Klasifikasi dan prediksi – Membangun model (fungsi) yang menguraikan dan membedakan kelas atau konsep untuk peramalan kedepan • Misal, mengklasifikasikan negara berdasarkan iklim, atau mengklasifikasikan mobil berdasarkan gas mileage – Presentasi: pohon-keputusan, kaidah klasifikasi, neural network – Menaksir beberapa nilai numerik yang tidak diketahui atau hilang

Fungsionalitas Data Mining • Analisis cluster (analisis pengelompokan) – Label kelas tidak diketahui: kelompokkan data untuk membentuk kelas baru, misal mengelompokkan rumah untuk mendapatkan pola distribusi – Memaksimalkan kemiripan antar kelas dan meminimumkan kemiripan didalam kelas • Analisis outlier – Outlier: suatu objek data yang tidak mengikuti perilaku umum dari data – Gangguan atau pengecualian? Tidak! Berguna dalam deteksi kecurangan, analisis peristiwa yang jarang terjadi

Fungsionalitas Data Mining • Analisis trend dan evolusi – Trend dan deviasi: analisis regresi – Penggalian pola sekuensial, analisis periodisitas • Analisis arah pola lain atau statistik

Ditemukan Menarik? • Penambangan data bisa membuat ribuan pola: Adakah Seluruh Pola Yang Ditemukan Menarik? • Penambangan data bisa membuat ribuan pola: tidak semua pola tersebut menarik – Pendekatan yang disarankan: berpusatkan kepada manusia, berbasis query, penggalian terfokus • Ukuran ketertarikan – Suatu pola adalah menarik jika pola tersebut mudah dipahami oleh manusia, valid (berlaku) pada data baru atau uji dengan suatu derajat kepastian, potensial berguna, baru atau membenarkan suatu hipotesa yang dicari user untuk konfirmasi

Ditemukan Menarik? • Ukuran ketertarikan objektif vs. subjektif Adakah Seluruh Pola Yang Ditemukan Menarik? • Ukuran ketertarikan objektif vs. subjektif – Objektif: berdasarkan statistik dan struktur pola, misal, dukungan, kepercayaan, dsb. – Subjektif: berdasarkan keyakinan user terhadap data, misal, ketakterdugaan, pengalaman baru, tindakan yang bisa diperkarakan, dsb.

Hanya Pola Yang Menarik? Bisakah Memperoleh Seluruh Atau Hanya Pola Yang Menarik? • Dapatkan seluruh pola yang menarik: Kelengkapan – Bisakah suatu sistem data mining mendapatkan seluruh pola yang menarik? – Pencarian heuristik vs. exhaustive (melelahkan) – Asosiasi vs. klasifikasi vs. clustering

Hanya Pola Yang Menarik? Bisakah Memperoleh Seluruh Atau Hanya Pola Yang Menarik? • Cari hanya pola yang menarik: suatu problem optimasi – Bisakah suatu sistem data mining mendapatkan hanya pola yang menarik? – Pendekatan • Pertama dapatkan seluruh pola lalu saring atau keluarkan yang tidak diminati • Buatlah hanya pola yang diminati—optimisasi query penggalian

Data Mining: Tempat Pertemuan Banyak Disiplin Sistem Database Statistik Mesin Pembelajaran Algoritma Data Mining Visualisasi Disiplin Lainnya

Tinjauan Data Mining: Skema Klasifikasi • Fungsionalitas umum: – Uraian data mining: • Uraikan hal menarik apa yang bisa ditemukan dalam data ini! • Terangkan data ini ke saya! – Peramalan data mining: • Berdasarkan data ini dan sebelumnya, beritahu saya apa yang akan terjadi kemudian! • Tunjukkan ke saya trend kedepan!

Tinjauan Data Mining: Skema Klasifikasi • Tinjauan multi-dimensi … – Databases yang akan digali – Pengetahuan yang akan dicari – Teknik-teknik yang digunakan – Aplikasi yang disesuaikan • Mari kita lihat lebih dekat pada tinjauan ini ...

Databases yang akan digali Tinjauan Data Mining Databases yang akan digali • Relasional Data warehouse Transaksional Object-oriented Object- relational • Aktif • Spasial • Time-series • Teks, XML Multi-media Heterogen Warisan Induktif WWW dsb. Databases • • • • • • • • • •

Aplikasi yang disesuaikan Tinjauan Data Mining Aplikasi yang disesuaikan • Retail (supermarkets etc.) • Telecom • Banking • Fraud analysis • DNA mining • Analisa stock market • Web mining • Analisa data log • dsb. Applic.

OLAP Mining: Integrasi Dari Data Mining dan Data Warehouse • Sistem data mining, DBMS, Data warehouse systems coupling – No coupling, loose-coupling, semi-tight-coupling, tight-coupling • Data on-line analytical mining (OLAM) – Integrasi dari penggalian dan teknologi OLAP

OLAP Mining: Integrasi Dari Data Mining dan Data Warehouse • Penggalian pengetahuan multi-level secara interaktif – Kebutuhan penggalian pengetahuan dan pola pada suatu level berbeda dari abstraksi dengan drilling/rolling, pivoting, slicing/dicing, dsb. • Integrasi dari banyak fungsi penggalian – Klasifikasi berkarakter, pertama clustering dan kemudian asosiasi

• Metodologi dan interaksi penambangan Isu Utama dalam Data Mining • Metodologi dan interaksi penambangan – Penambangan berbagai jenis pengetahuan – Penambangan pengetahuan secara interaktif – Penggabungan latar belakang pengetahuan – Bahasa query DM dan DM khusus – Visualisasi hasil DM – Penanganan gangguan dan data tak lengkap – Ketertarikan problem • Kinerja dan skalabilitas: – Efisiensi dan skalabilitas dari algoritma DM – Metoda penambangan paralel, tersebar dan bertumbuh

Isu Utama dalam dalam Data Mining • Aneka ragam tipe data: – Penanganan tipe data kompleks – Penambangan informasi dari database heterogen (Web misalnya) • Aplikasi dan integrasi pengetahuan yang didapat: – Tool DM khusus domain – Jawaban query cerdas dan pembuatan keputusan – Integrasi dari pengetahuan yang didapat dengan pengetahuan yang ada • Proteksi data … – Keamanan – Integritas – Kerahasiaan

dan banyak lagi konferensi kecil / baru dari DM … – PAKDD, PKDD Historis Aktivitas Data Mining 1989 IJCAI Workshop 1991--1994 KDD Workshops 1995--1998 KDD Conferences 1998 ACM SIGKDD 1999- SIGKDD Conferences dan banyak lagi konferensi kecil / baru dari DM … – PAKDD, PKDD – SIAM-Data Mining, (IEEE) ICDM – dsb. • • • • • •

Data Mining “Standards” • DM: • DM/DB: • AI/ML: Conferences: Journals: Rujukan Yang Berguna untuk Data Mining “Standards” • DM: • DM/DB: • AI/ML: Conferences: Journals: KDD, PKDD, PAKDD, ... Data Mining and Knowledge Discovery, CACM ACM-SIGMOD/PODS, VLDB, ... ACM-TODS, J. ACM, IEEE-TKDE JIIS, ... Machine Learning, AAAI, IJCAI, ... Machine Learning, Artific. Intell., ... TKDE,

• Data mining: penemuan pola menarik dari data set yang Kesimpulan • Data mining: penemuan pola menarik dari data set yang besar secara semi-otomatis • Knowledge discovery adalah suatu proses: – Preprocessing – Data mining – Postprocessing • Untuk digali, digunakan atau dimanfaatkan … – Databases (relasional, object-oriented, spasial, WWW, …) – Pengetahuan (karakterisasi, pengumpulan, asosiasi, …) – Teknik (mesin pembelajaran, statistik, visualisasi, …) – Aplikasi (retail, telecom, Web mining, analisa log, …)