Universitas Gunadarma

Slides:



Advertisements
Presentasi serupa
KNOWLEGDE DISCOVERY in DATABASE (KDD)
Advertisements

Diadaptasi dari slide Jiawei Han
BASIS DATA LANJUTAN.
Peran Utama Data Mining
Data Mining Object-Oriented Programming
DATA MINING 1.
HEALTHCARE DATAMINING
Chapter 10 ALGORITME for ASSOCIATION RULES
Algoritma Data Mining Object-Oriented Programming Algoritma Data Mining
M ANAJEMEN D ATA “Pengaksesan Data”. P ENDAHULUAN Selama beberapa waktu, teknologi informasi berkonsentrasi pada pembangunan sistem bermisi kritis,- sistem.
Pertemuan X DATA MINING
Data Mining: Klasifikasi dan Prediksi Naive Bayesian & Bayesian Network . April 13, 2017.
Pengenalan Supervised dan Unsupervised Learning
Tahapan dan Pengelompokan Data Mining
Pengenalan Data Mining
A rsitektur dan M odel D ata M ining. Arsitektur Data Mining.
DATA MINING (Machine Learning)
Course Outline 1. Pengantar Data Mining 2. Proses Data Mining
Data mining ABU SALAM, M.KOM.
DATA MINING 25 Januari 2008.
Sistem Berbasis Fuzzy Materi 4
Penambangan data Pertemuan 2.
2. Data & Proses Datamining
DATA AND INFORMATION MANAGEMENT
Data Mining Junta Zeniarja, M.Kom, M.CS
Data Mining Junta Zeniarja, M.Kom, M.CS
Decision Tree.
Peran Utama Data Mining
PEMBUATAN POHON KEPUTUSAN
Algoritma C4.5. Algoritma C4.5 Object-Oriented Programming Introduction Algoritma C4.5 merupakan algoritma yang digunakan.
Data Mining Junta Zeniarja, M.Kom, M.CS
Data Mining.
Disiplin Ilmu, Metode Penelitian, Computing Method
Pengenalan Pola Materi 1
Data Mining.
Konsep Data Mining Ana Kurniawati.
Pengantar DATA MINING • Mengapa data mining? Apa data mining?
Data Mining Yohana Nugraheni, S.Kom, MT
Clustering Best Practice
Data Mining.
Disiplin Ilmu, Metode Penelitian, Computing Method
Naïve Bayes Classification.
Aplikasi Business Intelligence & Data Mining
Business Intelligent Ramos Somya, S.Kom., M.Cs.
KELOMPOK 6 Nama Kelompok: Lulus Irmawati ( )
MATERI PERKULIAHAN KECERDASAN BUATAN
Mata Kuliah Analisa Perancangan Sistem Informasi
PROGRAM STUDI SISTEM INFORMASI TEKNIK INFORMATIKA
Naïve Bayes Classification.
Analisis Klastering K-Means Model Datamining Kelompok 1 Eko Suryana
PRODI MIK | FAKULTAS ILMU-ILMU KESEHATAN
MIK | FAKULTAS ILMU-ILMU KESEHATAN
DATA MINING with W E K A.
KLASIFIKASI.
Object-Oriented Programming Data Mining Romi Satria Wahono
Konsep Aplikasi Data Mining
DATA PREPARATION Kompetensi
Konsep Aplikasi Data Mining
Arsitektur dan Model Data Mining
Pengetahuan Data Mining
Pertemuan 1 & 2 Pengantar Data Mining 12/6/2018.
DATA PREPARATION.
Machine Learning Introduction
KLASIFIKASI.
Konsep Data Mining Ana Kurniawati.
ASSOCIATION RULE DAN PENERAPANNYA
DATA MINING 01 Introduction
Konsep Aplikasi Data Mining
Universitas Gunadarma
Universitas Gunadarma
Transcript presentasi:

Universitas Gunadarma KONSEP DATA MINING Disusun Oleh : Dr Lily Wulandari Universitas Gunadarma Logo Seminar

Buku Referensi

RENCANA PEMBELAJARAN SEMESTER PROGRAM STUDI Sistem Informasi FAKULTAS - IKTI UNIVERSITAS GUNADARMA (RPS FILE)

Konsep Data Mining & Aplikasinya Pada Bidang Informasi

Outline Pengenalan Data Mining Proses Data Mining Evaluasi dan Validasi pada Data Mining Metode dan Algoritma Data Mining Penelitian Data Mining

Mining? Warehousing?

The World of Data 7

Heterogeneous Data

Kaya Data tetapi Miskin Informasi The global data supply reached 2.8 zettabytes (ZB) in 2012 - or 2.8 trillion GB - but just 0.5% of this is used for analysis, according to the Digital Universe Study. http://www.guardian.co.uk/news/datablog/2012/dec/19/big-data-study-digital-universe-global-volume

Business Intelligence

Data Integration & Analysis

From Data To Intelligence Decision Models Data Mining Preprocessing Database Decision Support Knowledge Information Data

Financial Institutions It is all about data … Financial Institutions Retail WWW Healthcare Consulting Companies Government Bioinformatics Telecommunication

Big Data

Artificial Intelligence Interdisciplinary Data Mining Machine Learning Pattern Recognition Statistics Artificial Intelligence

Keterhubungan Data Mining Business Intelligence Data Analytics Big Data Decision Support Customer Relationship Management

Pengenalan Data Mining romi@romisatriawahono.net Object-Oriented Programming Pengenalan Data Mining Apa itu Data Mining? Peran Utama Data Mining Algoritma Data Mining http://romisatriawahono.net

Apa itu Data Mining? romi@romisatriawahono.net Object-Oriented Programming Apa itu Data Mining? http://romisatriawahono.net

romi@romisatriawahono.net Object-Oriented Programming Mengapa Data Mining? Manusia dalam suatu organisasi, sadar atau tidak sadar telah memproduksi berbagai data yang jumlahnya sangat besar Contoh data: bisnis, kedokteran, ekonomi, geografi, olahraga, … Pada dasarnya, data adalah entitas yang tidak memiliki arti, meskipun kemungkinan memiliki nilai di dalamnya http://romisatriawahono.net

Apa itu Data Mining?

Apa itu Data Mining? Disiplin ilmu yang mempelajari metode untuk mengekstrak pengetahuan atau menemukan pola dari suatu data Data: fakta yang terekam dan tidak membawa arti Pengetahuan: pola, aturan atau model yang muncul dari data Sehingga Data mining sering disebut Knowledge Discovery in Database (KDD) Konsep Transformasi DataInformasiPengetahuan

Pengetahuan Gabungan dari suatu pengalaman, nilai, informasi kontekstual dan juga pandangan pakar yang memberikan suatu framework untuk mengevaluasi dan menciptakan pengalaman dan informasi baru (Thomas H. Davenport, Laurence Prusak) Bisa berupa solusi pemecahan suatu masalah, petunjuk suatu pekerjaan dan ini bisa ditingkatkan nilainya, dipelajari dan juga bisa diajarkan kepada yang lain

romi@romisatriawahono.net Object-Oriented Programming Definisi Data Mining Melakukan ekstraksi untuk mendapatkan informasi penting yang sifatnya implisit dan sebelumnya tidak diketahui, dari suatu data (Witten et al., 2011) Kegiatan yang meliputi pengumpulan, pemakaian data historis untuk menemukan keteraturan, pola dan hubungan dalam set data berukuran besar (Santosa, 2007) http://romisatriawahono.net

romi@romisatriawahono.net Object-Oriented Programming Definisi Data Mining Analisis set data pengamatan (sering besar) untuk menemukan hubungan yang tidak terduga dan untuk meringkas data dalam cara-cara baru yang dapat dimengerti dan berguna bagi pemilik data (Han & Kamber, 2001) Proses menemukan korelasi, pola, dan tren baru yang bermakna dengan memilah-milah sejumlah besar data yang disimpan dalam repositori, menggunakan teknologi pengenalan pola serta teknik statistik dan matematika (Gartner Group) http://romisatriawahono.net

Data – Informasi - Pengetahuan Data Kehadiran Pegawai NIP TGL DATANG PULANG 1103 02/12/2004 07:20 15:40 1142 07:45 15:33 1156 07:51 16:00 1173 08:00 15:15 1180 07:01 16:31 1183 07:49 17:00

Data – Informasi - Pengetahuan Informasi Akumulasi Bulanan Kehadiran Pegawai NIP Masuk Alpa Cuti Sakit Telat 1103 22 1142 18 2 1156 10 1 11 1173 12 5 1180

Data – Informasi - Pengetahuan Informasi Kondisi kehadiran Mingguan Pegawai Senin Selasa Rabu Kamis Jumat Terlambat 7 1 5 Pulang Cepat 8 Izin 3 4 Alpa 2

Data – Informasi - Pengetahuan Pengetahuan tentang kebiasaan pegawai dalam jam datang/pulang kerja Pengetahuan tentang bagaimana teknik meningkatkan kehadiran pegawai  kebijakan

Data - Informasi - Pengetahuan - Kebijakan http://romisatriawahono.net Data - Informasi - Pengetahuan - Kebijakan Kebijakan penataan jam kerja karyawan khusus untuk hari senin dan jumat Peraturan jam kerja: Hari Senin dimulai jam 10:00 Hari Jumat diakhiri jam 14:00 Sisa jam kerja dikompensasi ke hari lain: Senin pulang setelah maghrib, toh jalanan Jakarta macet total di sore hari (bayar hutang 2 jam) Rabu dan kamis bayar hutang setengah jam di pagi hari dan setengah jam di sore hari (bayar hutang 2 jam) romi@romisatriawahono.net

Apa itu (bukan) Data Mining? Apa yang bukan merupakan Data Mining? Cari nomor telepon di direktori telepon Meminta mesin pencari Web untuk informasi tentang "Amazon" Apa itu data mining? Nama-nama tertentu lebih lazim di lokasi AS tertentu (O'Brien, O'Rourke, O'Reilly ... di daerah Boston) Kelompokkan dokumen serupa yang dikembalikan oleh mesin pencari sesuai konteksnya (mis., Hutan hujan Amazon, Amazon.com)

Proses Utama pada Data Mining romi@romisatriawahono.net Object-Oriented Programming Proses Utama pada Data Mining Input (Data) Metode (Algoritma Data Mining) Output (Pola/Model) http://romisatriawahono.net

Contoh Midwest grocery chain menggunakan DM untuk menganalisis pola pembelian: saat pria membeli roti di hari Kamis dan Sabtu, mereka juga membeli minuman. Analisis lebih lanjut: pembeli ini belanja di hari kamis dan sabtu, tapi di hari kamis jumlah item lebih sedikit. Kesimpulan yang diambil: pembeli membeli minuman untuk dihabiskan saat weekend. Tindak lanjut: menjual minuman dengan harga full di hari Kamis dan Sabtu. Mendekatkan posisi roti dan minuman.

Lanjutan CONTOH KASUS : Jika Anda mempunyai kartu kredit, sudah pasti Anda bakal sering menerima surat berisi brosur penawaran barang atau jasa. Jika Bank pemberi kartu kredit Anda mempunyai 1.000.000 nasabah, dan mengirimkan sebuah (hanya satu) penawaran dengan biaya pengiriman sebesar Rp. 1.000 per buah maka biaya yang dihabiskan adalah Rp. 1 Milyar!! Jika Bank tersebut mengirimkan penawaran sekali sebulan yang berarti 12x dalam setahun maka anggaran yang dikeluarkan per tahunnya adalah Rp. 12 Milyar!! Dari dana Rp. 12 Milyar yang dikeluarkan, berapa persenkah konsumen yang benar-benar membeli? Mungkin hanya 10 %-nya saja. Secara harfiah, berarti 90% dari dana tersebut terbuang sia-sia.

Lanjutan Dari contoh kasus di atas merupakan salah satu persoalan yang dapat diatasi oleh data mining dari sekian banyak potensi permasalahan yang ada. Data mining dapat menambang data transaksi belanja kartu kredit untuk melihat manakah pembeli-pembeli yang memang potensial untuk membeli produk tertentu. Mungkin tidak sampai presisi 10%, tapi bayangkan jika kita dapat menyaring 20% saja, tentunya 80% dana dapat digunakan untuk hal lainnya.

Irisan Bidang Ilmu Data Mining romi@romisatriawahono.net Object-Oriented Programming Irisan Bidang Ilmu Data Mining Statistik: Lebih bersifat teori Fokus ke pengujian hipotesis Machine Learning: Lebih bersifat heuristik Fokus pada perbaikan performansi dari suatu teknik learning Data Mining: Gabungan teori dan heuristik Fokus pada seluruh proses penemuan knowledge dan pola Termasuk data cleaning, learning dan visualisasi hasilnya http://romisatriawahono.net

Peran Utama Data Mining romi@romisatriawahono.net Object-Oriented Programming Peran Utama Data Mining http://romisatriawahono.net

Tugas-tugas Data Mining Metode Prediksi Gunakan beberapa variabel untuk memprediksi nilai variabel lain yang tidak diketahui atau di masa mendatang. Metode Deskripsi Temukan pola yang bisa ditafsirkan manusia yang menggambarkan data.

Peran Utama Data Mining romi@romisatriawahono.net Object-Oriented Programming Peran Utama Data Mining Estimation Prediction Classification Clustering Association Estimation Prediction Classification Clustering Association http://romisatriawahono.net

Algoritma Data Mining (DM) romi@romisatriawahono.net Object-Oriented Programming Algoritma Data Mining (DM) Estimation (Estimasi): Linear Regression, Neural Network, Support Vector Machine, etc Prediction/Forecasting (Prediksi/Peramalan): Classification (Klasifikasi): Naive Bayes, K-Nearest Neighbor, C4.5, ID3, CART, Linear Discriminant Analysis, etc Clustering (Klastering): K-Means, K-Medoids, Self-Organizing Map (SOM), Fuzzy C- Means, etc Association (Asosiasi): FP-Growth, A Priori, etc http://romisatriawahono.net

Metode Learning Pada Algoritma DM romi@romisatriawahono.net Object-Oriented Programming Metode Learning Pada Algoritma DM Supervised Learning Association Learning Unsupervised Learning http://romisatriawahono.net

Metode Learning Pada Algoritma DM romi@romisatriawahono.net Object-Oriented Programming Metode Learning Pada Algoritma DM Supervised Learning (Pembelajaran dengan Guru): Sebagian besar algoritma data mining (estimation, prediction/forecasting, classification) adalah supervised learning Variabel yang menjadi target/label/class ditentukan Algoritma melakukan proses belajar berdasarkan nilai dari variabel target yang terasosiasi dengan nilai dari variable prediktor http://romisatriawahono.net

Dataset dengan Attribute & Class Class/Label

Metode Learning Pada Algoritma DM romi@romisatriawahono.net Object-Oriented Programming Metode Learning Pada Algoritma DM Unsupervised Learning (Pembelajaran tanpa Guru): Algoritma data mining mencari pola dari semua variable (atribut) Variable (atribut) yang menjadi target/label/class tidak ditentukan (tidak ada) Algoritma clustering adalah algoritma unsupervised learning http://romisatriawahono.net

Dataset with Attribute (No Class)

Metode Learning Pada Algoritma DM romi@romisatriawahono.net Object-Oriented Programming Metode Learning Pada Algoritma DM Association Learning (Pembelajaran untuk Asosiasi Atribut) Proses learning pada algoritma asosiasi (association rule) agak berbeda karena tujuannya adalah untuk mencari atribut yang muncul bersamaan dalam satu transaksi Algoritma asosiasi biasanya untuk analisa transaksi belanja, dengan konsep utama adalah mencari “produk/item mana yang dibeli bersamaan” Pada pusat perbelanjaan banyak produk yang dijual, sehingga pencarian seluruh asosiasi produk memakan cost tinggi, karena sifatnya yang kombinatorial Algoritma association rule seperti apriori algorithm, dapat memecahkan masalah ini dengan efisien http://romisatriawahono.net

Output/Pola/Model/Knowledge Formula/Function (Rumus atau Fungsi Regresi) WAKTU TEMPUH = 0.48 + 0.6 JARAK + 0.34 LAMPU + 0.2 PESANAN Decision Tree (Pohon Keputusan) Rule (Aturan) IF ips3=2.8 THEN lulustepatwaktu Cluster (Klaster)

Dataset Transaction

Association Rules

Association Rules

Contoh Klasifikasi: Rekomendasi Main Golf romi@romisatriawahono.net Object-Oriented Programming Contoh Klasifikasi: Rekomendasi Main Golf Input: Output (Rules): If outlook = sunny and humidity = high then play = no If outlook = rainy and windy = true then play = no If outlook = overcast then play = yes If humidity = normal then play = yes If none of the above then play = yes http://romisatriawahono.net

Contoh: Rekomendasi Main Golf

Contoh Klasifikasi Learn Classifier Model categorical categorical quantitative class Test Set Learn Classifier Model Training Set

Contoh Tugas-Tugas Klasifikasi Mengklasifikasikan transaksi kartu kredit sebagai sah atau curang Klasifikasi tutupan lahan (badan air, daerah perkotaan, hutan, dll.) Menggunakan data satelit Mengkategorikan berita sebagai keuangan, cuaca, hiburan, olahraga, dll Mengidentifikasi penyusup di dunia maya Memprediksi sel tumor sebagai jinak atau ganas Mengklasifikasikan struktur sekunder protein sebagai alpha-helix, beta-sheet, atau col acak

Penentuan Kelulusan Mahasiswa NIM Gender Nilai UN Asal Sekolah IPS1 IPS2 IPS3 IPS 4 ... Lulus Tepat Waktu 10001 L 28 SMAN 2 3.3 3.6 2.89 2.9 Ya 10002 P 27 SMA DK 4.0 3.2 3.8 3.7 Tidak 10003 24 SMAN 1 2.7 3.4 3.5 10004 26.4 SMAN 3 11000 23.4 SMAN 5 2.8 3.1

Klastering Bunga Iris Dataset Tanpa Label Pembelajaran dengan romi@romisatriawahono.net Object-Oriented Programming Klastering Bunga Iris Dataset Tanpa Label Pembelajaran dengan Metode Klastering (K-Means) http://romisatriawahono.net

Pengetahuan Berupa Klaster romi@romisatriawahono.net Object-Oriented Programming Pengetahuan Berupa Klaster http://romisatriawahono.net

Input – Metode – Output – Evaluation romi@romisatriawahono.net Object-Oriented Programming Input – Metode – Output – Evaluation Input (Data) Metode (Algoritma Data Mining) Output (Pola/Model) Evaluation (Akurasi, AUC, RMSE, etc) http://romisatriawahono.net

romi@romisatriawahono.net Object-Oriented Programming Referensi Ian H. Witten, Frank Eibe, Mark A. Hall, Data mining: Practical Machine Learning Tools and Techniques 3rd Edition, Elsevier, 2011 Santosa Budi, Teknik Pemanfaatan Data Untuk Keperluan Bisnis, Graha Ilmu, 2007 Slide Materi Romi Satrio Wahono (www.ilmukomputer.com) http://romisatriawahono.net

TUGAS 1 URAIAN TUGAS : Tugas memilih artikel yang membahas hasil yang diperoleh dari melakukan data mining. Berdasarkan artikel yang dipilih, mahasiswa membuat ringkasan yang: menjelaskan data yang digunakan: type data, atribut, type atribut masing-masing, dimensi menjelaskan preprocessing yang digunakan menjelaskan task mining yang dilakukan menjelaskan hasil yang diperoleh menjelaskan tools yang digunakan Luaran tugas berupa tulisan yang berisi ringkasan pada poin 2 dengan format bebas.