Data Mining Junta Zeniarja, M.Kom, M.CS junta@dsn.dinus.ac.id.

Slides:



Advertisements
Presentasi serupa
KNOWLEGDE DISCOVERY in DATABASE (KDD)
Advertisements

Diadaptasi dari slide Jiawei Han
Data Mining: Proses Data Mining
Data Mining: 2. Proses Data Mining
Peran Utama Data Mining
Algoritma-algoritma Estimasi
Klasifikasi (Season 1) Naive Bayes
Chapter 11 k- Fold Cross Validation
HEALTHCARE DATAMINING
Progress Final Project Ke-1
Chapter 10 ALGORITME for ASSOCIATION RULES
Algoritma Data Mining Object-Oriented Programming Algoritma Data Mining
Chapter 9 ALGORITME Cluster dan WEKA
Marselina Silvia Suhartinah / 4IA05
STREAM INPUT/OUPUT Pertemuan 4 Matakuliah: T0456 / Algoritma dan Metode Object Oriented Programming Tahun: 2007.
1 Pertemuan 5 STREAM INPUT/OUPUT Matakuliah: T0456 ~ Algoritma dan Metode Object Oriented Programming Tahun: 2005 Versi: 5.
Data Mining: Klasifikasi dan Prediksi Naive Bayesian & Bayesian Network . April 13, 2017.
1 Pertemuan 1 Algoritma Matakuliah: T0456 ~ Algoritma dan Metode Object Oriented Programming Tahun: 2005 Versi: 5.
Pengenalan Supervised dan Unsupervised Learning
1 Pertemuan 8 Klasifikasi dan Rekognisi Pola (2) Matakuliah: T0283 – Computer Vision Tahun: 2005 Versi: Revisi 1.
Data Mining: 2. Proses Data Mining
A rsitektur dan M odel D ata M ining. Arsitektur Data Mining.
Data Mining: 2. Proses Data Mining
DATA MINING (Machine Learning)
Data mining ABU SALAM, M.KOM.
Data Mining: 2. Proses Data Mining
Sistem Berbasis Fuzzy Materi 4
2. Data & Proses Datamining
Data Mining Junta Zeniarja, M.Kom, M.CS
Pengertian Algoritma Pemrograman Pertemuan 1
K-SUPPORT VECTOR NEAREST NEIGHBOR UNTUK KLASIFIKASI BERBASIS K-NN
Klasifikasi.
STUDI KASUS KLASIFIKASI Algoritma C 4.5
Peran Utama Data Mining
PEMBUATAN POHON KEPUTUSAN
Data Mining Junta Zeniarja, M.Kom, M.CS
Data Mining.
Disiplin Ilmu, Metode Penelitian, Computing Method
4. Disiplin Ilmu, Metode Penelitian dan Computing Methods
Data Mining.
Konsep Data Mining Ana Kurniawati.
Data Mining Yohana Nugraheni, S.Kom, MT
Data Mining Junta Zeniarja, M.Kom, M.CS
Clustering Best Practice
Disiplin Ilmu, Metode Penelitian, Computing Method
DASAR PEMROGRAMAN [Teori] pertemuan 1
Metode penelitian lesson #10
Business Intelligent Ramos Somya, S.Kom., M.Cs.
TUGAS PROYEK AKHIR DATA MINING
Road Map Penelitian Data Mining
Matakuliah : T0456 ~ Algoritma dan Metode Object Oriented Programming
MATERI PERKULIAHAN KECERDASAN BUATAN
Mata Kuliah Analisa Perancangan Sistem Informasi
PROGRAM STUDI SISTEM INFORMASI TEKNIK INFORMATIKA
Oleh : Rahmat Robi Waliyansyah, M.Kom.
USING DATA MINING TO MODEL PLAYER EXPERIENCE
DATA MINING with W E K A.
KLASIFIKASI.
Object-Oriented Programming Data Mining Romi Satria Wahono
Konsep Aplikasi Data Mining
Klasifikasi dengan RapidMiner
Konsep Aplikasi Data Mining
Machine Learning Introduction
KLASIFIKASI.
Konsep Data Mining Ana Kurniawati.
Information Retrieval “Document Classification dengan Naive Bayes”
IMPLEMENTASI ALGORITMA k-NN
Konsep Aplikasi Data Mining
Universitas Gunadarma
Universitas Gunadarma
Transcript presentasi:

Data Mining Junta Zeniarja, M.Kom, M.CS junta@dsn.dinus.ac.id

Profil Nama : Junta Zeniarja, M.Kom, M.CS Alamat : Permata Tembalang, Dendronium 25 Kontak Phone : 085727181701 E-mail : junta@dsn.dinus.ac.id Room : D.2.F Pendidikan S1 => TI – UDINUS S2 => TI – UDINUS S2 => Computer Science UTeM (Universiti Teknikal Malaysia Melaka) Konsultasi - Sharing 1:00 pm – 3:00 pm, Senin, Selasa dan Kamis. Appointment via phone or e-mail preferred

Textbooks

Outline Pengenalan Data Mining Data Mining Peran Utama Data Mining Mengenal Rapidminer Algoritma Data Mining (Input => Output)

Algoritma Data Mining Mengolah Data (Input) Menjadi Model (Output)

Metode (Algoritma Data Mining) romi@romisatriawahono.net Object-Oriented Programming Input – Metode – Output Input (Data) Metode (Algoritma Data Mining) Output (Pola/Model) http://romisatriawahono.net

Contoh: Rekomendasi Main Golf romi@romisatriawahono.net Object-Oriented Programming Contoh: Rekomendasi Main Golf Lakukan training pada data golf (ambil dari repositories rapidminer) dengan menggunakan algoritma decision tree (C4.5) Tampilkan data (input) dan model tree (output) yang terbentuk http://romisatriawahono.net

romi@romisatriawahono.net Object-Oriented Programming http://romisatriawahono.net

romi@romisatriawahono.net Object-Oriented Programming http://romisatriawahono.net

romi@romisatriawahono.net Object-Oriented Programming http://romisatriawahono.net

romi@romisatriawahono.net Object-Oriented Programming http://romisatriawahono.net

romi@romisatriawahono.net Object-Oriented Programming http://romisatriawahono.net

romi@romisatriawahono.net Object-Oriented Programming http://romisatriawahono.net

romi@romisatriawahono.net Object-Oriented Programming http://romisatriawahono.net

romi@romisatriawahono.net Object-Oriented Programming http://romisatriawahono.net

romi@romisatriawahono.net Object-Oriented Programming http://romisatriawahono.net

romi@romisatriawahono.net Object-Oriented Programming http://romisatriawahono.net

romi@romisatriawahono.net Object-Oriented Programming http://romisatriawahono.net

Penentuan Jenis Bunga Iris romi@romisatriawahono.net Object-Oriented Programming Penentuan Jenis Bunga Iris Lakukan training pada data bunga Iris (ambil dari repositories rapidminer) dengan menggunakan algoritma decision tree (C4.5) Tampilkan data (input) dan model tree (output) yang terbentuk http://romisatriawahono.net

Tampilkan data (input) dan model tree (output) yang terbentuk romi@romisatriawahono.net Object-Oriented Programming Penentuan Mine/Rock Lakukan training pada data Sonar (ambil dari repositories rapidminer) dengan menggunakan algoritma decision tree (C4.5) Tampilkan data (input) dan model tree (output) yang terbentuk http://romisatriawahono.net

Contoh: Rekomendasi Contact Lenses romi@romisatriawahono.net Object-Oriented Programming Contoh: Rekomendasi Contact Lenses Lakukan training pada data contact lenses (contact-lenses.arff) dengan menggunakan algoritma C4.5 Pilih label dari data (set role) Tampilkan data (input) dan model tree (output) yang terbentuk http://romisatriawahono.net

romi@romisatriawahono.net Object-Oriented Programming http://romisatriawahono.net

romi@romisatriawahono.net Object-Oriented Programming http://romisatriawahono.net

romi@romisatriawahono.net Object-Oriented Programming http://romisatriawahono.net

romi@romisatriawahono.net Object-Oriented Programming http://romisatriawahono.net

romi@romisatriawahono.net Object-Oriented Programming http://romisatriawahono.net

romi@romisatriawahono.net Object-Oriented Programming http://romisatriawahono.net

romi@romisatriawahono.net Object-Oriented Programming http://romisatriawahono.net

romi@romisatriawahono.net Object-Oriented Programming http://romisatriawahono.net

romi@romisatriawahono.net Object-Oriented Programming http://romisatriawahono.net

romi@romisatriawahono.net Object-Oriented Programming http://romisatriawahono.net

romi@romisatriawahono.net Object-Oriented Programming http://romisatriawahono.net

romi@romisatriawahono.net Object-Oriented Programming http://romisatriawahono.net

romi@romisatriawahono.net Object-Oriented Programming http://romisatriawahono.net

romi@romisatriawahono.net Object-Oriented Programming http://romisatriawahono.net

Estimasi Performance CPU romi@romisatriawahono.net Object-Oriented Programming Estimasi Performance CPU Lakukan training pada data CPU (cpu.arff) dengan menggunakan algoritma linear regression Tampilkan data (input) dan model tree (output) yang terbentuk http://romisatriawahono.net

Prediksi Elektabilitas Caleg romi@romisatriawahono.net Object-Oriented Programming Prediksi Elektabilitas Caleg Lakukan training pada data pemilu (datapemilukpu.xls) dengan menggunakan algoritma C4.5 Pilih label dari data (set role) Tampilkan data (input) dan model tree (output) yang terbentuk http://romisatriawahono.net

Evaluasi dan Validasi terhadap Model (Output) yang Terbentuk

Input – Metode – Output – Evaluation romi@romisatriawahono.net Object-Oriented Programming Input – Metode – Output – Evaluation Input (Data) Metode (Algoritma Data Mining) Output (Pola/Model) Evaluation (Akurasi, AUC, RMSE, etc) http://romisatriawahono.net

Prediksi Elektabilitas Caleg romi@romisatriawahono.net Object-Oriented Programming Prediksi Elektabilitas Caleg Lakukan training pada data pemilu (datapemilukpu.xls) dengan menggunakan algoritma C4.5, NB dan K-NN Lakukan pengujian dengan menggunakan 10-fold X Validation Ukur performance-nya dengan confusion matrix dan ROC Curve C4.5 NB K-NN Accuracy 92.45% 77.46% 88.72% AUC 0.851 0.840 0.5 http://romisatriawahono.net

Prediksi Elektabilitas Caleg romi@romisatriawahono.net Object-Oriented Programming Prediksi Elektabilitas Caleg Lakukan training pada data pemilu (datapemilukpu.xls) dengan menggunakan algoritma C4.5, NB dan K-NN Lakukan pengujian dengan menggunakan 10-fold X Validation Ukur performance-nya dengan confusion matrix dan ROC Curve Uji beda dengan t-Test untuk mendapatkan model terbaik http://romisatriawahono.net

Prediksi Elektabilitas Caleg: Result Komparasi Accuracy dan AUC Uji Beda (t-Test) Urutan model terbaik: 1. C4.5 2. NB 3. K-NN C4.5 NB K-NN Accuracy 92.45% 77.46% 88.72% AUC 0.851 0.840 0.5

Prediksi Kelulusan Mahasiswa romi@romisatriawahono.net Object-Oriented Programming Prediksi Kelulusan Mahasiswa Lakukan training pada data mahasiswa (datakelulusanmahasiswa.xls) dengan menggunakan C4.5, LDA, NB, K-NN dan RF Atribut yang tidak digunakan adalah: IPS5, IPS6, IPS7, IPS8, IPK Lakukan pengujian dengan menggunakan 10-fold X Validation Ukur performance-nya dengan confusion matrix dan ROC Curve Uji beda dengan t-Test untuk mendapatkan model terbaik http://romisatriawahono.net

Prediksi Kelulusan Mahasiswa: Result Komparasi Accuracy dan AUC Uji Beda (t-Test) Urutan model terbaik: 1. NB 2. C4.5 3.k-NN 4. RF 5.LDA C4.5 NB K-NN LDA RF Accuracy 88.12% 86.27% 84.96% 59.63% 59.37% AUC 0.872 0.912 0.5

Estimasi Performansi CPU romi@romisatriawahono.net Object-Oriented Programming Estimasi Performansi CPU Lakukan training pada data cpu (cpu.arff) dengan menggunakan algoritma linear regression, neural network dan support vector machine Lakukan pengujian dengan XValidation (numerical) Ukur performance-nya dengan menggunakan: RMSE Urutan model terbaik: 1. NN 2. LR 3. SVM LR NN SVM RMSE 64.846 64.515 106.089 http://romisatriawahono.net

Main Process romi@romisatriawahono.net Object-Oriented Programming http://romisatriawahono.net

Sub Process romi@romisatriawahono.net Object-Oriented Programming http://romisatriawahono.net

Prediksi Elektabilitas Caleg romi@romisatriawahono.net Object-Oriented Programming Prediksi Elektabilitas Caleg Lakukan training pada data pemilu (datapemilukpu.xls) dengan menggunakan algoritma Naive Bayes, K-Nearest Neighbor, RandomForest, Logistic Regression, Linear Discriminant Analysis Lakukan pengujian dengan menggunakan XValidation Ukur performance-nya dengan confusion matrix dan ROC Curve Masukkan setiap hasil percobaan ke dalam file Excel DT NB K-NN RF LR LDA Accuracy 92.21% 76.89% 89.63% AUC 0.851 0.826 0.5 http://romisatriawahono.net

romi@romisatriawahono.net Object-Oriented Programming Prediksi Harga Saham Lakukan training pada data harga saham (hargasaham-training.xls) dengan menggunakan neural network Lakukan pengujian dengan numerical XValidation Lakukan Ploting data testing Ukur performance-nya dengan menggunakan: RMSE http://romisatriawahono.net

romi@romisatriawahono.net Object-Oriented Programming Prediksi Harga Saham Lakukan training pada data harga saham (hargasaham-training.xls) dengan menggunakan neural network Lakukan pengujian dengan data uji (hargasaham-testing.xls) Lakukan Ploting data testing Ukur performance-nya dengan menggunakan: RMSE Ubah metode ke linear regression dan support vector machine http://romisatriawahono.net

Klastering Jenis Bunga Iris romi@romisatriawahono.net Object-Oriented Programming Klastering Jenis Bunga Iris Lakukan training pada data iris (ambil dari repositories rapidminer) dengan menggunakan algoritma clustering k-means Set k=3 Tampilkan data (input) dan cluster (output) yang terbentuk Ukur performance-nya http://romisatriawahono.net

Psychomotor-Cognitive Assignment romi@romisatriawahono.net Object-Oriented Programming Psychomotor-Cognitive Assignment Lakukan ujicoba terhadap semua dataset yang ada di folder datasets, dengan menggunakan berbagai metode data mining yang sesuai (estimasi, prediksi, klasifikasi, clustering, association) Kombinasikan pengujian dengan pemecahan data training-testing, dan pengujian dengan menggunakan metode X validation Ukur performance dari model yang terbentuk dengan menggunakan metode pengukuran sesuai dengan metode data mining yang dipilih Jelaskan secara mendetail tahapan ujicoba yang dilakukan, kemudian lakukan analisis dan sintesis, dan buat laporan dalam bentuk slide Presentasikan di depan kelas http://romisatriawahono.net

Cari 1 paper di bidang data mining Tugas Cari 1 paper di bidang data mining Pilih yang mudah dipahami baik secara obyek penelitian maupun metode yang digunakan Rangkumkan dalam bentuk slide dengan format Author, Judul, Publisher, Tahun Latar Belakang Masalah Rumuan Masalah Tujuan Penelitian Metode Eksperimen Hasil Penelitian Presentasikan di depan kelas

Referensi Wikipedia, http://en.wikipedia.org/wiki/RapidMiner romi@romisatriawahono.net Object-Oriented Programming Referensi Ian H. Witten, Frank Eibe, Mark A. Hall, Data mining: Practical Machine Learning Tools and Techniques 3rd Edition, Elsevier, 2011 Santosa Budi, Teknik Pemanfaatan Data Untuk Keperluan Bisnis, Graha Ilmu, 2007 Wikipedia, http://en.wikipedia.org/wiki/RapidMiner RapidMiner Installation Guide, http://rapid-i.com/content/view/17/40/ RapidMiner 5.0 Manual, Rapid-I, 2010, http://www.rapid-i.com Slide Materi Romi Satrio Wahono (www.ilmukomputer.com) http://romisatriawahono.net