Oleh : Rahmat Robi Waliyansyah, M.Kom.

Slides:



Advertisements
Presentasi serupa
Identifikasi Pembuktian (Penerapan) dalam Sistem Informasi
Advertisements

KNOWLEGDE DISCOVERY in DATABASE (KDD)
Software Process Model
Sasaran Menjelaskan apa yang dimaksud model proses
Ujian Akhir Semester (UAS)
PROJECT-BASED LEARNING
CRISP – DM Cross-Industry Standard Process for Data Mining
Pengenalan Datawarehouse
Pertemuan 2 Konsep Aplikasi Berbasis Objek, UML dan Rational Rose
SISTEM MENEMUKAN PENGETAHUAN :
Pengenalan Datawarehouse
Manajemen Data: Data, Database, dan Pergudangan
Pengenalan Supervised dan Unsupervised Learning
1 Pendahuluan Pertemuan 12 Matakuliah: H0062/Teori Sistem Tahun: 2006.
KEBUTUHAN APLIKASI WEB
PENELITIAN SURVEI Program MPMT PPs UT MATERI INISIASI 4
BERBASIS LABORATORIUM
DATA MINING (Machine Learning)
Managing Software Requirement 3
FASE PERENCANAAN MPSI – sesi 4.
DATA MINING 25 Januari 2008.
KETERAMPILAN PROSES SAINS DASAR
Penambangan data Pertemuan 2.
SISTEM PENDUKUNG PENGAMBILAN KEPUTUSAN
PENGOLAHAN & ANALISIS DATA
MK Manajemen Proyek S1-Kesmas
FASE PERENCANAAN MPSI – sesi 4.
System Life Cycle Nurhayati, S.Kom., M.Kom Dosen STMIK Kaputama 1.
Model Proses Analisis Bisnis
STUDI KASUS KLASIFIKASI Algoritma C 4.5
Menentukan masalah Humas
Cross-Industry Standard Process for Data Mining CRISP-DM
SISTEM INFORMASI MANAJEMEN
KONSEP DASAR PENELITIAN PENDIDIKAN
KECERDASAN BUATAN (ARTIFICIAL INTELLIGENCE)
Data Mining.
Konsep Data Mining Ana Kurniawati.
MODEL PEMBELAJARAN MIKRO
Rekayasa Kebutuhan Software
Semester VII/Kelas A, B, C
PERTEMUAN 2 Proses Pengembangan Perangkat Lunak
KECERDASAN BUATAN (ARTIFICIAL INTELLIGENCE)
Business Intelligent Ramos Somya, S.Kom., M.Cs.
PROSES PEMODELAN.
BAB 5 PROSES PERENCANAAN DI SUSUN OLEH: HILMAN PRAKARSA S
Manajemen Proyek Sistem Informasi DAY-2
BUSINESS INTELLIGENCE
Pengembangan Kebutuhan Bisnis
Pemodelan bisnis dan use case binis
PENELITIAN KESEHATAN dr.Juliandi Hrp,MA
MANAJEMEN PROYEK PERANGKAT LUNAK
Analisis Use Case SI401 Perancangan Sistem Informasi Pertemuan #2
Perancangan Data Logis dan Fisik
ASPEK PENILAIAN DALAM MATEMATIKA
METODE PENGEMBANGAN DATAWAREHOUSE
Analisis Klastering K-Means Model Datamining Kelompok 1 Eko Suryana
KOMPUTASI KECERDASAN BUATAN
TOGAF Architecture Development Method (ADM)
Analisis pekerjaan dan perencanaan SDM
TESTING DAN QA SOFTWARE PERTEMUAN 18
Oleh : Rahmat Robi Waliyansyah, M.Kom.
Pertemuan 1 & 2 Pengantar Data Mining 12/6/2018.
DISUSUN OLEH: SUHERTI ROFIQAH
Konsep Data Mining Ana Kurniawati.
Data Mining.
By : Rahmat Robi Waliyansyah, M.Kom
Reseach methode Julio Skom.,MMSi.
Intro Algoritma K-Nearest Neighbor (K- NN) adalah sebuah metode klasifikasi terhadap sekumpulan data maupun dokumen berdasarkan pembelajaran  data yang.
Konsep Aplikasi Berbasis Objek
LANGKAH-LANGKAH ANALISA SISTEM Oleh : Saenal Abidin, S.IP., M.Hum.
Transcript presentasi:

Oleh : Rahmat Robi Waliyansyah, M.Kom. CRISP-Data Mining Oleh : Rahmat Robi Waliyansyah, M.Kom.

CRISP-DM CRISP-DM merupakan singkatan dari Cross-Industry Standard Process Model for Data Mining. Secara umum menjelaskan tentang proses data mining dalam enam tahap. Proses ini salah satu tujuannya untuk menemukan pola yang menarik dan bermakna dalam data. Serta melibatkan beberapa disiplin ilmu, seperti Statistika, Machine Learning, Artificial Intelligence, Pattern Recognition, dan Data Mining.

CRISP-DM Salah satu keuntungan dari menggunakan proses ini adalah menjelaskan langkah paling umum dalam proses – prosesnya. Proses ini juga melibatkan manajer dan praktisi secara bersamaan. Dimana manajer secara garis besar memberikan arahan tujuan utama proyek yang akan dikerjakan, ketersediaan data dan model - model yang akan digunakan. Sedangkan praktisi akan bekerja sesuai dengan bidangnya dalam setiap proses yang ada, praktisi disinipun bisa terdiri dari berbagai disiplin ilmu, bisa dari matematika, statistika, ataupun teknik informatika.

Business Understanding Secara garis besar untuk mendefinisikan proyek. Ini adalah tahap pertama dalam CRISP-DM dan termasuk bagian yang cukup vital dalam proyek dan selama pengerjaan pada proses selanjutnya. Pada tahap ini membutuhkan pengetahuan dari objek bisnis, bagaimana membangun atau mendapatkan data, dan bagaimana untuk mencocokan tujuan pemodelan untuk tujuan bisnis sehingga model terbaik dapat dibangun.

2. Data Understanding Secara garis besar untuk memeriksa data, sehingga dapat mengidentifikasi masalah dalam data. Tahap ini memberikan fondasi analitik untuk sebuah proyek dengan membuat ringkasaan (summary) dan mengidentifikasi potensi masalah dalam data. Tahap ini juga harus dilakukan secara cermat dan tidak terburu - buru, seperti pada visualisasi data, yang terkadang insightnya sangat sulit didapat dika dihubungkan dengan summary datanya. Jika ada masalah pada tahap ini yang belum terjawab, maka akan menggangu pada tahap modeling.

2. Data Understanding Ringkasan atau summary dari data dapat berguna untuk mengkonfirmasi apakah data terdistribusi seperti yang diharapkan, atau mengungkapkan penyimpangan tak terduga yang perlu ditangani pada tahap selanjutnya, yaitu Data Preperation Masalah dalam data biasanya seperti nilai-nilai yang hilang, outlier, berdistribusi spike, berdistribusi bimodal harus diidentifikasi dan diukur sehingga dapat diperbaiki dalam Data Preperation.

3. Data Preperation Secara garis besar untuk memperbaiki masalah dalam data, kemudian membuat variabel derived. Tahap ini jelas membutuhkan pemikiran yang cukup matang dan usaha yang cukup tinggi untuk memastikan data tepat untuk algoritma yang digunakan.

3. Data Preperation Bukan berarti saat Data Preperation pertama kali dimana masalah-masalah pada data sudah diselesaikan, data sudah dapat digunakan hingga tahap terakhir. Tahap ini merupakan tahap yang sering ditinjau kembali saat menemukan masalah pada saat pembangunan model. Sehingga dilakukan iterasi sampai menemukan hal yang cocok dengan data. Tahap sampling dapat dilakukan disini dan data secara umum dibagi menjadi dua, data training dan data testing.

4. Modeling Secara garis besar untuk membuat model prediktif atau deskriptif. Pada tahap ini akhirnya kita dapat menggunakan Statistika dan Machine Learning untuk mendapatkan insight yang berguna dari data untuk mencapai tujuan proyek. Beberapa modeling yang biasa dilakukan adalah classification, scoring, ranking, clustering, finding relation, characterization.

5. Evaluation Secara garis besar untuk menilai model agar dapat melaporkan efek yang diharapkan dari model Setelah mempunyai model, kita harus menentukan apakah sesuai dengan tujuan kita. Beberapa pertanyaan di bawah ini bisa membantu apakah model kita sudah sesuai dengan tujuan atau belum.

6. Deployment Secara garis besar untuk rencana penggunaan model Tahap ini adalah tahap yang paling dihargai dari proses CRISP-DM. Perencanaan untuk Deployment dimulai selama Business Understanding dan harus menggabungkan tidak hanya bagaimana untuk menghasilkan nilai model, tetapi juga bagaimana mengkonversi skor keputusan, dan bagaimana untuk menggabungkan keputusan dalam sistem operasional.

QUIZ Jelaskan persamaan SEMMA, KDD dan CRISP- DM!