DATA MINING with W E K A.

Slides:



Advertisements
Presentasi serupa
KNOWLEGDE DISCOVERY in DATABASE (KDD)
Advertisements

Eni Sumarminingsih,S.Si,MM
MENGGAMBAR TEKNIK ELEKTRONIKA Program Visio Technical.
Peran Utama Data Mining
HEALTHCARE DATAMINING
Sistem Pendukung Keputusan
Pengenalan Datawarehouse
Text Mining.
Marselina Silvia Suhartinah / 4IA05
Knowledge Management Tools
Pengenalan Datawarehouse
PENGKLASIFIKASIKAN SPAM-MAIL PERBANDINGAN KINERJA ALGORITMA ID3 DAN C4
Data Mining: Klasifikasi dan Prediksi Naive Bayesian & Bayesian Network . April 13, 2017.
BY NUR HIDAYA BUKHARI Jika pada mulanya SPSS dibuat untuk pemecahan masalah statistik pada ilmu-ilmu sosial, maka dengan semakin populernya.
4- Classification: Logistic Regression 9 September 2015 Intro to Logistic Regression.
A rsitektur dan M odel D ata M ining. Arsitektur Data Mining.
DATA MINING (Machine Learning)
DATA MINING 25 Januari 2008.
2. Data & Proses Datamining
Data Mining Junta Zeniarja, M.Kom, M.CS
Decision Tree.
Pertemuan 4 Teknik-teknik Data Mining
Pemrograman Visual Oleh : Erni Fatmawati.
STUDI KASUS KLASIFIKASI Algoritma C 4.5
Peran Utama Data Mining
Martin Budi G Di Bawah Bimbingan Rindang Karyadin, S.T., M.Kom.
PEMBUATAN POHON KEPUTUSAN
Algoritma & PEMROGRAMAN 2B (Visual basic)
Pengaruh incomplete data terhadap
MEMULAI, MENGENAL DAN MEMBUAT DATABASE ACCESS
Konsep Data Mining Ana Kurniawati.
Bayu Pratama Nugroho, S.Kom, M.T
Klasifikasi Berdasarkan Teorema Bayes
Clustering Best Practice
Naïve Bayes Classification.
Pohon Keputusan (Decision Trees)
Install Sistem Operasi Linux - UBuntu
Sistem Operasi Oleh: Oktapiyanti.
Klasifikasi dengan Naive Bayes
Business Intelligent Ramos Somya, S.Kom., M.Cs.
Konsep & Perancangan Database
Classification Supervised learning.
Praktikum 1 (pengenalan matlab dan pemograman)
Pengenalan Borland Delphi 7.0
BASIS DATA TERDISTRIBUSI
PRODI MIK | FAKULTAS ILMU-ILMU KESEHATAN
Konversi Data Arie Nugraha 2009.
M-File Sebagai Fungsi.
USING DATA MINING TO MODEL PLAYER EXPERIENCE
Pengantar Optimasi Statistika dengan R
KLASIFIKASI.
Anggota Dwita Eprila ( ) Mayang Hermeiliza Eka Putri ( ) Nadiah Amelia ( ) Rafif Abdusalam ( ) Shofyan.
Oleh : Rahmat Robi Waliyansyah, M.Kom.
Perancangan Sistem Klasifikasi Masa Studi Mahasiswa Menggunakan Data Mining Berbasis Algoritma ID3 (Studi Kasus:Jurusan Teknik Komputer –Unikom) Oleh:
Konsep Aplikasi Data Mining
DATA PREPARATION Kompetensi
Klasifikasi dengan Naive Bayes
Pertemuan 8, 9, 10 Teknik-teknik Data Mining
Klasifikasi dengan RapidMiner
Arsitektur dan Model Data Mining
DATA PREPARATION.
DISUSUN OLEH: SUHERTI ROFIQAH
KLASIFIKASI.
Konsep Data Mining Ana Kurniawati.
IMPLEMENTASI ALGORITMA k-NN
Pendahuluan MATLAB (Matrix Laboratory) adalah sebuah program untuk analisis dan komputasi numerik yang merupakan bahasa pemrograman matematika lanjutan.
Pertemuan 10.
Universitas Gunadarma
Klasifikasi dengan Naive Bayes
RANCANGAN LAYAR Grafik User Interface OBJEK ORIENTED DISAIN.
Transcript presentasi:

DATA MINING with W E K A

Introduction Weka merupakan Aplikasi Data Mining Open Source berbasis Java Weka terdiri dari sekumpulan algoritma machince learning yang digunakan untuk melakukan generalisasi / formulasi dari sekumpulan data sampling Weka telah banyak mendukung algoritma untuk pemodelan data yang disebut dengan CLASSIFIER

Algoritma Pemodelan / Classifier Algoritma J48 merupakan pengembangan dari algiritma C4.5 yang dapat digunakan untuk pembentukan pohon keputusan (Decision Tree) Linear Regression Algoritma untuk menghasilkan formulasi numerik dengan metode statistik regresi linear Naïve Bayes Merupakan salah satu classifier numerik

Format Data Masukan / Input Atribut-Relation File Format (ARFF) File teks yang berisi berbagai instansi data yang berhubungan dengan suatu set atribut data Comma Separated Values (CSV) File teks dengan pemisah tanda koma (,) Format C4.5 Database

Interface 1 : Main Panel

Interface 1 : Main Panel Weka memiliki 4 (empat) PANEL utama untuk menjalankan aplikasinya : EXPLORER  digunakan untuk eksplorasi lebih jauh tentang informasi dataset yang akan diuji dengan WEKA EXPERIMENTER  digunakan untuk melakukan percobaan dengan pengujian data statistik KNOWLEDGE  digunakan sebagai pengetahuan pendukung SIMPLE CLI  menggunakan tampilan command line

Training Data Set File ini bisa disimpan dalam format *.ARFF atau *.CSV sebagai Training Data Set yang akan diuji dengan aplikasi WEKA

Interface 2 : WEKA Explorer

Interface 2 : Weka Explorer Weka Explorer memiliki 4 (empat) PANEL utama : Panel PreProcess memiliki fasilitas import data dari database, file CSV, file ARFF dan lainnya. Untuk PreProcessing ini menggunakan algoritma yang disebut FILTERING. Panel Classifier, memungkinkan pengguna untuk menggunakan algoritma Klasifikasi dan Regresi. Panel Associate, menyediakan akses bagi pengguna untuk identifikasi semua keterkaitan attribut dan data. Panel Cluster, penggunaan algorimta K.

Interface 2 : Weka Explorer Panel Attribute, menyediakan algoritma untuk mengidentifikasi atribut yang paling prediktif dalam dataset. Panel Visualisasi, menunjukkan scatter plot matriks. di mana scatter plot individu dapat dipilih dan diperbesar, dan dianalisis lebih lanjut menggunakan operator berbagai pilihan.

Interface 2 : Weka Explorer Berdasarkan gambar diatas, terdapat atribut sebagai berikut : TransID Item

Klasifikasi Data – Algoritma J48

Interface 3 : Classifier Ada 4 pilihan dalam Klasifikasi Data : Use Training Set, pengujian data dilakukan dengan data Training Set itu sendiri. Supplier Test Set, pengujian dilakukan dengan data lain. Dengan pilihan ini pengguna dapat melakukan prediksi data. Cross Validation, nilai default = 10. Dimana k adalah nilai dari fold. Selanjutnya, untuk tiap dari subset, akan dijadikan data tes dari hasil klasifikasi yang dihasilkan dari k-1 subset lainnya. Jadi, akan ada 10 kali tes. Dimana, setiap datum akan menjadi data tes sebanyak 1 kali, dan menjadi data training sebanyak k-1 kali. Kemudian, error dari k tes tersebut akan dihitung rata-ratanya

Interface 3 : Classifier Percentage Split Hasil klasifikasi akan dites dengan menggunakan k% dari data tersebut. k merupakan masukan dari user.

Interface 4 : Output dari Algoritma J48

Interface 4 : Decision Tree berdasarkan Algirutma J48

Penjelasan Decision Tree Bahwa dari decision tree tersebut maka root node pada TransID menunjukkan cabang sebelah kiri untuk pembelian < 2000 dimana Item yang memenuhi syarat adalah A, B, C sebanyak 2

Terima kasih Penutup