KLASIFIKASI.

Slides:



Advertisements
Presentasi serupa
Machine Learning Team PENS – ITS 2006
Advertisements

Kesimpulan BUKU Data Mining
Diadaptasi dari slide Jiawei Han
Pendahuluan Landasan Teori.
BAYESIAN CLASSIFICATION
Klasifikasi (Season 1) Naive Bayes
Probabilitas Bagian 2.
Marselina Silvia Suhartinah / 4IA05
Data Mining: Klasifikasi dan Prediksi Naive Bayesian & Bayesian Network . April 13, 2017.
Teorema Bayes - #4 PAC175 (3 sks) DATA MINING Nurdin Bahtiar, S.Si, MT.
NIPRL 1.4 Probabilitas Bersyarat Definisi Probabilitas Bersyarat(1/2) Probabilitas Bersyarat Probabilitas bersyarat kejadian A pada kejadian B adalah.
Tahapan dan Pengelompokan Data Mining
Distribusi Binomial. 2 Pendahuluan Diantara sekian banyak distribusi barangkali distribusi normal merupakan distribusi yang secara luas banyak digunakan.
A rsitektur dan M odel D ata M ining. Arsitektur Data Mining.
Naive Bayesian & Bayesian Network
DATA MINING (Machine Learning)
Sistem Berbasis Fuzzy Materi 4
Statistik TP A Pengujian Hipotesis dan Analisa Data
Data Mining Junta Zeniarja, M.Kom, M.CS
Decision Tree.
Teorema Bayes - #4 PAC175 (3 sks) DATA MINING Nurdin Bahtiar, S.Si, MT.
Sistem Berbasis Fuzzy Materi 5
Klasifikasi.
STUDI KASUS KLASIFIKASI Algoritma C 4.5
Oleh: Aditya Nugroho G Dibimbing Oleh: Ir. Agus Buono, M.Si., M.Kom.
MUHAMMAD RAFI MUTTAQIN G
Bayes’ Theorem: Basics
Konsep Data Mining Ana Kurniawati.
Klasifikasi Berdasarkan Teorema Bayes
Klasifikasi.
Data Mining: Klasifikasi Naive Bayesian & Bayesian Network
Algoritma kNN (k-Nearest Neighbor)
Naïve Bayes Classification.
Pohon Keputusan (Decision Trees)
Klasifikasi dengan Naive Bayes
Review probabilitas (1)
Classification Supervised learning.
Tutun Juhana Review probabilitas Tutun Juhana
Tutun Juhana Review probabilitas Tutun Juhana
Naïve Bayes Classification.
SISTEM PAKAR DIAGNOSA KANKER SERVIKS MENGGUNAKAN METODE BAYES MUHAMAD ALFARISI ( ) MUHAMAD RALFI AKBAR ( ) ANDHIKA DWITAMA.
Oleh : Rahmat Robi Waliyansyah, M.Kom.
.:: NAive bayes ::. DSS - Wiji Setiyaningsih, M.Kom.
Pengantar Statistik Juweti Charisma.
PRODI MIK | FAKULTAS ILMU-ILMU KESEHATAN
Algoritma kNN (k-Nearest Neighbor)
Klasifikasi Nearest Neighbor
MIK | FAKULTAS ILMU-ILMU KESEHATAN
DATA MINING with W E K A.
KLASIFIKASI.
Machine Learning Naïve Bayes
Anggota Dwita Eprila ( ) Mayang Hermeiliza Eka Putri ( ) Nadiah Amelia ( ) Rafif Abdusalam ( ) Shofyan.
Perancangan Sistem Klasifikasi Masa Studi Mahasiswa Menggunakan Data Mining Berbasis Algoritma ID3 (Studi Kasus:Jurusan Teknik Komputer –Unikom) Oleh:
Data Mining: Klasifikasi dan Prediksi Naive Bayesian & Bayesian Network . November 8, 2018.
DATA PREPARATION Kompetensi
Teknik Klasifikasi & Pengenalan Pola
Klasifikasi dengan Naive Bayes
ILMU PENGETAHUAN DAN JENIS PENELITIAN 29
Arsitektur dan Model Data Mining
Pertemuan 1 & 2 Pengantar Data Mining 12/6/2018.
DATA PREPARATION.
Konsep Data Mining Ana Kurniawati.
Information Retrieval “Document Classification dengan Naive Bayes”
IMPLEMENTASI ALGORITMA k-NN
Model Linier untuk Klasifikasi Satu arah
DECISION SUPPORT SYSTEM [MKB3493]
Data Mining Classification.
Klasifikasi dengan Naive Bayes
Universitas Gunadarma
Algoritma kNN (k-Nearest Neighbor)
Transcript presentasi:

KLASIFIKASI

KEMAMPUAN AKHIR YANG DIHARAPKAN Menjelaskan konsep klasifikasi dan contoh penerapan pada data Klasifikasi adalah sebuah proses untuk menemukan model yang menjelaskan atau membedakan konsep atau kelas data Tujuan untuk dapat memperkirakan kelas dari suatu objek yang kelasnya tidak diketahui (Tan et all, 2004)

KLASIFIKASI Proses untuk menyatakan suatu objek ke salah satu kategori yang sudah didefinisikan sebelumnya. Proses untuk memetakan setiap sekumpulan atribut ke salah satu kelas yang sudah didefiniskan sebelumnya.

KLASIFIKASI Proses untuk menyatakan suatu objek ke salah satu kategori yang sudah didefinisikan sebelumnya. Proses untuk memetakan setiap sekumpulan atribut ke salah satu kelas yang sudah didefiniskan sebelumnya.

KLASIFIKASI Klasifikasi terdiri dari sekumpulan record yang merupakan data latih (training set). Setiap record terdiri atas sekumpulan atribut. Salah satu atribut adalah kelas. Mencari model untuk atribut kelas merupakan fungsi dari nilai-nilai atribut lain. Model klasifikasi digunkaan untuk: - Pemodelan deskriptif untuk membedakan objek-objek dari kelas yang yang berbeda - Pemodelan prediktif digunakan untuk memprediksi kelas label untuk record yang tidak diketahui

KLASIFIKASI Tujuan dari klasifikasi adalah untuk: Menemukan model dari training set yang membedakan record kedalam kategori atau kelas yang sesuai, model  tersebut kemudian digunakan untuk mengklasifikasikan record yang kelasnya belum diketahui sebelumnya pada test set. Mengambil  keputusan  dengan  memprediksikan  suatu  kasus,  berdasarkan  hasil klasifikasi yang diperoleh .

KLASIFIKASI Tahapan dari klasifikasi dalam data mining terdiri dari : Pembangunan model, dalam tahapan ini dibuat sebuah model untuk menyelesaikan masalah klasifikasi class atau attribut dalam data, model ini dibangun berdasarkan training set-sebuah contoh data dari permasalahan yang dihadapi, training set ini sudah mempunyai informasi yang lengkap baik attribut maupun classnya Penerapan model, pada tahapan ini model yang sudah dibangun sebelumnya digunakan untuk menentukan attribut / class dari sebuah data baru yang attribut / classnya belum diketahui sebelumnya Evaluasi, pada tahapan ini hasil dari penerapan model pada tahapan sebelumnya dievaluasi menggunakan parameter terukur untuk menentukan apakah model tersebut dapat diterima

CONTOH KLASIFIKASI Test Set Learn Classifier Training Set Model Data latih adalah data yang sudah ada sebelumnya berdasarkan fakta yang sudah terjadi (predefined class) Data uji adalah data yang sudah berkelas/berlabel yang digunakan untuk menghitung akurasi model klasifikasi yang dibentuk Training Set Learn Classifier Model

PENGAPLIKASIAN KLASIFIKASI PADA KEHIDUPAN SEHARI-HARI Memprediksi sel tumor sebagai sel yang jinak atau ganas Mengklasifikasi struktur sekunder protein sebagai alpha-helix, beta-sheet, or random coil Pengenalan tulisan tangan Mengkategorikan berita sebagai berita keuangan, cuaca, olahraga, dll.

TEKNIK-TEKNIK KLASIFIKASI LAINNYA

NAÏVE BAYES Naive Bayes adalah pengklasifikasian statistik yang dapat digunakan untuk memprediksi probabilitas keanggotaan suatu class. Naive Bayes didasarkan pada teorema Bayes yang memiliki kemampuan klasifikasi serupa dengan decision tree dan neural network. Naive Bayes terbukti memiliki akurasi dan kecepatan yang tinggi saat diaplikasikan ke dalam database dengan data yang besar

Formula Naïve Bayes X adalah data sample yang belum diketahui kelasnya H adalah dugaan bahwa X adalah anggota C Klasifikasi ditentukan oleh P(H|X) , (posteriori probability), probabilitas bahwa dugaan terhadap data sample X P(H) adalah prior probability Probabilitas dari sample data yang diamati P(X|H) (likelyhood), probabilitas dari sample X dengan memperhatikan dugaan.

Klasifikasi Naïve Bayes Misal D adalah record data training dan setiap record terdapat label kelasnya dan masing-masing record dinyatakan n atribut (n field) X= (x1,x2, ….., xn). Misal terdapat m kelas C1, C2, C3,… Cm Klasifikasi diperoleh maksimum posterior yaitu, maksimum P(Ci|X) Ini dapat diperoleh dari teorema Bayes Karena P(X) adalah konstan untuk semua kelas, hanya Perlu dimaksimumkan

Algoritma Naïve Bayes Baca Data Training Hitung jumlah class Hitung jumlah kasus yang sama dengan class yang sama Kalikan semua nilai hasil sesuai dengan data X yang dicari class-nya

1. Data Training age income student credit_rating buys_computer <=30 high no fair excellent 31…40 yes >40 medium low No Yes

2. Hitung Jumlah Kelas Terdapat 2 class dari data training tersebut, yaitu: C1:buys_computer = ‘yes’ C2:buys_computer = ‘no’ Total = 14 record Maka: P(Ci): P(buys_computer = “yes”) = 9/14 = 0.643 P(buys_computer = “no”) = 5/14= 0.357 Pertanyaan: Data X = (age <= 30 , income = medium, student = yes, credit_rating = fair) Apakah X membeli computer?

3. Hitung jumlah kasus yang sama dengan class yang sama P(age = “<=30” | buys_computer = “yes”) = 2/9 = 0.222 P(age = “<= 30” | buys_computer = “no”) = 3/5 = 0.6 P(income = “medium” | buys_computer = “yes”) = 4/9 = 0.444 P(income = “medium” | buys_computer = “no”) = 2/5 = 0.4 P(student = “yes” | buys_computer = “yes) = 6/9 = 0.667 P(student = “yes” | buys_computer = “no”) = 1/5 = 0.2 P(credit_rating = “fair” | buys_computer = “yes”) = 6/9 = 0.667 P(credit_rating = “fair” | buys_computer = “no”) = 2/5 = 0.4

3. Hitung jumlah kasus yang sama dengan class yang sama P(age = “<=30” | buys_computer = “yes”) = 2/9 = 0.222 P(age = “<= 30” | buys_computer = “no”) = 3/5 = 0.6 P(income = “medium” | buys_computer = “yes”) = 4/9 = 0.444 P(income = “medium” | buys_computer = “no”) = 2/5 = 0.4 P(student = “yes” | buys_computer = “yes) = 6/9 = 0.667 P(student = “yes” | buys_computer = “no”) = 1/5 = 0.2 P(credit_rating = “fair” | buys_computer = “yes”) = 6/9 = 0.667 P(credit_rating = “fair” | buys_computer = “no”) = 2/5 = 0.4

Kalikan semua nilai hasil sesuai dengan data X yang dicari class-nya X = (age <= 30 , income = medium, student = yes, credit_rating = fair) P(X|Ci) : P(X|buys_computer = “yes”) = 0.222 x 0.444 x 0.667 x 0.667 = 0.044 P(X|buys_computer = “no”) = 0.6 x 0.4 x 0.2 x 0.4 = 0.019 P(X|Ci)*P(Ci) : P(X|buys_computer = “yes”) * P(buys_computer = “yes”) = 0.028 P(X|buys_computer = “no”) * P(buys_computer = “no”) = 0.007 Jadi , X termasuk kelas (“buys_computer = yes”)

TERIMA KASIH 