Naïve Bayes Classification.

Slides:



Advertisements
Presentasi serupa
Pohon Keputusan (Decision Tree)
Advertisements

Kesimpulan BUKU Data Mining
Diadaptasi dari slide Jiawei Han
Model Datamining Dr. Sri Kusumadewi, S.Si., MT. Materi Kuliah [10]:
BAYESIAN CLASSIFICATION
Klasifikasi (Season 1) Naive Bayes
Naïve Bayes Fajar Agung Nugroho, S.Kom, M.CS
Algoritma Data Mining Object-Oriented Programming Algoritma Data Mining
Marselina Silvia Suhartinah / 4IA05
NoOUTLOKTEMPERATUREHUMIDITYWINDYPLAY 1SunnyHotHighFALSENo 2SunnyHotHighTRUENo 3CloudyHotHighFALSEYes 4RainyMildHighFALSEYes 5RainyCoolNormalFALSEYes 6RainyCoolNormalTRUEYes.
Pertemuan XII FUNGSI MAYOR Classification.
Data Mining: Klasifikasi dan Prediksi Naive Bayesian & Bayesian Network . April 13, 2017.
Pengenalan Supervised dan Unsupervised Learning
NIPRL 1.4 Probabilitas Bersyarat Definisi Probabilitas Bersyarat(1/2) Probabilitas Bersyarat Probabilitas bersyarat kejadian A pada kejadian B adalah.
Distribusi Binomial. 2 Pendahuluan Diantara sekian banyak distribusi barangkali distribusi normal merupakan distribusi yang secara luas banyak digunakan.
A rsitektur dan M odel D ata M ining. Arsitektur Data Mining.
Naive Bayesian & Bayesian Network
DATA MINING (Machine Learning)
Sistem Berbasis Fuzzy Materi 4
2. Data & Proses Datamining
Klasifikasi Data Mining Berdasarkan Rule
STUDI KASUS KLASIFIKASI Algoritma C 4.5
Peran Utama Data Mining
Martin Budi G Di Bawah Bimbingan Rindang Karyadin, S.T., M.Kom.
Algoritma C4.5. Algoritma C4.5 Object-Oriented Programming Introduction Algoritma C4.5 merupakan algoritma yang digunakan.
Data Mining Junta Zeniarja, M.Kom, M.CS
Data Mining.
Decision Tree Classification.
Decision Tree Classification.
Bayes’ Theorem: Basics
Pengenalan Pola Materi 1
Klasifikasi Berdasarkan Teorema Bayes
Klasifikasi.
Data Mining: Klasifikasi Naive Bayesian & Bayesian Network
Pohon Keputusan (Decision Trees)
Klasifikasi dengan Naive Bayes
Classification Supervised learning.
Naïve Bayes Classification.
Decision Tree.
Oleh : Rahmat Robi Waliyansyah, M.Kom.
.:: NAive bayes ::. DSS - Wiji Setiyaningsih, M.Kom.
Analisis Klastering K-Means Model Datamining Kelompok 1 Eko Suryana
PRODI MIK | FAKULTAS ILMU-ILMU KESEHATAN
Algoritma kNN (k-Nearest Neighbor)
MIK | FAKULTAS ILMU-ILMU KESEHATAN
DATA MINING with W E K A.
Data Mining.
KLASIFIKASI.
Machine Learning Naïve Bayes
Anggota Dwita Eprila ( ) Mayang Hermeiliza Eka Putri ( ) Nadiah Amelia ( ) Rafif Abdusalam ( ) Shofyan.
Perancangan Sistem Klasifikasi Masa Studi Mahasiswa Menggunakan Data Mining Berbasis Algoritma ID3 (Studi Kasus:Jurusan Teknik Komputer –Unikom) Oleh:
Data Mining: Klasifikasi dan Prediksi Naive Bayesian & Bayesian Network . November 8, 2018.
DATA PREPARATION Kompetensi
Teknik Klasifikasi & Pengenalan Pola
Klasifikasi dengan Naive Bayes
2.5. Aturan Perkalian Teorema(2.4):
Klasifikasi dengan RapidMiner
Arsitektur dan Model Data Mining
Pertemuan 1 & 2 Pengantar Data Mining 12/6/2018.
DATA PREPARATION.
KLASIFIKASI.
Konsep Data Mining Ana Kurniawati.
Information Retrieval “Document Classification dengan Naive Bayes”
IMPLEMENTASI ALGORITMA k-NN
DECISION SUPPORT SYSTEM [MKB3493]
Data Mining Classification.
Klasifikasi dengan Naive Bayes
Universitas Gunadarma
Universitas Gunadarma
Algoritma kNN (k-Nearest Neighbor)
Transcript presentasi:

Naïve Bayes Classification

Classification Model/ fungsi tujuan Klasifikasi Merupakan proses pembelajaran suatu fungsi tujuan yang memetakan tiap himpunan atribut x ke satu dari label kelas y yang didefinisikan sebelumnya. Classification Model/ fungsi tujuan Ouput Y (Class Label) Input X (attribute set)

Model Klasifikasi Pemodelan Deskriptif Model Klasifikasi yang dpt berfungsi sbg alat penjelasan untuk membedakan obyek-obyek dalam kelas-kelas yang berbeda. Pemodelan Prediktif Model klasifikasi yang dapat digunakan untuk memprediksi label kelas yang tidak diketahui pada suatu object/record.

Klasifikasi memerlukan Training Set Klasifikasi adalah proses pembelajaran secara terbimbing (supervised learning) Untuk melakukan klasifikasi, dibutuhkan training set sebagai data pembelajaran Setiap sampel dari training set memiliki atribut dan class label

Dua Tahapan Klasifikasi Learning (training): Pembelajaran menggunakan data training (untuk Naïve Bayesian Classifier, nilai probabilitas dihitung dalam proses pembelajaran) Testing: Menguji model menggunakan data testing Sumber: Bing Liu, Web Data Mining

Akurasi Akurasi = Jml Prediksi Yang Benar_____ Jml Prediksi keseluruhan Error = Jml Prediksi Yang Salah_____

Teori Bayesian: Sebagai Dasar P(H|X), yaitu peluang hipotesa H berdasar kondisi X X:data sampel dengan klas (label) yang tidak diketahui H:merupakan hipotesa bahwa X adalah data dengan klas (label) C. P(H) : peluang dari hipotesa H P(X) adalah peluang dari X yang diamati P(X|H) : peluang X, berdasarkan kondisi pada hipotesa H

Naïve Bayesian Classifier Adalah metode classifier yang berdasarkan probabilitas dan Teorema Bayesian dengan asumsi bahwa setiap variabel X bersifat bebas(independence) Dengan kata lain, Naïve Bayesian Classifier mengasumsikan bahwa keberadaan sebuah atribut (variabel) tidak ada kaitannya dengan beradaan atribut (variabel) yang lain

Naïve Bayesian Classifier Karena asumsi atribut tidak saling terkait(conditionally independent), maka: Bila P(X|Ci) dapat diketahui melalui perhitungan di atas, maka klas (label) dari data sampel X adalah klas (label) yang memiliki P(X|Ci)*P(Ci) maksimum

Naïve Bayes Dataset class: C1: Beli Komputer: ya C2: Beli Komputer: tdk bila data baru yg blm memiliki class sbb: X =(umur<=30, pendapatan=sedang, mhs=ya,rating kredit= Fair) Umur Pendapatan Mhs Rating Kredit Beli Komputer <=30 tinggi bukan fair tdk excellent 30…40 ya >40 sedang rendah 31…40

Hitung P(Xk|Ci) utk setiap class i X =(umur<=30, pendapatan=sedang, mhs=ya, rating kredit= Fair) P(umur<=30| beli_komputer=ya) = > 2/9 = 0.220 P(umur<=30| beli_komputer=tdk) => 3/5 = 0.600 Umur Pendapatan Mhs Rating Kredit Beli Komputer <=30 tinggi bukan fair tdk excellent sedang rendah ya >40 30…40 31…40

Hitung P(Xk|Ci) utk setiap class i X =(umur<=30, pendapatan=sedang, mhs=ya,rating kredit= Fair) P(pendapatan=sedang| beli_komputer=ya) => 4/9= 0.444 P(pendapatan=sedang| beli_komputer=tdk) => 2/5=0.400 ID Umur Pendapatan Mhs Rating Kredit Beli Komputer 1 >40 rendah ya excellent tdk 2 <=30 fair 3 4 31…40 5 sedang bukan 6 7 8 9 10 11 tinggi 12 13 30…40 14

Hitung P(Xk|Ci) utk setiap class i X =(umur<=30, pendapatan=sedang, mhs=ya,rating kredit= Fair) ID Umur Pendapatan Mhs Rating Kredit Beli Komputer 1 <=30 sedang bukan fair tdk 2 >40 excellent 3 tinggi 4 5 ya 6 31…40 7 30…40 8 rendah 9 10 11 12 13 14 P(mhs=ya| beli_komputer=ya) => 6/9 = 0.670 P(mhs=ya| beli_komputer=tdk) => 1/5 = 0.200

Hitung P(Xk|Ci) utk setiap class i X =(umur<=30, pendapatan=sedang, mhs=ya,rating kredit= Fair) ID Umur Pendapatan Mhs Rating Kredit Beli Komputer 1 <=30 tinggi bukan excellent tdk 2 >40 sedang 3 rendah ya 4 31…40 5 6 7 fair 8 9 10 30…40 11 12 13 14 P(rating kredit=fair| beli_komputer=ya) => 6/9 = 0.670 P(rating kredit=fair| beli_komputer=tdk) => 2/5 = 0.400

Hitung P(Xk | Ci) utk setiap class I P(umur<=30| beli_komputer=ya) = 2/9 0.222 P(umur<=30| beli_komputer=tdk) = 3/5 0.600 P(pendapatan=sedang| beli_komputer=ya) = 4/9 0.444 P(pendapatan=sedang| beli_komputer=tdk) = 2/5 0.400 P(mhs=ya| beli_komputer=ya) = 6/9 0.667 P(mhs=ya| beli_komputer=tdk) = 1/5 0.200 P(rating kredit=fair| beli_komputer=ya) = 6/9 P(rating kredit=ya| beli_komputer=tdk) = 2/5 Hitung P(X|Ci) untuk setiap Class: P(X|beli_computer=“ya”) 0.222 X 0.444 X 0.667 X 0.667 = 0.044 P(X|beli_computer=“tdk”) 0.600 x 0.400 x 0.200 x 0.400 = 0.019

X memiliki class “beli_computer=ya” P(X|Ci)*P(Ci ): P(X|beli_computer=“ya”) * P(beli_computer=“ya”) 0.044 * (9/14) = 0.028 P(X|beli_computer=“tdk”) * P(beli_computer=“tdk”) 0.019 * (5/14) = 0.007 X memiliki class “beli_computer=ya” karena P(X|beli_computer=“ya”) memiliki nilai maksimum pada perhitungan di atas

Naïve Bayesian: Summary Kekuatan: Mudah diimplementasi Memberikan hasil yang baik untuk banyak kasus Kelemahan: Harus mengasumsi bahwa antar fitur tidak terkait (independent) Dalam realita, keterkaitan itu ada Keterkaitan tersebut tidak dapat dimodelkan oleh Naïve Bayesian Classifier

Latihan Tentukan class label dari X: X =(Outlook=Rainy,Temperature=Cool, Humidity=High, Windy=False) ID OUTLOOK TEMPERATUR HUMIDITY WINDY PLAY 1 Sunny Hot High FALSE NO 2 TRUE 3 Cloudy YES 4 Rainy Mild 5 Cool Normal 6 7 8 9 10 11 12 13 14