Naïve Bayes Classification.

Slides:



Advertisements
Presentasi serupa
Distribusi Binomial.
Advertisements

Pohon Keputusan (Decision Tree)
Machine Learning Team PENS – ITS 2006
Kesimpulan BUKU Data Mining
Diadaptasi dari slide Jiawei Han
Model Datamining Dr. Sri Kusumadewi, S.Si., MT. Materi Kuliah [10]:
BAYESIAN CLASSIFICATION
Klasifikasi (Season 1) Naive Bayes
Naïve Bayes Fajar Agung Nugroho, S.Kom, M.CS
Algoritma Data Mining Object-Oriented Programming Algoritma Data Mining
NoOUTLOKTEMPERATUREHUMIDITYWINDYPLAY 1SunnyHotHighFALSENo 2SunnyHotHighTRUENo 3CloudyHotHighFALSEYes 4RainyMildHighFALSEYes 5RainyCoolNormalFALSEYes 6RainyCoolNormalTRUEYes.
Pertemuan XII FUNGSI MAYOR Classification.
Data Mining: Klasifikasi dan Prediksi Naive Bayesian & Bayesian Network . April 13, 2017.
Bab 8C Estimasi Bab 8C
UJI HIPOTHESIS BEDA RATA-RATA
Pengenalan Supervised dan Unsupervised Learning
NIPRL 1.4 Probabilitas Bersyarat Definisi Probabilitas Bersyarat(1/2) Probabilitas Bersyarat Probabilitas bersyarat kejadian A pada kejadian B adalah.
Distribusi Binomial. 2 Pendahuluan Diantara sekian banyak distribusi barangkali distribusi normal merupakan distribusi yang secara luas banyak digunakan.
A rsitektur dan M odel D ata M ining. Arsitektur Data Mining.
Naive Bayesian & Bayesian Network
DATA MINING (Machine Learning)
2. Data & Proses Datamining
STUDI KASUS KLASIFIKASI Algoritma C 4.5
Peran Utama Data Mining
Algoritma C4.5. Algoritma C4.5 Object-Oriented Programming Introduction Algoritma C4.5 merupakan algoritma yang digunakan.
Data Mining Junta Zeniarja, M.Kom, M.CS
Data Mining.
Decision Tree Classification.
Decision Tree Classification.
Bayes’ Theorem: Basics
Pengenalan Pola Materi 1
Klasifikasi Berdasarkan Teorema Bayes
Klasifikasi.
Data Mining: Klasifikasi Naive Bayesian & Bayesian Network
Naïve Bayes Classification.
Pohon Keputusan (Decision Trees)
TEORI PROBABILITAS.
Pertemuan 4 Peningkatan Kehandalan Sistem
Klasifikasi dengan Naive Bayes
BAB VII PROBABILITAS (2).
Classification Supervised learning.
TEMU 11 COMPARE MEANS: MEANS.
Decision Tree.
Oleh : Rahmat Robi Waliyansyah, M.Kom.
.:: NAive bayes ::. DSS - Wiji Setiyaningsih, M.Kom.
Analisis Klastering K-Means Model Datamining Kelompok 1 Eko Suryana
PRODI MIK | FAKULTAS ILMU-ILMU KESEHATAN
TEMU 11 COMPARE MEANS: MEANS.
MIK | FAKULTAS ILMU-ILMU KESEHATAN
DATA MINING with W E K A.
KLASIFIKASI.
Machine Learning Naïve Bayes
Anggota Dwita Eprila ( ) Mayang Hermeiliza Eka Putri ( ) Nadiah Amelia ( ) Rafif Abdusalam ( ) Shofyan.
Perancangan Sistem Klasifikasi Masa Studi Mahasiswa Menggunakan Data Mining Berbasis Algoritma ID3 (Studi Kasus:Jurusan Teknik Komputer –Unikom) Oleh:
Data Mining: Klasifikasi dan Prediksi Naive Bayesian & Bayesian Network . November 8, 2018.
DATA PREPARATION Kompetensi
Teknik Klasifikasi & Pengenalan Pola
Klasifikasi dengan Naive Bayes
Konsep Aplikasi Data Mining
Pengetahuan Data Mining
Pertemuan 1 & 2 Pengantar Data Mining 12/6/2018.
DATA PREPARATION.
KLASIFIKASI.
Information Retrieval “Document Classification dengan Naive Bayes”
IMPLEMENTASI ALGORITMA k-NN
DECISION SUPPORT SYSTEM [MKB3493]
Data Mining Classification.
Klasifikasi dengan Naive Bayes
Universitas Gunadarma
Universitas Gunadarma
Transcript presentasi:

Naïve Bayes Classification

Klasifikasi memerlukan Training Set Klasifikasi adalah proses pembelajaran secara terbimbing (supervised learning) Untuk melakukan klasifikasi, dibutuhkan training set sebagai data pembelajaran Setiap sampel dari training set memiliki atribut dan klas label

Dua Tahapan Klasifikasi Learning (training): Pembelajaran menggunakan data training (untuk Naïve Bayesian Classifier, nilai probabilitas dihitung dalam proses pembelajaran) Testing: Menguji model menggunakan data testing Sumber: Bing Liu, Web Data Mining

Teori Bayesian: Sebagai Dasar Untuk masalah klasifikasi, yang dihitung adalah P(H|X), yaitu peluang hipotesa H berdasar kondisi X :

Teori Bayesian: Sebagai Dasar X:data sampel dengan klas (label) yang tidak diketahui H:merupakan hipotesa bahwa X adalah data dengan klas (label) C. P(H) : peluang dari hipotesa H P(X) adalah peluang dari X yang diamati P(X|H) : peluang X, berdasat kondisi pada hipotesa H

Naïve Bayesian Classifier Adalah metode classifier yang berdasarkan probabilitas dan Teorema Bayesian dengan asumsi bahwa setiap variabel X bersifat bebas(independence) Dengan kata lain, Naïve Bayesian Classifier mengasumsikan bahwa keberadaan sebuah atribut (variabel) tidak ada kaitannya dengan beradaan atribut (variabel) yang lain

Naïve Bayesian Classifier Karena asumsi atribut tidak saling terkait(conditionally independent), maka: Bila P(X|Ci) dapat diketahui melalui perhitungan di atas, maka klas (label) dari data sampel X adalah klas (label) yang memiliki P(X|Ci)*P(Ci) maksimum

Naïve Bayes Dataset class: C1: Beli Komputer: ya C2: Beli Komputer: tdk bila data baru yg blm memiliki class sbb: X =(umur<=30, pendapatan=sedang, mhs=ya,rating kredit= Fair) Umur Pendapatan Mhs Rating Kredit Beli Komputer <=30 tinggi bukan fair tdk excellent 30…40 ya >40 sedang rendah 31…40

Hitung P(Xk|Ci) utk setiap class i X =(umur<=30, pendapatan=sedang, mhs=ya,rating kredit= Fair) P(umur<=30| beli_komputer=ya) = > 2/9 = 0.220 P(umur<=30| beli_komputer=tdk) => 3/5 = 0.600 Umur Pendapatan Mhs Rating Kredit Beli Komputer <=30 tinggi bukan fair tdk excellent sedang rendah ya >40 30…40 31…40

Hitung P(Xk|Ci) utk setiap class i X =(umur<=30, pendapatan=sedang, mhs=ya,rating kredit= Fair) P(pendapatan=sedang| beli_komputer=ya) => 4/9= 0.444 P(pendapatan=sedang| beli_komputer=tdk) => 2/5=0.400 ID Umur Pendapatan Mhs Rating Kredit Beli Komputer 1 >40 rendah ya excellent tdk 2 <=30 fair 3 4 31…40 5 sedang bukan 6 7 8 9 10 11 tinggi 12 13 30…40 14

Hitung P(Xk|Ci) utk setiap class i X =(umur<=30, pendapatan=sedang, mhs=ya,rating kredit= Fair) ID Umur Pendapatan Mhs Rating Kredit Beli Komputer 1 <=30 sedang bukan fair tdk 2 >40 excellent 3 tinggi 4 5 ya 6 31…40 7 30…40 8 rendah 9 10 11 12 13 14 P(mhs=ya| beli_komputer=ya) => 6/9 = 0.670 P(mhs=ya| beli_komputer=tdk) => 1/5 = 0.200

Hitung P(Xk|Ci) utk setiap class i X =(umur<=30, pendapatan=sedang, mhs=ya,rating kredit= Fair) ID Umur Pendapatan Mhs Rating Kredit Beli Komputer 1 <=30 tinggi bukan excellent tdk 2 >40 sedang 3 rendah ya 4 31…40 5 6 7 fair 8 9 10 30…40 11 12 13 14 P(rating kredit=fair| beli_komputer=ya) => 6/9 = 0.670 P(rating kredit=fair| beli_komputer=tdk) => 2/5 = 0.400

Hitung P(Xk | Ci) utk setiap class I P(umur<=30| beli_komputer=ya) = 2/9 0.222 P(umur<=30| beli_komputer=tdk) = 3/5 0.600 P(pendapatan=sedang| beli_komputer=ya) = 4/9 0.444 P(pendapatan=sedang| beli_komputer=tdk) = 2/5 0.400 P(mhs=ya| beli_komputer=ya) = 6/9 0.667 P(mhs=ya| beli_komputer=tdk) = 1/5 0.200 P(rating kredit=fair| beli_komputer=ya) = 6/9 P(rating kredit=ya| beli_komputer=tdk) = 2/5 Hitung P(X|Ci) untuk setiap Class: P(X|beli_computer=“ya”) 0.222 X 0.444 X 0.667 X 0.667 = 0.044 P(X|beli_computer=“tdk”) 0.600 x 0.400 x 0.200 x 0.400 = 0.019

X memiliki class “beli_computer=ya” P(X|Ci)*P(Ci ): P(X|beli_computer=“ya”) * P(beli_computer=“ya”) 0.044 * (9/14) = 0.028 P(X|beli_computer=“tdk”) * P(beli_computer=“tdk”) 0.019 * (5/14) = 0.007 X memiliki class “beli_computer=ya” karena P(X|beli_computer=“ya”) memiliki nilai maksimum pada perhitungan di atas

Naïve Bayesian: Summary Kekuatan: Mudah diimplementasi Memberikan hasil yang baik untuk banyak kasus Kelemahan: Harus mengasumsi bahwa antar fitur tidak terkait (independent) Dalam realita, keterkaitan itu ada Keterkaitan tersebut tidak dapat dimodelkan oleh Naïve Bayesian Classifier

Latihan ID OUTLOOK TEMPERATUR HUMIDITY WINDY PLAY 1 Sunny Hot High FALSE NO 2 TRUE 3 Cloudy YES 4 Rainy Mild 5 Cool Normal 6 7 8 9 10 11 12 13 14 Tentukan class label dari X:X =(Outlook=Rainy,Temperature=Cool, Humidity=High, Windy=False)