Kesimpulan BUKU Data Mining

Slides:

Advertisements

Presentasi serupa

TURUNAN/ DIFERENSIAL.

Advertisements

BAGIAN - 8 Teori Probabilitas.

Bab 4 Basic Probability Business Statistics, A First Course (4e) © 2006 Prentice-Hall, Inc.

Analisis Outlier.

Bahan Kuliah Matematika Diskrit

TIPE DATA DAN PEMILIHAN ANALISIS STATISTIK

DASAR-DASAR PENGUJIAN PERANGKAT LUNAK

SOAL ESSAY KELAS XI IPS.

PENGANTAR EKONOMI 1 Pengantar Ekonomi 1.

PENULISAN LAPORAN PENELITIAN Oleh MUH. YUNANTO, SE., MM.

Sistem Persamaan Diferensial

Pengolahan Data Dan Prototyping

Sistem Pendukung Keputusan (SPK)

STRUKTUR DISKRIT PROBABILITAS DISKRIT PROGRAM STUDI TEKNIK KOMPUTER

TINJAUAN UMUM DATA DAN STATISTIKA

THE RATIO ESTIMATOR VARIANCE DAN BIAS RATIO PENDUGA SAMPEL VARIANCE

Modul 7 : Uji Hipotesis.

Sebaran Bentuk Kuadrat

Menentukan Perilaku Biaya

Mari Kita Lihat Video Berikut ini.

CONTOH PENERAPAN PENDEKATAN SCIENTIFIC DALAM PEMBELAJARAN IPA

10 Uji Hipotesis untuk Dua Sampel.

SISTEM PERSAMAAN LINEAR DUA VARIABEL SPLDV by Gisoesilo Abudi.

UJI HOMOGENITAS DATA SATU VARIABEL UJI T DAN ANOVA

LIMIT FUNGSI LIMIT FUNGSI ALJABAR.

Induksi Matematika.

Ujian Akhir Semester (UAS)

SISTEMATIKA PENULISAN ILMIAH Saryono. Susunan Laporan Penelitian  Baris kepemilikan  Judul  Abstrak  Pendahuluan  Tinjauan Pustaka  Metode Penulisan/

Induksi Matematik TIN2204 Struktur Diskrit.

Konsep Sistem Informasi

Persamaan Linier dua Variabel.

DISTRIBUSI PROBABILITAS DISKRET

BAYESIAN CLASSIFICATION

Diskripsi Mata Kuliah Memberikan gambaran dan dasar-dasar pengertian serta pola pikir yang logis sehubungan dengan barisan dan deret bilangan yang tersusun.

Induksi Matematika Materi Matematika Diskrit.

THEOREMA SISA, THEOREMA FAKTOR BENTUK POLINUM

Luas Daerah ( Integral ).

Klasifikasi (Season 1) Naive Bayes

TINJAUAN UMUM DATA DAN STATISTIKA

PENELITIAN EKSPERIMEN

BAB VII ANALISIS KORELASI DAN REGRESI LINIER SEDERHANA

Pertemuan 5 P.D. Tak Eksak Dieksakkan

Selamat Datang Dalam Kuliah Terbuka Ini

Intan Silviana Mustikawati, SKM, MPH

TINJAUAN UMUM DATA DAN STATISTIKA

Komor 2011 by Lidia Evelina, MM

BAB I SISTEM BILANGAN.

BAB XII PROBABILITAS (Aturan Dasar Probabilitas) (Pertemuan ke-27)

PD Tingkat/orde Satu Pangkat/derajat Satu

BAGIAN - 8 Teori Probabilitas.

RANCANGAN PROGRAM.

PENDEKATAN KETRAMPILAN PROSES DALAM PEMBELAJARAN IPA

1 Pendahuluan Ir. Waniwatining Astuti, M.T.I Muhammad Rachmadi, S.T., M.T.I.

PENYELESAIAN PERSAMAAN KUADRAT

M ANAJEMEN D ATA “Pengaksesan Data”. P ENDAHULUAN Selama beberapa waktu, teknologi informasi berkonsentrasi pada pembangunan sistem bermisi kritis,- sistem.

WISNU HENDRO MARTONO,M.Sc

Data Mining: Klasifikasi dan Prediksi Naive Bayesian & Bayesian Network . April 13, 2017.

Tahapan dan Pengelompokan Data Mining

DATA MINING (Machine Learning)

Pengenalan Pola Materi 1

Klasifikasi Berdasarkan Teorema Bayes

Machine Learning Naïve Bayes

DECISION SUPPORT SYSTEM [MKB3493]

Transcript presentasi:

Kesimpulan BUKU Data Mining By Muhammad Kasim

Buku Analisis dan kesimpulan yang telah saya lakukan pada buku yang berjudul : “Data Mining Konsep dan Aplikasi menggunakan MATLAB” Oleh “Eko Prayetno yang di terbitkan oleh ANDI Yogyakarta”

Kata Pengantar “Buku ini disusun secara sistematis dan jelas dalam menjelaskan konsep dan aplikasi data mining, dan disertai dengan contoh nyata untuk penerapan metode yang di bahas dengan MATLAB. Salah satu metode yang dibahas dalam buku ini adalah klasifikasi Naive Bayes yang di bahas secara jelas dan lengkap disertai dengan contoh implementasinya menggunakan MATLAB”.

1. Pendahuluan Munculnya data mining didasarkan pada kenyataan bahwa jumlah data yang tersimpan dalam basis data semakin besar. Misalnya, disebuah market dan perusahaan yang memiliki transaksi dan prosduksi yang dibuat. Disiplin ilmu data mining berusaha menjawab masalah tersebut dengan melakukan proses yang dapat menemukan suatu informasi baru yang berguna bagi perusahaan.

2. Landasan Teori Data mining sebagai proses untuk mendapatkan informasi yang berguna dari gudang basis data yang besar. Data mining juga dapat di artikan sebagai pengekstrakan informasi baru yang diambil dari bongkahan data besar yang membantu dalam pengambilan keputusan. (Tan, 2006)

Pekerjaan dalam Data Mining Pekerjaan yang berkaitan dengan data mining dapat dibagi 4 kelompok, yaitu : Model Prediksi Model prediksi berkaitan dengan pembuatan sebuah model yang dapat melakukan pemetaan dari setiap himpunan variabel k setiap himpunan variabel ke setiap target nya. 2. Analisis kelompok Analisis kelompok melakukan pengelompokan data-data ke dalam sejumlah kelompok (cluster) berdasarkan kesamaan karakteristik masing-masing data pada kelompok-kelompok yang ada.

Analisis Asosiasi Digunakan untuk menemukan pola yang menggambarkan kekuatan hubungan fitur dalam data. Deteksi Anomali Deteksi anomali berkaitan dengan pengamatan sebuah data dari sejumlah data yang secara signifikan mempunyai karakteristik yang berbeda dari sisa data yang lain

Naive Bayes Classifier Teorema Bayes : Bayes merupakan teknik prediksi berbasis probabilistik sederhana yang berdasar pada penerapan teorema Bayes (atau aturan Bayes) dengan asumsi indepedensi yang kuat. Yang dimaksud dengan indepedensi yang kuat ada fitur pada sebuah data tidak berkaitan dengan ada atau tidaknya fitur lain dalam data yang sama.

Prediksi bayes didasarkan pada teorema Bayes dengan formula umum sebagai berikut: Dimana : P(H) = probabilitas awal (priori) hipotesis H terjadi tanpa memandang bukti apapun P(H|E) = Probabilitas akhir bersyarat (conditional probability) suatu hipotesis H terjadi jika diberikan bukti (evidence) E terjadi.

P(E|H) = Probabilitas sebuah bukti E terjadi akan memengaruhi hipotesis H P(E) = Probabilitas awal (priori) bukti E terjadi tanpa memandang hipotesis/bukti yang lain

Contoh Masalah Data uji berupa hewan musang dgn fitur kulit = rambut , melahirkan =ya, berat =15. masuk kelas manakah ? Nama Hewan Kulit Melahirkan Berat Kelas Ular Sisik Ya 10 Reptil Tikus Bulu 0,8 Mamalia Kambing Rambut 21 Sapi 120 Kadal Tidak 0,4 Kucing 1,5 Bekicot Harimau Rusa Kura-kura Cangkang 0,3 43 45 7 Reptil Mamalia

Untuk menyelesaikannya pertama kita harus mengetahui nilai probabilitas setia fitur pada setiap kelasnya Mencari mean sample Xi (¯x) dan sample (s)

Setelah dapat sample dan varian sample , selanjutnya kita menghitung nilai probabilitas musang .

Setelah itu kita membuat tabel probabilitas fitur dan kelas , seperti gambar di bawah ini

Dari tabel diatas barulah kemudian menghitung probabilitas akhir setiap kelas P(X|mamalia) = P(Rambut|mamalia) x P(Lahir=Ya| mamalia) x P(Berat=15|mamalia) = 5/6 x 1 x 0,0104 = 0,0087 P(X|Reptil) = P(kulit=Rambut| reptil) x P(Lahir=Ya| reptil) x P(Berat=15|reptil) = 0 x 0,25 x 0.8733 = 0 Selanjutnya nilai tersebut dimasukkan untuk memndapat kan probablitias akhir.

P(Mamalia| X) = α x 0,6 x 0,0087 = 0,0052α P(Reptil|X) = α x 0 x 0,4 = 0 α= 1/P(x) nilainya konstan sehingga tidak perlu diketahui karena yang terbesar dari dua kelas tersebut tidak dapat dipengaruhi P(X). Karena nilai probabilitas akhir terbesar ada dikelas mamalia, data uji musang di prediksi sebagai kelas mamalia.

Karakteristik Naive bayes Metode naive bayes teguh (robust) terhadap data-data yang terisolasi yang biasanya merupakan data dengan karakteristik berbeda (outlier). Naive bayes juga bisa menangani nilai atribut yang salah dengan mengabaikan data latih selama proses pembangunan model dan prediksi Tangguh menghadapai atribut yang tidak relevan Attribut yang mempunyai korelasi bisa mendegradasi kinerja klasifikasi Naive Bayes karena asumsi independensi atribut tersebut sudah tidak ada.

KESIMPULAN Dengan metode navie bayes kita bisa memecahkan masalah / data yang sudah di klasifikasikan terlebih dahulu, walaupun dalam metode navie bayes untuk memecahkan prediksi kelas untuk musang menurut saya sangat tepat karena kita melakukan perhitungan dengan contoh yang ada.

Saran Pada metode navie bayes ini untuk memudahkan pengerjaan nya sebaiknya di gabungkan dengan metode Discovery Model, karena navie bayes hanya bisa digunakan untuk persoalan klasifikasi data yang telah terkategori, sedangkan dalam suatu database belum tentu data tersebut langsung terkategori.

Dari maka itu kita memerlukan suatu model yang dapat mengolah data di dalam database / mengelompokkan data berdasarkan karakterisktik atau kategori secara otomatis. Serta menggunakan suatu model decision tree yang bertujuan untuk membagi ruang pencarian masalah menjadi himpunan masalah.

SEKIAN TERIMA KASIH