Upload presentasi
Presentasi sedang didownload. Silahkan tunggu
Diterbitkan olehDevi Atmadja Telah diubah "7 tahun yang lalu
1
PENGIDENTIFIKASIAN PENYAKIT ERYTHEMATO-SQUAMOUS MENGGUNAKAN PROBABILISTIC NEURAL NETWORK
Oleh: Aditya Nugroho G Dibimbing Oleh: Ir. Agus Buono, M.Si., M.Kom. Heru Sukoco, S.Si., M.T. Arief Ramadhan, S.Kom.
2
Latar Belakang Masalah:
Diagnosa untuk membedakan penyakit-penyakit erythemato-squamous dalam dermatologi Memiliki ciri-ciri klinis erythema dan scaling dengan perbedaan-perbedaan yang sangat kecil
3
Latar Belakang (Lanjutan)
Masalah: Satu jenis penyakit mungkin menunjukkan ciri-ciri histopatologis penyakit lain pada tahap permulaan dan baru menunjukkan karakteristiknya pada tahap berikutnya (Merz dan Murphy, 1996 dalam Fajriyati 2005)
4
Latar Belakang (Lanjutan)
Penelitian untuk memprediksi jenis penyakit tersebut: Model Ketepatan (%) Jaringan Saraf Tiruan (JST) dengan inisialisasi pembobotan awal Nguyen-Widrow 94.42 JST dengan inisialisasi pembobotan awal Acak 96.65 JST dengan Inisialisasi pembobot awal menggunakan regresi logistik biner dengan 6 neuron tersembunyi 94.40 JST dengan inisisalisasi pembobot acak dengan 6 neuron tersembunyi 76.02 JST dengan algoritma propagasi balik dan apriori 68.00
5
Latar Belakang (Lanjutan)
Ketepatan prediksi model JST masih lebih rendah dibandingkan dengan ketepatan prediksi menggunakan algoritma lainnya yang mencapai 99.20%, yaitu menggunakan voting feature interval-5 (Güvenir et al 1998).
6
Latar Belakang (Lanjutan)
Pada penelitian ini digunakan algoritma Propabilistic Neural Network (PNN) untuk membandingkan apakah algoritma PNN memiliki ketelitian lebih tinggi dibandingkan dengan model yang sudah ada
7
Tujuan Mengetahui ketepatan hasil pengklasifikasian penyakit erythemato-squamous menggunakan PNN
8
Ruang Lingkup Penelitian ini menggunakan data asli dari hasil diagnosa terhadap pasien dan menggunakan teknik pembelajaran PNN. Sedangkan nilai smoothing parameter yang digunakan adalah 1
9
Manfaat Penelitian Sistem dapat mengklasifikasi data hasil diagnosa pasien ke dalam kelompok penyakit erythemato-squamous
10
TINJAUAN PUSTAKA Jaringan Syaraf Tiruan Metode Bayes
Fungsi Pendugaan Kepekatan Peluang Metode Parzen sbg Penduga Kepekatan Probabilistic Neural Network Validasi Silang
11
Jaringan Syaraf Tiruan (JST)
Jaringan Syaraf Tiruan (JST) merupakan suatu sistem pemroses informasi yang memiliki persamaan secara umum dengan cara kerja jaringan syaraf biologi (Fausett 1994)
12
JST (Lanjutan) b Y = X1W1 + X2W2 + … + XnWn x1 x2 xn Y W1 W2 Wn 1
13
Metode Bayes Metode Bayes adalah aturan untuk memilih suatu kategori kelas dengan kesalahan seminimum mungkin Untuk meminimumkan kesalahan, aturan tersebut akan memilih kelas yang memiliki peluang posterior terbesar
14
Metode Bayes (Lanjutan)
Misalkan terdapat c kelas yaitu w1, w2, .., wc, lalu diberikan suatu vektor x, aturan tersebut akan memasukkan vektor x ke dalam kelas wi jika : P(wi | x) > P(wj | x) untuk setiap i≠j. P(wi | x) = P(x|wi)*P(wi) P(wi) prior probability hi P(x|wi) sulit ditentukan, sehingga perlu diduga menggunakan fungsi kepekatan peluang tertentu fi(X)
15
Fungsi Pendugaan Kepekatan Peluang
Penduga kernel merupakan salah satu penduga fungsi kepekatan peluang secara nonparametrik (Silverman 1990)
16
Fungsi Penduga Kepekatan Peluang (Lanjutan)
Peubah Univariative Peubah Multivariative
17
Metode Parzen sbg Penduga Kepekatan
Penduga untuk fungsi kepekatan peluang parzen menggunakan fungsi pembobot (disebut kernel) K(x) yang nilainya akan tinggi seiring dengan besarnya nilai x
18
Metode Parzen sbg Penduga Kepekatan (Lanjutan)
Menurut Silverman (1990), penduga fungsi kepekatan peluang Parzen merupakan penjumlahan fungsi tersebut untuk setiap titik contoh
19
Metode Parzen sbg Penduga Kepekatan (Lanjutan)
Fungsi kernel K untuk dimensi d harus memenuhi: Dalam hal ini fungsi kernel yang digunakan adalah fungsi Gauss:
20
Metode Parzen sbg Penduga Kepekatan (Lanjutan)
Dari 2 persamaan sebelumnya maka didapat persamaan sebagai berikut:
21
Probabilistic Neural Network (PNN)
Probabilistic Neural Network dirancang menggunakan ide dari teori probabilitas klasik yaitu Bayesian dan estimator pengklasifikasian Parzen untuk Probability Density Function
22
PNN (Lanjutan) Dengan menggunakan pengklasifikasian Bayesian dapat ditentukan bagaimana sebuah data masukkan diklasifikasi sebagai anggota suatu kelas dari beberapa kelas yang ada, yaitu yang mempunyai nilai maksimum pada kelas tersebut (Fausett 1994)
23
PNN (Lanjutan) PNN terdiri dari empat layer yaitu: Input Layer
Pattern Layer Summation Layer Decision Layer.
24
Validasi Silang Validasi betujuan untuk menentukan apakah sistem dapat menunjukkan kinerja yang dapat diterima dalam hal akurasi dan efisiensi (Fu 1994)
25
Validasi Silang (Lanjutan)
K-fold cross validation melakukan pengulangan sebanyak k kali untuk sample yang dibagi secara acak ke dalam k himpunan bagian yang terpisah
26
Validasi Silang (Lanjutan)
Setiap pengulangan terdapat satu bagian untuk proses testing dan sisanya (k-1 bagian) sebagai data training, sehingga terdapat sebanyak k pengulangan
27
METODELOGI PENELITIAN
Inisialisasi Data Validasi Silang Pelatihan dan Pengujian Spesifikasi Perangkat Lunak dan Perangkat Keras
28
Inisialisasi Data Berasal dari (Merz dan Murphy 1996 dalam Fajriayati 2005) merupakan hasil pemeriksaan terhadap 366 pasien penderita penyakit erythemato-squamous Terdapat 8 pasien yang tidak tercatat umurnya yang digunakan sebanyak 358
29
Inisialisasi Data (Lanjutan)
Terdiri atas 12 ciri-ciri klinis dan 22 ciri pemeriksaan histopatologis Setiap ciri-ciri, baik klinis maupun histopatologis diberi nilai antara kecuali ciri family history dan umur
30
Inisialisasi Data (Lanjutan)
Nilai 0 menunjukkan tidak terdapat ciri tersebut Nilai 1, 2, dan 3 menunjukkan kemungkinan besar ciri Family history memiliki nilai 1 jika terdapat riwayat jenis penyakit tersebut pada keluarga pasien yang didiagnosis dan nilai 0 jika tidak ditemukan
31
Validasi Silang 3-fold cross validation
Membagi data menjadi 3 sub sample terpisah Dua sub sample akan digunakan sebagai data pelatihan dan satu sub sample akan digunakan sebagai data pengujian
32
Validasi Silang (Lanjutan)
Data dikelompokkan berdasarkan kelas penyakit. Penyakit erythemato-squamous terbagi ke dalam 6 kelas penyakit, dikodekan menjadi 1, 2, sampai 6 Untuk setiap kelas, data dibagi menjadi tiga sub sample, kelompok 1, 2 dan 3
33
Validasi Silang (Lanjutan)
setiap sub sample digabungkan kembali berdasarkan kelompok, berurut sesuai dengan kode kelas menjadi data sub sample yang lengkap berisi bagian seluruh kelas
34
Pelatihan dan Pengujian
Hasil dari proses persiapan data dengan validasi silang akan menjadi pasangan data pelatihan dan data pengujian Percobaan Pelatihan Pengujian 1 sub sample 2 dan 3 sub sample 1 2 sub sample 1 dan 3 sub sample 2 3 sub sample 1 dan 2 sub sample 3
35
Spesifikasi Perangkat Lunak & Perangkat Keras
Matlab 6.5 Microsoft Office Excel 2003 Sistem Operasi yang digunakan ialah Microsoft Windows XP Professional Perangkat keras: Processor AMD Athlon XP 1700+ RAM DDR 768 MB Harddisk dengan kapasitas 240 GB
36
HASIL DAN PEMBAHASAN Tahap Praproses Percobaan 1, 2 dan 3
Perbandingan Ketepatan Prediksi Percobaan 1, 2 dan 3 Perbandingan Ketepatan Prediksi Rata-rata Percobaan 1, 2 dan 3 dengan Penelitian sebelumnya
37
Tahap Praproses Dari Hasil proses Validasi Silang, data terkelompokkan menjadi: Kelas D1 D2 D3 1 37 2 20 3 23 24 4 26 5 16 6 7
38
Percobaan 1, 2 dan 3 Percobaan 1:
Pasangan data pelatihan adalah D2 dan D3 dengan data pengujian D1 Terdapat 119 neuron pada input layer, dengan 34 variabel, dan 239 neuron pada pattern layer
39
Percobaan 1, 2 dan 3 (Lanjutan)
Percobaan 1 (Lanjutan): Didapatkan 103 data pengujian dikenali oleh sistem dan 16 data pengujian tidak dikenali oleh sistem Ketepatan Percobaan 1 adalah 86.55%
40
Percobaan 1, 2 dan 3 (Lanjutan)
Pasangan data pelatihan adalah D1 dan D3 dengan data pengujian D2 Terdapat 119 neuron pada input layer, dengan 34 variabel, dan 239 neuron pada pattern layer
41
Percobaan 1, 2 dan 3 (Lanjutan)
Percobaan 2 (Lanjutan): Didapatkan 105 data pengujian dikenali oleh sistem dan 14 data pengujian tidak dikenali oleh sistem Ketepatan Percobaan 2 adalah 88.23%
42
Percobaan 1, 2 dan 3 (Lanjutan)
Pasangan data pelatihan adalah D1 dan D2 dengan data pengujian D3 Terdapat 120 neuron pada input layer, dengan 34 variabel, dan 238 neuron pada pattern layer
43
Percobaan 1, 2 dan 3 (Lanjutan)
Percobaan 3 (Lanjutan): Didapatkan 104 data pengujian dikenali oleh sistem dan 16 data pengujian tidak dikenali oleh sistem Ketepatan Percobaan 3 adalah 86.66%
44
Perbandingan Ketepatan Prediksi Percobaan 1, 2 dan 3
86.55 2 88.23 3 86.67 Rata-rata 87.15
45
Perbandingan Ketepatan Rata-rata Prediksi Percobaan 1, 2 dan 3 dgn Penelitian sebelumnya
Model Ketepatan (%) Model I (Nguyen-Widrow) 94.42 Model II (Acak) 96.65 JST dgn Inisialisasi pembobot awal menggunakan regresi logistik biner dgn 6 neuron tersembunyi 94.40 JST dengan algoritma probabilistic neural network 87.15 JST dengan inisisalisasi pembobot acak dengan 6 neuron tersembunyi 76.02 JST dengan algoritma propagasi balik dan apriori 68.00
46
KESIMPULAN DAN SARAN Kesimpulan:
Penelitian ini menghasilkan rata-rata ketepatan dibawah Model I (Widrow-Nguyen), Model II (Acak) serta JST dengan Inisialisasi pembobot awal menggunakan regresi logistik biner dengan 6 neuron tersembunyi pada penelitian sebelumnya
47
KESIMPULAN DAN SARAN (Lanjutan)
Kesimpulan (Lanjutan): Penelitian ini menghasilkan rata-rata ketepatan yang lebih besar dari JST dengan inisisalisasi pembobot acak dengan 6 neuron tersembunyi dan JST dengan algoritma propagasi balik dan apriori
48
KESIMPULAN DAN SARAN (Lanjutan)
Kesimpulan (Lanjutan): Dengan rata-rata ketepatan mencapai 87.15%, maka algoritma PNN seperti yang digunakan dalam penelirian ini dapat menjadi salah satu alternatif untuk indentifikasi penyakit erythemato-squamous
49
KESIMPULAN DAN SARAN (Lanjutan)
Penulis mengharapkan agar penelitian ini dapat dikembangkan lagi pada penelitian-penelitian selanjutnya. Misalnya, dengan praproses pengelompokkan variabel umur menggunakan algoritma clustering tertentu
50
KESIMPULAN DAN SARAN (Lanjutan)
Pemilihan faktor pemulus yang optimal juga sangat disarankan, misalnya menggunakan algoritma genetika sehingga dapat dihasilkan ketepatan prediksi yang lebih tinggi
Presentasi serupa
© 2024 SlidePlayer.info Inc.
All rights reserved.