Marselina Silvia Suhartinah / 4IA05

Slides:



Advertisements
Presentasi serupa
SQL – DML.
Advertisements

MATA KULIAH : “LOGIKA DAN ALGORITMA”
SQL (Structured Query Language)
Praktikum Database Query Tingkat Lanjut Abdul Kadir.
Diadaptasi dari slide Jiawei Han
PENDAFTARAN SIDANG LKP Program Diploma Tiga Bisnis Dan Kewirausahaan
PERSIAPAN INPUT DATA DOWNLOAD WEBLOADER.EXE (APLIKASI)
Peran Utama Data Mining
Ujian Akhir Semester (UAS)
Praktikum Database Pengenalan Query
Teknik Pemrograman (TEKPRO)
Sistem Manajemen Basis Data
Aplikasi Penghitungan IPK dengan menggunakan Microsoft Visual Basic 6
PENULISAN ALGORITMA dengan PSEUDOCODE & FLOWCHART
APLIKASI PENGENALAN HURUF,ANGKA,DAN GAMBAR MELALUI HANDPHONE Pajar Ahmad Kurniawan for further detail, please visit
Algoritma dan Struktur Data
Select Case.
TRIGGER.
Fungsi Agregat fungsi yang mengambil suatu kumpulan nilai-nilai sebagai input dan mengembalikan satu nilai sebagai output Select fungsi agregat SUM/AVG/MIN/MAX/COUNT.
PENGKLASIFIKASIKAN SPAM-MAIL PERBANDINGAN KINERJA ALGORITMA ID3 DAN C4
INNER JOIN.
Praktikum Database Subquery Lanjutan dan View Abdul Kadir.
PEMBUATAN APLIKASI PENGISIAN KRS (Kartu Rencana Studi) VIA MOBILE Sri Wahyudi for further detail, please visit
Data Mining: Klasifikasi dan Prediksi Naive Bayesian & Bayesian Network . April 13, 2017.
Kasus Buat algoritma untuk menghitung total pembayaran dari proses pembelian.
MENGELOLAH DATABASE DENGAN MYSQL.
PI. Jurusan Teknik Informatika, Fakultas Teknik Industri, Universitas Gunadarma, Aplikasi Profil Kepribadian Online Dengan PHP dan MySQL for further detail,
SQL (Structured Query Language)
MANAJEMEN BASIS DATA Pertemuan 8 SUBQUERY.
NIPRL 1.4 Probabilitas Bersyarat Definisi Probabilitas Bersyarat(1/2) Probabilitas Bersyarat Probabilitas bersyarat kejadian A pada kejadian B adalah.
Pembangunan Sistem Skripsi Online Prodi/Fakultas KIP UMS
METODOLOGI PENELITIAN
Dosen Pengampu : Edhy Sutanta, ST.,M.Kom.. Hoby Renang Badminton Traveling.
A rsitektur dan M odel D ata M ining. Arsitektur Data Mining.
DATA MINING (Machine Learning)
Data Mining Junta Zeniarja, M.Kom, M.CS
Konsep Dasar Organisasi Berkas
Algoritma dan Pemrograman STRUKTUR PEMILIHAN (SELECTION) lanjutan
Adi Rachmanto – UNIKOM Q U E R Y Adi Rachmanto – UNIKOM
Praktikum Berkas dan Basis Data
SYSTEM FLOWCHART.
Konsep Data Mining Ana Kurniawati.
Klasifikasi Berdasarkan Teorema Bayes
Perintah Manipulasi Data
Algoritma dan Pemrograman STRUKTUR PEMILIHAN (SELECTION) lanjutan
Naïve Bayes Classification.
SYSTEM FLOWCHART.
Pertemuan 7 SQL – SELECT (Join Table)
Adi Rachmanto – UNIKOM Q U E R Y Adi Rachmanto – UNIKOM
KELOMPOK 6 Nama Kelompok: Lulus Irmawati ( )
Adi Rachmanto – UNIKOM Q U E R Y Adi Rachmanto – UNIKOM
SISTEM PAKAR BERBASIS WEB DALAM TROUBLESHOOTING PADA JARINGAN NIRKABEL
PRODI MIK | FAKULTAS ILMU-ILMU KESEHATAN
Algoritma dan Pemrograman STRUKTUR PEMILIHAN (SELECTION) lanjutan
Modul Praktikum 13 Tujuan khusus
USING DATA MINING TO MODEL PLAYER EXPERIENCE
DATA MINING with W E K A.
KLASIFIKASI.
Machine Learning Naïve Bayes
Latihan Buatlah algoritma untuk menentukan status kelulusan mahasiswa pada satu matakuliah. Mahasiswa dinyatakan lulus apabila nilai >= 60. Input : nilai.
Perancangan Sistem Klasifikasi Masa Studi Mahasiswa Menggunakan Data Mining Berbasis Algoritma ID3 (Studi Kasus:Jurusan Teknik Komputer –Unikom) Oleh:
Pertemuan 1 & 2 Pengantar Data Mining 12/6/2018.
FAKULTAS KEDOKTERAN UNIVERSITAS LAMPUNG 2018
KLASIFIKASI.
Konsep Data Mining Ana Kurniawati.
Universitas Gunadarma
Hari, Tanggal Judul Tugas Akhir FONT 36 Jenis Ujian Nama Mahasiswa NIM.
Klasifikasi dengan Naive Bayes
MEMBANGUN APLIKASI ……. OLEH:.
Universitas Gunadarma
Transcript presentasi:

Marselina Silvia Suhartinah 50406459 / 4IA05 APLIKASI PREDIKSI KELULUSAN MAHASISWA UNIVERSITAS GUNADARMA MENGGUNAKAN ALGORITMA NAIVE BAYES DAN ALGORITMA C4.5

Latar Belakang Masalah mahasiswa yang tidak lulus sesuai dengan waktu studi. Jumlah data mahasiswa baru yang setiap tahun terus meningkat Mencoba menemukan pola untuk memprediksi mahasiswa yang dapat lulus sesuai dengan waktu studi yang ditentukan. penerapan dan perbandingan algoritma naive bayes dan algoritma C4.5

Batasan Masalah Tujuan Penerapan algoritma naive bayes dan C4.5 dalam prediksi kelulusan mahasiswa yang dapat lulus sesuai dengan waktu studi menggunakan Java Netbeans. Analisa perbandingan hasil dan akurasi algoritma naive bayes dan algoritma C4.5. Tujuan mencari dan menemukan pola yang terdapat pada data mahasiswa berdasarkan data NEM, IP DNS semester 1, IP DNS semester 2, IPK DNU semester 1-2, gaji orang tua dan pekerjaan orang tua, untuk memprediksi mahasiswa yang lulus atau tidak lulus sesuai dengan waktu studi dengan menggunakan algoritma naive bayes dan C4.5, kemudian membandingkan hasil dan akurasi kedua algoritma tersebut.

Gambaran Umum Sistem INPUT Data mahasiswa tahun 2005 sebagai training set PROSES Data Mining dengan algoritma naive bayes dan C4.5 Pengujian dengan data tes set OUTPUT Prediksi kelulusan mahasiswa yang tepat waktu

Flowchart Naive Bayes(bag. 1) Mulai Tabel Training dalam databases k, P_1, P_2 =0 Prob_1, Prob_2=1 kasus[k]={data kasus} atribut[k] ={atribut input} data_lulus = select count(*) from training where keterangan = lulus data_tidak = select count(*) from training where keterangan = tidak lulus jum = data_lulus + data_tidak P(lulus) = data_lulus / jum P(tidak) = data_tidak / jum A

Flowchart Naive Bayes(bag. 2) data1[k] = select count(atribut[k]) dari table training where atribut[k] = kasus[k] and keterangan = lulus. data2[k] = select count(atribut[k]) dari table training where atribut[k] = kasus[k] and keterangan = tidak lulus Prob1 = Prob1 * (data1[k]+(m*1/jum_nilai_atribut[k])) /jum_data[0]+m) Prob2 = Prob2 * (data2[k]+(m*1/jum_nilai_atribut[k])) /(jum_data[1]+m) Inc(k) P_1 = P(lulus) * Prob1 P_2 = P(tidak) * Prob2 Selesai k = k.length? A P_1 > P_2 ? “LULUS” Posterior = P_1 / (P_1+P_2) Tidak Ya “TIDAK LULUS” Posterior = P_2 / (P_1+P_2)

Algoritma C4.5 Nem IP DNS 1 IP DNS 2 IPK DNU (1-2) Gaji Orang tua Pekerjaan Keterangan 5-6 1,01-2,00 2,51-3,00 <1 juta Lainnya Tidak lulus 6-7 2,01-2,50 Karyawan Lulus 8-9 3,01-3,50 1-3 juta BUMN Label / output adalah atribut yang dipilih untuk pemisah obyek. Pada penelitian kali ini atribut output adalah keterangan dengan nilai lulus dan tidak lulus. - [Select count(keterangan) as jum from training where keterangan = lulus;] keterangan = tidak lulus;] Data / example adalah atribut-atribut data yang berisi record- record data sebagai dasar perhitungan untuk menentukan record tersebut tergolong ke dalam obyek atau ouput yang mana (lulus dan tidak lulus). - [Select count(atribut[x]) as jum from training where atribut[x]= a[y] and keterangan = lulus;] atibut[x]=a[y] and keterangan = tidak lulus;]

Algoritma C4.5 Entropi Contoh perhitungan entropi atribut gaji - gaji = a (<1 juta) - gaji = b (1-3 juta) Entropi [16,13] = 0.9922 - gaji = c (>3 juta) Entropi [4,5] = 0.9910 Entropi Total Atribut Gaji

Algoritma C4.5 Information Gain

Tampilan Output

Hasil Uji Coba dan Analisis NPM Keterangan Prediksi dengan Naive Bayes Prediksi dengan algoritma C4.5 50405696 Tidak Lulus 50405782 Lulus 50405761 50405762 50405779 50406659 50406145 50406168 50406737 50406574 50406650 50405006 50405054 50405204 50405218 50405137 50405407 50405408 50405425 50405427 50405438

Hasil Uji Coba dan Analisis Perbandingan akurasi naive bayes dan C4.5 Berdasarkan tabel data hasil pengujian maka didapatkan perbandingan akurasi hasil dan nilai kesalahan dari kedua algoritma dimana : hasil prediksi naive bayes adalah : ((17/21) x 100%) = 80,85%. Sementara Presentase kesalahan adalah : ((4/21) x 100%)= 19,05%. Akurasi ketepatan hasil prediksi C4.5 adalah : ((18/21) x 100%) = 85,7%. Sedangkan nilai kesalahan pada penelitian dengan algoritma C4.5 adalah : ((3/21) x 100%) = 14,3%. Prediksi Naive Bayes Prediksi C4.5 Akurasi Ketepatan 80,85% 85,7% Kesalahan 19,05% 14,3%

Hasil Uji Coba dan Analisis akurasi dari algoritma C4.5 lebih tinggi dibandingkan akurasi naive bayes. Selain itu nilai kesalahan dari algoritma C4.5 lebih rendah dibandingkan nilai kesalahan naive bayes. Hal ini dikarenakan algoritma C4.5 membentuk sebuah pohon keputusan dengan cara melakukan klasifikasi record-record ke dalam kelas tujuan yang ada. Namun proses prediksi C4.5 memiliki waktu proses yang sedikit lebih lama karena terlebih dahulu harus membangun pohon keputusan berdasarkan data training selanjutnya melakukan penelusuran berdasarkan data kasus yang dicari.

Hasil Uji Coba dan Analisis Pada tabel, hasil pengujian data dari record 1-11 merupakan data yang tidak digunakan dalam proses training. Pada 11 record data ini naive bayes memiliki nilai kesalahan ((2/11) * 100%) = 18,18%, sedangkan C4.5 memiliki nilai kesalahan ((3/11) * 100%)= 27,27%. Ini berarti tingkat akurasi naive bayes untuk data yang berbeda dari data training lebih baik. Hal ini dikarenakan pada naive bayes nilai suatu atribut adalah independent terhadap nilai lainnya dalam satu atribut yang sama. Sehingga hanya satu nilai dari suatu atribut dalam sebuah kelas tujuan yang dibutuhkan untuk menentukan klasifikasi.

Kesimpulan Proses pengklasifikasian nilai sangat penting karena dapat mengelompokkan nilai-nilai yang akan diuji. Dengan menggunakan algoritma C4.5 kesalahan yang dihasilkan dalam proses prediksi lebih sedikit karena C4.5 melakukan klasifikasi record-record ke dalam kelas tujuan yang ada. Algoritma decision tree memiliki kompleksitas yang lebih besar. Karena pada algoritma C4.5 setiap nilai dalam suatu atribut ditelusuri dan diproses untuk mendapatkan entropi masing-masing nilai yang akan digunakan untuk mencari ukuran purity masing-masing atribut yang dinyatakan dengan information gain. Proses penelusuran ini akan membentuk sebuah pola berupa pohon keputusan.

Kesimpulan Algoritma naive bayes bila diimplementasikan menggunakan data yang digunakan dalam proses training akan menghasilkan nilai kesalahan yang lebih besar karena pada naive bayes nilai suatu atribut adalah independent terhadap nilai lainnya dalam satu atribut yang sama. Namun memiliki akurasi yang lebih tinggi bila dimplementasikan ke data yang berbeda dari data training dan kedalam data yang jumlahnya lebih besar.

Thank You Gracias Merci Obrigado Danke Grazie Japanese Hindi Traditional Chinese Russian Tamil Arabic Simplified Chinese Merci Obrigado French Brazilian Portuguese Gracias Danke Spanish German Grazie Italian Thank You English