Data Mining Algoritma C4.5
Penjelasan metode Kelebihan dan kekurangan
Model Driven Menggunakan model yang telah ada untuk menganalisis data yang ada Data-Driven Mengekstraksi dan menganalisis informasi dari database Data Mining = Menemukan relasi dari kumpulan data Membuat Pohon Keputusan C 4.5
Salah satu algoritma yang digunakan untuk melakukan klasifikasi atau segmentasi atau pengelompokan dan bersifat prediktif. Algoritma untuk membangkitkan suatu pohon keputusan
Beberapa Istilah yang akan digunakan: Atribut : Faktor-faktor yang mempengaruhi suatu pengambilan keputusan. Contoh: Cuaca atau suhu Nilai Atribut: Klasifikasi untuk suatu atribut tertentu. Contoh: untuk atribut cuaca memiliki nilai atribut berawan, hujan dan cerah Gain: Tingkat pengaruh suatu atribut terhadap keputusan Entrophy: Tingkat perbedaan keputusan terhadap nilai atribut tertentu. Semakin tinggi entrophy semakin tinggi tingkat perbedaan keputusan
1.Tentukan Atribut-atribut yang mempengaruhi pengambilan keputusan 2.Hitung Entropi untuk setiap nilai atribut 3.Hitung Gain setiap atribut 4.Pilih atribut dengan gain tertinggi sebagai akar 5.Jadikan nilai atribut sebagai cabang dari akar 6.Tentukan keputusan pada setiap cabang dengan melihat dari entrophy nilai atribut. 7.Eliminasi atribut yang telah dipilih sebagai akar, kembali lagi pada langkah 1. Lakukan iterasi sampai semua atribut dibuat dalam pohon keputusan
Pj = Proporsi jumlah kejadian nilai atribut terhadap jumlah total kejadian k = Jenis kasus
Mengambil keputusan untuk bermain tenis berdasarkan keadaan cuaca.
Keputusan memperoleh beasiswa berdasarkan beberapa kriteria, yaitu : IPK Penghasilan orang tua Keaktifan berorganisasi Menerima beasiswa pihak lain
NoIPK Penghasilan Orang Tua Keaktifan Berorganisasi Menerima Beasiswa Pihak LainKeputusan 1>3.25RendahAktifYaTidak 2>3.25RendahTidak AktifYaTidak 3>3.5RendahAktifYaTidak 4>3.5RendahTidak AktifYaTidak 5>3.75RendahAktifYaTidak 6>3.75RendahTidak AktifYaTidak 7>3.25MenengahAktifYaTidak 8>3.25MenengahTidak AktifYaTidak 9>3.5MenengahAktifYaTidak 10>3.5MenengahTidak AktifYaTidak 11>3.75MenengahAktifYaTidak 12>3.75MenengahTidak AktifYaTidak 13>3.25TinggiAktifYaTidak 14>3.25TinggiTidak AktifYaTidak 15>3.5TinggiAktifYaTidak 16>3.5TinggiTidak AktifYaTidak 17>3.75TinggiAktifYaTidak 18>3.75TinggiTidak AktifYaTidak
NoIPK Penghasilan Orang Tua Keaktifan Berorganisasi Menerima Beasiswa Pihak LainKeputusan 19>3.25RendahAktifTidak 20>3.25RendahTidak AktifTidak 21>3.5RendahAktifTidak 22>3.5RendahTidak AktifTidak 23>3.75RendahAktifTidakIya 24>3.75RendahTidak AktifTidakIya 25>3.25MenengahAktifTidak 26>3.25MenengahTidak AktifTidak 27>3.5MenengahAktifTidak 28>3.5MenengahTidak AktifTidak 29>3.75MenengahAktifTidakIya 30>3.75MenengahTidak AktifTidak 31>3.25TinggiAktifTidak 32>3.25TinggiTidak AktifTidak 33>3.5TinggiAktifTidak 34>3.5TinggiTidak AktifTidak 35>3.75TinggiAktifTidak 36>3.75TinggiTidak AktifTidak
Node Jumlah KasusNoYesEntropyGain 1Total IPK > > > Penghasilan Orangtua Rendah Menengah Tinggi12 00 Keaktifan Berorganisasi Aktif Tidak Aktif Menerima Beasiswa Pihak Lain Ya18 00 Tidak
NoIPK Penghasilan Orang Tua Keaktifan Berorganisasi Menerima Beasiswa Pihak LainKeputusan 5>3.75RendahAktifYaTidak 6>3.75RendahTidak AktifYaTidak 11>3.75MenengahAktifYaTidak 12>3.75MenengahTidak AktifYaTidak 17>3.75TinggiAktifYaTidak 18>3.75TinggiTidak AktifYaTidak 23>3.75RendahAktifTidakIya 24>3.75RendahTidak AktifTidakIya 29>3.75MenengahAktifTidakIya 30>3.75MenengahTidak AktifTidak 35>3.75TinggiAktifTidak 36>3.75TinggiTidak AktifTidak
Node Jumlah KasusNoYesEntropyGain 1.3IPK Penghasilan Orangtua Rendah4221 Menengah Tinggi4400 Keaktifan Berorganisasi Aktif Tidak Aktif Menerima Beasiswa Pihak Lain Ya6400 Tidak6331
NoIPK Penghasilan Orang Tua Keaktifan Berorganisasi Menerima Beasiswa Pihak LainKeputusan 5>3.75RendahAktifYaTidak 6>3.75RendahTidak AktifYaTidak 11>3.75MenengahAktifYaTidak 12>3.75MenengahTidak AktifYaTidak 17>3.75TinggiAktifYaTidak 18>3.75TinggiTidak AktifYaTidak 23>3.75RendahAktifTidakIya 24>3.75RendahTidak AktifTidakIya 29>3.75MenengahAktifTidakIya 30>3.75MenengahTidak AktifTidak 35>3.75TinggiAktifTidak 36>3.75TinggiTidak AktifTidak NoIPK Penghasilan Orang Tua Keaktifan Berorganisasi Menerima Beasiswa Pihak LainKeputusan 23>3.75RendahAktifTidakIya 24>3.75RendahTidak AktifTidakIya 29>3.75MenengahAktifTidakIya 30>3.75MenengahTidak AktifTidak 35>3.75TinggiAktifTidak 36>3.75TinggiTidak AktifTidak
Node Jumlah KasusNoYesEntropyGain IPK dan Menerima Beasiswa Pihak Lain - Ya 6331 Penghasilan Orangtua Rendah2020 Menengah2111 Tinggi2200 Keaktifan Berorganisasi Aktif Tidak Aktif
NoIPK Penghasilan Orang Tua Keaktifan Berorganisasi Menerima Beasiswa Pihak LainKeputusan 23>3.75RendahAktifTidakIya 24>3.75RendahTidak AktifTidakIya NoIPK Penghasilan Orang Tua Keaktifan Berorganisasi Menerima Beasiswa Pihak LainKeputusan 23>3.75RendahAktifTidakIya 24>3.75RendahTidak AktifTidakIya 29>3.75MenengahAktifTidakIya 30>3.75MenengahTidak AktifTidak 35>3.75TinggiAktifTidak 36>3.75TinggiTidak AktifTidak
Node Jumlah KasusNoYesEntropyGain IPK , Menerima Beasiswa Pihak Lain - Ya, dan Penghasilan Orangtua - Menengah 2111 Keaktifan Berorganisasi Aktif1010 Tidak Aktif1100
Kecepatan membaca dan membentuk model Daerah pengambilan menjadi lebih simpel dan spesifik Eliminasi perhitungan-perhitungan yang tidak diperlukan Fleksibel sehingga akan meningkatkan kualitas keputusan yang dihasilkan Dapat mengolah data numerik (kontinyu) dan diskret Interpretabilitas yaitu model yang dihasilkan mudah dipahami
Terjadi overlapping Pengakumulasian jumlah kesalahan dari setiap tingkat dalam sebuah pohon keputusan yang besar Kesulitan dalam mendesain pohon keputusan yang optimal Hasil kualitas keputusan sangat tergantung pada bagaimana pohon tersebut didesain. Sampel yang harus disimpan secara keseluruhan dan pada waktu yang bersamaan di memori (kebutuhan memori tinggi)
Agrawal, G. L., & Gupta, H. (2013). Optimization of C4.5 Decision Tree Algorithm for Data Mining Application. International Journal of Emerging Technology and Advanced Engineering, Falani, Z. (2012). Algoritma C4.5. Dipetik Maret 19, 2015, dari Manajemen Files Narotama: mFILES: Data%20Mining/Algoritma%20C4.pdf Syamsuddin, A. (2012). Algoritma Decision Tree C4.5. Dipetik Maret 25, 2015, dari Aries Syamsuddin - Blog ITB: decision-tree-c4-5/