Presentasi sedang didownload. Silahkan tunggu

Presentasi sedang didownload. Silahkan tunggu

Data Mining Algoritma C4.5. Penjelasan metode Kelebihan dan kekurangan.

Presentasi serupa


Presentasi berjudul: "Data Mining Algoritma C4.5. Penjelasan metode Kelebihan dan kekurangan."— Transcript presentasi:

1 Data Mining Algoritma C4.5

2 Penjelasan metode Kelebihan dan kekurangan

3 Model Driven Menggunakan model yang telah ada untuk menganalisis data yang ada Data-Driven Mengekstraksi dan menganalisis informasi dari database Data Mining = Menemukan relasi dari kumpulan data Membuat Pohon Keputusan C 4.5

4 Salah satu algoritma yang digunakan untuk melakukan klasifikasi atau segmentasi atau pengelompokan dan bersifat prediktif. Algoritma untuk membangkitkan suatu pohon keputusan

5 Beberapa Istilah yang akan digunakan: Atribut : Faktor-faktor yang mempengaruhi suatu pengambilan keputusan. Contoh: Cuaca atau suhu Nilai Atribut: Klasifikasi untuk suatu atribut tertentu. Contoh: untuk atribut cuaca memiliki nilai atribut berawan, hujan dan cerah Gain: Tingkat pengaruh suatu atribut terhadap keputusan Entrophy: Tingkat perbedaan keputusan terhadap nilai atribut tertentu. Semakin tinggi entrophy semakin tinggi tingkat perbedaan keputusan

6 1.Tentukan Atribut-atribut yang mempengaruhi pengambilan keputusan 2.Hitung Entropi untuk setiap nilai atribut 3.Hitung Gain setiap atribut 4.Pilih atribut dengan gain tertinggi sebagai akar 5.Jadikan nilai atribut sebagai cabang dari akar 6.Tentukan keputusan pada setiap cabang dengan melihat dari entrophy nilai atribut. 7.Eliminasi atribut yang telah dipilih sebagai akar, kembali lagi pada langkah 1. Lakukan iterasi sampai semua atribut dibuat dalam pohon keputusan

7 Pj = Proporsi jumlah kejadian nilai atribut terhadap jumlah total kejadian k = Jenis kasus

8 Mengambil keputusan untuk bermain tenis berdasarkan keadaan cuaca.

9

10

11

12

13

14

15

16

17 Keputusan memperoleh beasiswa berdasarkan beberapa kriteria, yaitu : IPK Penghasilan orang tua Keaktifan berorganisasi Menerima beasiswa pihak lain

18 NoIPK Penghasilan Orang Tua Keaktifan Berorganisasi Menerima Beasiswa Pihak LainKeputusan 1>3.25RendahAktifYaTidak 2>3.25RendahTidak AktifYaTidak 3>3.5RendahAktifYaTidak 4>3.5RendahTidak AktifYaTidak 5>3.75RendahAktifYaTidak 6>3.75RendahTidak AktifYaTidak 7>3.25MenengahAktifYaTidak 8>3.25MenengahTidak AktifYaTidak 9>3.5MenengahAktifYaTidak 10>3.5MenengahTidak AktifYaTidak 11>3.75MenengahAktifYaTidak 12>3.75MenengahTidak AktifYaTidak 13>3.25TinggiAktifYaTidak 14>3.25TinggiTidak AktifYaTidak 15>3.5TinggiAktifYaTidak 16>3.5TinggiTidak AktifYaTidak 17>3.75TinggiAktifYaTidak 18>3.75TinggiTidak AktifYaTidak

19 NoIPK Penghasilan Orang Tua Keaktifan Berorganisasi Menerima Beasiswa Pihak LainKeputusan 19>3.25RendahAktifTidak 20>3.25RendahTidak AktifTidak 21>3.5RendahAktifTidak 22>3.5RendahTidak AktifTidak 23>3.75RendahAktifTidakIya 24>3.75RendahTidak AktifTidakIya 25>3.25MenengahAktifTidak 26>3.25MenengahTidak AktifTidak 27>3.5MenengahAktifTidak 28>3.5MenengahTidak AktifTidak 29>3.75MenengahAktifTidakIya 30>3.75MenengahTidak AktifTidak 31>3.25TinggiAktifTidak 32>3.25TinggiTidak AktifTidak 33>3.5TinggiAktifTidak 34>3.5TinggiTidak AktifTidak 35>3.75TinggiAktifTidak 36>3.75TinggiTidak AktifTidak

20 Node Jumlah KasusNoYesEntropyGain 1Total 363330.4138 IPK 0.1434 >3.2512 00 >3.512 00 >3.7512930.811 Penghasilan Orangtua 0.059 Rendah121020.650 Menengah121110.413 Tinggi12 00 Keaktifan Berorganisasi 0.0074 Aktif181620.5032 Tidak Aktif181710.3095 Menerima Beasiswa Pihak Lain 0.0888 Ya18 00 Tidak181530.650

21

22 NoIPK Penghasilan Orang Tua Keaktifan Berorganisasi Menerima Beasiswa Pihak LainKeputusan 5>3.75RendahAktifYaTidak 6>3.75RendahTidak AktifYaTidak 11>3.75MenengahAktifYaTidak 12>3.75MenengahTidak AktifYaTidak 17>3.75TinggiAktifYaTidak 18>3.75TinggiTidak AktifYaTidak 23>3.75RendahAktifTidakIya 24>3.75RendahTidak AktifTidakIya 29>3.75MenengahAktifTidakIya 30>3.75MenengahTidak AktifTidak 35>3.75TinggiAktifTidak 36>3.75TinggiTidak AktifTidak

23 Node Jumlah KasusNoYesEntropyGain 1.3IPK - 3.75 12930.8113 Penghasilan Orangtua 0.213 Rendah4221 Menengah4310.8113 Tinggi4400 Keaktifan Berorganisasi 0.152 Aktif6420.9183 Tidak Aktif6510.6500 Menerima Beasiswa Pihak Lain 0.247 Ya6400 Tidak6331

24

25 NoIPK Penghasilan Orang Tua Keaktifan Berorganisasi Menerima Beasiswa Pihak LainKeputusan 5>3.75RendahAktifYaTidak 6>3.75RendahTidak AktifYaTidak 11>3.75MenengahAktifYaTidak 12>3.75MenengahTidak AktifYaTidak 17>3.75TinggiAktifYaTidak 18>3.75TinggiTidak AktifYaTidak 23>3.75RendahAktifTidakIya 24>3.75RendahTidak AktifTidakIya 29>3.75MenengahAktifTidakIya 30>3.75MenengahTidak AktifTidak 35>3.75TinggiAktifTidak 36>3.75TinggiTidak AktifTidak NoIPK Penghasilan Orang Tua Keaktifan Berorganisasi Menerima Beasiswa Pihak LainKeputusan 23>3.75RendahAktifTidakIya 24>3.75RendahTidak AktifTidakIya 29>3.75MenengahAktifTidakIya 30>3.75MenengahTidak AktifTidak 35>3.75TinggiAktifTidak 36>3.75TinggiTidak AktifTidak

26 Node Jumlah KasusNoYesEntropyGain 1.3.1 IPK - 3.75 dan Menerima Beasiswa Pihak Lain - Ya 6331 Penghasilan Orangtua 0.35826 Rendah2020 Menengah2111 Tinggi2200 Keaktifan Berorganisasi 0.2608 Aktif3120.9183 Tidak Aktif3210.9183

27

28 NoIPK Penghasilan Orang Tua Keaktifan Berorganisasi Menerima Beasiswa Pihak LainKeputusan 23>3.75RendahAktifTidakIya 24>3.75RendahTidak AktifTidakIya NoIPK Penghasilan Orang Tua Keaktifan Berorganisasi Menerima Beasiswa Pihak LainKeputusan 23>3.75RendahAktifTidakIya 24>3.75RendahTidak AktifTidakIya 29>3.75MenengahAktifTidakIya 30>3.75MenengahTidak AktifTidak 35>3.75TinggiAktifTidak 36>3.75TinggiTidak AktifTidak

29 Node Jumlah KasusNoYesEntropyGain 1.3.1.1 IPK - 3.75, Menerima Beasiswa Pihak Lain - Ya, dan Penghasilan Orangtua - Menengah 2111 Keaktifan Berorganisasi 0.414 Aktif1010 Tidak Aktif1100

30

31 Kecepatan membaca dan membentuk model Daerah pengambilan menjadi lebih simpel dan spesifik Eliminasi perhitungan-perhitungan yang tidak diperlukan Fleksibel sehingga akan meningkatkan kualitas keputusan yang dihasilkan Dapat mengolah data numerik (kontinyu) dan diskret Interpretabilitas yaitu model yang dihasilkan mudah dipahami

32 Terjadi overlapping Pengakumulasian jumlah kesalahan dari setiap tingkat dalam sebuah pohon keputusan yang besar Kesulitan dalam mendesain pohon keputusan yang optimal Hasil kualitas keputusan sangat tergantung pada bagaimana pohon tersebut didesain. Sampel yang harus disimpan secara keseluruhan dan pada waktu yang bersamaan di memori (kebutuhan memori tinggi)

33 Agrawal, G. L., & Gupta, H. (2013). Optimization of C4.5 Decision Tree Algorithm for Data Mining Application. International Journal of Emerging Technology and Advanced Engineering, 341-345. Falani, Z. (2012). Algoritma C4.5. Dipetik Maret 19, 2015, dari Manajemen Files Narotama: mFILES: http://mfile.narotama.ac.id/files/Zakki%20Falani/Konsep%20 Data%20Mining/Algoritma%20C4.pdf Syamsuddin, A. (2012). Algoritma Decision Tree C4.5. Dipetik Maret 25, 2015, dari Aries Syamsuddin - Blog ITB: http://blogs.itb.ac.id/aiceware/2012/09/23/algoritma- decision-tree-c4-5/

34


Download ppt "Data Mining Algoritma C4.5. Penjelasan metode Kelebihan dan kekurangan."

Presentasi serupa


Iklan oleh Google