Data Mining Algoritma C4.5. Penjelasan metode Kelebihan dan kekurangan.

Slides:



Advertisements
Presentasi serupa
Pohon Keputusan (Decision Tree)
Advertisements

TEKNIK PERANCANGAN BASIS DATA
Diadaptasi dari slide Jiawei Han
Topik-Topik Lanjutan Sistem Informasi Johanes Kevin Lumadi Deny Setiawan Machliza Devi Sasmita Silvia Line Billie.
Ujian Akhir Semester (UAS)
Masalah, Ruang Masalah dan Pencarian
DASAR-DASAR PEMROGRAMAN
Desain dan Analisis Algoritma
Pohon Keputusan (Decision Tree)
KECERDASAN BUATAN (ARTIFICIAL INTELLIGENCE)
Algoritma Runut-balik (Backtracking)
Penerapan BFS dan DFS pada Pencarian Solusi
Informatics Theory & Programming (ITP) Informatics Eng. Dept. – IT Telkom.
NoOUTLOKTEMPERATUREHUMIDITYWINDYPLAY 1SunnyHotHighFALSENo 2SunnyHotHighTRUENo 3CloudyHotHighFALSEYes 4RainyMildHighFALSEYes 5RainyCoolNormalFALSEYes 6RainyCoolNormalTRUEYes.
Ruang Keadaan (state space)
Pencarian (Searching)
Metode Pencarian/Pelacakan
Oleh : Devie Rosa Anamisa
Heuristic Search Best First Search.
Decision Tree.
SISTEM PENDUKUNG KEPUTUSAN
IMPLEMENTASI DATA MINING SEBAGAI INFORMASI STRATEGIS PENJUALAN BATIK (STUDI KASUS BATIK MAHKOTA LAWEYAN) Oleh: Yusuf Sulistyo Nugroho, S.T., M.Eng. Fatah.
DATA MINING (Machine Learning)
Penerapan BFS dan DFS pada Pencarian Solusi
KECERDASAN BUATAN PERTEMUAN 3.
Penyelesaian Masalah menggunakan Teknik Pencarian Blind Search
Decision Tree.
Metode Pencarian/Pelacakan
STUDI KASUS KLASIFIKASI Algoritma C 4.5
Martin Budi G Di Bawah Bimbingan Rindang Karyadin, S.T., M.Kom.
Algoritma C4.5. Algoritma C4.5 Object-Oriented Programming Introduction Algoritma C4.5 merupakan algoritma yang digunakan.
Data Mining Junta Zeniarja, M.Kom, M.CS
Decision Tree Classification.
Decision Tree Classification.
Heuristic Search (Part 2)
Agus Aan Jiwa Permana, S.Kom., M.Cs
Konsep Data Mining Ana Kurniawati.
Routing & Internetworking
Klasifikasi.
Decision Tree Analysis
KECERDASAN BUATAN (ARTIFICIAL INTELLIGENCE)
Search.
Solusi persamaan aljabar dan transenden
Matematika Diskrit Semester Ganjil TA Kode Huffman.
Fakultas Ilmu Komputer
POHON KEPUTUSAN (DECISION TREE)
Oleh : Yusuf Nurrachman, ST .,MMSI
Masalah, Ruang Masalah dan Pencarian
MIK | FAKULTAS ILMU-ILMU KESEHATAN
Decision Tree Analysis
Data Mining DATA SET. Set Data Ada bermacam –macam cara untuk merepresentasikan data, Misalnya, atribut yang digunakan untuk menggambarkan jenis objek.
DATA MINING with W E K A.
KLASIFIKASI.
Penerapan BFS dan DFS pada Pencarian Solusi
Anggota Dwita Eprila ( ) Mayang Hermeiliza Eka Putri ( ) Nadiah Amelia ( ) Rafif Abdusalam ( ) Shofyan.
Perancangan Sistem Klasifikasi Masa Studi Mahasiswa Menggunakan Data Mining Berbasis Algoritma ID3 (Studi Kasus:Jurusan Teknik Komputer –Unikom) Oleh:
DATA PREPARATION Kompetensi
Heuristic Search.
Heuristic Search Best First Search.
Decision Tree Pertemuan : 13.
DATA PREPARATION.
KLASIFIKASI.
K-MEANS ALGORITHM CLUSTERING
Konsep Data Mining Ana Kurniawati.
DECISION SUPPORT SYSTEM [MKB3493]
© presentationgo.compresentationgo.com By:.com PROSES DAN TEKNIK PENGAMBILAN KEPUTUSAN OLEH : Ikrima M. Mustafa, S.Sos.,MM Your Logo FAKULTAS EKONOMI BISNIS.
Universitas Gunadarma
Data Mining Classification.
Modul II Masalah, Ruang Masalah dan Pencarian
Universitas Gunadarma
Transcript presentasi:

Data Mining Algoritma C4.5

Penjelasan metode Kelebihan dan kekurangan

Model Driven Menggunakan model yang telah ada untuk menganalisis data yang ada Data-Driven Mengekstraksi dan menganalisis informasi dari database Data Mining = Menemukan relasi dari kumpulan data Membuat Pohon Keputusan C 4.5

Salah satu algoritma yang digunakan untuk melakukan klasifikasi atau segmentasi atau pengelompokan dan bersifat prediktif. Algoritma untuk membangkitkan suatu pohon keputusan

Beberapa Istilah yang akan digunakan: Atribut : Faktor-faktor yang mempengaruhi suatu pengambilan keputusan. Contoh: Cuaca atau suhu Nilai Atribut: Klasifikasi untuk suatu atribut tertentu. Contoh: untuk atribut cuaca memiliki nilai atribut berawan, hujan dan cerah Gain: Tingkat pengaruh suatu atribut terhadap keputusan Entrophy: Tingkat perbedaan keputusan terhadap nilai atribut tertentu. Semakin tinggi entrophy semakin tinggi tingkat perbedaan keputusan

1.Tentukan Atribut-atribut yang mempengaruhi pengambilan keputusan 2.Hitung Entropi untuk setiap nilai atribut 3.Hitung Gain setiap atribut 4.Pilih atribut dengan gain tertinggi sebagai akar 5.Jadikan nilai atribut sebagai cabang dari akar 6.Tentukan keputusan pada setiap cabang dengan melihat dari entrophy nilai atribut. 7.Eliminasi atribut yang telah dipilih sebagai akar, kembali lagi pada langkah 1. Lakukan iterasi sampai semua atribut dibuat dalam pohon keputusan

Pj = Proporsi jumlah kejadian nilai atribut terhadap jumlah total kejadian k = Jenis kasus

Mengambil keputusan untuk bermain tenis berdasarkan keadaan cuaca.

Keputusan memperoleh beasiswa berdasarkan beberapa kriteria, yaitu : IPK Penghasilan orang tua Keaktifan berorganisasi Menerima beasiswa pihak lain

NoIPK Penghasilan Orang Tua Keaktifan Berorganisasi Menerima Beasiswa Pihak LainKeputusan 1>3.25RendahAktifYaTidak 2>3.25RendahTidak AktifYaTidak 3>3.5RendahAktifYaTidak 4>3.5RendahTidak AktifYaTidak 5>3.75RendahAktifYaTidak 6>3.75RendahTidak AktifYaTidak 7>3.25MenengahAktifYaTidak 8>3.25MenengahTidak AktifYaTidak 9>3.5MenengahAktifYaTidak 10>3.5MenengahTidak AktifYaTidak 11>3.75MenengahAktifYaTidak 12>3.75MenengahTidak AktifYaTidak 13>3.25TinggiAktifYaTidak 14>3.25TinggiTidak AktifYaTidak 15>3.5TinggiAktifYaTidak 16>3.5TinggiTidak AktifYaTidak 17>3.75TinggiAktifYaTidak 18>3.75TinggiTidak AktifYaTidak

NoIPK Penghasilan Orang Tua Keaktifan Berorganisasi Menerima Beasiswa Pihak LainKeputusan 19>3.25RendahAktifTidak 20>3.25RendahTidak AktifTidak 21>3.5RendahAktifTidak 22>3.5RendahTidak AktifTidak 23>3.75RendahAktifTidakIya 24>3.75RendahTidak AktifTidakIya 25>3.25MenengahAktifTidak 26>3.25MenengahTidak AktifTidak 27>3.5MenengahAktifTidak 28>3.5MenengahTidak AktifTidak 29>3.75MenengahAktifTidakIya 30>3.75MenengahTidak AktifTidak 31>3.25TinggiAktifTidak 32>3.25TinggiTidak AktifTidak 33>3.5TinggiAktifTidak 34>3.5TinggiTidak AktifTidak 35>3.75TinggiAktifTidak 36>3.75TinggiTidak AktifTidak

Node Jumlah KasusNoYesEntropyGain 1Total IPK > > > Penghasilan Orangtua Rendah Menengah Tinggi12 00 Keaktifan Berorganisasi Aktif Tidak Aktif Menerima Beasiswa Pihak Lain Ya18 00 Tidak

NoIPK Penghasilan Orang Tua Keaktifan Berorganisasi Menerima Beasiswa Pihak LainKeputusan 5>3.75RendahAktifYaTidak 6>3.75RendahTidak AktifYaTidak 11>3.75MenengahAktifYaTidak 12>3.75MenengahTidak AktifYaTidak 17>3.75TinggiAktifYaTidak 18>3.75TinggiTidak AktifYaTidak 23>3.75RendahAktifTidakIya 24>3.75RendahTidak AktifTidakIya 29>3.75MenengahAktifTidakIya 30>3.75MenengahTidak AktifTidak 35>3.75TinggiAktifTidak 36>3.75TinggiTidak AktifTidak

Node Jumlah KasusNoYesEntropyGain 1.3IPK Penghasilan Orangtua Rendah4221 Menengah Tinggi4400 Keaktifan Berorganisasi Aktif Tidak Aktif Menerima Beasiswa Pihak Lain Ya6400 Tidak6331

NoIPK Penghasilan Orang Tua Keaktifan Berorganisasi Menerima Beasiswa Pihak LainKeputusan 5>3.75RendahAktifYaTidak 6>3.75RendahTidak AktifYaTidak 11>3.75MenengahAktifYaTidak 12>3.75MenengahTidak AktifYaTidak 17>3.75TinggiAktifYaTidak 18>3.75TinggiTidak AktifYaTidak 23>3.75RendahAktifTidakIya 24>3.75RendahTidak AktifTidakIya 29>3.75MenengahAktifTidakIya 30>3.75MenengahTidak AktifTidak 35>3.75TinggiAktifTidak 36>3.75TinggiTidak AktifTidak NoIPK Penghasilan Orang Tua Keaktifan Berorganisasi Menerima Beasiswa Pihak LainKeputusan 23>3.75RendahAktifTidakIya 24>3.75RendahTidak AktifTidakIya 29>3.75MenengahAktifTidakIya 30>3.75MenengahTidak AktifTidak 35>3.75TinggiAktifTidak 36>3.75TinggiTidak AktifTidak

Node Jumlah KasusNoYesEntropyGain IPK dan Menerima Beasiswa Pihak Lain - Ya 6331 Penghasilan Orangtua Rendah2020 Menengah2111 Tinggi2200 Keaktifan Berorganisasi Aktif Tidak Aktif

NoIPK Penghasilan Orang Tua Keaktifan Berorganisasi Menerima Beasiswa Pihak LainKeputusan 23>3.75RendahAktifTidakIya 24>3.75RendahTidak AktifTidakIya NoIPK Penghasilan Orang Tua Keaktifan Berorganisasi Menerima Beasiswa Pihak LainKeputusan 23>3.75RendahAktifTidakIya 24>3.75RendahTidak AktifTidakIya 29>3.75MenengahAktifTidakIya 30>3.75MenengahTidak AktifTidak 35>3.75TinggiAktifTidak 36>3.75TinggiTidak AktifTidak

Node Jumlah KasusNoYesEntropyGain IPK , Menerima Beasiswa Pihak Lain - Ya, dan Penghasilan Orangtua - Menengah 2111 Keaktifan Berorganisasi Aktif1010 Tidak Aktif1100

Kecepatan membaca dan membentuk model Daerah pengambilan menjadi lebih simpel dan spesifik Eliminasi perhitungan-perhitungan yang tidak diperlukan Fleksibel sehingga akan meningkatkan kualitas keputusan yang dihasilkan Dapat mengolah data numerik (kontinyu) dan diskret Interpretabilitas yaitu model yang dihasilkan mudah dipahami

Terjadi overlapping Pengakumulasian jumlah kesalahan dari setiap tingkat dalam sebuah pohon keputusan yang besar Kesulitan dalam mendesain pohon keputusan yang optimal Hasil kualitas keputusan sangat tergantung pada bagaimana pohon tersebut didesain. Sampel yang harus disimpan secara keseluruhan dan pada waktu yang bersamaan di memori (kebutuhan memori tinggi)

Agrawal, G. L., & Gupta, H. (2013). Optimization of C4.5 Decision Tree Algorithm for Data Mining Application. International Journal of Emerging Technology and Advanced Engineering, Falani, Z. (2012). Algoritma C4.5. Dipetik Maret 19, 2015, dari Manajemen Files Narotama: mFILES: Data%20Mining/Algoritma%20C4.pdf Syamsuddin, A. (2012). Algoritma Decision Tree C4.5. Dipetik Maret 25, 2015, dari Aries Syamsuddin - Blog ITB: decision-tree-c4-5/