STUDI KASUS KLASIFIKASI Algoritma C 4.5

Slides:



Advertisements
Presentasi serupa
Pohon Keputusan (Decision Tree)
Advertisements

Diadaptasi dari slide Jiawei Han
GAME PLAYING ( METODE MINIMAX )
Ujian Akhir Semester (UAS)
DATA MINING 1.
Desain dan Analisis Algoritma
Pohon Keputusan (Decision Tree)
Algoritma Runut-balik (Backtracking)
NoOUTLOKTEMPERATUREHUMIDITYWINDYPLAY 1SunnyHotHighFALSENo 2SunnyHotHighTRUENo 3CloudyHotHighFALSEYes 4RainyMildHighFALSEYes 5RainyCoolNormalFALSEYes 6RainyCoolNormalTRUEYes.
Algoritma Pemotongan Algoritma Gomory Langkah 1 x3* = 11/2 x2* = 1
Pertemuan 24 BRANCH AND BOUND (2)
Oleh : Devie Rosa Anamisa
LINEAR PROGRAMMING Pertemuan 05
Decision Tree.
Data Mining Algoritma C4.5. Penjelasan metode Kelebihan dan kekurangan.
IMPLEMENTASI DATA MINING SEBAGAI INFORMASI STRATEGIS PENJUALAN BATIK (STUDI KASUS BATIK MAHKOTA LAWEYAN) Oleh: Yusuf Sulistyo Nugroho, S.T., M.Eng. Fatah.
DATA MINING (Machine Learning)
INTEGER PROGRAMMING Modul 8. PENELITIAN OPERASIONAL Oleh : Eliyani
Pertemuan 22 BACKTRACKING
Perbandingan Algoritma Brute Force dan Depth First Search (DFS) dalam Kasus Travelling Salesman Problem (TSP) Ervin Yohannes ( )
Decision Tree.
Perulangan.
MUHAMMAD RAFI MUTTAQIN G
Matematika Diskrit Kode Huffman Heru Nugroho, S.Si., M.T.
Martin Budi G Di Bawah Bimbingan Rindang Karyadin, S.T., M.Kom.
PEMBUATAN POHON KEPUTUSAN
Algoritma C4.5. Algoritma C4.5 Object-Oriented Programming Introduction Algoritma C4.5 merupakan algoritma yang digunakan.
Data Mining Junta Zeniarja, M.Kom, M.CS
Decision Tree Classification.
Decision Tree Classification.
Bilangan bulat Definisi dan operasi.
Probabilitas & Diagram Pohon Keputusan
Pengelolaan Instalasi Komputer
UJI TANDA UJI WILCOXON.
Klasifikasi Berdasarkan Teorema Bayes
PROG.STUDI PEND.FISIKA UIN ALAUDDIN MAKASSAR
Linear Programming (Pemrograman Linier)
Klasifikasi.
1. AHP DAN TOPSIS -- Bagian 2 2. ENTROPY-- Bagian 1
Decision Tree Analysis
MODUL-III OPERASI FILE
Matematika Diskrit Semester Ganjil TA Kode Huffman.
MANAJEMEN MEMORI PEMARTISIAN STATIS
SEMINAR HASIL PENELITIAN
MANAJEMEN MEMORI PEMARTISIAN DINAMIS
PRODI MIK | FAKULTAS ILMU-ILMU KESEHATAN
Soal Independent Sample T-Test
Analisa algoritma rekursif
Perulangan.
MIK | FAKULTAS ILMU-ILMU KESEHATAN
Decision Tree Analysis
Data Mining DATA SET. Set Data Ada bermacam –macam cara untuk merepresentasikan data, Misalnya, atribut yang digunakan untuk menggambarkan jenis objek.
DATA MINING with W E K A.
ANALISIS CLUSTER Part 1.
KLASIFIKASI.
21 September September :24 SIDANG SKRIPSI
Anggota Dwita Eprila ( ) Mayang Hermeiliza Eka Putri ( ) Nadiah Amelia ( ) Rafif Abdusalam ( ) Shofyan.
Perancangan Sistem Klasifikasi Masa Studi Mahasiswa Menggunakan Data Mining Berbasis Algoritma ID3 (Studi Kasus:Jurusan Teknik Komputer –Unikom) Oleh:
DATA PREPARATION Kompetensi
Pertemuan ke 9.
Decision Tree Pertemuan : 13.
DATA PREPARATION.
KLASIFIKASI.
K-MEANS ALGORITHM CLUSTERING
HIERARCHICAL CLUSTERING
Pertemuan 10.
DECISION SUPPORT SYSTEM [MKB3493]
Universitas Gunadarma
Data Mining Classification.
Universitas Gunadarma
Transcript presentasi:

STUDI KASUS KLASIFIKASI Algoritma C 4.5 SESI – 6 BLS-DATA MINING WAHYU NURJAYA WK, S.T., M.KOM.

ALGORITMA C 4.5 Algoritma data mining C4.5 merupakan salah satu algoritma yang digunakan untuk melakukan klasifikasi atau segmentasi atau pengelompokan dan bersifat prediktif. Dasar algoritma C4.5 adalah pembentukan pohon keputusan (decision tree). Cabang-cabang pohon keputusan merupakan pertanyaan klasifikasi dan daun-daunnya merupakan kelas-kelas atau segmen-segmennya.

CONTOH DECISION TREE

ALGORITMA C 4.5 Algoritma C4.5 merupakan salah satu algoritma machine learning. Dengan algoritma ini, mesin (komputer) akan diberikan sekelompok data untuk dipelajari yang disebut learning dataset. Kemudian hasil dari pembelajaran selanjutnya akan digunakan untuk mengolah data-data yang baru yang disebut test dataset. Karena algoritma C4.5 digunakan untuk melakukan klasifikasi, jadi hasil dari pengolahan test dataset berupa pengelompokkan data ke dalam kelas-kelasnya.

STUDI KASUS Berikut ini adalah uraian langkah-langkah dalam algoritma C4.5 untuk menyelesaikan kasus suatu pertandingan tenis akan dilakukan atau tidak, berdasarkan keadaan cuaca, suhu, kelembaban, dan angin. Data yang telah ada pada Tabel 1, akan digunakan untuk membentuk pohon keputusan. Pada Tabel 1, atribut-atributnya adalah Cuaca, Suhu, Kelembaban, dan Berangin. Setiap atribut memiliki nilai. Sedangkan kelasnya ada pada kolom Main yaitu kelas “Tidak” dan kelas “Ya”. Kemudian data tersebut dianalisis; dataset tersebut memiliki 14 kasus yang terdiri 10 “Ya” dan 4 “Tidak” pada kolom Main (lihat: Tabel 1)

LEARNING DATASET

HITUNG ENTROPI

CATATAN S adalah ruang (data) sample yang digunakan untuk pelatihan. p+ adalah jumlah yang bersolusi positif atau mendukung pada data sampel untuk kriteria tertentu dan p- adalah jumlah yang bersolusi negatif atau tidak mendukung pada data sampel untuk kriteria tertentu. Entropy (S) sama dengan 0, jika semua contoh pada S berada dalam kelas yang sama. Entropy (S) sama dengan 1, jika jumlah contoh positif dan negatif dalam S adalah sama. Entropy (S) lebih dari 0 tetapi kurang dari 1, jika jumlah contoh positif dan negatif dalam S tidak sama. [Mitchell, 1997]

SETELAH MENGHITUNG ENTROPI  HITUNG GAIN

RUMUS MENGHITUNG GAIN

AKAR PERTAMA NODE 1

HASIL AKHIR POHON KEPUTUSAN