Decision Tree Pertemuan : 13
Decision Tree Decision Tree merupakan struktur flowchart yang mempunyai tree(pohon), dimana setiap simpul internal menandakan suatu tes atribut,setiap cabang merepresentasikan hasil tes, dan simpul daun merepresentasikan kelas atau distribusi kelas.
Alur pada Decision Tree Ditelusuri dari simpul akar ke simpul daun yang memegang prediksi kelas untuk contoh tersebut.
Decision tree mudah untuk dikonversi ke aturan klasifikasi (classification rule). Konsep data dalam decision tree dinyatakan dalam bentuk tabel dengan atribut dan record
Pohon (Tree) Pohon merupakan sebuah graf terhubung yang tidak mengandung sirkuit. Konsep pohon (tree) dalam teori graf merupakan konsep yang sangat penting, karena terapannya diberbagai bidang ilmu. Oleh karenanya antara pohon (tree) sangat erat hubungannya dengan teori graf.
Dari defenisi Pohon, ada dua sifat penting pada pohon yaitu: Terhubung Tidak mengandung sirkuit.
Karakteristik Tree: Pohon seringkali memiliki akar . karena setiap simpul pada pohon hanya memiliki satu lintasan akses dari setiap simpul lainnya, maka tidak mungkin bagi sebuah lintasan untuk membentuk simpul (loop) atau siklus (cycle) yang secara berkesinambungan melalui serangkaian simpul
Gambar
Data Rule Konsep Decision Tree Decision Tree Mengubah data menjadi pohon keputusan (decision tree) dan aturan-aturan keputusan (Rule) Decision Tree Data Rule
Konsep Data dalam Decision Tree Data dinyatakan dalam bentuk tabel yang tersusun atas atribut dan record Atribut menyatakan sebuah parameter yang dibuat sebagai kriteria dalam pembentukan tree Atribut terdiri atas atribut kriteria dan atribut target. Atribut target merupakan atribut yang menyatakan data solusi. Nilai pada masing-masing atribut disebut dengan instance
Continue...
Proses dalam Decision Tree Ubah bentuk data menjadi model tree Ubah model tree menjadi rules Sederhanakan rule (Proses Pruning)
Proses Data menjadi Tree
Continue.. Mengubah data menjadi tree dilakukan dengan menghitung nilai Entropy pada masing-masing kriteria dari sejumlah data sampel yang digunakan.
Mengubah Tree menjadi Rule
Conjunction dan Disjunction
Contoh Soal Dari 8 data sampel yang digunakan berikut akan diprediksi seseorang menderita penyakit Hipertensi atau tidak. Digunakan 3 kriteria penilaian, yaitu: Usia, berat badan, dan jenis kelamin. Tabel berikut menjelaskan data selengkapnya:
Penyelesaian: 1. Menghitung Entropi pada masing-masing kriteria
Nilai entropy untuk masing-masing kriteria :
Penyusunan Tree Awal
Penentuan Node berikutnya pada Berat Overweight
Kasus Soal 1 Waktu Paket Frekuensi Prioritas Kondisi Pendek Besar Sedang Rendah Gangguan Kecil Tinggi Panjang Normal
Pertanyaan: Buat Decision Tree Dan tentukan rule keputusannya dari kasus tersebut
Kasus Soal2
Pertanyaan: Buat Decision Tree Dan tentukan rule keputusannya dari kasus tersebut Apakah Prediksinya jika diketahui: Seorang wanita muda yang merokok tetapi tidak berolah raga?