Pertemuan 10
Pohon keputusan
Decision Tree sederhana ©Tom Mitchell, McGraw Hill, 1997
Representasi internal node = attribute test Branch/cabang = attribute value leaf /daun node = classification ©Tom Mitchell, McGraw Hill, 1997
Contoh Decision Tree
Induksi Top-Down pada Decision Trees Pembagian rekursif Temukan atribut uji “terbaik” untuk dijadikan akar (root) Bagi data berdasarkan akar uji Temukan atribut uji “terbaik” untuk dijadikan node baru Bagi data uji berdasarkan node baru Ulangi hingga: Setiap node murni (memiliki hasil pasti) Setiap node memiliki jumlah jalur all < k distribusi node tidak lagi memiliki kemungkinan Pohon mencapai kedalaman maksimum (max depth) yang ditentukan Atribut uji habis
Measures of Node Impurity Gini Index Entropy Misclassification error
Tipe atribut Boolean Nominal Ordinal / skala Integer Continuous Sort berdasarkan value, kemudian temukan threshold terbaik untuk binary split Cluster kelompokkan ke dalam interval n dan lakukan n-way split
Keunggulan Decision Trees Relatif cepat baik dengan data sets besar dan banyak atribut Pohon berukuran kecil-menengah biasanya dapat dimengerti Dapat dikonversi menjadi aturan Melakukan feature selection sering menghasilkan model yang ringkas
Intelligible Decision Trees
Tidak semua Decision Trees Intelligible
Perkiraan pohon probabilitas Small Tree Daunnya sedikit Probabilitas diskrit sedikit Large Tree Daunnya banyak Setiap daun memiliki beberapa kasus perkiraan probabilitas berdasarkan sampel kecil / noisy
Kelemahan Decision Trees Pohon yang besar atau kompleks sering kali sulit dimengerti Semakin banyak atribut, semakin buruk hasil DT Kurang optimum dalam prediksi menggunakan continuous values Mudah terjadi out of data pada saat Recursive partitioning
Popular Decision Tree Packages ID3 (ID4, ID5, …) [Quinlan] CART: Classification and Regression Trees [Breiman] Populer untuk orang diluar bidang machine learning C4.5 (C5.0) [Quinlan] Populer untuk orang dibidang machine learning IND (INDuce) [Buntine]
Kapan menggunakan Decision Trees Regresi tidak dapat digunakan Model intelligibility dianggap penting Masalah tidak tergantung pada banyak fitur Kecepatan pembelajaran dianggap penting Kombinasi Linear dari fitur tidak dianggap penting training sets medium ke besar
Hierarchy Plus Input-Process-Output (HIPO)
PENGERTIAN HIPO (Hierarchy plus Input-Proses-Output) merupakan alat dokumentasi program yang berdasarkan fungsinya untuk meningkatkan efesiensi usaha perawatan program. Tapi sekarang HIPO juga banyak digunakan sebagai alat desain dan teknik dokumentasi dalam siklus pengembangan sistem.
TUJUAN HIPO Untuk struktur yang memungkinkan fungsi suatu sistem dapat dimengerti. untuk menggambarkan suatu struktur bertingkat guna memahami fungsi- fungsi dari modul-modul suatu sistem untuk menggambarkan modul-modul yang harus diselesaikan oleh pemrogram. menyediakan penjelasan yang lengkap dari input yang akan digunakan, proses yang akan dilakukan serta output yang diinginkan. tidak dipakai untuk menunjukkan instruksi-instruksi program yang akan digunakan
H.I.P.O Chart Keunggulan Kelemahan Memperlihatkan hubungan fungsional Tidak menunjukkan non-functional requirements
JENIS-JENIS DIAGRAM DALAM PAKET HIPO Daftar isi visual/ Visual Table of Contents (VTOC), yang terdiri dari satu diagram hirarki atau lebih. Diagram Ringkasan/ Overview Diagram yaitu suatu seri diagram fungsional. Masing-masing diagram dihubungkan dengan salah satu fungsi sistem. Diagram Rinci/ Detail Diagram yaitu suatu seri dagram fungsional dan masing-masing diagram dihubungkan dengan sebuah sub-fungsi sistem.
Daftar isi vizual/ Visual Tabel of Contens (VTOC) VTOC menggambarkan seluruh program HIPO baik rinci maupun ringkasan yang terstruktur. Pada diagram ini nama dan nomor dari program HIPO diidentifikasikan. Struktur paket diagram dan hubungan fungsi juga diidentifikasikan dalam bentuk hierarki.
Visual Tabel of Contens (VTOC)
Diagram Ringkasan/ Overview Diagram Overview diagram menggambarkan fungsi dan referensi utama dari suatu sistem. Fungsi dan referensi ini diperlukan oleh program untuk memperluas fungsi sampai uraian yang terkecil. Diagram ini berisi input, proses, output dari fungsi khusus.
Overview Diagram
Overview Diagram
Diagram Rinci/ Detail Diagram Diagram rinci merupakan diagram yang paling rendah yang terdapat dalam paket HIPO. Diagram rinci berisi unsur-unsur paket dasar. Fungsi dari diagram ini adalah menjelaskan fungsi-fungsi khusus, menunjukkan item-item output dan input yang khusus dan menunjukkan diagram rinci lainnya.
Diagram Rinci
Diagram Rinci