Presentasi sedang didownload. Silahkan tunggu

Presentasi sedang didownload. Silahkan tunggu

PEMBUATAN POHON KEPUTUSAN

Presentasi serupa


Presentasi berjudul: "PEMBUATAN POHON KEPUTUSAN"— Transcript presentasi:

1 PEMBUATAN POHON KEPUTUSAN
PERBANDINGAN METODE DISKRETISASI DATA PARTISI INTUITIF DAN CLUSTERING TERHADAP PEMBUATAN POHON KEPUTUSAN Disusun Oleh : Liesca Levy S (G ) Pembimbing : Imas S. Sitanggang, S.Si, M.Kom

2 Pendahuluan Pendahuluan Tinjauan Pustaka Metode Penelitian
Hasil dan pembahasan Kesimpulan

3 Pendahuluan Latar Belakang
Teknologi komputasi dan pengumpulan data semakin berkembang  jumlah data tidak sedikit dari berbagai bidang  belum ada teknologi untuk menggali informasi dalam data tersebut  konsep Data mining Tahapan praproses data  data sesuai dengan Data Mining Diskretisasi atribut sebagai salah satu tahapan praproses data

4 Tujuan Menerapkan teknik partisi intuitif dan clustering dengan algoritme K-Means dalam diskretisasi atribut Menerapkan hasil diskretisasi pada teknik klasifikasi dengan metode pohon keputusan menggunakan algoritme ID3 Membandingkan pohon keputusan yang dihasilkan

5 Ruang Lingkup Pohon keputusan dibuat menggunakan algoritme ID3 yang tersedia dalam perangkat lunak WEKA (Waikato Environment for Knowledge Analysis) Data yang digunakan  data tanaman padi dari tahun

6 Tinjauan Pustaka Data Mining menurut (Han & Kamber 2006) merupakan proses ekstraksi informasi data berukuran besar. Praproses Data teknik untuk memperbaiki kualitas data. Tahapan praproses data Pembersihan data Integrasi data Transformasi data Reduksi data

7 Tinjauan Pustaka (lanjutan)
Diskretisasi menurut (Han & Kamber 2006) adalah teknik untuk mengurangi jumlah nilai pada atribut yang diberikan. Metode diskretisasi Binning Analisis histogram Diskretisasi berbasis entropy X2-merging Analisis cluster Partisi intuitif

8 Tinjauan pustaka (Lanjutan)
Partisi Intuitif Metode diskretisasi yang membagi range menjadi interval yang cukup seragam dengan aturan Algoritme K-Means K-Means membagi data menjadi beberapa cluster. Setiap cluster memiliki centroid, dan nilai dimasukkan ke dalam cluster yang dekat dengan centroid. Algoritme K-Means (Tan et al 2005) Select K points as the initial centroids Repeat From K cluster by assigning all points to the closest centroids Recomputed the centroids of each cluster Until the centroids don’t change

9 Tinjauan Pustaka (lanjutan)
Pohon Keputusan Merupakan salah satu metode classification yang paling populer dan paling banyak digunakan dalam data mining. Alur kerja decision tree: Konstruksi pohonpembentukan akarmembagi data berdasar atributdaun (sebagai label atau kelas) Pemangkasan pohon identifikasi dan membuang cabang yang tidak diperlukan Pembentukan aturan keputusan

10 Tinjauan Pustaka (lanjutan)
Root Means Square Error (RMSE) Salah satu standar pengukuran performa dari nilai perkiraan kuantitatif Cross Validation Metode evaluasi kinerja classifier data dipartisi ke dalam dua subset yang berukuran sama. Pilih satu dari kedua subset tersebut untuk training dan satu lagi untuk testing lakukan pertukaran fungsisubset yang sebelumnya training set menjadi test set demikian sebaliknya

11 Tinjauan Pustaka (lanjutan)
Algoritma ID3 Algoritme Pembentuk pohon keputusan dengan metode divide and conquer data secara rekursif dari atas ke bawah. Pohon dimulai sebagai node tunggal (akar/root) sebagai representasi semua data. Data pada node akar diukur dengan information gain untuk memilih atribut pembagi Pohon dimulai sebagai node tunggal (akar/root) sebagai representasi semua data. Data pada node akar diukur dengan information gain untuk memilih atribut pembagi

12 Metode Penelitian Proses Dasar Sistem

13 Metode Penelitian (lanjutan)
Pemilihan Data Praproses Data Pembentukan Pohon Keputusan

14 Hasil dan Pembahasan Pemilihan Data
Dari Tanaman Pangan dan Hortikultura dipilih data tanaman Padi. Tanaman pangan dan Hortikultura =32384 recordTanaman pangan = 6021 recordTanaman Padi =1016 record Pembersihan data dan integrasi datatelah dilakukan peneliti sebelumnya (Purnamasari, 2006) Diskretisasi data menggunakan 2 metode Partisi intuitif K-Means clustering dengan jumlah cluster 4 dan 5 cluster

15 Hasil dan Pembahasan (lanjutan)
Kelas Interval P1 P2 P3 P4 P5 P6 P7 P8 P9 P10 P11 Hasil diskretisasi menggunakan metode partisi intuitif untuk atribut produksi

16 Hasil dan Pembahasan (lanjutan)
Hasil diskretisasi menggunakan metode partisi intuitif untuk atribut luas_panen Kelas Interval (Dalam Ha) L1 L2 L3 L4 L5 L6 L7 L8 Kelas Interval (Dalam Ha) L9 L10 L11 L12 L13 L14 L15 L16

17 Hasil dan Pembahasan (lanjutan)
Hasil diskretisasi menggunakan Algoritme K-Means dengan 4 cluster untuk atribut produksi Hasil diskretisasi menggunakan Algoritme K-Means dengan 4 cluster untuk atribut luas_panen cluster Interval (dalam Ton) 3 1 4 2 cluster Interval (dalam Ha) 1 2 4 3

18 Hasil dan Pembahasan (lanjutan)
Hasil diskretisasi menggunakan Algoritme K-Means dengan 5 cluster untuk atribut produksi Hasil diskretisasi menggunakan Algoritme K-Means dengan 5 cluster untuk atribut luas_panen cluster Interval (dalam Ha) 3 2 1 4 5 cluster Interval (dalam Ha) 1 2 3 4 5

19 Hasil dan Pembahasan (lanjutan)
Partisi intuitif Algoritme K-Means dengan 4 cluster Algortime k-means dengan 5 cluster

20 Hasil dan Pembahasan (lanjutan)
Contoh aturan yang terbentuk If lokasi = Bali then produksi =P1 If lokasi = Bangka_Belitung then produksi = P1 If lokasi = Banten then produksi =P2 If lokasi = Jawa_Barat and luas_panen =L3 then produksi = P5 If lokasi= Jawa_Barat and luas_panen = L2 then produksi = P3 If lokasi = Jawa_Timur then produksi = P5 Algoritme K-Means clustering dengan jumlah cluster 4 If lokasi = Bali then produksi = P3 If lokasi = Bangka_Belitung then produksi = P3 If lokasi = Banten then produksi = P4 If lokasi = Jawa_Barat and luas_panen =L3 then produksi = P2 If lokasi = Jawa Barat and luas_panen = L2 then produksi = null If lokasi = Jawa_Timur then produksi = P2

21 Hasil dan Pembahasan (lanjutan)
Algoritme K-Means clustering dengan jumlah cluster 5 If lokasi = Bali then produksi = P2 If lokasi = Bangka_Belitung then produksi = P3 If lokasi= Banten then produksi = P1 If lokasi= Jawa_Barat and luas_panen = L3 then produksi = null If lokasi = Jawa_Barat and luas_panen = L2 then produksi =null If lokasi = Jawa_Timur then produksi = P4

22 Hasil dan Pembahasan (lanjutan)
Partisi intuitif Algoritme K- Means 4 Cluster 5 Cluster Jumlah klasifikasi benar 915 888 781 Jumlah klasifikasi salah 98 127 234 Root Means Square Error 0.11 0.20 0.24 Jumlah Aturan yang terbentuk 35 37 38 Perbandingan hasil pohon keputusan dengan metode partisi intuitif dan Algoritme K-Means

23 Hasil dan pembahasan (lanjutan)
Akurasi pohon keputusan menggunakan metode partisi intuitif mencapai 90,06% , sedangkan akurasi metode clustering dengan algoritme K-Means sebesar 87,40% untuk jumlah cluster 4 dan 76,87% untuk jumlah cluster 5. Nilai Root Mean Square Error (RMSE) yang diperoleh dari hasil perhitungan WEKA untuk metode partisi intuitif sebesar 0.11 sedangkan untuk algoritme K-Means sebesar 0.2 untuk jumlah cluster 4 dan 0.24 untuk algoritme K-Means dengan jumlah cluster 5. Jumlah aturan yang dihasilkan oleh pohon keputusan dengan metode partisi intuitif sebesar 35, metode K-Means clustering dengan jumlah cluster 4 sebesar 37 dan K-Means clustering dengan jumlah cluster 5 sebesar 38.

24 Kesimpulan Berdasarkan hasil perhitungan akurasi pohon kepyutusan, nilai rmse, dan jumlah aturan yang terbentuk, secara umum dapat dismpulkan bahwa diskretisai menggunakan metode partisi intuitif menhasilkan pohon keputusan yang lebih baik dibandingkan dengan algortime K-Means clustering

25 Daftar Pustaka Au, W. H., Chan, K. C. C Classification with Degree of Membership : A Fuzzy Approach. Hasil ICDM’01 Han J dan Kamber Data Mining: Concepts and Techniques. Simon Fraser University. USA: Morgan Kaufman Publisher Kantardzic M Data Mining : Concept, Models, Methods, and Algorithms. USA: Wiley Interscience Purnamasari, Y Penerapan Teknik Klasifikasi Dengan Algoritme Decision Tree Untuk Data Tanaman Pangan dan Hortikultura [Skripsi]. Bogor: Fakultas Matematika dan Ilmu Pengetahuan Alam, Institut Pertanian Bogor. Quinlan, R. The ID3 Algorithm [17 Juli 2008]. Tan PN, Kumar V, Steinbach M Introduction To Data Mining. Addison Wesley Publisher


Download ppt "PEMBUATAN POHON KEPUTUSAN"

Presentasi serupa


Iklan oleh Google