Upload presentasi
Presentasi sedang didownload. Silahkan tunggu
Diterbitkan olehSiska Hermanto Telah diubah "7 tahun yang lalu
1
Pembuatan Spatial Decision Tree Menggunakan Algoritme NBTree untuk Persebaran Hotspot di Provinsi Riau Pritasari Palupiningsih G Pembimbing : Imas S. Sitanggang, S.Si, M.Kom Sony Hartono Wijaya, S.Kom, M.Kom Departemen Ilmu Komputer Institut Pertanian Bogor 2009
2
Pendahuluan Kebakaran hutan merupakan salah satu persoalan lingkungan yang muncul hampir setiap tahun di Indonesia termasuk di pulau Kalimantan. Padahal, dampak yang ditimbulkan dari kebakaran hutan sangat merugikan. Apabila peristiwa ini bisa mendapat pencegahan atau penanggulangan yang baik , kuantitas dampak yang ditimbulkan dampak dikurangi. Salah satunya bentuk pencegahan itu dengan deteksi hotspot. Persebaran hotspot merupakan informasi yang dapat digunakan untuk pencegahan dan analisis terjadinya kebakaran hutan dan lahan. Data persebaran hotspot dapat digunakan untuk deteksi dini kebakaran hutan Akan tetapi, sampai saat ini data persebaran hotspot tersebut hanya disimpan dan tidak dilakukan proses pengolahan. Sedikit sekali informasi yang dapat diperoleh dari penumpukan data tersebut Sehingga dibutuhkan suatu teknik untuk melakukan pengolahan dan analisis terhadap data persebaran hotspot untuk menggali informasi yang terkandung dalam data tersebut. Salah satu teknik dalam spatial data mining adalah spatial decission tree. Spatial decission tree akan membangun sebuah decision tree dari data spasial yang dapat digunakan untuk membentuk aturan-aturan klasifikasi. Salah satu metode pembentukan spatial decision tree adalah dengan menghitung spatial relationships antar objek untuk setiap atribut. Kemudian spatial relationships tersebut diperlakukan seperti atribut biasa. Sehingga algoritma pembentukan decision tree konvensional dapat diterapkan untuk membangun spatial decision tree.
3
Latar Belakang Terjadinya kebakaran hutan di Provinsi Riau setiap tahun Persebaran hotspot dapat digunakan untuk deteksi dini kebakaran hutan Analisis data persebaran hotspot dengan spatial decision tree Kebakaran hutan merupakan salah satu persoalan lingkungan yang muncul hampir setiap tahun di Indonesia termasuk di pulau Kalimantan. Padahal, dampak yang ditimbulkan dari kebakaran hutan sangat merugikan. Apabila peristiwa ini bisa mendapat pencegahan atau penanggulangan yang baik , kuantitas dampak yang ditimbulkan dampak dikurangi. Salah satunya bentuk pencegahan itu dengan deteksi hotspot. Persebaran hotspot merupakan informasi yang dapat digunakan untuk pencegahan dan analisis terjadinya kebakaran hutan dan lahan. Data persebaran hotspot dapat digunakan untuk deteksi dini kebakaran hutan Akan tetapi, sampai saat ini data persebaran hotspot tersebut hanya disimpan dan tidak dilakukan proses pengolahan. Sedikit sekali informasi yang dapat diperoleh dari penumpukan data tersebut Sehingga dibutuhkan suatu teknik untuk melakukan pengolahan dan analisis terhadap data persebaran hotspot untuk menggali informasi yang terkandung dalam data tersebut. Salah satu teknik dalam spatial data mining adalah spatial decission tree. Spatial decission tree akan membangun sebuah decision tree dari data spasial yang dapat digunakan untuk membentuk aturan-aturan klasifikasi. Salah satu metode pembentukan spatial decision tree adalah dengan menghitung spatial relationships antar objek untuk setiap atribut. Kemudian spatial relationships tersebut diperlakukan seperti atribut biasa. Sehingga algoritma pembentukan decision tree konvensional dapat diterapkan untuk membangun spatial decision tree. Penghitungan hubungan spasial dan memperlakukannya sebagai atribut biasa Algoritme pembentukan decision tree konvensional
4
Tujuan Membentuk sebuah model klasifikasi yang dapat digunakan untuk memprediksi jumlah titik panas (hotspot) di suatu wilayah dengan mempertimbangkan hubungan antara jumlah hotspot di suatu daerah dengan data spasial (HPH, HTI, TGHK, Land system). Penelitian ini juga bertujuan untuk melihat karakteristik suatu wilayah tempat terjadinya hotspot. Kebakaran hutan merupakan salah satu persoalan lingkungan yang muncul hampir setiap tahun di Indonesia termasuk di pulau Kalimantan. Padahal, dampak yang ditimbulkan dari kebakaran hutan sangat merugikan. Apabila peristiwa ini bisa mendapat pencegahan atau penanggulangan yang baik , kuantitas dampak yang ditimbulkan dampak dikurangi. Salah satunya bentuk pencegahan itu dengan deteksi hotspot. Persebaran hotspot merupakan informasi yang dapat digunakan untuk pencegahan dan analisis terjadinya kebakaran hutan dan lahan. Data persebaran hotspot dapat digunakan untuk deteksi dini kebakaran hutan Akan tetapi, sampai saat ini data persebaran hotspot tersebut hanya disimpan dan tidak dilakukan proses pengolahan. Sedikit sekali informasi yang dapat diperoleh dari penumpukan data tersebut Sehingga dibutuhkan suatu teknik untuk melakukan pengolahan dan analisis terhadap data persebaran hotspot untuk menggali informasi yang terkandung dalam data tersebut. Salah satu teknik dalam spatial data mining adalah spatial decission tree. Spatial decission tree akan membangun sebuah decision tree dari data spasial yang dapat digunakan untuk membentuk aturan-aturan klasifikasi. Salah satu metode pembentukan spatial decision tree adalah dengan menghitung spatial relationships antar objek untuk setiap atribut. Kemudian spatial relationships tersebut diperlakukan seperti atribut biasa. Sehingga algoritma pembentukan decision tree konvensional dapat diterapkan untuk membangun spatial decision tree.
5
Ruang Lingkup Pembentukan spatial decision tree untuk
data persebaran hotspot di wilayah Provinsi Riau pada tahun 2005 Kebakaran hutan merupakan salah satu persoalan lingkungan yang muncul hampir setiap tahun di Indonesia termasuk di pulau Kalimantan. Padahal, dampak yang ditimbulkan dari kebakaran hutan sangat merugikan. Apabila peristiwa ini bisa mendapat pencegahan atau penanggulangan yang baik , kuantitas dampak yang ditimbulkan dampak dikurangi. Salah satunya bentuk pencegahan itu dengan deteksi hotspot. Persebaran hotspot merupakan informasi yang dapat digunakan untuk pencegahan dan analisis terjadinya kebakaran hutan dan lahan. Data persebaran hotspot dapat digunakan untuk deteksi dini kebakaran hutan Akan tetapi, sampai saat ini data persebaran hotspot tersebut hanya disimpan dan tidak dilakukan proses pengolahan. Sedikit sekali informasi yang dapat diperoleh dari penumpukan data tersebut Sehingga dibutuhkan suatu teknik untuk melakukan pengolahan dan analisis terhadap data persebaran hotspot untuk menggali informasi yang terkandung dalam data tersebut. Salah satu teknik dalam spatial data mining adalah spatial decission tree. Spatial decission tree akan membangun sebuah decision tree dari data spasial yang dapat digunakan untuk membentuk aturan-aturan klasifikasi. Salah satu metode pembentukan spatial decision tree adalah dengan menghitung spatial relationships antar objek untuk setiap atribut. Kemudian spatial relationships tersebut diperlakukan seperti atribut biasa. Sehingga algoritma pembentukan decision tree konvensional dapat diterapkan untuk membangun spatial decision tree.
6
Tinjauan Pustaka
7
Data Spasial & Operasi Spasial
Model dari data spasial dibedakan menjadi 2 kategori, yaitu field dan object. Pada data model object, hubungan antarobject ditentukan oleh posisi object tersebut dalam ruang. Contain Overlap Inside (Shekhar & Chawla 2003)
8
Spatial Join Index Hubungan spasial merupakan suatu hubungan atau asosiasi dari properti lingkungan geografis. Spatial join index merupakan sebuah tabel tambahan yang menjadi acuan dalam mempertemukan objek dari layer thematic R dengan S dan menyimpan nilai hubungan spasial keduanya. (Chelgoum et al 2002)
9
Spatial Join Index (Chelghoum & Zeitouni 2004)
Operator Complete Penggunaan operator COMPLETE diperlukan untuk mengatur kembali data spatial join index ke dalam sebuah tabel yang unik tanpa adanya duplikasi data objek. Objek 1 Objek 2 Spatial Join Index COMPLETE (R, V, I, {Max}) Spatial Join Index (Chelghoum & Zeitouni 2004)
10
Algoritme NBTree Algoritme NBTree merupakan algoritme hasil penggabungan teknik decision tree classifier dengan naïve-bayes classifier. Algoritme ini akan membangun decision tree dengan node yang mengandung univariate split seperti decision tree biasa, tetapi pada node leaf terkandung naïve-bayes classifier . (Kohavi 1996)
11
Algoritme NBTree For each attribute Xi , evaluate the utility, μXi, of a split on attribute Xi. For continuous attributes, a threshold is also found at this stage. Let j= arg maxi (μi), i.e, the attribute with the highest utility. If μj is not significantly better than the utility of the current node, create a Naïve-Bayes classifier for the current node and return. Partition T according to the test on Xj . If Xj is continuous, a threshold split is made for all possible values. For each child, call the algorithm recursively on the portion of T that matches the test leading to the child. (Kohavi 1996)
12
Metode penelitian
13
Metode Penelitian (Tahap Penelitian)
14
Tahapan Praproses Penggabungan tabel spatial join index
Pemilihan data Record data persebaran hotspot yang terjadi di provinsi Riau Seleksi atribut Memilih atribut dari setiap data untuk pembentukan spatial decision tree Penentuan hubungan spasial Operasi intersection antara data hotspot dengan data spasial lain Transformasi tipe file Penghitungan jumlah hotspot Penghitungan jumlah hotspot di tiap kecamatan Pembersihan data Mengisi nilai data yang kosong dengan “TIDAK ADA INFORMASI” Penyederhanaan tabel spatial join index Penyederhanaan menggunakan operator complete Penggabungan tabel spatial join index Penggabungan data Penggabungan data jumlah hotspot dan data provinsi Riau Transformasi data jumlah hotspot : Pengubahan format data menjadi kategori Clustering luas area menggunakan K-means Clustering hasil penyederhanaan tabel SJI Penambahan label kategori luas area atribut luas area diganti dengan kategori luas area
15
HASIL & PEMBAHASAN
16
Data Data persebaran hotspot Data land system
Data sebaran hak pengusahaan hutan (HPH) Data sebaran hutan tanaman industri (HTI) Data tata guna hutan kesepakatan (TGHK) Data provinsi Riau
17
Penggabungan Data Id Jumlah hotspot 1 9 2 14 … …. 79 ArcView
Atribut data provinsi Riau : Kecamatan Kabupaten Proviinsi Luas MI_Prinx Id ArcView Data jumlah hotspot Data provinsi Riau id Kecamatan Kabupaten Provinsi Luas Mi_Prinx Jumlah hotspot 1 Bangkinang Kampar Riau 9 2 Bangko Batam 14 … …. 79 Tandun Data Hotspot2005
18
Interval jumlah hotspot
Penentuan Kelas Target Interval jumlah hotspot untuk setiap kelas Kelas Interval jumlah hotspot Tidak ada hotspot Sedikit 1-323 Sedang Banyak Banyak sekali Pengelompokkan jumlah hotspot ini digunakan untuk menentukan kelas dari setiap record. Kecamatan ….. Jumlah hotspot Bangkinang 9 Batam Barat 4 … …. Kubu 553 Tandun …... Kecamatan …… Kelas Bangkinang ….. Sedikit Batam Barat … …. Kubu Sedang Tandun Tdk ada hotspot
19
Penentuan Hubungan Spasial Menggunakan Operasi Intersection
Peta hotspot Peta TGHK Peta hotspot - TGHK
20
Penentuan Hubungan Spasial Menggunakan Operasi Intersection
Id_hotspot Hubungan spasial Id_tghk Luas area H1 overlap T325 87,05 T807 53,69 Id_hotspot Hubungan spasial Id_tghk Luas area H1 overlap T325 87,05 Id_hotspot Hubungan spasial Id_tghk Luas area H1 overlap T325 87,05 T807 53,69 … …. contain T853 1,22 ….. Id_hotspot Hubungan spasial Id_hph Luas area Peta hotspot - TGHK Spatial join index
21
luas area yang memiliki TGHK luas area yang tumpang tindih dengan TGHK
Penyederhanaan Tabel Spatial Join Index Id_hotspot Hubungan spasial Id_tghk Luas area Jenis tghk H1 overlap T325 87,05 HPK T807 53,69 T840 403,42 contain T853 1,22 T889 387,20 HPT Jumlah luas area jenis TGHK : 544,16 COMPLETE Id_hotspot luas area yang memiliki TGHK Jenis TGHK luas area yang tumpang tindih dengan TGHK H1 1.22 (HPK) 544,16
22
Clustering Luas Area Menggunakan K-means Kelompok Persentase luas area
Kate gori Persentase rasio luas area Jenis TGHK HPT1 0,003% - 24,85% Hutan Produksi Terbatas (HPT) HPT2 28,47% - 58,70% HPT3 65,71% - 91,94% HPK1 0,09% - 19,69% Hutan Produksi Yang Dapat Di Konvesi (HPK) HPK2 34,22% - 59,42% HPK3 64,75%-98,44% Kelompok Persentase luas area 1 0,004% - 27,16% 2 27,97% - 59,42% 3 60,28% - 98,44% Hasil Clustering Kategori luas area TGHK
23
Penambahan Label Cluster (Kategori) Luas Area
id_ hot spot luas area yang memiliki TGHK (%) Jenis TGHK luas area yang tumpang tindih dengan TGHK (%) H1 0.13 HPK 48.31 H2 18.08 HPT 76.60 H3 34.52 49.69 H4 null 45.82 id_ hot spot Kategori luas area yang memiliki TGHK Kategori luas area yang tumpang tindih dengan TGHK H1 HPK1 HPK2 H2 HPT1 HPT3 H3 HPT2 H4 null Tabel Spatial Join Index (Kategori) Tabel Spatial Join Index
24
Penggabungan Tabel Spatial Join Index Tabel SJI Tabel SJI Hotspot-HPH
Hotspot-HTI Tabel SJI Hotspot-TGHK Tabel SJI Hotspot-Landsys id_ hot spot Kategori luas area HPH Kategori luas area yang memiliki HTI Kategori luas area yang tumpang tindih dengan HTI Kategori luas area yang memiliki TGHK Kategori luas area yang tumpang tindih dengan TGHK Kategori luas area yang memiliki Landsys Kategori luas area yang tumpang tindih dengan Landsys Kelas H1 null HTI1 HPK1 HPK2 SAR1 MBI1 sedikit H4 HPH2 MDW2 tdk ada hotspot H23 HPH1 P1 HPT2 BPD1 H25 HSA1 HP3 KHY1 banyak
25
Spatial Decision Tree JIKA area tidak mengandung wilayah HTI DAN terdapat 0,01% - 27,16% area tumpang tindih dengan wilayah HTI MAKA penentuan kelas dapat dihitung menggunakan model naïve bayes 19.
26
Spatial Decision Tree Model Naïve Bayes Class sedikit:
Prior probability = 0.75 HPH: Discrete Estimator. Counts = (Total = 23) ContainHTI: Discrete Estimator. Counts = (Total = 22) OverlapHTI: Discrete Estimator. Counts = (Total = 22) ContainTGHK: Discrete Estimator. Counts = (Total = 34) OverlapTGHK: Discrete Estimator. Counts = (Total = 33) ContainLandsys: Discrete Estimator.Counts= (Total = 52) OverlapLandsys: Discrete Estimator. Counts = (Total = 48)
27
Spatial Decision Tree Penghitungan peluang record H1 termasuk ke dalam kelas Sedikit Peluang H1 termasuk ke dalam setiap kelas Kelas P (kelas | H1) TidakAdaHotspot 1,4 x 10-14 Sedikit 5,7 x 10-5 Sedang 5,4 x 10-16 Banyak 1,6 x 10-18 BanyakSekali 5 x 10-16
28
Akurasi Confussion Matrix
Kelas yang diprediksi Kelas = Tidak ada hotspot Kelas = sedikit Kelas = sedang Kelas = banyak Kelas = banyak sekali Kelas Aktual 18 8 11 36 4 1 Akurasi = Banyaknya prediksi yang benar Total banyaknya prediksi = 79 = 0,6835 Akurasi yang diperoleh = 68,35% > threshold
29
Peluang record termasuk ke dalam kelas
Penggunaan Model Klasifikasi Pada Data Baru Nilai Atribut ID HPH ContainHTI OverlapHTI ContainTGHK OverlapTGHK ContainLandsys OverlapLandsys X1 null APL1 HPT2 KHY3 LWW1 Record X1 Aturan yang sesuai untuk record X1 adalah aturan 15. Sehingga model naive bayes yang digunakan adalah model naïve bayes 14. id Peluang record termasuk ke dalam kelas TidakAda Hotspot Sedikit Sedang Banyak Banyak Sekali X1 4,9 x10-10 7,1 x10-15 7,1 x10- 15
30
Kesimpulan & saran
31
Kesimpulan Telah terbentuk model klasifikasi spasial untuk persebaran hotspot yang memiliki 17 aturan klasifikasi dengan akurasi 68,35%. Jumlah hotspot di suatu wilayah dapat dideskripsikan oleh atribut hak pengusahaan hutan (HPH), hutan tanaman industry (HTI), dan tata guna hutan kesepakatan (TGHK). Penggunaan tabel spatial join index dan operator Complete dalam menentukan hubungan spasial dapat diterapkan dalam membentuk spatial decision tree dengan menggunakan algoritme klasifikasi konvensional.
32
Saran Untuk memodelkan persebaran hotspot, diperlukan data set dengan jumlah yang berimbang untuk setiap kategori jumlah hotspot. Perlu dibuat aplikasi komputer untuk mengimplementasikan proses penggunaan operator Complete, terutama untuk mengelola data spasial yang berukuran besar.
33
Daftar Pustaka Chelghoum N, Zeitouni K Spatial Data Mining – Alternative and Performance. Versailles : Prims Laboratory University of Versailles. Chelghoum N, Zeitouni K, Boulmakoul A A Decision Tree for Multi-Layered Spatial Data. IEEE Han J, Kamber M Data Mining : Concepts and Techniques. San Francisco : Morgan Kaufman Publisher. Kohavi R Scaling Up the Accuracy of Naïve-Bayes Classifiers : a Decision-Tree Hybrid. AAAI. Shekhar S, Chawla S Spatial Database A Tour. New Jersey : Prentice Hall. Sukmawati A Hubungan Antara Curah Hujan Dengan Titik Panas (Hotspot) Sebagai Indikator Terjadinya Kebakaran Hutan Dan Lahan Di Kabupaten Pontianak Propinsi Kalimantan Barat [Skripsi]. Bogor. Program Studi Budidaya Hutan Fakultas Kehutanan Institut Pertanian Bogor.
34
Daftar Pustaka Tan P., Michael S., & Vipin K Introduction to Data mining. Boston : Pearson Education, Inc. Williams N, Zander S, & Armitage G Evaluating Machine Learning Algorithms for Automated Network Application Identification. Yonatan D Studi Sebaran Titik Panas (Hotspot) Sebagai Indikator Kebakaran Hutan Dan Lahan Di Propinsi Jambi Tahun [Skripsi]. Bogor. Program Studi Budidaya Hutan Fakultas Kehutanan Institut Pertanian Bogor. Zeitouni K, Chelghoum N Spatial Decision Tree – Application to Traffic Risk Analysis. IEEE.
35
Terima kasih
Presentasi serupa
© 2024 SlidePlayer.info Inc.
All rights reserved.