Presentasi sedang didownload. Silahkan tunggu

Presentasi sedang didownload. Silahkan tunggu

Oleh : Napthalena G Pembimbing : Imas S. Sitanggang, S.Si, M.Kom

Presentasi serupa


Presentasi berjudul: "Oleh : Napthalena G Pembimbing : Imas S. Sitanggang, S.Si, M.Kom"— Transcript presentasi:

1 Penerapan Spatial Decision Tree untuk Identifikasi Lahan Mangrove Menggunakan Algoritme C4.5
Oleh : Napthalena G Pembimbing : Imas S. Sitanggang, S.Si, M.Kom Sony H. Wijaya, S.Kom, M.Kom Departemen Ilmu Komputer Institut Pertanian Bogor

2 Outline Latar Belakang Tujuan Ruang Lingkup Tinjaun Pustaka Metode
Hasil dan Pembahasan Kesimpulan dan Saran Daftar Pustaka

3 Latar Belakang Manfaat hutan mangrove bagi kehidupan
Persebaran hutan mangrove yang tidak merata Membutuhkan analisis spasial untuk mengetahui deskripsi wilayah hutan mangrove

4 pertumbuhan mangrove yang tidak merata
c D mangrove A,B,C,D : Wilayah

5 Tujuan Menerapkan teknik klasifikasi pada data spasial mangrove menggunakan Algoritme C4.5. Membuat Spatial Classifier untuk mendeskripsikan wilayah yang memiliki lahan mangrove. Ruang Lingkup Data spasial wilayah Kabupaten Kutai Timur dan Kota Tarakan Metode yang digunakan adalah Algoritme C4.5

6 Tinjauan Pustaka

7 Data Spasial Merepresentasikan aspek-aspek keruangan dari fenomena yang terdapat di dunia nyata. Direpresentasikan di dalam basis data sebagai raster atau vektor. Model Vektor Model Raster (Prahasta 2001)

8 Data Spasial (lanjutan…)
Model informasi Spasial Field Object Hubungan Topological pada model object overlap inside contains (Sekhar & Chawla 2003)

9 Spatial Join Index Hubungan spasial bersifat implicit (tersembunyi) dan memerlukan banyak operasi spatial join. Metode untuk menyederhanakan proses ini menggunakan struktur yang disebut Spatial Join Index (SJI). SJI menghitung secara tepat hubungan spasial antara dua objek.

10 Spatial Join Index (lanjutan…)
(Zeitouni & Chelgoum 2004)

11 Operator Complete Mengatur kembali data di dalam tabel unik dari gabungan tiga tabel termasuk tabel SJI. Menghindari adanya duplikasi analisis objek (Chelgoum & Zeitouni 2004)

12 Algoritme C4.5 Pengembangan dari Algoritme ID3
Menggunakan konsep dari information gain untuk memilih pemisahan (split) yang optimal. Memilih split yang memiliki information gain terbesar . Algoritma C4.5 Build the decision tree form the training set (conventional ID3). Convert the resulting tree into an equivalent set of rules. The number of rules is equivalent to the number of possible paths from the root to a leaf node. Prune (generalize) each rule by removing preconditions that increase classification accuracy. Sort pruned rules by their accuracy, and use them in this order when classifying future test example (Larose 2005) (Quinlan 1993)

13 Confusion Matrix Evaluasi dari kinerja model didasarkan pada banyaknya (count) dari test record secara benar dan secara tidak benar oleh model. Count ini ditabulasikan ke dalam matrik. Predicted Class Class = 1 Class =0 Actual Class Class =1 f11 f10 f01 f00 Akurasi = banyaknya total prediksi yang benar Total banyaknya prediksi = f11 + f00 f11 +f10 +f01 +f00 (Tan et. Al 2006)

14 Metode

15 Tahapan

16 Data dan seleksi data Data spasial wilayah kabupaten Kutai Timur  42 wilayah kelurahan dan 39 objek spasial Data spasial wilayah kota tarakan  19 wilayah kelurahan dan 60 objek spasial Data yang terseleksi : Batas wilayah Kabupeten Kutai Timur Batas wilayah Kota Tarakan Data landuse Data topografi Data sungai Data lereng Data substrat Data tanah Data geologi Data geomorfologi

17 Praproses

18 Contoh SJI dan Operator Complete
Spatial Relationships ID2 Area R1 Inside C4 50 R2 Overlap C1 23 C2 40 C3 30 Contains C5 35 ID2 nama C1 belukar C2 hutan C3 C4 rumput C5 ID1 Nama R1 A R2 B Kelurahan Landuse Spatial Join Index

19 Spatial Relationships Spatial Relationships
Contoh SJI dan Operator Complete (lanjutan…) ID1 Spatial Relationships ID2 Area R1 Inside C4 50 R2 Overlap C1 23 C2 40 C3 30 Contains C5 35 ID2 nama C1 belukar C2 hutan C3 C4 rumput C5 ID1 Nama R1 A R2 B Kelurahan Spatial Join Index Landuse ID1 nama Spatial Relationships ID2 Nama Area R1 A Inside C4 rumput 50 R2 B Overlap C1 belukar 23 C2 hutan 40 C3 30 Contains C5 35

20 Contoh SJI dan Operator Complete (lanjutan…)
nama Spatial Relationships Nama Area R1 A Inside belukar 50 R2 B Overlap 53 Contains Hutan 40 hutan 35 %area= (area/area kelurahan) *100% COMPLETE ( aggregate= {Max} ) ID1 Nama …. % area yang beroverlap landuse jenis R1 A ….. bot contains R2 B 53 Belukar

21 Praproses (lanjutan…)
Penentuan dan pemberian label kategori Menggunakan teknik clustering, Algoritme K-means ID1 Nama …. % area yang beroverlap landuse jenis R1 A ….. Not contains R2 B 53 Belukar ID1 Nama …. Jenis landuse yang beroverlap R1 A ….. Ncl R2 B B1

22 Praproses (lanjutan…)
Penentuan kelas target - Menggunakan K-means - 3 cluster (sedikit, sedang, banyak) Penambahan atribut kelas

23 Pengembangan Sistem Perangkat Lunak Perangkat Keras ArcView 3.3
Processor Intel(R)pentium 4 CPU 3.06 Ghz Matlab 7.0 Memory 1280 MB RAM Weka 3.6.0 Mouse Microsoft Excell 2007 Keyboard

24 Hasil dan Pembahasan

25 Praproses Perhitungan luas area
didapatkan 61 wilayah kelurahan yang telah dihitung luas areanya dengan satuan m2 Penentuan hubungan spasial Objek spasial Hubungan spasial Jumlah record mangrove Contains, overlap 122 topografi Contains 227 Landuse 431 substrat Overlap 92 geologi Contains, inside, overlap 290 geomorfologi 477 lereng 296 tanah 352

26 Penentuan hubungan spasial (lanjutan…)
16 wilayah tidak memiliki topografi  0 12 wilayah menggunakan operasi buffer operasi buffer Wilayah yang menggunakan operasi buffer

27 Praproses (lanjutan…)
Penyederhanaan tabel SJI Luas area pada tabel SJI data mangrove dijumlahkan semua data yang memiliki 3 hubungan spasial  2 hubungan spasial (inside = tidak ada) jumlah record semua objek spasial masing-masing menjadi 61 record. Penentuan dan pemberian label kategori 406 data luas area (%) dikelompokkan ke dalam 3 cluster Hasil clustering luas area (%) Objek spasial Jumlah kategori Landuse 10 Substrat 6 Geomorfologi 14 Geologi 13 Lereng 4 Tanah 5 Cluster 1 Cluster 2 Cluster 3 0.01 – 30.16 30.87 – 70.75

28 Praproses (lanjutan..) Penentuan kelas target
Clustering rasio luas area Cluster 1 Cluster 2 Cluster 3 Interval (%) – 8.17 kelas sedikit sedang Banyak Kelas tidak sedikit sedang banyak Jumlah record 24 22 13 2

29 Praproses (lanjutan..) Atribut data latih Penggabungan tabel Atribut
Nama 1 Topografi 2 Sungai 3 Jenis landuse yang terkandung 4 Jenis landuse yang beroverlap 5 Jenis substrat yang beroverlap 6 Jenis geologi yang terkandung 7 Jenis geologi yang beroverlap 8 Jenis geomorfologi yang terkandung 9 Jenis geomorfologi yang beroverlap 10 Jenis lereng yang terkandung 11 Jenis lereng yang beroverlap 12 Jenis tanah yang terkandung 13 Jenis tanah yang beroverlap 14 Label kelas Atribut Tipe Topografi Numeric Sungai Landuse Kategori Geologi Geomorfologi susbtrat Lereng Tanah transformasi

30 Klasifikasi menggunakan Spatial Decision Tree
10-fold cross validation Algoritme J.48 Model yang dihasilkan Test atribut : co_lereng, ov_susbtrat, topografi dan co_landuse Menghasilkan 23 aturan Rules 1 : JIKA 0.01% % area memiliki lereng agak curam MAKA area tersebut TIDAK memiliki mangrove.

31 Contoh aturan Rules 2 : JIKA 0.01% % area memiliki lereng datar MAKA area tersebut memiliki mangrove dalam kelas SEDANG. Rules 3: JIKA area tidak memiliki lereng DAN 0.01% % area bertumpang tindih dengan substrat pasir DAN area memiliki ketinggian > 23 MAKA area tersebut memiliki mangrove dalam kelas SEDIKIT. Rules 4 : JIKA area tidak memiliki lereng DAN tidak memiliki area yang bertumpang tindih dengan substrat DAN 30.87% % area memiliki landuse belukar MAKA area tersebut TIDAK memiliki mangrove. Rules 5 : JIKA area tidak memiliki lereng DAN tidak memiliki area yang bertumpang tindih dengan substrat DAN 0.01% % area memiliki landuse pemukiman MAKA area tersebut memiliki mangrove dalam kelas SEDIKIT.

32 Akurasi classifier Kelas hasil prediksi Kelas aktual 20 3 1 6 13 4 K0
1 6 13 4 Kelas 0 : tidak Kelas 1 : sedikit Kelas 2 : sedang Kelas 3 : banyak Akurasi = banyaknya total prediksi yang benar Total banyaknya prediksi = 37/61 =

33 Penggunaan classifier pada data baru
Contoh data yang belum memiliki label kelas Record Id Topografi Substsrat beroverlap Landuse yang terkandung Lereng yang terkandung Kelas 1 30 ps1 h1 nclr ? 2 200 .. ncs b2 3 127 pm1 Keterangan : ps1 = pasir dengan area (0.01% %) ncs = area tidak memiliki substrat H1 = hutan dengan area (0.01% %) B2 = belukar dengan area (30.87% %) pm1 = pemukiman dengan area (0.01% %) Ncl = area tidak memiliki landuse nclr = area tidak memiliki lereng

34 Penggunaan classifier pada data baru (lanjutan..)
Pengisian label kelas record 1  Rules 3 dengan nilai test atribut tidak memiliki lereng (nclr), bertumpang tindih dengan substrat pasir (ps1), dan ketinggian wilayah > 23 (30). record 1label kelas sedikit. record 2  Rules 4 dengan nilai test atribut tidak memiliki lereng (nclr), tidak bertumpang tindih dengan substrat (ncs), dan memiliki landuse belukar (b2). record 2  label kelas tidak. record 3  Rules 5 dengan nilai test atribut tidak memiliki lereng (nclr), tidak bertumpang tindih dengan substrat (ncs), dan memiliki landuse pemukiman (pm1). record 3  label kelas sedikit.

35 Kesimpulan dan saran

36 Kesimpulan Terbentuknya spasial classifier yang terdiri dari 23 aturan dengan akurasi 60.66%. Dari penelitian ini kategori luas area mangrove dideskripsikan oleh area yang mengandung lereng, area yang beroverlap dengan substrat, topografi, dan area yang mengandung landuse. Penggunaan spatial join index dan operator complete dalam menentukan hubungan spasial antara objek spasial menghasilkan dataset yang dapat diolah menggunakan teknik klasifikasi konvensional.

37 Saran Untuk memodelkan area mangrove diperlukan keseimbangan dalam jumlah kelas target. Perlu dibuat aplikasi komputer untuk mengimplementasikan proses spatial join index dan operator complete, terutama untuk data spasial berukuran besar.

38 Daftar Pustaka Chelghoum N, Zeitouni K Spatial Data Mining Implementation : Alternatives and performance. Versailles. Prism Laboratory University of Versailles. Dahuri, R Keanekaragaman Hayati Laut : Aset Pembangunan Berkelanjutan Indonesia. Jakarta. PT Gramedia Indonesia Pustaka. Han J, Kamber M Data Mining Concepts and Techniques. San Diego, USA: Morgan-Kaufmann. Larose, T Daniel Discovering Knowledge In Data : An Introduction To Data Mining. New Jersey. Wiley-Interscience. Prahasta E Konsep-konsep Dasar Sistem Informasi Geografis. Bandung. Informatika. Quinlan, J.R C4.5: Programs For Machine Learning. San Mateo. CA: Morgan Kaufmann. Sekhar S, Chawla S Spatial Databases a Tour. New Jersey. Prentice Hall. Tan P, Michael S. dan Vipin K Introduction to Data Mining. Addison Wesley. Zeitouni K, Chelghoum N Spatial Decision Tree – Applications to Traffic Risk Analysis. IEEE International Conference on Computer Systems and Applications. Lebanon. Zeitouni K, Yeh L, Aufaure MA Join Indices as a Tool for Spatial Data Mining. International Workshop on Temporal, Spatial and Spatio-Temporal Data Mining, Lecture Notes in Artificial Intelligence, , 2007.

39 Terima Kasih


Download ppt "Oleh : Napthalena G Pembimbing : Imas S. Sitanggang, S.Si, M.Kom"

Presentasi serupa


Iklan oleh Google