Upload presentasi
Presentasi sedang didownload. Silahkan tunggu
Diterbitkan olehWidya Oesman Telah diubah "7 tahun yang lalu
1
VISUALISASI K-MEANS CLUSTERING DATA POTENSI PERTANIAN DESA MENGGUNAKAN MAPSERVER
Pembimbing: Henri Harianja G Imas S. Sitanggang, S.Si M.Kom Dr. Ir. Lailan Syaufina, M.Sc.
2
Visualisasi K-Means Clustering
Latar Belakang Indonesia merupakan negara agraris tetapi hasil pertanian belum mencukupi kebutuhan dalam negeri. BPS melakukan survei potensi desa. Data mining ekstraksi informasi dari data berukuran besar. Clustering salah satu metode data mining Visualisasi K-Means Clustering
3
Tujuan Menerapkan teknik clustering dengan menggunakan Algoritme K-Means pada data potensi pertanian desa. Memvisualisasikan hasil clustering dalam bentuk Sistem Informasi Geografis (SIG) berbasis web. Visualisasi K-Means Clustering
4
Visualisasi K-Means Clustering
Ruang Lingkup K-Means Clustering Visualisasi K-Means Clustering Kab. Bogor & Kota Bogor 2006
5
Manfaat Penelitian ini diharapkan dapat berguna bagi pihak-pihak yang membutuhkan informasi potensi pertanian pada level desa. Informasi yang didapatkan diharapkan dapat membantu dalam pembangunan sektor pertanian. Visualisasi K-Means Clustering
6
Tinjauan Pustaka Clustering K-Means Evaluasi Cluster Sistem Informasi Geografis (SIG) Potensi Desa Visualisasi K-Means Clustering
7
Clustering Secara umum, clustering merupakan proses pengelompokan kumpulan objek ke dalam cluster sehingga objek-objek dalam satu cluster memiliki kemiripan yang tinggi tetapi tidak mirip dengan objek cluster lain(Han & Kamber 2006). Visualisasi K-Means Clustering
8
Visualisasi K-Means Clustering
Algoritme K-Means Tentukan initial partition dengan k cluster berisi samples yang dipilih secara acak, hitung centroid dari tiap-tiap cluster. Bangkitkan partisi baru dengan assigning setiap sample terhadap pusat cluster terdekat. Hitung pusat-pusat cluster baru sebagai centroids dari clusters. Ulangi langkah 2 dan 3 sampai nilai optimum dari fungsi kriteria dipenuhi (atau sampai cluster membership stabil). Visualisasi K-Means Clustering
9
K-Means dievaluasi menggunakan total SSE.
Evaluasi cluster Prinsip: Meminimalkan jarak intra-cluster (cohesion) Memasksimalkan jarak inter-cluster (separation) Cohesion Total SSE (Sum of square error) Separation Total SSB (Group sum of squares) Total SSE + Total SSB = constant K-Means dievaluasi menggunakan total SSE. Visualisasi K-Means Clustering
10
Sistem Informasi Geografis (SIG)
Sistem berbasis komputer yang mempunyai kemampuan untuk menyimpan, menganalisis, melakukan query, dan menampilkan data geografis (Chang 2002). Bentuk data: Data spasial vektor dan raster Data atribut Visualisasi K-Means Clustering
11
Visualisasi K-Means Clustering
Potensi Desa Keterangan umum desa/kelurahan Kependudukan dan ketenagakerjaan Perumahan dan lingkungan hidup Pendidikan dan kesehatan Rekreasi, hiburan dan olahraga Penggunaan lahan Ekonomi dll Visualisasi K-Means Clustering
12
Metode Penelitian Preprocessing Data Mining Clustering Evaluasi Cluster Knowledge Presentation Visualisasi K-Means Clustering
13
Visualisasi K-Means Clustering
Preprocessing 494 record Data Podes Jawa Barat 2006 Data Podes Kab. Bogor & Kota Bogor 2006 Seleksi record 5808 record 443 atribut Visualisasi K-Means Clustering Data Potensi Pertanian Kab. Bogor & Kota Bogor 2006 Seleksi atribut 4 atribut
14
Visualisasi K-Means Clustering
Preprocessing Hasil seleksi atribut (saran Bapak Dr. Firdaus dari FEM IPB): Luas lahan sawah (Ha), selanjutnya disebut A. Luas lahan sawah berperairan yang diusahakan (Ha) selanjutnya disebut B. Luas lahan non pertanian (pemukiman / perumahan / pertokoan / perkantoran / industri dan lainnya) (Ha) selanjutnya disebut C. Ada atau tidaknya perusahaan perkebunan (Tidak digunakan dalam proses data mining) Visualisasi K-Means Clustering
15
Data Mining Percobaan clustering dilakukan untuk ukuran cluster 2 sampai 10. Untuk masing-masing ukuran cluster (k) dilakukan percobaan dengan random seed (s) 5, 10, 15, dan 20. Algoritme K-Means akan menghasilkan cluster centroid (means) untuk masing-masing cluster sesuai dengan ukuran cluster. Visualisasi K-Means Clustering
16
Cluster centroid untuk dan k=4 s=20 Visualisasi K-Means Clustering
Data Mining Cluster centroid untuk dan k=4 s=20 Cluster A B C 1 2 3 Visualisasi K-Means Clustering
17
Visualisasi K-Means Clustering
Evaluasi cluster Total SSE s = 5 s = 10 s = 15 s = 20 k = 2 k = 3 k = 4 k = 5 k = 6 k = 7 k = 8 k = 9 k = 10 Visualisasi K-Means Clustering
18
Evaluasi cluster Visualisasi K-Means Clustering
19
Visualisasi Clustering
Dibangun menggunakan MapServer sebagai web-server dan Chameleon sebagai framework. Memplotkan hasil clustering untuk k=2 sampai k=10 dengan total SSE terkecil berdasarkan Tabel total SSE. Visualisasi K-Means Clustering
20
Design Interface Visualisasi K-Means Clustering
21
Knowledge Presentation
Plot cluster terhadap atribut A <Luas lahan sawah (Ha)> Visualisasi K-Means Clustering
22
Knowledge Presentation
Plot cluster terhadap atribut B <Luas lahan sawah berperairan yang diusahakan (Ha)> Visualisasi K-Means Clustering
23
Knowledge Presentation
Plot atribut A terhadap atribut B Visualisasi K-Means Clustering A (Luas lahan sawah) B (Luas lahan sawah yang diusahakan)
24
Knowledge Presentation
Plot cluster terhadap atribut C <Luas lahan non-pertanian(Ha)> Visualisasi K-Means Clustering
25
Knowledge Presentation
A: <Luas lahan sawah(Ha)> B: <Luas lahan sawah berperairan yang diusahakan (Ha)> C: <Luas lahan non-pertanian(Ha)> Visualisasi K-Means Clustering Plot cluster terhadap atribut A,B,C
26
Knowledge Presentation
Plot k=4 s=20 Visualisasi K-Means Clustering Cluster A B C 1 2 3
27
Kesimpulan Clustering terbaik diperoleh pada k=4 dan s=20 dengan total SSE= dan penyebaran anggota tidak merata. Sebagai alat bantu visualisasi, hasil clustering diplotkan dengan melibatkan aspek spasialnya dalam bentuk sistem informasi geografis (SIG) berbasis web. Visualisasi K-Means Clustering
28
Visualisasi K-Means Clustering
Kesimpulan Cluster Means lahan sawah relatif sempit sehingga pertanian yang sebaiknya dikembangkan untuk wilayah ini tidak berbasis lahan. 3 1 lahan sawah relatif luas sehingga pertanian yang berbasis lahan masih cocok diterapkan di wilayah ini dan mungkin perlu ditingkatkan efektifitas dan efisiensi penggunaan lahan sawah di wilayah ini. 2 lahan sawah relatif cukup luas dan lahan non-pertanian relatif jauh lebih luas sehingga yang perlu diperhatikan adalah perlindungan lahan sawah agar tidak dikonversi menjadi lahan non-pertanian. Visualisasi K-Means Clustering
29
Saran Menggunakan algoritme lain untuk keseluruhan atribut, mis: Qrock. Clustering dapat diterapkan untuk wilayah yang lebih luas, mis: se-Jawa Barat. Clustering dapat dilakukan untuk data tahun-tahun sebelumnya sehingga diperoleh informasi perkembangan potensi pertanian. Visualisasi K-Means Clustering
30
Penutup THANKS Visualisasi K-Means Clustering
Presentasi serupa
© 2024 SlidePlayer.info Inc.
All rights reserved.