Presentasi sedang didownload. Silahkan tunggu

Presentasi sedang didownload. Silahkan tunggu

Pembimbing: Henri Harianja G Imas S. Sitanggang, S.Si M.Kom

Presentasi serupa


Presentasi berjudul: "Pembimbing: Henri Harianja G Imas S. Sitanggang, S.Si M.Kom"— Transcript presentasi:

1 VISUALISASI K-MEANS CLUSTERING DATA POTENSI PERTANIAN DESA MENGGUNAKAN MAPSERVER
Pembimbing: Henri Harianja G Imas S. Sitanggang, S.Si M.Kom Dr. Ir. Lailan Syaufina, M.Sc.

2 Visualisasi K-Means Clustering
Latar Belakang Indonesia merupakan negara agraris tetapi hasil pertanian belum mencukupi kebutuhan dalam negeri. BPS melakukan survei potensi desa. Data mining  ekstraksi informasi dari data berukuran besar. Clustering  salah satu metode data mining Visualisasi K-Means Clustering

3 Tujuan Menerapkan teknik clustering dengan menggunakan Algoritme K-Means pada data potensi pertanian desa. Memvisualisasikan hasil clustering dalam bentuk Sistem Informasi Geografis (SIG) berbasis web. Visualisasi K-Means Clustering

4 Visualisasi K-Means Clustering
Ruang Lingkup K-Means Clustering Visualisasi K-Means Clustering Kab. Bogor & Kota Bogor 2006

5 Manfaat Penelitian ini diharapkan dapat berguna bagi pihak-pihak yang membutuhkan informasi potensi pertanian pada level desa. Informasi yang didapatkan diharapkan dapat membantu dalam pembangunan sektor pertanian. Visualisasi K-Means Clustering

6 Tinjauan Pustaka Clustering K-Means Evaluasi Cluster Sistem Informasi Geografis (SIG) Potensi Desa Visualisasi K-Means Clustering

7 Clustering Secara umum, clustering merupakan proses pengelompokan kumpulan objek ke dalam cluster sehingga objek-objek dalam satu cluster memiliki kemiripan yang tinggi tetapi tidak mirip dengan objek cluster lain(Han & Kamber 2006). Visualisasi K-Means Clustering

8 Visualisasi K-Means Clustering
Algoritme K-Means Tentukan initial partition dengan k cluster berisi samples yang dipilih secara acak, hitung centroid dari tiap-tiap cluster. Bangkitkan partisi baru dengan assigning setiap sample terhadap pusat cluster terdekat. Hitung pusat-pusat cluster baru sebagai centroids dari clusters. Ulangi langkah 2 dan 3 sampai nilai optimum dari fungsi kriteria dipenuhi (atau sampai cluster membership stabil). Visualisasi K-Means Clustering

9 K-Means dievaluasi menggunakan total SSE.
Evaluasi cluster Prinsip: Meminimalkan jarak intra-cluster (cohesion) Memasksimalkan jarak inter-cluster (separation) Cohesion  Total SSE (Sum of square error) Separation  Total SSB (Group sum of squares) Total SSE + Total SSB = constant K-Means dievaluasi menggunakan total SSE. Visualisasi K-Means Clustering

10 Sistem Informasi Geografis (SIG)
Sistem berbasis komputer yang mempunyai kemampuan untuk menyimpan, menganalisis, melakukan query, dan menampilkan data geografis (Chang 2002). Bentuk data: Data spasial  vektor dan raster Data atribut Visualisasi K-Means Clustering

11 Visualisasi K-Means Clustering
Potensi Desa Keterangan umum desa/kelurahan Kependudukan dan ketenagakerjaan Perumahan dan lingkungan hidup Pendidikan dan kesehatan Rekreasi, hiburan dan olahraga Penggunaan lahan Ekonomi dll Visualisasi K-Means Clustering

12 Metode Penelitian Preprocessing Data Mining  Clustering Evaluasi Cluster Knowledge Presentation Visualisasi K-Means Clustering

13 Visualisasi K-Means Clustering
Preprocessing 494 record Data Podes Jawa Barat 2006 Data Podes Kab. Bogor & Kota Bogor 2006 Seleksi record 5808 record 443 atribut Visualisasi K-Means Clustering Data Potensi Pertanian Kab. Bogor & Kota Bogor 2006 Seleksi atribut 4 atribut

14 Visualisasi K-Means Clustering
Preprocessing Hasil seleksi atribut (saran Bapak Dr. Firdaus dari FEM IPB): Luas lahan sawah (Ha), selanjutnya disebut A. Luas lahan sawah berperairan yang diusahakan (Ha) selanjutnya disebut B. Luas lahan non pertanian (pemukiman / perumahan / pertokoan / perkantoran / industri dan lainnya) (Ha) selanjutnya disebut C. Ada atau tidaknya perusahaan perkebunan  (Tidak digunakan dalam proses data mining) Visualisasi K-Means Clustering

15 Data Mining Percobaan clustering dilakukan untuk ukuran cluster 2 sampai 10. Untuk masing-masing ukuran cluster (k) dilakukan percobaan dengan random seed (s) 5, 10, 15, dan 20. Algoritme K-Means akan menghasilkan cluster centroid (means) untuk masing-masing cluster sesuai dengan ukuran cluster. Visualisasi K-Means Clustering

16 Cluster centroid untuk dan k=4 s=20 Visualisasi K-Means Clustering
Data Mining Cluster centroid untuk dan k=4 s=20 Cluster A B C 1 2 3 Visualisasi K-Means Clustering

17 Visualisasi K-Means Clustering
Evaluasi cluster Total SSE s = 5 s = 10 s = 15 s = 20 k = 2 k = 3 k = 4 k = 5 k = 6 k = 7 k = 8 k = 9 k = 10 Visualisasi K-Means Clustering

18 Evaluasi cluster Visualisasi K-Means Clustering

19 Visualisasi Clustering
Dibangun menggunakan MapServer sebagai web-server dan Chameleon sebagai framework. Memplotkan hasil clustering untuk k=2 sampai k=10 dengan total SSE terkecil berdasarkan Tabel total SSE. Visualisasi K-Means Clustering

20 Design Interface Visualisasi K-Means Clustering

21 Knowledge Presentation
Plot cluster terhadap atribut A <Luas lahan sawah (Ha)> Visualisasi K-Means Clustering

22 Knowledge Presentation
Plot cluster terhadap atribut B <Luas lahan sawah berperairan yang diusahakan (Ha)> Visualisasi K-Means Clustering

23 Knowledge Presentation
Plot atribut A terhadap atribut B Visualisasi K-Means Clustering A (Luas lahan sawah) B (Luas lahan sawah yang diusahakan)

24 Knowledge Presentation
Plot cluster terhadap atribut C <Luas lahan non-pertanian(Ha)> Visualisasi K-Means Clustering

25 Knowledge Presentation
A: <Luas lahan sawah(Ha)> B: <Luas lahan sawah berperairan yang diusahakan (Ha)> C: <Luas lahan non-pertanian(Ha)> Visualisasi K-Means Clustering Plot cluster terhadap atribut A,B,C

26 Knowledge Presentation
Plot k=4 s=20 Visualisasi K-Means Clustering Cluster A B C 1 2 3

27 Kesimpulan Clustering terbaik diperoleh pada k=4 dan s=20 dengan total SSE= dan penyebaran anggota tidak merata. Sebagai alat bantu visualisasi, hasil clustering diplotkan dengan melibatkan aspek spasialnya dalam bentuk sistem informasi geografis (SIG) berbasis web. Visualisasi K-Means Clustering

28 Visualisasi K-Means Clustering
Kesimpulan Cluster Means lahan sawah relatif sempit sehingga pertanian yang sebaiknya dikembangkan untuk wilayah ini tidak berbasis lahan. 3 1 lahan sawah relatif luas sehingga pertanian yang berbasis lahan masih cocok diterapkan di wilayah ini dan mungkin perlu ditingkatkan efektifitas dan efisiensi penggunaan lahan sawah di wilayah ini. 2 lahan sawah relatif cukup luas dan lahan non-pertanian relatif jauh lebih luas sehingga yang perlu diperhatikan adalah perlindungan lahan sawah agar tidak dikonversi menjadi lahan non-pertanian. Visualisasi K-Means Clustering

29 Saran Menggunakan algoritme lain untuk keseluruhan atribut, mis: Qrock. Clustering dapat diterapkan untuk wilayah yang lebih luas, mis: se-Jawa Barat. Clustering dapat dilakukan untuk data tahun-tahun sebelumnya sehingga diperoleh informasi perkembangan potensi pertanian. Visualisasi K-Means Clustering

30 Penutup THANKS Visualisasi K-Means Clustering


Download ppt "Pembimbing: Henri Harianja G Imas S. Sitanggang, S.Si M.Kom"

Presentasi serupa


Iklan oleh Google