K-MEANS ALGORITHM CLUSTERING

Slides:



Advertisements
Presentasi serupa
K-Means Clustering.
Advertisements

Klastering dengan K-Means
Pengelompokan Jenis Tanah Menggunakan Algoritma Clustering K-Means
Model Datamining Dr. Sri Kusumadewi, S.Si., MT. Materi Kuliah [10]:
Self Organizing Maps Tim Asprak Metkuan
Minggu lalu Decision tree Bayesian Classification Ujian.
Segmentasi Citra.
Oleh I Putu Agus Hendra Krisnawan
DATA MINING 1.
Fachrul Reza ( ) Julpan ( ) M. Nur Cipta Hidayah Lubis ( ) Oleh:
SISTEM PENDUKUNG KEPUTUSAN PENGADAAN BUKU PERPUSTAKAAN STIKOM SURABAYA MENGGUNAKAN METODE K-MEANS CLUSTERING Arief Rahman Susanto
TOWARDS MULTIPLE IDENTITY DETECTION IN SOCIAL NETWORKS & RESEARCH METODOLOGY 3KS2 ERMA FITRIANA RANITA RIZKI APRILLIA.
Aplikasi Model Jaringan Syaraf Tiruan dengan Radial Basis Function untuk Mendeteksi Kelainan Otak (Stroke Infark) Yohanes Tanjung S.
Sistem Pendukung Keputusan Pengadaan Buku Perpustakaan STIKOM Surabaya Menggunakan Metode Fuzzy C-means Clustering. Catur Sugeng. P
Pemrosesan Teks Klasterisasi Dokumen Teknik Informatika STMIK GI MDP 2013 Shinta P.
Clustering. Definition Clustering is “the process of organizing objects into groups whose members are similar in some way”. A cluster is therefore a collection.
ALGORITMA THINNING Kelompok 12: Slamet Eries Nugroho Indra Setiawan
S1 Teknik Informatika Disusun Oleh Dr. Lily Wulandari
Fuzzy Clustering Logika Fuzzy Materi Kuliah Prodi Teknik Informatika
Clustering (Season 2) Self-Organizing Map
Oleh : Melysa Sparingga Conditional Branch Pengertian Conditional Branch Konsep conditional branch ini dapat kita anggap dengan kondisi sebab akibat.
Fuzzy Clustering Materi Kuliah (Pertemuan 13 & 14) LOGIKA FUZZY
Pengenalan Supervised dan Unsupervised Learning
Fuzzy Clustering Materi Kuliah (Pertemuan 13 & 14) LOGIKA FUZZY
Pertemuan 3 JARINGAN PERCEPTRON
Pertemuan 12 ARTIFICIAL NEURAL NETWORKS (ANN) - JARINGAN SYARAF TIRUAN - Betha Nurina Sari, M.Kom.
Fuzzy Clustering Materi Kuliah (Pertemuan 13 & 14) LOGIKA FUZZY
Clustering Suprayogi.
Datamining - Suprayogi
Sistem Berbasis Fuzzy Materi 5
STUDI KASUS KLASIFIKASI Algoritma C 4.5
Fuzzy Clustering Materi Kuliah (Pertemuan 13 & 14) LOGIKA FUZZY
Pembimbing: Henri Harianja G Imas S. Sitanggang, S.Si M.Kom
Oleh : Yusuf Nurrachman, ST, MMSI
Konsep Data Mining Ana Kurniawati.
Clustering Best Practice
Aplikasi Kecerdasan Komputasional
Kuliah Sistem Fuzzy Pertemuan 7 “Fuzzy Clustering”
SOM – KOHONEN Unsupervised Learning
Algoritma kNN (k-Nearest Neighbor)
DATA STATISTIK.
K-Nearest Neighbor dan K-means
SYSTEM FLOWCHART.
Clustering (Season 1) K-Means
Oleh : Devie Rosa Anamisa
PRODI MIK | FAKULTAS ILMU-ILMU KESEHATAN
Informed (Heuristic) Search
Bubble sort.
CLUSTERING.
Clustering (Season 2) Self-Organizing Map
Analisis Klastering K-Means Model Datamining Kelompok 1 Eko Suryana
PRODI MIK | FAKULTAS ILMU-ILMU KESEHATAN
ALGORITMA GENETIKA.
Algoritma kNN (k-Nearest Neighbor)
ANALISIS CLUSTER Part 1.
Pembelajaran tak-terbimbing dan klustering
ANALISIS CLUSTER Part 2.
KLASIFIKASI.
Pengetahuan Data Mining
CLUSTERING.
Pengelompokan Dokumen (Document Clustering)
Konsep Data Mining Ana Kurniawati.
Implementasi clustering K-MEANS (dengan IRIS dataset)
By : Rahmat Robi Waliyansyah, M.Kom
HIERARCHICAL CLUSTERING
Manfaat dan Teknik Penyajian Data
DECISION SUPPORT SYSTEM [MKB3493]
Universitas Gunadarma
Konsep Nilai Mutlak OLEH Agil Ari W, S.Pd.
Algoritma kNN (k-Nearest Neighbor)
Transcript presentasi:

K-MEANS ALGORITHM CLUSTERING 1 Dalam system klasifikasi terdapat 2 jenis Klasifikasi yaitu : supervised classification dan unsupervised classification Pendahuluan Clustering dapat dianggap yang paling penting dalam masalah unsupervised learning. Sebuah cluster merupakan kumpulan objek-objek yang "sama" di antara mereka dan "berbeda" pada objek dari cluster lainnya.

K-MEANS ALGORITHM CLUSTERING 2 Clustering algoritma dapat diterapkan dalam berbagai bidang, misalnya: Pemasaran Biologi Perpustakaan Asuransi Perencanaan kota Aplikasi

K-MEANS ALGORITHM CLUSTERING 3 Clustering algoritma dapat diklasifikasikan sebagai berikut: Exclusive Clustering Overlapping Clustering Hierarchical Clustering Probabilistic Clustering Klasifikasi

K-MEANS ALGORITHM CLUSTERING 4 K-Means merupakan algoritma untuk cluster n objek berdasarkan atribut menjadi k partisi, dimana k < n. Secara Umum K-means clustering merupakan salah satu metode data clustering non-hirarki yang mengelompokan data dalam bentuk satu atau lebih cluster/kelompok K-Means

Kelemahan K-Means 7 Bila jumlah data tidak terlalu banyak, mudah untuk menentukan cluster awal. Jumlah cluster, sebanyak K, harus ditentukan sebelum dilakukan perhitungan. Tidak pernah mengetahui real cluster dengan menggunakan data yang sama, namun jika dimasukkan dengan cara yang berbeda mungkin dapat memproduksi cluster yang berbeda jika jumlah datanya sedikit. Tidak tahu kontribusi dari atribut dalam proses pengelompokan karena dianggap bahwa setiap atribut memiliki bobot yang sama

Algoritma K-Means Clustering 8 Langkah-langkah dalam Algoritma K-means Clustering : Menentukan jumlah cluster . Menentukan nilai centroid. Dalam menentukan nilai centroid untuk awal iterasi, nilai awal centroid dilakukan secara acak. Sedangkan jika menentukan nilai centroid yang merupakan tahap dari iterasi, maka digunakan rumus sebagai berikut :

Algoritma K-Means Clustering 9 Menghitung jarak antara titik centroid dengan titik tiap objek Pengelompokan object untuk menentukan anggota cluster adalah dengan memperhitungkan jarak minimum objek. Kembali ke tahap 2, lakukan perulangan hingga nilai centroid yang dihasilkan tetap dan anggota cluster tidak berpindah ke cluster lain.

Flowchart K-Means Clustering 10

Transformasi Data 11 Metode K-Means Clustering hanya bisa mengolah data dalam bentuk angka, maka untuk data yang berbentuk nominal harus di Inisialisasikan terlebih dahulu dalam bentuk angka. Langkahnya adalah : Urutkan data berdasarkan frekuensi kemunculannya Inisialisasikan data tersebut mulai dari data tertinggi dengan nilai 1, kemudian data selanjutnya 2, 3 dan Seterusnya

11 Transformasi Data Contoh Hasil Transformasi Nama Mahasiswa Kota Asal Eki Aryadi Bukittinggi Hasri Awal Padang Jasmine Solok Roni Julianto Wahyu Zulfikar Hasil Transformasi Kota Frekuensi Inisial Bukittinggi 3 1 Padang 2 Solok

Contoh Kasus 12 . Diberikan data nilai dari 12 siswa sebagai Berikut, kemudian jadikan data tersebut menjadi 2 Cluster.

13 Penyelesaian : Contoh Kasus Tentukan pusat awal cluster “Centroid” Untuk penentuan awal diasumsikan : Diambil data ke- 2 sebagai pusat Cluster Ke-1: (84, 76, 79, 77, 76, 77, 75, 81) Diambil data ke- 5 sebagai pusat Cluster Ke-2: (82, 82, 81, 91, 90, 82, 79, 91).

14 Contoh Kasus Perhitungan jarak pusat cluster Untuk mengukur jarak antara data dengan pusat cluster digunakan Euclidian distance, kemudian akan didapatkan matrik jarak sebagai berikut :

Contoh Kasus 15 Perhitungan Jarak dari data ke 1 terhadap pusat cluster

Contoh Kasus 16 Perhitungan Jarak dari data ke 2 terhadap pusat cluster

Contoh Kasus 17 Perhitungan Jarak dari data ke 3 terhadap pusat cluster

Contoh Kasus 18 Perhitungan seterusnya sampai Jarak dari data ke 12 terhadap pusat cluster, Sehingga hasil perhitungan jarak selengkapnya adalah : Baris Pertama Menunjukkan nilai jarak data terhadap titik pusat Cluster Pertama, Baris kedua menunjukkan nilai jarak data terhadap pusat cluster kedua.

Contoh Kasus 19 Pengelompokan Data

C1= 20 Contoh Kasus Penentuan Pusat Cluster Baru Karena C1 memiliki 10 anggota maka perhitungan cluster baru menjadi : C1=

Contoh Kasus 21 Karena C2 hanya mempunyai 2 anggota maka cluster baru menjadi : C2=

Contoh Kasus 22 Pengulangan langkah ke 2 hingga posisi data tidak mengalami perubahan Perhitungan Jarak dari data ke 1 terhadap pusat cluster

Contoh Kasus 23 Perhitungan Jarak dari data ke 2 terhadap pusat cluster

Contoh Kasus 24 Perhitungan seterusnya sampai Jarak dari data ke 12 terhadap pusat cluster. Sehingga hasil perhitungan jarak selengkapnya adalah :

Contoh Kasus 25 Lakukan pengelompokan data kembali sehingga dihasilkan matrik yang dimisalkan dengan G2.

Contoh Kasus 26 Karena G1 = G2 dimana anggota yang sama, maka tidak perlu dilakukan iterasi / perulangan lagi. Dan sampai disini hasil Clustering sudah mencapai stabil dan Konvergen Kesimpulan. Hasil Clustering adalah Cluster 1 : Siswa 1, 2, 4, 6, 7, 8,9,10, 11,12 Cluster 2 : Siswa 3 dan 5

TRANSITIONAL PAGE SEKIAN & TERIMAKASIH