By : Rahmat Robi Waliyansyah, M.Kom

Slides:



Advertisements
Presentasi serupa
Analisis Outlier.
Advertisements

K-Means Clustering.
Klastering dengan K-Means
Pengelompokan Jenis Tanah Menggunakan Algoritma Clustering K-Means
Clustering Okt 2012.
Model Datamining Dr. Sri Kusumadewi, S.Si., MT. Materi Kuliah [10]:
Self Organizing Maps Tim Asprak Metkuan
Minggu lalu Decision tree Bayesian Classification Ujian.
Oleh I Putu Agus Hendra Krisnawan
DATA MINING 1.
CS3204 Pengolahan Citra - UAS
Fachrul Reza ( ) Julpan ( ) M. Nur Cipta Hidayah Lubis ( ) Oleh:
SISTEM PENDUKUNG KEPUTUSAN PENGADAAN BUKU PERPUSTAKAAN STIKOM SURABAYA MENGGUNAKAN METODE K-MEANS CLUSTERING Arief Rahman Susanto
Pendahuluan Clustering adalah salah satu teknik unsupervised learning dimana kita tidak perlu melatih metoda tersebut atau dengan kata lain, tidak ada.
TOWARDS MULTIPLE IDENTITY DETECTION IN SOCIAL NETWORKS & RESEARCH METODOLOGY 3KS2 ERMA FITRIANA RANITA RIZKI APRILLIA.
Aplikasi Model Jaringan Syaraf Tiruan dengan Radial Basis Function untuk Mendeteksi Kelainan Otak (Stroke Infark) Yohanes Tanjung S.
Pemrosesan Teks Klasterisasi Dokumen Teknik Informatika STMIK GI MDP 2013 Shinta P.
Clustering. Definition Clustering is “the process of organizing objects into groups whose members are similar in some way”. A cluster is therefore a collection.
Fuzzy Clustering Logika Fuzzy Materi Kuliah Prodi Teknik Informatika
Fuzzy Clustering Materi Kuliah (Pertemuan 13 & 14) LOGIKA FUZZY
Pengenalan Supervised dan Unsupervised Learning
Fuzzy Clustering Materi Kuliah (Pertemuan 13 & 14) LOGIKA FUZZY
ANALISIS OUTLIER 1 Data Mining.
Clustering Suprayogi.
K-SUPPORT VECTOR NEAREST NEIGHBOR UNTUK KLASIFIKASI BERBASIS K-NN
Datamining - Suprayogi
Sistem Berbasis Fuzzy Materi 5
Fuzzy Clustering Materi Kuliah (Pertemuan 13 & 14) LOGIKA FUZZY
Pembimbing: Henri Harianja G Imas S. Sitanggang, S.Si M.Kom
Lin (1996), menggunakan jaringan syaraf untuk
Metode Riset Segmentasi
Konsep Data Mining Ana Kurniawati.
Clustering.
Clustering Best Practice
Kuliah Sistem Fuzzy Pertemuan 7 “Fuzzy Clustering”
Algoritma kNN (k-Nearest Neighbor)
Analisis Cluster.
K-Nearest Neighbor dan K-means
Clustering (Season 1) K-Means
Similarity/ Dissimilarity
Pathfinding dan Tactical AI
Oleh : Devie Rosa Anamisa
PRODI MIK | FAKULTAS ILMU-ILMU KESEHATAN
CLUSTERING.
Clustering (Season 2) Self-Organizing Map
Analisis Klastering K-Means Model Datamining Kelompok 1 Eko Suryana
Self-Organizing Network Model (SOM) Pertemuan 10
Klasifikasi Nearest Neighbor
ASESMEN PEMAHAMAN KONSEP MATEMATIKA
ANALISIS CLUSTER Part 1.
Oleh : Rahmat Robi Waliyansyah, M.Kom.
Oleh : Rahmat Robi Waliyansyah, M.Kom.
Pembelajaran tak-terbimbing dan klustering
ANALISIS CLUSTER Part 2.
KONSEP DASAR CITRA DIGITAL
Oleh : Rahmat Robi Waliyansyah, M.Kom.
Oleh : Rahmat Robi Waliyansyah, M.Kom.
TEKNIK KLASIFIKASI DAN PENGENALAN POLA
Pengetahuan Data Mining
CLUSTERING.
Oleh : Rahmat Robi Waliyansyah, M.Kom.
K-MEANS ALGORITHM CLUSTERING
Pengelompokan Dokumen (Document Clustering)
Konsep Data Mining Ana Kurniawati.
Implementasi clustering K-MEANS (dengan IRIS dataset)
HIERARCHICAL CLUSTERING
DECISION SUPPORT SYSTEM [MKB3493]
Universitas Gunadarma
Intro Algoritma K-Nearest Neighbor (K- NN) adalah sebuah metode klasifikasi terhadap sekumpulan data maupun dokumen berdasarkan pembelajaran  data yang.
Universitas Gunadarma
Transcript presentasi:

By : Rahmat Robi Waliyansyah, M.Kom Cluster Analysis Algoritma CLUSTERING K-means By : Rahmat Robi Waliyansyah, M.Kom

KEMAMPUAN AKHIR YANG DIHARAPKAN Dapat menjelaskan konsep dasar cluster dan penerapannya pada data.

CLUSTERING Clustering adalah salah satu teknik unsupervised learning dimana tidak ada fase learning. Cluster berguna untuk mengelompokkan objek-objek data yang memiliki kemiripan ke dalam satu grup dan yang berbeda dikelompokkan ke dalam grup lainnya Semakin besar tingkat kemiripan/similarity (atau homogenitas) di dalam satu grup dan semakin besar tingkat perbedaan diantara grup, maka semakin baik (atau lebih berbeda) clustering tersebut.

APLIKASI CLUSTERING Mengelompokkan dokumen-dokumen yang relatif, mengelompokkan gen dan protein yang memiliki fungsi yang sama. Mengurangi ukuran data yang besar

TIPE-TIPE CLUSTERING Partitional clustering adalah himpunan obyek data ke dalam sub-himpunan (cluster) yang tidak overlap, sehingga setiap obyek data berada dalam tepat satu cluster. Hierarchical clustering adalah cluster yang memiliki subcluster. Himpunan cluster besarang yang diatur dalam tree.

PARTITIONAL CLUSTERING

HIERARCHICAL CLUSTERING

SIMILARITY AND DISSIMILARITY BETWEEN OBJECTS Jarak biasanya digunakan untuk mengukur kemiripan dan ketidakmiripan diantara dua objek Rumus untuk mengukur jarak diantara dua objek: Jika nilai q=1, maka jarak tersebut diukur dengan Manhattan distance

SIMILARITY AND DISSIMILARITY BETWEEN OBJECTS Jika q=2, maka jarak tersebut diukur dengan Euclidean distance d(i,j) ≥0 d(i,j) = 0 d(i,j)=d(j,i)

ALGORITMA CLUSTERING K-Means K-Medoids Hierarchical Clustering

Algoritma k-means Algoritma K-Means K-means merupakan metode clustering secara partitioning yang memisahkan data ke dalam kelompok yang berbeda Dengan partitioning secara iteratif, K-Means mampu meminimalkan rata-rata jarak setiap data ke cluster-nya.

Algoritma k-means Dasar algoritma K-means adalah sebagai berikut : Tentukan nilai k sebagai jumlah klaster yang ingin dibentuk. Bangkitkan k centroid (titik pusat klaster) awal secara random. Hitung jarak setiap data ke masing-masing centroid menggunakan rumus korelasi antar dua objek yaitu Euclidean Distance Kelompokkan setiap data berdasarkan jarak terdekat antara data dengan centroidnya.

Algoritma k-means Tentukan posisi centroid baru (Ck ) dengan cara menghitung nilai rata-rata dari data-data yang ada pada centroid yang sama. Dimana nk adalah jumlah dokumen dalam cluster k dan di adalah dokumen dalam cluster k. Kembali ke langkah 3 jika posisi centroid baru dengan centroid lama tidak sama.

Algoritma k-means Contoh : Dengan menggunakan Algoritma K-Means, temukan grup terbaik dari dua cluster berikut : M1 = ( 2 , 5.0), M2 = ( 2 , 5.5), M3 = ( 5 , 3.5), M4 = ( 6.5 , 2.2), M5 = ( 7 , 3.3), M6 = ( 3.5 , 4.8), M7 = ( 4 , 4.5)

Cluster Analysis Jawab :

Algoritma k-means Asumsi: Semua data akan dikelompokkan ke dalam dua kelas Center points dari kedua cluster adalah C1( 3 , 4), C2( 6 , 4)

Algoritma k-means Iterasi 1 a. Menghitung Euclidean Distance dari semua data ke tiap titik pusat pertama 2 3,25 4,25 15,52 16,48 0,88 1,26 √15.52 √16.48 √0.88 √1.26

Algoritma k-means Dengan cara yang sama hitung jarak tiap titik ke titik pusat ke-2 dan kita akan mendapatkan D21 = 4.12, D22 = 4.27, D23 = 1.18, D24 = 1.86, D25 = 1.22, D26 = 2.62, D27 = 2.06

Algoritma k-means b. Dari penghitungan Euclidean distance, kita dapat membandingkan:                                            M1  M2   M3   M4    M5  M6  M7  jarak ke C1  1.41 1.80 2.06  3.94   4.06   0.94   1.12                C2    4.12  4.27  1.18  1.86   1.22   2.62   2.06 {M1 , M2 , M6 , M7 } anggota C1 dan {M3 , M4 , M5 } anggota C2

Algoritma k-means  c. Hitung titik pusat baru

Algoritma k-means Iterasi ke 2 a. Hitung Euclidean distance dari tiap data ke titik pusat yang baru Dengan cara yang sama dengan iterasi pertama kita akan mendapatkan perbandingan sebagai berikut: M1  M2  M3  M4  M5  M6  M7 Jarak ke C1  0.76   0.96  2.65   4.62   4.54   0.76   1.31                C2  4.62   4.86  1.27  0.86   0.88   3.22   2.63

Algoritma k-means b. Dari perbandingan tersebut kita tahu bahwa {M1 , M2 , M6 , M7 } anggota C1 dan {M3 , M4 , M5 } anggota C2  c. Karena anggota kelompok tidak ada yang berubah maka titik pusat pun tidak akan berubah. Kesimpulan {M1 , M2 , M6 , M7 } anggota C1 dan {M3 , M4 , M5 } anggota C2