PERBANDINGAN ALGORITME CLUSTERING ROCK DAN QROCK UNTUK DATA KATEGORIK Oleh : Marisa Anggreani G64104037 Pembimbing : Annisa, S.Kom, M.Kom Hari Agung, S.Kom, M.Si
Over View Latar Belakang Tujuan Ruang Lingkup Tinjauan Pustaka Metode Penelitian Hasil dan Pembahasan Kesimpulan Saran
Latar Belakang, Tujuan, dan Ruang Lingkup
Sponge
Contoh jenis-jenis sponge
Anatomi dan fisiologo sponge Cortex Megascleras Spicule Microscleras Ecstosomic Exsostilo Aster Diplaster Esferaster Warna Lapisan permukaan Permukaan Jumlah papilas Panjang megasclera Ketebalan cortex Data Numerik Fisiologi Data Kategorik
…. A B C D 1 … N …. 2 M S K Y 54 Data Sponge Clustering Taxonomy
ROCK A … C 1 N B 2 M S K Y 54 Bandingkan QROCK
Algoritme Clustering Distance : K-means Algoritme ROCK Kualitasnya lebih baik Skalabilitas lebih baik Algoritme QROCK Lebih mudah Lebih efisien Mendeteksi outlier
Tinjauan Pustaka
x y Clustering
Agglomerative Hirarchical Clustering
X Y A 3 4 B 5 C 1 B A Jarak C Data Numerik
Data Kategorik X Y A Merah Basar B Kuning Besar C Biru Kecil B A 1 Similaritas C Rentang Nilai Similaritas Data Kategorik
Similarity measure jaccard coefficient
Evaluation clustering x y Cohesion Separation f(θ) = (1+θ)/(1-θ) Evaluation clustering
ROCK
Input ROCK : Data, k, θ. 2. Hitung Similaritas 1. Inisialisasi 1 3 2 4 10 6 7 5 8 9 9 1 2 3 5 4 6 8 7 10
3. Hitung Nbrlist 4. Hitung Link If (Sim ≥ θ) = 1 Common Neighbor 1 3 2 4 10 6 7 5 8 9 1 3 2 4 10 6 7 5 8 9
5. Hitung Local Heap Goodness Measure 1 3 2 4 10 6 7 5 8 9 f(θ) = (1+θ)/(1-θ)
6. Hitung Global Heap 7. Merge 1 3 2 4 10 6 7 5 8 9 1 3 2 4 10 6 7 5 8 9
6. Cluster yang Dihasilkan 1 3 2 4 10 6 7 5 8 9 1 3 2 4 10 6 7 5 8 9 Jika sudah tidak ada link antar cluster Jika k terpenuhi k = 2
QROCK
Input QROCK : Data, θ. 2. Hitung Similaritas 1. Inisialisasi 1 3 2 4 10 6 7 5 8 9 9 1 2 3 5 4 6 8 7 10
3. Hitung Nbrlist 4. Inisialisasi MFSET If (Sim ≥ θ) = 1 setHeaders setNames count first element set name next element 1 2 3 …. … 10 1 3 2 4 10 6 7 5 8 9
4. Inisialisasi elemen x є D 5. Inisialisasi elemen y є (nbrlist = 1) 1,2,3,…..10 = x x = 1, y = 2, 3. 1 3 2 4 10 6 7 5 8 9 1 3 2 4 10 6 7 5 8 9
6. Find A = first elemen x x = 1, y =2,3. A = 1 setHeaders setNames count first element set name next element 1 2 3 …. … 10 1 3 2 4 10 6 7 5 8 9
7. Find B = first elemen y x = 1, y =2,3. B = 2 setHeaders setNames count first element set name next element 1 2 3 …. … 10 1 3 2 4 10 6 7 5 8 9
8. If (A ≠ B) Merge A = 1 A ≠ B -> Merge B = 2 setHeaders setNames count first element set name next element 1 2 3 …. … 10 1 3 2 4 10 6 7 5 8 9
9. Cluster yang dihasilkan 1 3 2 4 10 6 7 5 8 9
Metode Penelitian
ROCK QROCK Sponge.xls Evaluation Clustering Evaluation Clustering Analisis Kesimpulan
Hasil dan Pembahasan
Cluster Anggota Persentase (%) Cohesion Separation ROCK Inputan k = 7, θ = 0.8 Cluster Anggota Persentase (%) Cohesion Separation 1 [6 22 24 30 36 37] 11 0.00039 0.0039 2 [13 16 20 21 33 34 52] 13 0.00041 0.0015 3 [9 23 29 32 39 40 41 45] 15 0.0012 0.0054 4 [4 5 7 31 48 49 50 51] 0.00089 0.005 5 [11 12 14 15 17 18 19 28] 0.0004 0.0014 6 [2 3 8 25 26 42 43 44] 0.00044 0.004 7 [1 10 27 35 38 46 47 53 54] 17 0.00018 0.0011 0.0039 0.0223
Cluster Anggota Persentase (%) Cohesion Separation QROCK Inputan θ = 0.85 Cluster Anggota Persentase (%) Cohesion Separation 1 [1] 2 [2 3 4 5 6 7 8 9 22 23 24 25 26 29 30 31 32 36 37 39 40 41 44 45 48 49 50 51] 52 0.000062 3 [10] 4 [11 12 13 14 15 16 17 18 19 20 21 27 28 33 34 35 38 52 53 54] 37 0.0000068 5 [42 43] 6 [46 47] 0.000069
ROCK QROCK Ukuran Cluster terhadap Cohesion
Jumlah cluster banyak Jumlah anggota sedikit Jumlah cohesion kecil
ROCK QROCK Niali Thareshold terhadap Cohesion
nilai threshold besar Nilai nbrlist kecil Jumlah cluster banyak
Deteksi oulier x y x y ROCK QROCK
Kesimpulan dan Saran
< > k 1. ROCK θ Operasi QROCK θ Lebih mudah 2. ROCK Separation Cluster ROCK QROCK Cohesion Separation < > Lebih baik
3. 4. Cluster Θ = 0.9 ROCK QROCK 19 Cluster 23 Cluster Deteksi outlier
1. Cluster Taxonomy …. …. …. …. …. ….
2. QROCK Algoritme Clustering Lain Bandingkan
TERIMAKASIH