Pembelajaran tak-terbimbing dan klustering Kuliah 5
Pembelajaran tak-terbimbing Estimasi kerapatan Penggugusan (Clustering)
Estimasi Kerapatan : Histogram Visualisasi Kerapatan
Estimasi Kerapatan Histogram Visualisasi kerapatan, menggunakan LDA (Linear Discriminant Analysis) Database: ‘1’ =1269 ‘3’ = 824 ‘7’ = 792 ‘8’= 708 Ciri: Mean Standart deviasi
Estimasi Kerapatan
Clustering: Algoritma Maximin-Distance Algoritma K-Means Algoritma Fuzzy C-Means
Algoritma Maximin-Distance L1: Mulai dengan memisalkan x1 menjadi pusat cluster pertama (z1). L2: Menentukan titik sampel terjauh dari x1, dalam hal ini x6 kemudian menjadi pusat cluster (z2) L3: Hitung jarak dari semua titik sampel ke z1 dan z2. Simpan nilai jarak minimum dari hasil perhitungan. Pilih maksimum dari nilai-nilai tersebut. Pusat cluster (z3) sekurang-kurangnya 1½ kalinya. Sehingga didapat x7 menjadi pusat cluster z3.
Algoritma K-Means L1: Pilih K pusat cluster z1(1), z2(1),…, zK(1). L2: Pada iterasi ke-k, berlaku untuk semua i=1,2,…,K; i ≠ j , dimana Sj(k) merupakan himpunan titik-titik sampel dengan pusat cluster zj(k). L3: Hitung pusat cluster baru L4: Jika zj(k+1)=zj(k) untuk j=1,2,…,K, prosedur berhenti, jika tidak kembali ke L2.
Contoh:
Algoritma Fuzzy C-Means Fuzzy Clustering