DATA DIRI DOSEN Nama : AFIJAL, S.Kom, M.Kom NIDN : 0125088401 TTL : Pulau Kayu, 25 Agustus 1984 Alamat : Jl. Medan – B. Aceh Lr. Sawah Gampong Uteun Geulinggang Kec. Dewantara Kab. Aceh Utara No. HP : +62813 6058 8524 – PIN BB : 73EA1C50 Webblog : http://www.ijalnewbie.wordpress.com PENDIDIKAN SD Negeri 1 Blang Dalam Kab. Aceh Selatan SMP Negeri 1 Kuala Batee Kab. Aceh Selatan SMA Negeri 2 Lhokseumawe Kab. Aceh Utara AMIK Logika Yos Sudarso Medan Diploma I STMIK Bina Bangsa Lhokseumawe Sarjana Komputer Teknik Informatika Universitas Putra Indonesia “YPTK” Padang Magister Komputer Sistem Informasi PEKERJAAN SEKARANG Dosen Tetap Universitas Almuslim Peusangan Direktur LSM JADUP Bireuen Tuha Peut Kualisi untuk Advokasi Laut Aceh (KuALA) Ketua Pembina Yayasan RIPMA (Riset dan Pengembangan Masyarakat)
Algoritma fuzzy k-means (cluster) dalam data mining
Pengklusteran (Clustering) Clustering merupakan suatu teknik data mining yang membagi-bagikan data ke dalam beberapa kelompok (grup atau cluster atau segmen) yang tiap cluster dapat ditempati beberapa anggota bersama-sama. Clustering tidak mensyaratkan pengetahuan sebelumnya dari grup yang dibentuk, juga dari para anggota yang harus mengikutinya. Pengklusteran (Clustering)
Analisis kluster atau clustering merupakan proses membagi data dalam suatu himpunan kedalam beberapa kelompok yang kesamaan datanya dalam suatu kelompok lebih besar dari pada kesamaan data tersebut dengan data dalam kelompok lain (Jang, Sun dan Mizutani, 2004). Potensi clustering adalah dapat digunakan untuk mengetahui struktur dalam data yang dapat dipakai lebih lanjut dalam berbagai aplikasi secara luas seperti klasifikasi, pengolahan gambar dan pengenalan pola. Fuzzy C-Means
Lanjutan Fuzzy C-Means Data tentang 8 nasabah yang pernah memperoleh kredit dari BNI NASABAH JUMLAH RUMAH JUMLAH MOBIL A 1 3 B C 4 D 5 E 2 F G H Lanjutan Fuzzy C-Means
Prototype Masalah Pengelompokan KELOMPOK (CLUSTER) ANGGOTA KELOMPOK 1 {B} 2 {A,E,G,H} 3 {C,D,F} KELOMPOK PERTAMA: KELOMPOK UNIK KARENA MEMILIKI 1 ORG ANGGOTA (3 RUMAH DAN 3 MOBIL) KELOMPOK KEDUA: 4 ORANG ANGGOTA MEMILIKI RATA-RATA JUMLAH RUMAH SEDIKITNYA 1,25 BUAH DAN RATA-RATA JUMLAH MOBIL 1,75 KELOMPOK KETIGA: 3 ORANG ANGGOTA MEMILIKI RATA-RATA JUMLAH RUMAH SEDIKITNYA 4,33 BUAH DAN MOBIL 2,67 BUAH Prototype Masalah Pengelompokan
LANGKAH PERTAMA: TANYAKAN PADA PEMAKAI ALGORITMA K-MEANS, BERAPA KELOMPOK YANG INGIN DIBUAT! LANGKAH KEDUA: SECARA SEMBARANG, PILIH K BUAH CATATAN (DARI SEKIAN CATATAN YANG ADA) SEBAGAI PUSAT-PUSAT KELOMPOK AWAL LANGKAH KETIGA: UNTUK SETIAP CATATAN, TENTUKAN PUSAT KELOMPOK TERDEKAT DAN TETAPKAN CATATAN TERSEBUT SEBAAI ANGGOTA DARI KELOMPOK YANG TERDEKAT PUSAT KELOMPOKNYA. HITUNG RASIO BETWEEN CLUSTER VARIATION DENGAN WITHIN CLUSTER VARIATION. BANDINGKAN DENGAN RASIO SEBELUMNYA, JIKA MEMBESAR LANJUT KE LANGKAH KEEMPAT, JIKA TIDAK HENTIKAN PROSES LANGKAH KEEMPAT: PERBAHARUI PUSAT-PUSAT KELOMPOK (BERDASARKAN LANGKAH KETIGA) DAN KEMBALILAH KE LANGKAH KETIGA Langkah Algoritma C-Means
APA YANG MENJADI LANGKAH PERTAMA? MENANYAKAN BERAPA KELOMPOK YANG INGIN DIBUAT JIKA KELOMPOKNYA TIGA, MAKA K-NYA ADALAH 3 ATAU K = 3 Langkah Algoritma C-Means Pertama
PILIH SECARA SEMBARANG, PUSAT-PUSAT KELOMPOK (K=3) CATATAN B SEBAGAI PUSAT KELOMPOK 1 SEHINGGA M1=(3,3) CATATAN E SEBAGAI PUSAT KELOMPOK 2 SEHINGGA M2=(1,2) CATATAN F SEBAGAI PUSAT KELOMPOK 3 SEHINGGA M3=(4,2) Langkah Algoritma C-Means Kedua
TENTUKAN PUSAT KELOMPOK TERDEKATNYA CATATAN JARAK KE M1 (3,3) JARAK KE M2 (1,2) JARAK KE M3 (4,2) JARAK TERDEKAT KE KELOMPOK A (1,3) 2 1 3,162 C2 B (3,3) 2,236 1,414 C1 C (4,3) C3 D (5,3) 4,123 E (1,2) 3 F (4,2) G (1,1) 2,828 H (2,1) Langkah Algoritma C-Means Ketiga
Lanjutan Langkah Algoritma KELOMPOK YANG DIPEROLEH : KELOMPOK 1 (C1) = {B} KELOMPOK 2 (C2) = {A,E,G,H} KELOMPOK 3 (C3) = {C,D,F} HITUNG RASIO BCV DAN WCV BCV= d(M1,M2) + d(M1,M3) + d(M2,M3) = 6,650 WCV = 12 + 02 + 12 + 1,4142 + 02 + 02 + 12 + 1,4142 = 7 BCV/WCV = 0,950 Lanjutan Langkah Algoritma C-Means Ketiga
Lanjutan Langkah Algoritma KELOMPOK YANG DIPEROLEH : KELOMPOK 1 (C1) = {B} KELOMPOK 2 (C2) = {A,E,G,H} KELOMPOK 3 (C3) = {C,D,F} HITUNG RASIO BCV DAN WCV BCV= d(M1,M2) + d(M1,M3) + d(M2,M3) = 6,741 WCV = 1,2752 + 02 + 0,4712 + 0,7452 + 0,3542 + 0,7452 + 0,7912 + 1,0612 = 4,833 BCV/WCV = 1,394 Lanjutan Langkah Algoritma C-Means Ketiga
TENTUKAN PUSAT KELOMPOK YANG TELAH DITEMUKAN M1 = RATA-RATA (B) = (3,3) M2 = RATA-RATA (A, E, G, H) = (1,25;1,75) M3 = RATA-RATA (C, D, F) = (4,333; 2,667) KEMBALI KE LANGKAH KETIGA Langkah Algoritma C-Means Keempat
JARAK TERDEKAT KE KELOMPOK Lanjutan Langkah Algoritma TENTUKAN PUSAT KELOMPOK TERDEKATNYA CATATAN JARAK KE M1 JARAK KE M2 JARAK KE M3 JARAK TERDEKAT KE KELOMPOK A 2 1,275 3,350 C2 B 1,768 1,374 C1 C 1 3,021 0,471 C3 D 3,953 0,745 E 2,236 0,354 3,399 F 1,414 2,813 G 2,828 0,791 3,727 H 1,061 2,867 Lanjutan Langkah Algoritma C-Means Keempat
KARENA RASIO BCV/WCV TERAKHIR SAMA DENGAN YANG SEBELUMNYA YAITU 1,394 ALGORITMA DIHENTIKAN 3 KELOMPOK YANG DIPEROLEH YAITU KELOMPOK 1 (C1) = {B} KELOMPOK 2 (C2) ={A,E,G,H} KELOMPOK 3 (C3) = {C,D,F} ENDING (selesai)
Bertanyalah Bila Anda Tidak Ingin Sesat di Jalan Pertanyaan dan Diskusi Bertanyalah Bila Anda Tidak Ingin Sesat di Jalan
Latihan Soal Fuzzy C-Means DENGAN MENGGUNAKAN ALGORITMA C-MEANS, CARILAH PENGELOMPOKAN TERBAIK SEHINGGA MEMPEROLEH 2 KLASTER DARI DATA-DATA BERIKUT : A=(2, 5.0), B=(2, 5.5), C=(5, 3.5), D=(6.5, 2.2), E=(7, 3.3), F=(3.5, 4.8), G=(4, 4.5) Latihan Soal Fuzzy C-Means
Jawaban Latihan Soal Fuzzy C-Means {A, B, F, G} anggota C1 dan {C, D, E} anggota C2 K-means procedure [coba,pusat] = kmeans (b,2,'dist','sqEuclidean'); Jawaban Latihan Soal Fuzzy C-Means
Kata-kata Bijak perangsang Otak “Pengetahuan yang benar tidak diukur dari seberapa banyak Anda menghafal dan seberapa banyak yang mampu Anda jelaskan, melainkan, pengetahuan yang benar adalah ekspresi kesalehan (melindungi diri dari apa yang Allah larang dan bertindak atas apa yang Allah amanatkan)” Kata-kata Bijak perangsang Otak
Sampai Jumpa Pada Pertemuan Berikutnya....... !