Presentasi sedang didownload. Silahkan tunggu

Presentasi sedang didownload. Silahkan tunggu

Clustering (Season 2) Self-Organizing Map

Presentasi serupa


Presentasi berjudul: "Clustering (Season 2) Self-Organizing Map"— Transcript presentasi:

1 Clustering (Season 2) Self-Organizing Map
Pengenalan Pola Materi 4 Eko Prasetyo Teknik Informatika UPN “Veteran” Jawa Timur 2012

2 Self-Organizing Map Self-Organizing Map (SOM) pertama kali diperkenalkan oleh Kohonen (Kohonen, 1989) Memperkenalkan teknik pelatihan ANN yang berbasis winner take all, dimana hanya neuron yang menjadi pemenang yang akan dilakukan pembaruan pada bobotnya. Meskipun berbasis ANN, SOM tidak menggunakan nilai target kelas, tidak ada kelas yang ditetapkan untuk setiap data Karakteristik inilah yang membuat SOM dapat digunakan untuk keperluan clustering (berbasis ANN) Arsitektir SOM dapat digambarkan secara topografi untuk dapat memberikan visualisasi clustering

3 Topografi SOM Linear neighborhood Rectangular neighborhood
Hexagonal neighborhood

4 Self-Organizing Map Ada K neuron yang disusun dalam larik satu atau dua dimensi Sinyal masukan untuk setiap neuron dilewatkan pada bobot dengan jumlah elemen bobot yang sama dengan N fitur (Kohonen, 1989) Sehingga untuk arsitektur SOM akan memerlukan NK bobot Neuron dengan nilai terkecil dianggap sebaga neuron pemenang Kemudian akan memperbarui bobotnya bersama dengan tetangga-tetangga yang didefinisikan dalam arsitekturnya Komputasi sinyal keluaran tidak menggunakan inner- product seperti pada perceptron Tetapi menggunakan Euclidean kuadrat (square Euclidean) antara data masukan dengan bobot pada setiap neuron pemroses.

5 Self-Organizing Map Akumulasi sinyal yang didapat tidak perlu diaktivasi (fungsi aktivasi linear) Karena fungsi aktivasi tidak memberikan pengaruh pada pemilihan neuron pemenang yang akan memperbarui bobotnya dan bobot tetangganya. Cluster yang diikuti oleh sebuah data sebagai hasil proses clustering ditunjukkan oleh indeks neuron dalam layernya Untuk K neuron maka ada cluster 1 sampai K yang diberikan sebagai hasil clustering Tidak adalah error yang dihitung pada setiap iterasi pelatihan Kriteria berhentinya proses pelatihan dalam SOM (sebagai proses clustering) menggunakan jumlah iterasi tertentu

6 Self-Organizing Map Pada setiap iterasi untuk setiap data yang diproses, neuron dengan nilai keluaran terkecil akan mengalami perbaruan bobot bersama dengan tetangga yang didefinisikan. Misalnya, untuk ketetanggaan linear, tetangga pada radius R disekitar neuron J yang terdiri dari semua unit j yaitu max(1,J-R)  j  min(J+R,K), dimana K adalah jumlah neuron (cluster). Arsitektur ANN SOM

7 Algoritma Pelatihan SOM
Yang perlu ditekankan adalah bobot yang terhubung tidak dikalikan dengan sinyal (data masukan) untuk neuron pemroses tetapi menggunakan kuantisasi perbedaan (atau ketidakmiripan) antara data masukan dengan K neuron pemroses (kecuali jika menggunakan metrik inner-product untuk mengukur perbedaan/ketidakmiripan). Algoritma Clustering dengan Self-Organizing Map: Inisialisasi bobot wij. Tentukan parameter topologi ketetanggaan. Tentukan parameter laju pembelajaran. Tentukan jumlah maksimal iterasi pelatihan Selama jumlah maksimal iterasi belum tercapai, lakukan langkah 3 – 7. Untuk setiap data masukan X, lakukan langkah 4 – 6. Untuk setiap neuron j, hitung , i = 1, …, N, N adalah dimensi data (N). Cari indeks dari sejumlah neuron yaitu Dj, yang mempunyai nilai terkecil. Untuk neuron j dan semua neuron yang menjadi tetangga J (yang sudah didefinisikan) dalam radius R, dilakukan perbaruan bobot: . Perbarui nilai laju pembelajaran.

8 Algoritma Pelatihan SOM
Nilai laju pembelajaran () yang digunakan disini sama dengan ANN perceptron, menggunakan jangkauan nilai 0 sampai 1 Tetapi nilai ini akan terus diturunkan setiap kali kenaikan iterasi dengan sebuah fungsi pembelajaran (learning function); penurunan geometrik akan memberikan hasil yang sama. Misal, penurunan (fungsi pembelajaran) sebesar 0.6, maka jika pada iterasi pertama menggunakan =0.5 maka pada iterasi kedua akan menjadi =0.6, pada iterasi ketiga akan menjadi =0.60.6. Inisialisasi bobot awal, bisa menggunakan nilai acak dengan jangkauan -0.5 sampai +0.5 atau menggunakan nilai acak dengan jangkauan nilai seperti pada data masukan

9 Contoh Data asli Data X Y 1 2 4 3 5 Akan dilakukan clustering pada 5 buah data dengan jumlah dimensinya 2: X dan Y. Parameter yang digunakan: Jumlah cluster 3 Jumlah iterasi pelatihan maksimal 5 Laju pembelajaran 0.5 dan akan menjadi 0.6 (fungsi pembelajaran) darinya pada iterasi berikutnya. Inisialisasi bobot, karena jumlah fitur ada 2 dan jumlah cluster ada 3 maka matrik bobot w berukuran 23, secara acak digunakan bobot awal sebagai berikut:

10 Iterasi 1 (data 1) Bobot lama:
Untuk data 1 [1 1], hitung jarak ke setiap neuron: terkecil Jarak terkecil (terdekat) adalah neuron ke-1, maka neuron 1 diperbarui bobotnya: Bobot baru menjadi: Data berikutnya…

11 Iterasi 1 (data 2) Bobot lama:
Untuk data 2 [4 1], hitung jarak ke setiap neuron: terkecil Jarak terkecil (terdekat) adalah neuron ke-1, maka neuron 1 diperbarui bobotnya: Bobot baru menjadi: Data berikutnya…

12 Iterasi 1 (data 3) Bobot lama:
Untuk data 3 [1 2], hitung jarak ke setiap neuron: Jarak terkecil (terdekat) adalah neuron ke-2, maka neuron 2 diperbarui bobotnya: terkecil Bobot baru menjadi: Data berikutnya…

13 Iterasi 1 (data 3) Bobot lama:
Untuk data 4 [3 4], hitung jarak ke setiap neuron: Jarak terkecil (terdekat) adalah neuron ke-3, maka neuron 3 diperbarui bobotnya: terkecil Bobot baru menjadi: Data berikutnya…

14 Iterasi 1 (data 3) Bobot lama:
Untuk data 5 [5 4], hitung jarak ke setiap neuron: Jarak terkecil (terdekat) adalah neuron ke-3, maka neuron 3 diperbarui bobotnya: terkecil Bobot baru menjadi: Iterasi berikutnya…

15 Hasil Iterasi 1 Bobot baru setelah iterasi 1:
Laju pembelajaran yang baru menjadi: Indeks cluster yang diikuti data: Lanjut ke Iterasi berikutnya…

16 Pembaruan Cluster Terdekat
Iterasi 1 - 2 Iterasi Data D Cluster Terdekat Pembaruan Cluster Terdekat Bobot Inisialisasi bobot 2 2 2 2 3 5 a b c = b*(a-dprev) d = a+c 1 1 1 2 5 17 0.5 -0.5 4 1 1.25 -0.25 1 2 2 3 4 3 5 4 0.3 -0.15 -0.45 0.375 -0.075 -0.105 -0.015 0.4425

17 Pembaruan Cluster Terdekat
Iterasi 3 - 5 Iterasi Data D Cluster Terdekat Pembaruan Cluster Terdekat Bobot a b c = b*(a-dprev) d = a+c 3 1 1 2 0.18 4 1 1 1 2 3 4 5 4 4 0.108 5 0.0648 Indeks (nomor) cluster yang diikuti data Bobot akhir setelah 5 iterasi pelatihan

18 Fungsi SOM di matlab sintaks penggunaan sebagai berikut:
[Idx, w, C, D] = somtrain(X,C,Iterasi,lr,lf) Fungsi tersebut digunakan untuk melakukan clustering pada data set X pada sejumlah cluster C. Penjelasan parameter yang digunakan sebagai berikut: Parameter Keterangan X X adalah matrik MN, dimana M menyatakan jumlah data, N menyatakan jumlah fitur. C C menyatakan jumlah cluster (neuron pemroses). Iterasi Jumlah maksimal iterasi, default=100. lr Laju pembelajaran (), default = 0.5. lf Fungi pembelajaran, default = 0.6. Idx Matrik M1 yang menyatakan indeks cluster, setiap barisnya menyatakan cluster yang diikuti data pada baris tersebut di matrik X. Nilainya berturut-turut mulai 1, 2, .... sesuai indeks cluster. w Matrik NC yang menyatakan bobot untuk setiap neuron (cluster), N menyatakan jumlah fitur, C menyatakan jumlah neuron (cluster). D Matrik MC, baris menyatakan data, kolom menyatakan jarak data ke neuron (cluster).

19 Contoh Program data = [ 1 4 1 3 5; 1 1 2 4 4; ]'; C = 3; Iterasi = 5;
lr = 0.5; lf = 0.6; [idx, w, C, D] = somtrain(data,C,Iterasi,lr,lf); figure('Position',[ ]); plot(data(idx==1,1),data(idx==1,2),'ko',data(idx==2,1),data(idx==2,2),'k+',data(idx==3,1),data(idx==3,2),'k^','MarkerSize',6); axis([0 6,0 6]); display('bobot: w1 | w2 | w3'); w display(' X | Y | C | D1 | D2 | D3 '); [data idx D]

20 Contoh Program Hasil clustering data set dengan SOM
>> contoh_som bobot: w1 | w2 | w3 w = X | Y | C | D1 | D2 | D3 ans = Hasil clustering data set dengan SOM

21 To Be Continued … Clustering (Season 3)
ANY QUESTION ?


Download ppt "Clustering (Season 2) Self-Organizing Map"

Presentasi serupa


Iklan oleh Google