Presentasi sedang didownload. Silahkan tunggu

Presentasi sedang didownload. Silahkan tunggu

BACKPROPAGATION Dr. Benyamin Kusumoputro. Arsitektur JNPB JNPB terdiri dari : –satu lapis masukan –satu atau lebih lapis tersembunyi –satu lapis keluaran.

Presentasi serupa


Presentasi berjudul: "BACKPROPAGATION Dr. Benyamin Kusumoputro. Arsitektur JNPB JNPB terdiri dari : –satu lapis masukan –satu atau lebih lapis tersembunyi –satu lapis keluaran."— Transcript presentasi:

1 BACKPROPAGATION Dr. Benyamin Kusumoputro

2 Arsitektur JNPB JNPB terdiri dari : –satu lapis masukan –satu atau lebih lapis tersembunyi –satu lapis keluaran. Lapisan masukan hanya bertugas meneruskan masukan dan tidak melakukan komputasi, sementara lapisan tersembunyi dan lapisan keluaran melakukan komputasi. Jumlah neuron pada lapisan masukan sama dengan jumlah ciri atau atribut pada pola yang akan dikenali, sedang jumlah neuron pada lapisan keluaran sama dengan jumlah kelas pola.

3 Arsitektur JNPB (2)

4 Algoritma 1. Tentukan inisialisasi bobot awal –Random – Nguyen Widrow 2. Mekanisme komputasi jaringan Terdapat dua macam jenis komputasi, – komputasi maju (forward pass) – komputasi balik (backward pass).

5 Algoritma (2) 2.a. Komputasi Maju Dalam komputasi maju, menghitung nilai aktivasi semua neuron (lapis tersembunyi dan lapis keluaran); mulai dari neuron masukan menuju neuron keluaran Neuron pada lapis tersembunyi menghitung nilai total masukan : menjumlahkan perkalian sinyal masukan dari lapisan masukan dengan bobot antara lapisan masukan dan lapisan tersembunyi, dan bias tertentu. Neuron tersebut lalu menghitung nilai aktivasi dengan menerapkan fungsi aktifasi pada nilai total masukan. Sinyal keluaran dari lapisan tersembunyi menjadi masukan bagi lapisan keluaran. Neuron pada lapisan keluaran menghitung nilai total masukan neuron keluaran (lihat 1).

6 Algoritma (3) Neuron bersangkutan menghitung nilai aktivasi neuron keluaran dengan menerapkan fungsi aktifasi pada nilai total masukan neuron keluran (lihat 2). Step 1 : Selama kondisi stopping FALSE, lakukan Step 2-9 Step 2 : Untuk setiap pasangan pelatihan, lakukan Step 3-8 (Proses Feedforward) : Step 3 : Setiap unit input (X n, n = 1,…,N) : - menerima input x n - mengirimkannya ke semua unit layer diatasnya (Hidden layer).

7 Algoritma (4) Step 4 : Setiap unit hidden (Z m, m = 1,…,M) - menghitung semua sinyal input dengan bobotnya : z_in m = v m0 +  x n v mn - menghitung nilai aktivasi setiap unit hidden sebagai output unit hidden : z m = f(z_in m ) - mengirim nilai aktivasi sebagai input untuk unit output.

8 Algoritma (5) Step 5 : Setiap unit output (Y l, l = 1,…,L) - menghitung semua sinyal inputnya dengan bobotnya : y_in l = w l0 +  z m w lm - menghitung nilai aktivasi setiap unit output sebagai output jaringan. y l = f(y_in l )

9 Algoritma (6) 2.b. Perhitungan Komputasi Balik Komputasi balik dimulai dari lapisan keluaran. Komputasi balik bertujuan untuk menyesuaikan bobot dalam jaringan. Setiap neuron di lapisan keluaran menghitung selisih target keluaran dan sinyal keluaran. Setiap neuron di lapisan keluaran menghitung dan menyesuaikan bobot hubungan dari dirinya ke semua neuron di lapisan tersembunyi. Propagasikan sinyal kesalahan ke lapisan tersembunyi sehingga setiap neuron di lapisan tersembunyi menghitung dan menyesuaikan bobot hubungan dari dirinya ke semua neuron di lapisan masukan (lihat 2)

10 Fungsi Kesalahan Algoritma propagasi balik menggunakan prosedur gradient descent atau menuruni lembah permukaan error, untuk meminimisasi suatu fungsi kesalahan. Fungsi kesalahan yang umum dipakai ialah fungsi error kuadratis:

11 Aturan Pembelajaran (3) 4. Lakukan komputasi balik : a. Komputasi di lapis keluaran: Setiap neuron di lapisan keluaran diberikan target masukan tertentu. Hitung sinyal error  k untuk setiap neuron k di lapisan ini: Hitung modifikasi bobot untuk setiap hubungan antara neuron bersangkutan dengan semua neuron di lapisan tersembunyi: Hitung modifikasi bias untuk setiap neuron di lapisan keluaran:

12 Aturan Pembelajaran (4) b. Komputasi di lapis tersembunyi: Hitung sinyal error  j untuk setiap neuron j di lapisan tersembunyi: Hitung modifikasi bobot untuk hubungan antara neuron bersangkutan dengan semua neuron di lapisan masukan: Hitung modifikasi bias untuk setiap neuron di lapisan tersembunyi:

13 Aturan Pembelajaran (5) Ubah bobot dan bias 5. Uji kriteria kesalahan, bila kesalahan lebih besar dari batas yang telah ditetapkan, ulangi langkah 2 sampai 4; bila tidak, pelatihan selesai.

14 Faktor-faktor dalam Pembelajaran 1. Inisialisasi bobot Bobot awal menentukan apakah jaringan akan mencapai global minima atau local minima kesalahan, dan seberapa cepat jaringan akan konvergen. Inisialisasi acak merupakan cara yang paling sering digunakan dalam inisialisasi bobot. Untuk mempercepat proses pelatihan, suatu modifikasi dari inisialisasi acak diperkenalkan oleh Nguyen dan Widrow. Beberapa faktor yang mempengaruhi keberhasilan algoritma propagasi balik, antara lain:

15 Faktor-faktor dalam Pembelajaran (2) Untuk bias dan bobot hubungan antara semua neuron di lapisan tersembunyi dan semua neuron di lapisan keluaran, lakukan inisialisasi acak dengan jangkauan - 0,5 dan 0,5. Untuk bias bobot hubungan antara lapisan tersembunyi dan lapisan masukan, lakukan sebagai berikut: –Hitung  = 0.7 (P) 1/N di mana adalah faktor skala, P adalah ukuran lapisan tersembunyi dan N adalah ukuran lapisan masukan. Inisialisasi Nguyen-Widrow didefinisikan sebagai:

16 Faktor-faktor dalam Pembelajaran (3) –Untuk setiap neuron j di lapisan tersembunyi, lakukan sebagai berikut: Inisialisasi secara acak bobot antara neuron bersangkutan dengan semua neuron di lapisan masukan: wij = bilangan acak antara -0,5 dan 0,5. Hitung norma wj: Inisialisasi kembali wij: Inisialisasi bias:  j = bilangan acak antara -  dan .

17 Faktor-faktor dalam Pembelajaran (4) 2. Laju pembelajaran Merupakan parameter jaringan dalam mengendalikan proses penyesuaian bobot. Nilai laju pembelajaran yang optimal bergantung pada kasus yang dihadapi. Laju pembelajaran yang terlalu kecil menyebabkan konvergensi jaringan menjadi lebih lambat, sedang laju pembelajaran yang terlalu besar dapat menyebabkan ketidakstabilan pada jaringan 3. Momentum Momentum digunakan untuk mempercepat pelatihan jaringan. Metode momentum melibatkan penyesuaian bobot ditambah dengan faktor tertentu dari penyesuaian sebelumnya. Penyesuaian dinyatakan sebagai berikut:

18 Studi Modifikasi Standard Backpropagasi 1. Modifikasi fungsi objektif dan turunan 2. Modifikasi optimsasi algoritma Step Studi : 1. Studi literatur 2. Studi standard backpropagasi a. Uji coba standar backpropagasi pada xor problem b. Evaluasi karakteristik standar backpropagasi 1). Tingkat konvergensi ke global minimum 2). Tingkat akurasi output

19 Studi Modifikasi Standard Backpropagasi (2) 3. Studi modifikasi standar backpropagasi a. Uji coba modifikasi standar backpropagasi pada XOR problem b. Evaluasi karakteristik modifikasi standar backpropagasi 1). Tingkat konvergensi ke global minimum 2). Tingkat akurasi output 4. Membandingkan standar dan modifikasi backpropagasi a. Tingkat konvergensi ke global minimum b. Tingkat akurasi output 5. Implementasi a. Programing b. Management Database

20 Backpropagasi Backpropagasi merupakan algoritma pelatihan untuk memperkecil tingkat error dengan menyesuaikan bobot berdasarkan perbedaan output dan target yang diinginkan. Proses pelatihan : –Pengambilan input –Penelusuran error –Penyesuaian bobot

21 Arsitektur Backpropagasi

22 Notasi X : nilai masukan, X = ( X 1,... X i,...X n ) v : bobot antara bias atau input dengan hidden Z : nilai aktivasi hidden, Z = ( Z 1,... X j,...X p ) Z j = f (z_in) n z_in j = v 0j +  x i v ij i=1 w : bobot antara bias atau hidden dengan output Y : nilai output aktual, Y = ( Y1,... Yk,...Ym ) Y k = f (y_in) p y_in k = w 0k +  x i v ij k=1

23 Update Bobot Tanpa Momentum w jk (t+1) = w jk (t) +  w jk  w jk = -   E(w jk )  w jk v ij (t+1) = v ij (t) +  v ij  v ij = -   E(v ij )  v ij Dengan Momentum w jk (t+1) = w jk (t) +  w jk +   w jk (t-1)  w jk = -   E(w jk )  w jk v ij (t+1) = v ij (t) +  v ij +   v ij (t-1)  v ij = -   E(v ij )  v ij

24 Fungsi Error : Kuadratik E = 0.5  k (tk - Y k ) 2 Untuk update bobot antara hidden dan output ;  E =  E  Y k  y_in k  w jk  Y k  y_in k  w jk  E = -  k (t k - Y k )  Y k Y k = f(y_in k ) y_in k = w ok +  z j w jk  Y k = f ‘ (y_in k )  y_in k = z j  y_in k  w jk

25 Fungsi Error : Kuadratik (2)  E(w jk ) = -  k (t k - Y k ) f ‘ (y_in k ) z j  w jk didefinisikan :  k =  k(t k - y k ) (f’(y_in))  E(w jk ) = -  k Z j  w jk  W = -  (-  k Z j )=   k Z j

26 Fungsi Error : Kuadratik (3) Untuk update bobot antara input dan hidden ;  E =  E  Y k  y_in k  z j  z_in j  v ij  Y k  y_in k  z j  z_in j  v ij  E = -  k (t k - Y k )  Y k Y k = f(y_in k ) y_in k = w ok +  z j w jk  Y k = f ‘ (y_in k )  y_in k = w jk  y_in k  z j

27 Fungsi Error : Kuadratik (4) n  z j = f ‘ (z_in j ) z_in j = v 0j +  x i v ij  z_in j i=1  z_in j = x i  v ij  E = -  k (t k - Y k ) f ‘(y_in k ) w jk f ‘(z_in j ) X i  v ij didefinisikan :  k =  k(t k - y k ) (f’(y_in))  E = -  k  k w jk f ‘(z_in j ) X i  v ij didefinisikan :  j =  k  k w jk f ‘(z_in j )  E = -  j X j  v ij  V = -  (-  j X i )=   j X i

28 Fungsi Error : Cross Entropi E =  k (-t k ). ln (Y k ) - (1 - t k ). ln (1 - Y k ) Untuk update bobot antara hidden dan output ;  E =  E  Y k  y_in k  w jk  Y k  y_in k  w jk  E =  k -t k t k = -  k (t k - Y k )  Y k Y k 1 - Y k Y k (1-Y k ) Y k = f(y_in k ) y_in k = w ok +  z j w jk  Y k = f ‘ (y_in k ) = Y k (1 - Y k )  y_in k = z j  y_in k  w jk

29 Fungsi Error : Cross Entropi(2)  E = -  k (t k - Y k ) Y k (1-Y k ) z j  w jk Y k (1-Y k ) = -  k (t k - Y k ) z j didefinisikan :  k =  k(t k - y k )  E = -  k Z j  w jk  W = -  (-  k Z j )=   k Z j

30 Fungsi Error : Cross Entropi(3) Untuk update bobot antara input dan hidden ;  E =  E  Y k  y_in k  z j  z_in j  v ij  Y k  y_in k  z j  z_in j  v ij  E =  k -t k t k = -  k (t k - Y k )  Y k Y k 1 - Y k Y k (1-Y k ) Y k = f(y_in k ) y_in k = w ok +  z j w jk  Y k = f ‘ (y_in k ) = Y k (1-Y k )  y_in k = w jk  y_in k  z j

31 Fungsi Error : Cross Entropi (4) n  z j = f ‘ (z_in j ) z_in j = v 0j +  x i v ij  z_in j i=1  z_in j = x i  v ij  E = -  k (t k - Y k ) f ‘(y_in k ) w jk f ‘(z_in j ) X i  v ij didefinisikan :  k =  k(t k - y k )  E = -  k  k w jk f ‘(z_in j ) X i  v ij didefinisikan :  j =  k  k w jk f ‘(z_in j )  E = -  j X j  v ij  V = -  (-  j X i )=   j X i

32 Fungsi Error : Metrik E =  k. ln (1 - (t k - Y k ) 2 ) Untuk update bobot antara hidden dan output ;  E =  E  Y k  y_in k  w jk  Y k  y_in k  w jk  E = -2  k (t k - Y k )  Y k (1 – (t k -Y k ) 2 ) Y k = f(y_in k ) y_in k = w ok +  z j w jk  Y k = f ‘ (y_in k ) = Y k (1 - Y k )  y_in k = z j  y_in k  w jk

33 Fungsi Error : Metrik(2)  E = -2  k (t k - Y k ) Y k (1-Y k ) z j  w jk (1-(t k -Y k )2) = -  k (t k - Y k ) zj didefinisikan :  k = -2  k (t k - y k ) Y k (1-Y k ) (1-(t k -Y k ) 2 )  E = -  k Z j  w jk  W = -  (-  k Z j )=   k Z j

34 Fungsi Error : Metrik(3) Untuk update bobot antara input dan hidden ;  E =  E  Y k  y_in k  z j  z_in j  v ij  Y k  y_in k  z j  z_in j  v ij  E = -2  k (t k - Y k )  Y k (1(t k – Y k ) 2 ) Y k = f(y_in k ) y_in k = w ok +  z j w jk  Y k = f ‘ (y_in k ) = Y k (1-Y k )  y_in k = w jk  y_in k  z j

35 Fungsi Error : Metrik(4) n  z j = f ‘ (z_in j ) z_in j = v 0j +  x i v ij  z_in j i=1  z_in j = x i  v ij  E = -2  k (t k - Y k ) f ‘(y_in k ) w jk f ‘(z_in j ) X i  v ij (1-(t k -Y k ) 2 ) didefinisikan :  j =  k  k w jk f ‘(z_in j )  E = -  j X j  v ij  V = -  (-  j X i )=   j X i

36 Algoritma Step 0 : Inisialisasi Bobot –Random –Nguyen-Widrom Step 1 : Selama kondisi stopping FALSE, lakukan Step 2-9 Step 2 : Untuk setiap pasangan pelatihan, lakukan Step 3-8 (Proses Feedforward) : Step 3 : Setiap unit input (X i, i = 1,…,n) - menerima input x i - mengirimkannya ke semua unit layer diatasnya (Hidden layer).

37 Algoritma (2) Step 4 : Setiap unit hidden (Z j, j = 1,…,p) - menghitung semua sinyal input dengan bobotnya : z_in j = v oj +  x i v ij - menghitung nilai aktivasi setiap unit hidden sebagai output unit hidden : z j = f(z_in j ) - mengirim nilai aktivasi sebagai input untuk unit output.

38 Algoritma (3) Step 5 : Setiap unit output (Y k, k = 1,…,m) - menghitung semua sinyal inputnya dengan bobotnya : y_in k = w ok +  z j w jk - menghitung nilai aktivasi setiap unit output sebagai output jaringan. y k = f(y_in k )

39 Algoritma (4) (Backpropagation of error) : Step 6 : Setiap unit output (Y k, k = 1,…,m) : - menerima pola target yang bersesuaian dengan pola input - menghitung informasi error :  k = (t k - y k ) f’(y_in k ) - menghitung besarnya koreksi bobot unit output :  w jk =   E(w j k j )/  w jk =   k z j - menghitung besarnya koreksi bias output :  w 0k =   k - mengirimkan  k ke unit-unit yang ada pada layer di bawahnya.

40 Algoritma(5) Step 7 : Setiap unit hidden (Zj, j = 1,…,p) : - menghitung semua koreksi error :  _in j =   k w jk - menghitung nilai aktivasi koreksi error :  j =  _in j f’(z_in j ) - menghitung koreksi bobot unit hidden :  v ij =   j x i - menghitung koreksi error bias unit hidden :  v 0j =   j

41 Algoritma(6) Step 8 : Setiap unit output (Y k, k = 1,…,m) : - meng-update bobot dan biasnya (j = 0,…,p) : w jk (baru) = w jk (lama) +  w jk w 0k (baru) = w 0k (lama) +  w 0k Setiap unit hidden (Z j, j = 1,…,p) - meng-update bobot dan biasnya (i = 0,…,n) : v ij (baru) = v ij (lama) +  v ij v 0j (baru) = v 0j (lama) +  v 0j Step 9 : Kondisi stopping ( Toleransi error )

42 Metode Inisialisasi Nguyen Widrow Menentukan faktor skala :  = 0.7 (p) 1/n dengan  : faktor skala n : jumlah unit input p : jumlah unit hidden Algoritma : Untuk setiap unit hidden (j=1,..., p) : Inisialisasi bobot secara random vij = bilangan acak antara -0.5 sampai 0.5 p Hitung :  vj  =  {  (vij)2} i=1 Update bobot vij =  vij  vj  Set bias v0j : bilangan acak antara -  sampai 


Download ppt "BACKPROPAGATION Dr. Benyamin Kusumoputro. Arsitektur JNPB JNPB terdiri dari : –satu lapis masukan –satu atau lebih lapis tersembunyi –satu lapis keluaran."

Presentasi serupa


Iklan oleh Google