JST Jaringan Saraf Tiruan.

Slides:

Advertisements

Presentasi serupa

UKURAN NILAI PUSAT UKURAN NILAI PUSAT ADALAH UKURAN YG DAPAT MEWAKILI DATA SECARA KESELURUHAN JENIS UKURAN NILAI PUSAT : MEAN , MEDIAN, MODUS KUARTIL,

Advertisements

Statistika Deskriptif: Distribusi Proporsi

SUBBIDANG DATA DAN INFORMASI

Wido Hanggoro ` Research and Development Department Indonesia Meteorological Climatological and Geophysical Agency.

Bulan maret 2012, nilai pewarnaan :

Tugas: Perangkat Keras Komputer Versi:1.0.0 Materi: Installing Windows 98 Penyaji: Zulkarnaen NS 1.

UKURAN PEMUSATAN Rata-rata, Median, Modus Oleh: ENDANG LISTYANI.

Bab 11A Nonparametrik: Data Frekuensi Bab 11A.

Bab 9B Analisis Variansi Bab 9B

BADAN KOORDINASI KELUARGA BERENCANA NASIONAL DIREKTORAT PELAPORAN DAN STATISTIK DISAJIKAN PADA RADALGRAM JAKARTA, 4 AGUSTUS 2009.

PEMBANDINGAN BERGANDA (Prof. Dr. Kusriningrum)

BOROBUDUR (4) FAHMI BASYA

JARINGAN SYARAF TIRUAN

Mari Kita Lihat Video Berikut ini.

Statistika Deskriptif

Bab 6B Distribusi Probabilitas Pensampelan

WEEK 6 Teknik Elektro – UIN SGD Bandung PERULANGAN - LOOPING.

Praktikum Metkuan Jaringan Syaraf Tiruan Propagasi Balik

UKURAN PENYEBARAN DATA

DISTRIBUSI FREKUENSI oleh Ratu Ilma Indra Putri. DEFINISI Pengelompokkan data menjadi tabulasi data dengan memakai kelas- kelas data dan dikaitkan dengan.

Pengolahan Citra Digital: Konsep Dasar Representasi Citra

: : Sisa Waktu.

Nonparametrik: Data Peringkat 2

PERKEMBANGAN KELULUSAN SMP/MTS, SMA/MA DAN SMK KOTA SEMARANG DUA TAHUN TERAKHIR T.P DAN 2013.

Pengujian Hipotesis Parametrik 2

Mata Kuliah: MATEMATIKA DISKRIT Harni Kusniyati

P E R C O B A A N F A K T O R I A L D E N G A N RANCANGAN ACAK LENGKAP

Aplikasi Matlab untuk Jaringan Syaraf Tiruan

Selamat Datang Dalam Kuliah Terbuka Ini

Bulan FEBRUARI 2012, nilai pewarnaan :

AREAL PARKIR PEMERINTAH KABUPATEN JEMBRANA

KINERJA SAMPAI DENGAN BULAN AGUSTUS 2013

Nonparametrik: Data Peringkat 2

DEA (Data Encryption Algorithm)

Jaringan Saraf Tiruan Model Hebb.

METODE HEBB~3 Sutarno, ST. MT..

Pengenalan Jaringan Syaraf Tiruan

Ir. Endang Sri Rahayu, M.Kom.

Aritmatika Bilangan Biner

Bab 9B Analisis Variansi Bab 9B

Statistika Deskriptif: Statistik Sampel

Statistika Deskriptif: Distribusi Proporsi

Nilai Ujian Statistik 80 orang mahasiswa Fapet UNHAS adalah sebagai berikut:

Teknik Numeris (Numerical Technique)

• Perwakilan BKKBN Provinsi Sulawesi Tengah•

BAB2 QUEUE 6.3 & 7.3 NESTED LOOP.

PERCEPTRON Arsitektur jaringannya mirip dengan Hebb

JST BACK PROPAGATION.

Jaringan Syaraf Tiruan

Korelasi dan Regresi Ganda

Jaringan Syaraf Tiruan (JST)

Pengantar sistem informasi Rahma dhania salamah msp.

Informatics Theory & Programming (ITP) Informatics Eng. Dept. – IT Telkom.

Konsep dasar Algoritma Contoh Problem

JARINGAN SARAF TIRUAN LANJUTAN

JST BACK PROPAGATION.

Jarringan Syaraf Tiruan

Learning Kecerdasan Mesin dan Artifisial

Pertemuan 12 ARTIFICIAL NEURAL NETWORKS (ANN) - JARINGAN SYARAF TIRUAN - Betha Nurina Sari, M.Kom.

Artificial Neural Network

Aplikasi Kecerdasan Komputasional

Jaringan Syaraf Tiruan

Jaringan Syaraf Tiruan Artificial Neural Networks (ANN)

Struktur Jaringan Syaraf Tiruan

Pertemuan 12 ARTIFICIAL NEURAL NETWORKS (ANN) - JARINGAN SYARAF TIRUAN - Betha Nurina Sari, M.Kom.

Transcript presentasi:

JST Jaringan Saraf Tiruan

Tahapan JST Tahap pembelajaran Tahap implementasi / testing

Paradigma Pembelajaran Terawasi (Supervised Learning) input dan output ditentukan, ada contoh untuk pelatihan. Tak Terawasi (Unsupervised Learning) tak ada contoh pelatihan. Gabungan antara Supervised dan Unsupervised (Hybrid)

Perceptron Neuron: Sel syaraf biologis Perceptron: Sel syaraf buatan Fungsi Input Fungsi Aktivasi Output

Perceptron

Perceptron Perceptron = MODEL SEDERHANA dari neuron Apa yang bisa dilakukan oleh satu perceptron? Klasifikasi Prediksi Optimasi, …

AND x1 x2 y 1 w = 1 x1  y y x2 w = 1 θ = 1,5

OR x1 x2 y 1 w = 1 x1  y y x2 θ = 0,5 w = 1

XOR y y y y    θ = 0,5 w = -1 x1 w = 1 w = 1 w = 1 θ = 0,5 w = 1 x2 1 θ = 0,5 w = -1  y x1 w = 1 w = 1  y y w = 1 θ = 0,5  y w = 1 x2 w = -1 θ = 0,5

Visualisasi 100 dimensi? Bisa dengan Perceptron?

Pola Pix 1 2 3 4 5 … 100 E1 F1 G1 O1 .. O5

Multi-Layer Perceptron (MLP)

Back Propagation (Propagasi balik)

Algoritma Belajar Propagasi Balik Definisikan masalah Matriks pola masukan (P) matriks target (T) Inisialisasi parameter jaringan Arsitektur jaringan (misalkan I-H-O) Bobot acak (atau dengan metode tertentu) Learning rate (lr)  laju belajar Threshold MSE  untuk menghentikan learning

Pengenalan Karakter E, F, G, O Matriks P Matriks T Pola Pix 1 2 3 4 5 … 100 E1 F1 G1 O1 E2 O5 N1 N2 N3 N4 Kelas 1 E F G O …

Training W1 W1 W2 W2 A1 A2 T E F2, G2, O2, … dan seterusnya W1 & W2: Random 0.71 -0.21 0.33 0.97 -0.18 0.62 0.55 -0.12 0.75 W1 -0.54 0.15 -0.49 0.68 -0.24 -0.95 -0.37 0.89 0.34 W1 -0.52 0.91 0.29 0.97 -0.18 0.62 0.55 -0.12 0.68 W2 -0.21 -0.53 0.58 0.32 0.25 -0.17 -0.93 0.45 0.88 0.87 W2 9.5 4.3 8.7 A1 0.9 0.1 0.4 0.3 A2 1 T 0.1 -0.1 -0.4 -0.3 E F2, G2, O2, … dan seterusnya hingga pola O5

Testing W1 W2 A2 Kelas W1 & W2: Trained 0.01 -0.83 0.19 0.34 0.22 0.62 0.60 -0.53 -0.38 W1 0.31 -0.38 0.35 0.87 -0.18 0.30 0.03 -0.09 0.98 0.74 W2 0.8 0.2 0.1 A2 1 Kelas

Strategi penggunaan ANN Cara memandang masalah: Klasifikasi Sekuriti Prediksi Optimasi Teknik learning: Supervised/Unsupervised Desain Arsitektur Jumlah layer Jumlah neuron Pemetaan output Strategi learning Penyiapan data: filterisasi data, pembagian data (training, validasi, test) Parameter: inisialisasi (acak atau memakai algoritma), laju belajar, dsb. Penghentian learning

Kasus 1 Verifikasi tandatangan OFFLINE atau ONLINE? Citra: 100 x 100 pixel grayscale Satu juta tandatangan? Input & Output? P dan T? Struktur dan parameter MLP? Perlu preprocessing?

Kasus 2: Sistem keamanan Satu ruangan hanya 10 orang yang boleh masuk Setiap orang yang akan masuk ruangan harus menempelkan ibu jari untuk diverifikasi sidik jarinya Citra: 300 x 300 pixels Input & Output? P dan T? Struktur dan parameter MLP? Perlu preprocessing?

Kasus 3: Prediksi pelanggan PSTN Data riil dari PT Telkom Jumlah pelanggan bulanan selama 7 tahun Error harus < 1 % Input & Output? P dan T? Struktur dan parameter MLP? Perlu preprocessing?

Kasus 4: Spam Filtering Email spam Email sampah atau email yang tidak diperlukan user Contoh: Instant messaging spam Web search engine spam Blogs spam Mobile phone messaging spam, dsb. Jumlahnya mencapai 90 milyar per hari

Tujuan Spam Penipuan (lotre, silahkan hubungi kami di alamat ...) Money laundring (menawarkan transaksi pekerjaan yang berhubungan dengan rekening bank) Promosi produk (seperti produk obat- obatan) Menyebarkan virus, trojan, worm, dsb.

From: DOUGLAS M ROBIN douglas_markrobin@yahoo. co From: DOUGLAS M ROBIN douglas_markrobin@yahoo.co.uk Subject: COMPLETE THE FORM WITH YOUR PASSPORT PHOTO ATTACHED The National Lottery PAYMENT/PROCESSING OFFICE, LONDON, UK. 3240 RIDGE-WAY,LONDON NW71RN. 00447040112422 Batch/074/05/ZY3 Ticket/ 5647600545188 Serial No /5073-11 Dear (), l acknowledge the receipt of your mail, as regard your request the reason is that over the years we have had cases of double claim of winnings and with the help of the verification form its earlier to detect the winners in various category. Your information is need to process other vital document before your cash prize can be release to you for claim. l need those vital information alongside passport photo to proceed with the processing of your winnings.l need urgent response in 24 hrs because you have less 2 weeks . Regards, Douglas Robin. (FIDUCIARY OFFICER)

Discovery Challenge Merupakan kompetisi tingkat internasional tentang Personalised Spam Filtering yang diselengarakan di Humboldt-Universität zu Berlin, Jerman. Menemukan daftar aturan atau strategi yang dapat membedakan suatu email sebagai spam atau bukan.

Data 4000 email sebagai training set untuk proses pelatihan (learning). 2000 spam dan 2000 non-spam. 4000 email sebagai tune set (validation set) untuk proses validasi hasil learning. 2000 spam dan 2000 non-spam. 2500 email sebagai validation set untuk proses validasi hasil learning. Data ini diambil dari suatu inbox pengguna yang berisi 1250 spam dan 1250 non-spam. 7500 email sebagai test set yang belum ada labelnya: spam atau non-spam. Data ini diambil dari 3 inbox, dimana masing-masing inbox berisi 2500 email.

Aturan Agar kompetisi berjalan adil, 18.000 email tersebut dikodekan ke dalam angka-angka. Pertama, dibuat daftar semua kata yang pernah muncul pada semua email tersebut (sering kita sebut dengan wordlist atau dictionary). Dari semua email tersebut, ternyata dihasilkan dictionary yang berisi lebih dari 200.000 kata. Kedua, setiap email akan diparsing dan setiap kata yang ditemukan diganti dengan nomor kata pada dictionary yang sudah dibuat tadi dan dihitung juga frekuensi kemunculan setiap kata dalam email tersebut. Email spam diberi kode 1, email non-spam diberi kode -1, dan email yang belum diketahui spam atau non-spam diberi kode 0.

Misal: Wordlist (Dictionary) No Kata 1 attached 2 document 3 form 4 lottery 5 national 6 open 7 passport 8 ticket … 200.000 urgent

From: DOUGLAS M ROBIN douglas_markrobin@yahoo. co From: DOUGLAS M ROBIN douglas_markrobin@yahoo.co.uk Subject: COMPLETE THE FORM WITH YOUR PASSPORT PHOTO ATTACHED The National Lottery PAYMENT/PROCESSING OFFICE, LONDON, UK. 3240 RIDGE-WAY,LONDON NW71RN. 00447040112422 Batch/074/05/ZY3 Ticket/ 5647600545188 Serial No /5073-11 Dear (), l acknowledge the receipt of your mail, as regard your request the reason is that over the years we have had cases of double claim of winnings and with the help of the verification form its earlier to detect the winners in various category. Your information is need to process other vital document before your cash prize can be release to you for claim. l need those vital information alongside passport photo to proceed with the processing of your winnings.l need urgent response in 24 hrs because you have less 2 weeks . Regards, Douglas Robin. (FIDUCIARY OFFICER)

Contoh: Spam Email 1 35:1 73:1 77:1 206:1 16176:1 1 2058:1 27162:1 49588:1 1 9:3 94:1 109:1 163:1 405:1 406:1 415:2 416:1 435:3 436:3 437:4 440:4 450:3 456:1 457:1 461:1 466:1 467:1 477:1 478:1 751:1 1015:1 1034:14 1041:1 1216:1 1226:1 1231:1 1666:1 2344:1 2345:1 2505:1 2528:1 3498:1 4339:1 4463:1 7480:1 8143:1 15050:1 17176:1 19051:1 20895:1 22963:1 35908:1 48253:1 49469:1 60004:1 78684:1 84924:1 85550:1 93429:1 95839:1 106782:1 106783:4 106784:2 106785:2 106786:1 106788:1 106802:1 106803:1

Contoh: Non-Spam Email -1 9:1 82:1 92:1 104:1 231:1 308:1 338:1 351:1 390:1 440:2 693:1 933:1 975:1 984:1 1631:1 2404:2 2560:2 2589:2 3361:1 3630:1 4042:1 4059:1 6515:1 7851:1 8762:1 10427:1 16178:1 37517:1 44973:1 53347:1 109089:2 109090:1 110944:1 111668:1 133323:1 140060:1 155590:1

Contoh: Email Tak Berlabel 0 94:1 204:1 257:1 582:1 4898:1 6371:1

Teknik Klasifikasi? ID3 Bayesian Learning Algoritma Genetika Support Vector Machine ANN: MLP Atau teknik lainnya

Training Set Email ke- K1 K2 K3 K4 K5 K6 … K200000 Kelas 1 3 9 2 7 -1 2 7 -1 17 8 4 16 5 6 12 18 4000 23

Supervised vs Unsupervised Klasifikasi Clustering Kelas harus diketahui Kelas tidak harus diketahui Waktu training lambat Waktu training cepat

Supervised vs Unsupervised Supervised  Klasifikasi Jumlah kelas diketahui Tersedia data latih yang VALID Unsupervised  Clustering Jumlah kelas bisa tidak diketahui Tidak tersedia data latih yang VALID User mengajari ANN ANN memberitahu user

ANN Klasifikasi atau Clustering Mudah implementasi Akurasi tinggi Tahan noise Implementasi hardaware (CHIP) Harus tersedia data latih dengan kelas yang jelas Waktu training lama Training ulang Penalarannya tidak bisa dijelaskan (Weights)