Presentasi sedang didownload. Silahkan tunggu

Presentasi sedang didownload. Silahkan tunggu

 Terdapat banyak jenis pola: ◦ Pola visual ◦ Pola temporal ◦ Pola logikal  Tidak ada tepat satu teori untuk menyelesaikan problem pengenalan pola 

Presentasi serupa


Presentasi berjudul: " Terdapat banyak jenis pola: ◦ Pola visual ◦ Pola temporal ◦ Pola logikal  Tidak ada tepat satu teori untuk menyelesaikan problem pengenalan pola "— Transcript presentasi:

1

2  Terdapat banyak jenis pola: ◦ Pola visual ◦ Pola temporal ◦ Pola logikal  Tidak ada tepat satu teori untuk menyelesaikan problem pengenalan pola  Terdapat model standar yang dapat dijadikan teori acuan ◦ Statistik atau Fuzzy ◦ Syntatic atau Struktur ◦ Berbasis pengetahuan 2 Statistical Pattern Recognitio n

3  Problem pengenalan pola didefinisikan sebagai problem klasifikasi  Daftar kata kunci : ◦ Klasifikasi ◦ Fitur ◦ Vektor fitur ◦ Model klasifikasi standar 3

4  Diperlukan suatu sistem untuk melakukan pengenalan ◦ Sistem mengenali data kemudian mengklasifikasi data tersebut berdasarkan pola tertentu ke suatu klas  Contoh aplikasi yang melakukan … ◦ Pengenalan suara ◦ Identifikasi sidik jari ◦ Pengenal karakter secara optik (OCR) ◦ Identifikasi urutan DNA 4

5  Terdapat data dengan pola visual  Data merepresentasikan karakter 26 huruf alfabet  Definisi problem: ◦ Pengenalan pola data yang diklasifikasikan ke 26 kelas ◦ Data kelas 1 adalah huruf A dengan segala variasi penulisannya, dst 5

6  Data merepresentasikan karakter 26 huruf alfabet  Definisi tujuan sistem  mengklasifikasikan data ke 26 kelas yang ada berdasarkan standar polanya  Problem yang muncul ◦ Q 1 : Apa yang akan dibandingkan? FITUR ◦ Q 2 : Bagaimana mengukur tingkat kesamaan pola? 6 standar pola kelas 1 Array nilai tingkat terang pixel Data dengan pola visual standar pola kelas 2 standar pola kelas 4 DITERIMA DITERIMA DITOLAK

7  Fitur adalah suatu nilai yang dapat membantu sebagai pembeda  Contoh dalam klasifikasi huruf cetak ◦ Dalam penentuan fitur untuk pembandingan perlu …  tahu luas area huruf  tahu daerah perbatasan luar huruf ◦ Dalam pengukuran tingkat kesamaan huruf dilakukan …  Berdasarkan rasio kepadatan luas area penulisan huruf dengan area batas luar huruf (disebut perimeter)  Huruf B lebih padat daripada huruf O  Berdasarkan tingkat simetri area huruf bagian atas dengan bawah  Huruf B lebih simetri daripada huruf P  Beberapa fitur dapat sensitif akan perubahan nilai ◦ Fitur tingkat kelurusan sisi kiri huruf  Pola untuk membedakan huruf D atau O 7

8  Set nilai sejumlah d fitur dihasilkan dari pengukuran setiap data yang akan diklasifikasikan ◦ x 1 = area ◦ x 2 = perimeter, …, ◦ x d = panjang garis melengkung / jarak garis lurus  Nilai sejumlah d fitur dari suatu data disimpan sebagai sebuah matrik baris x  Vektor Fitur ◦ Vektor x memiliki d baris = suatu data memiliki d dimensi ◦ Vektor x digambarkan sebagai suatu titik pada ruang fitur dimensi d 8

9  Pola suatu data hasil dari pengukuran direpresentasikan dalam sebuah vektor  Pada pengenalan pola terjadi pengurangan jumlah informasi, pemetaan atau pelabelan informasi 9

10  Sekumpulan ikan diletakkan pada ban berjalan  Berdasarkan sensor optik, mesin dapat mengelompokkan ikan-ikan tersebut sebagai SeaBass dan Salmon  Analisa problem ◦ Set posisi kamera untuk mengambil gambar ikan-ikan ◦ Dari gambar akan diekstrak informasi fitur:  Panjang ikan  Tingkat kecerahan warna sisik ikan  Lebar badan ikan  Jumlah dan bentuk sirip ikan  Posisi mulut ikan, dll. 10

11 11 sensor optik kumpulan ikan pada ban berjalan pra pemrosesan gambar ikan-ikan operasi segmentasi gambar untuk membedakan setiap ikan ekstraksi fitur peng- klasifikasi hasil pengelom- pokkan ikan salmon seabass lebar badan ikan tingkat kecerahan warna sisik ikan

12 12 Pilihan Fitur 1 : Panjang Ikan ERROR SEABASS ERROR SALMON NILAI AMBANG BATAS

13 13 ERROR SEABASS ERROR SALMON NILAI AMBANG BATAS fitur lightness lebih baik dibanding fitur length

14  Penentuan nilai ambang batas (threshold decision boundary) menentukan nilai biaya (cost function)  Solusi ◦ Menambah atau mengurangi nilai ambang batas 14 Problem yang Muncul TEORI KEPUTUSAN ERROR SALMON ERROR SEABASS Jika nilai ambang batas dikurangi:  seabass masuk klas salmon berkurang  salmon masuk klas seabass bertambah

15  Digunakan fitur lebar ikan dan tingkat kecerahan sisik ikan 15 x T = [ x 1, x 2 ] LIGHTNESS WIDTH

16  Batas pemisah (decision boundary) terbaik memberikan hasil klasifikasi yang optimal 16

17 17  Sistem pengenalan tidak memiliki sifat generalisasi jika ◦ Sistem hanya dapat mengklasifikasi data pelatihan ◦ Sistem tidak dapa mengklasifikasi dengan baik data baru GENERALISASI

18 18 SENSING : menggunakan alat optik untuk menangkap pola visual (mis: kamera) sistem pengenalan pola sensitif akan resolusi alat optik untuk mengurangi data terdistorsi x T = [ x 1, x 2 ] salmon seabass SEGMENTASI : pola – pola yang ada harus terpisah, tidak bertumpuk POST PROCESSING : melakukan evaluasi tingkat kesalahan (error rate) mempertimbangkan mengganti jenis fitur untuk pengenalan

19  Collect data : mengumpulkan data untuk pelatihan dan uji coba  Feature choice : memilih fitur yang akan digunakan berdasarkan data dan menentukan informasi prior  Model choice : memilih model klasifikasi. (catatan: telah ditetapkan model pengenalan pola berdasarkan teori statistik)  Train classifier : dengan data pelatihan, informasi prioir akan berubah sampai performa fungsi klasifikasi optimal  Evaluate classifier : melakukan evaluasi tingkat kesalahan kemudian mempertimbangkan untuk mengganti fitur 19 KOMPLEKSITA S KOMPUTASI Trade-off antara kemudahan komputasi dengan performa

20  Pembelajaran Supervised ◦ Terdapat kategori/klas/label sebagai hasil klasifikasi ◦ Terdapat fungsi biaya untuk setiap pola pada data pelatihan  Pembelajaran Unsupervised ◦ Sistem akan membentuk cluster/kelompok/gugus data berdasarkan pola yang ada 20

21  Melakukan ekstraksi fitur data asal untuk mendapat set fitur d; x 1, x 2, …, x d  Desain ekstraktor fitur tergantung pada problem  Keinginan ◦ Ekstraktor fitur menghasilkan vektor fitur yang sama untuk setiap data pada suatu klas  Kenyataan ◦ Ekstraktor fitur menghasilkan vektor fitur yang relatif sama untuk setiap data pada suatu klas ◦ Variasi vektor fitur data pada satu kelas lebih kecil dibanding data pada lain kelas 21

22 22  Membuat solusi hipotesa awal, kemudian diadaptasi modelnya sampai optimal ◦ CARA INTUITIF  Menurunkan fungsi pengklasifikasi optimal dari model matematisnya ◦ Membahas teori:  Pencocokan template ( template matching )  Pengklasifikasian mencari jarak terdekat ( minimum-distance classifiers )  Pengukuran ( metrics )  Perkalian inner product  Diskriminan linear  Decision boundaries

23 23  Contoh huruf alfabet D dan O dengan variasi penulisannya  Gambar D dan O kiri dijadikan acuan/template karena bebas distorsi  Data-data gambar sebelah kanan akan dicocokkan dengan template yang ada dan dihitung tingkat kecocokannya

24  Ada beberapa pendekatan yaitu: ◦ Maximum Correlation = jumlah kesamaan  Menghitung jumlah pixel hitam atau putih yang sama antar data dengan template  Pilih kelas dengan nilai kesamaan terbesar ◦ Minimum Error = jumlah ketidaksamaan  Menghitung jumlah pixel yang tidak sama (pixel hitam pada data dengan pixel putih pada template atau sebaliknya)  Pilih kelas dengan nilai ketidaksamaan terkecil  Digunakan jika variasi pada setiap kelas tergantung pada ada tidaknya tambahan noise ◦ Pada pengenalan huruf tidak terdapat distorsi akibat translation, rotation, shearing, warping, expansion, contraction, atau occlusion 24

25  Ekspresi Matematika dari Template Matching sebagai berikut: ◦ Terdapat vektor fitur x untuk data input ◦ Ditentukan sejumlah c klas ◦ Ditentukan template untuk setiap klas, m 1, m 2, …, m c  Error template matching antara x dan template ke k, m k dihitung dari norm vektor ( x - m k ) = || x - m k || dan k = { 1 … c }  Penghitungan || x - m k || = menghitung jarak antara vektor x dan vektor m k  Pengklasifikasi akan mencari error terkecil = mencari jarak terdekat ◦ Pengklasifikasi dengan Template Matching = Minimum-Distance Classifier 25

26 26

27  Ada banyak cara untuk mendefinisikan Norm || u ||. Contoh sebagai berikut : ◦ Manhattan ( taxicab ) metric  || u || = | u 1 | + | u 2 |+ | u 3 | | u d |  Contoh: digunakan pada template matching pengenalan huruf dengan menghitung jumlah ketidaksamaan ◦ Euclidean metric  || u || = sqrt ( u u u d 2 )  Untuk selanjutnya akan digunakan model ini 27

28  Contour dari jarak konstan Euclidean berbentuk circles / spheres  Contour dari jarak konstan Manhattan berbentuk squares / boxes  Contour dari jarak konstan Mahalanobis berbentuk ellipses/ellipsoids  Untuk selanjutnya pengukuran jarak akan menggunakan metric Euclidean atau Mahalanobis 28


Download ppt " Terdapat banyak jenis pola: ◦ Pola visual ◦ Pola temporal ◦ Pola logikal  Tidak ada tepat satu teori untuk menyelesaikan problem pengenalan pola "

Presentasi serupa


Iklan oleh Google