PENGEMBANGAN SISTEM PENGENALAN HURUF ARAB

Slides:



Advertisements
Presentasi serupa
KAJIAN PUSTAKA Oleh: Trisakti Handayani
Advertisements

Pengolahan Citra Digital
PENGENALAN POLA Dr. Kusrini, M.Kom.
CARA PENYAJIAN HAL-HAL DASAR
PEMBUATAN MEDIA PRESENTASI DENGAN POWER POINT
Drs. Iwan Wijaya PELATIHAN MEDIA PRESENTASI DENGAN Ms. POWER POINT 2007 SELAMAT DATANG di.
CS3204 Pengolahan Citra - UAS
Algoritma Thinning dan Aplikasinya
Morphologi.
ANATOMI KARYA ILMIAH Pendahuluan Format Pengetikan
“Image Retrieval” Shinta P.
Pengolahan Citra Berwarna
Pengolahan Citra (TIF05)
Pengolahan Citra Digital: Morfologi Citra
PEMBELAJARAN berbasis ICT
CSS.
KEMENTERIAN PENDIDIKAN NASIONAL
HTML Basic.
Pertemuan 7 Pengolahan Citra Digital
MORFOLOGI CITRA.
KEMENTERIAN PENDIDIKAN NASIONAL
Pusat Teknologi Informasi dan Komunikasi Pendidikan (Pustekkom) Departemen Pendidikan Nasional... educating people through ICT... Media Presentasi Menggunakan.
CITRA BINER.
2.2 Operasi Dasar Citra : Lokal dan Objek Operasi Ketetanggaan Pixel
MODUL KULIAH 10 Ekstraksi Fitur Bentuk
Semua isi di dalam PPT ini bersumberkan:
Implementasi Steganografi pada Media Teks dengan Metode Line-Shift Coding dan Metode Centroid Oleh: Indri Andiniarti G Pembimbing : Shelvie.
Pertemuan 9 : Temu Balik Informasi Multimedia
Pertemuan 1 Introduction
Media Presentasi Menggunakan Microsoft Power Point 2007
DBMS Basis Data Pertemuan 2.
Operasi-operasi Dasar Pengolahan Citra Digital
Mengapa Kita Butuh FFT ? 2013.
CS3204 Pengolahan Citra - UAS
MODUL16 Aplikasi Fitur Bentuk
Pengolahan Citra Digital: Morfologi Citra
Pengolahan Citra Digital: Morfologi Citra
Pengolahan Citra Digital: Morfologi Citra
Pengolahan Citra Digital
KOMPUTER APLIKASI IT XHTML & CSS MODUL 06
PENGERTIAN FONT SERIF DAN SANS SERIF
TEMU BALIK INFORMASI TI 14 A.
KEMENTERIAN PENDIDIKAN NASIONAL
RESEARCH FIELDS BIDANG PENELITIAN.
SERIF Jenis huruf Serif adalah huruf yang memiliki garis-garis kecil yang berdiri horizontal pada badan huruf. Garis-garis kecil ini biasa disebut juga.
PANDUAN PEMBUATAN PRESENTASI
PERTEMUAN 11 Morfologi Citra
Pengolahan Citra Pertemuan 11
Membuat Dokumen dengan Software Pengolah Angka
Analisis Tekstur.
OPERASI PADA CITRA BINER
Deteksi Tepi Pengolahan Citra Danar Putra Pamungkas, M.Kom
PENGEMBANGAN SISTEM PENGENALAN HURUF ARAB
Mengapa Kita Butuh FFT ? 2014.
Pengolahan Citra Digital Peningkatan Mutu/Kualitas Citra
Tips Membuat Presentasi Efektif
PENINGKATAN KUALITAS CITRA (Image Enhancement)
Digital Image Processing
14. MENARIK KESIMPULAN DAN MENYUSUN LAPORAN
Fast Fourier Transform (FFT)
Konsep Dasar Pengolahan Citra
Pembangunan Media Pembelajaran Untuk Konsep Struktur Kontrol Pada Algoritma Berbasis Multimedia ALFIN AKBAR
Segmentasi Gambar Pertemuan 10
IMAGE ENHANCEMENT.
Tips Membuat Presentasi Efektif
Pertemuan 10 Mata Kuliah Pengolahan Citra
SEGMENTASI.
Media Presentasi Menggunakan Microsoft Power Point 2007.
KEMENTERIAN PENDIDIKAN NASIONAL
Pusat Teknologi Informasi dan Komunikasi Pendidikan (Pustekkom) Departemen Pendidikan Nasional... educating people through ICT... Tips Membuat Presentasi.
Transcript presentasi:

PENGEMBANGAN SISTEM PENGENALAN HURUF ARAB M. ALBADR LUTAN NASUTION 13508011

Latar Belakang OCR sangat praktikal 50 bahasa 200 juta jiwa Tertinggal vs latin Segmentasi minim

Rumusan Masalah Segmentasi yg mendukung Skema hubungan komponen Kinerja Proses segmentasi yang mendukung Fitur dan pohon klasifikasi Skema penggabungan antar komponen pengenalan Kinerja perangkat lunak yang dibangun

citra teks alih aksara, terjemah, pencarian, suara, ... Tujuan piksel sulit diolah huruf dapat disunting dapat dicari OCR

Pelatihan dan Pengenalan Studi Literatur Tulisan Arab: 31 huruf, kursif, 4 bentuk, titik Akuisisi Data: Online vs Offline Tahapan Umum OCR: Piksel Fitur Huruf Kata Kalimat Makna Praproses Segmentasi Representasi Pelatihan dan Pengenalan Pascaproses

Penelitian Terkait Sarfraz, dkk (2003): Pengenalan nomor plat kendaraan dg. pencocokan templat Al-Taani dan Al-Haj (2010): Pengenalan huruf online dg. pohon keputusan Sarhan dan Al-Helalat (2007): Pengenalan huruf dg. JST dan fitur standar devisasi dan piksel Zidouri (2010): Metode segmentasi baru dan pengenalan dua tingkat: templat dan JST Abandah,dkk (2009): Ragam fitur huruf dan kombinasi pengenaan statistik

Alur Proses Praolah Segmentasi Penipisan Ekstraksi Fitur Klasifikasi

Praolah Median Filter Binerisasi Tinggi 64 Piksel Lini Basis 64 piksel Sekilas saja (1 menit lah) Median filter: setiap piksel dikumpulkan tetangganya dan diganti dengan nilai tengah. Untuk penghilangan derau. Binerisasi: Warna jadi hitam putih, dengan threshold Tinggi: Citra baris disamakan tingginya 64 piksel P1’ = median (P1..P9) BLACK if RG||GB||RB 64 piksel lini basis

Templat Cowell Hussain Penipisan Algoritma Hilditch Templat Cowell Hussain Templat Ketebalan Cepat saja, jangan lebih dari 30 detik 2 < = B(p1) < = 6 A(p1)=1 p2.p4.p8=0 or A(p2)!= 1 p2.p4.p6=0 or A(p4)!= 1

Segmentasi Baris Upakata Huruf Proyeksi horizontal Analisis piksel bersambung Badan utama vs objek sekunder Huruf Algoritma Zidouri (2010)

Segmentasi Baris

Segmentasi Upakata Tiap sangkar digolongkan ke: Amin (2000) Tiap sangkar digolongkan ke: “badan utama”, “objek sekunder”, dan “derau”

Segmentasi Huruf Zidouri (2010) Tipiskan Cari deretan piksel Masukkan fitur ke rule Ekstrak fitur setiap kandidat Masukkan sebagai pita kandidat Cek panjang deretan dan piksel atas bawah Cari deretan piksel Tipiskan Zidouri (2010)

Ekstraksi Fitur Badan Utama Tulang & Keliling Komponen Sekunder Rasio aspek Proyeksi Distribusi piksel Jumlah lubang Badan Utama Titik minat Rantai kode Panjang keliling Diag/keliling Rasio kekompakan Tulang & Keliling Jumlah Posisi Jenis komponen Komponen Sekunder

Klasifikasi Pohon Keputusan C4.5 (J48) Badan Utama Weka ++ Objek Sekunder

Data Uji Teks Arab 37 Halaman Sumber: Wikipedia Total 37 dokumen. Citra dari scanan dan ekspor Corel.

Prosedur Pengujian Fungsional Cek sampel hasil setiap proses Hingga fungsi dianggap cukup baik Segmentasi Data uji: seluruh citra dokumen Simpan citra hasil tiap segmentasi Hitung citra hasil (manual) Benar, Undersegmentasi, Oversegmentasi Klasifikasi Pembelajaran dari citra huruf tunggal manual tiap font Kinerja komponen: validasi silang setiap font pada data latih Kinerja sistem: cek dan hitung tebakan seluruh huruf pada data uji citra dokumen

Skrinsyut Citra asli Setelah praolah Penipisan Pengotakan Seg. huruf

Antarmuka

Hasil Uji: Seg. Baris Benar 98%. Under 0%. Over 2%. Jenis Huruf B O K Arial 99% 1% 21% Arial Unicode MS 9% Microsoft Sans Serif 98% 2% Segoe UI 27% Tahoma 13% Traditional Arabic 97% 3% 33% Benar 98%. Under 0%. Over 2%.

Hasil Uji: Seg. Huruf Benar 86%. Under 8%. Over 6%. Jenis Huruf B U O Arial 84% 11% 5% Arial Unicode MS 79% 17% 4% Microsoft Sans Serif 54% 43% 3% Segoe UI 91% 2% 7% Tahoma 92% 6% Traditional Arabic 46% 50% Benar 74%. Under 21%. Over 5%. Benar 86%. Under 8%. Over 6%.

demo?

Terima kasih.