Fakultas Ilmu Komputer – Universitas Indonesia DEVELOPING POSTAG FOR BAHASA INDONESIA Mirna Adriani Information Retrieval Lab Faculty of Computer Science.

Slides:



Advertisements
Presentasi serupa
TURUNAN/ DIFERENSIAL.
Advertisements

Selamat Datang Dalam Kuliah Terbuka Ini
METODE PERHITUNGAN (Analisis Stabilitas Lereng)
Sistem Kelistrikan & Instrumen
Pengendalian Proses : Seleksi (Conditional)
Menunjukkan berbagai peralatan TIK melalui gambar
03/04/2017 BARISAN DAN DERET KONSEP BARISAN DAN DERET 1.
ANALISIS PROSES BISNIS 8
Mata Kuliah Teknik Digital TKE 113
Mata Kuliah Dasar Teknik Digital TKE 113
Translasi Rotasi Refleksi Dilatasi
1 Pengantar Teknologi Informasi 1. Gambaran Umum.
Dr. Yoke Muelgini, M.Sc. Jurusan Ekonomi dan Studi Pembangunan Fakultas Ekonomi dan Bisnis Universitas Lampung 2012 FEB Unila Course on Econometrics 1.
Dr. Yoke Muelgini, M.Sc. Jurusan Ekonomi dan Studi Pembangunan Fakultas Ekonomi dan Bisnis Universitas Lampung 2012 FEB Unila Course on Econometrics 1.
ELEKTRONIKA Bab 7. Pembiasan Transistor
Menempatkan Pointer Q 6.3 & 7.3 NESTED LOOP.
Tugas Praktikum 1 Dani Firdaus  1,12,23,34 Amanda  2,13,24,35 Dede  3,14,25,36 Gregorius  4,15,26,37 Mirza  5,16,27,38 M. Ari  6,17,28,39 Mughni.
SOAL ESSAY KELAS XI IPS.
Suku ke- n barisan aritmatika
MANAJEMEN OPERASI DOSEN: Munjiati Munawaroh, S.E.,M.Si
Metode Simpleks Diperbaiki (Revised Simplex Method)
1suhardjono waktu 1Keterkatian PKB dengan Karya Inovatif, Macam dan Angka Kredit Karya Inovatif (buku 4 halaman ) 3 Jp 3Menilai Karya Inovatif.
Sistem Persamaan Diferensial
1 tutu ba tutu. 2 kuku kuku 3 lulu lulu 4 bat u bak u bal u.
1. = 5 – 12 – 6 = – (1 - - ) X 300 = = = 130.
Mendiagnisis dan menangani kelesuan manajerial Jawablan semua pertanyaan di bawah ini : 0 = sangat jarang atau tidak pernah 1 = jarang 2 = terkadang 3.
E-Business Framework Lecturer : Bambang Warsuta, S.Kom, M.T.I S1 Teknik Informatika Fakultas Ilmu Komputer Universitas Pembangunan.
Teori Tingkah Laku Konsumen Teori Nilaiguna (Utility)
STANDARD PELAYANAN MINIMAL PENDIDIKAN DASAR (SPM)
LUAS DAERAH LINGKARAN LANGKAH-LANGKAH :
Created by : Peningkatan kualitas Pendidikan Guru Produktif SMK di Kabupaten Indramayu Indramayu, 22 September 2007.
Mari Kita Lihat Video Berikut ini.
Sudaryatno Sudirham Bilangan Kompleks Klik untuk melanjutkan.
10 Uji Hipotesis untuk Dua Sampel.
Powerpoint Templates Page 1 Powerpoint Templates Page 2 Mohamad Mujab Fahmi Andri
ANALISA NILAI KELAS A,B,C DIBUAT OLEH: NAMA: SALBIYAH UMININGSIH NIM:
Materi Kuliah Kalkulus II
LIMIT FUNGSI LIMIT FUNGSI ALJABAR.
TURUNAN DIFERENSIAL Pertemuan ke
Induksi Matematik TIN2204 Struktur Diskrit.
Perancangan Basis Data
Melakukan Perbaikan Sistem Bahan Bakar Bensin
RESEP (lanjutan) Bahasa Latin, Sinonim, Sediaan Lazim, dan Khasiat Obat Dwi Endarti, SF, M.Sc, Apt. Lab Manajemen Farmasi dan Farmasi Masyarakat Bagian.
Luas Daerah ( Integral ).
Algoritma dan Struktur Data
PERTEMUAN KE 9 MENU TUNGGAL.
Bagaimana merancang diagram E-R yang interaktif
Fungsi Invers, Eksponensial, Logaritma, dan Trigonometri
FUNGSI MATEMATIKA DISKRIT K- 6 Universitas Indonesia
Is Fatimah. 28/03/ Sudahkan memahami SKEMA PENDANAAN (RD, RT, KP, DF) Insentif SINas ?
Pertemuan 5 P.D. Tak Eksak Dieksakkan
Intan Silviana Mustikawati, SKM, MPH
Perancangan Sistem Informasi Inventory Pada CV PSP
ELEMEN RANGKAIAN LISTRIK
ITK-121 KALKULUS I 3 SKS Dicky Dermawan
MATRIX.
PD Tingkat/orde Satu Pangkat/derajat Satu
ELEKTRONIKA Bab 4. Rangkaian Dioda
Matakuliah : Perangkat Keras Komputer Versi Materi
ELASTISITAS PERMINTAAN DAN PENAWARAN
Kompleksitas Waktu Asimptotik
Bagaimana merancang diagram E-R yang interaktif
Pondok Pesantren Daar El-Qolam adalah sebuah lembaga pendidikan Islam yang didirikan pada 20 Januari Semakin meningkatnya teknologi yang ada saat.
Dr. Yoke Muelgini, M.Sc. Jurusan Ekonomi dan Studi Pembangunan Fakultas Ekonomi dan Bisnis Universitas Lampung 2012 FEB Unila Course on Econometrics 1.
Persamaan Garis Lurus Latihan Soal-soal.
JamSenin 2 Des Selasa 3 Des Rabu 4 Des Kamis 5 Des Jumat 6 Des R R S S.
BAHTERA NUH Ibrani 11:7.
P OHON 1. D EFINISI Pohon adalah graf tak-berarah terhubung yang tidak mengandung sirkuit 2.
WISNU HENDRO MARTONO,M.Sc
Pengantar sistem informasi Rahma dhania salamah msp.
Transcript presentasi:

Fakultas Ilmu Komputer – Universitas Indonesia DEVELOPING POSTAG FOR BAHASA INDONESIA Mirna Adriani Information Retrieval Lab Faculty of Computer Science University of Indonesia, Indonesia 13 Januari 2009 PAN LOCALIZATION PROJECT

Fakultas Ilmu Komputer – Universitas Indonesia PAN Localization project Join the project in July 2008 Started in September 2008 University of Indonesia (Mirna Adriani) Developing POSTAG Parallel Corpus : English Indonesian (Penn Treebank Corpus) BPPT (Hammam Riza) Parallel Corpus (Indonesian-English) Machine Translation

Fakultas Ilmu Komputer – Universitas Indonesia Bahasa Indonesia Bahasa Indonesia is the national language in Indonesia (used in school, offices etc.) We have 742 local languages (many of them have different characters) Use roman characters No tenses Inflection words (prefix, postfix, suffix)

Fakultas Ilmu Komputer – Universitas Indonesia POSTAG for Bahasa Indonesia No available POSTAG We build Tagset based on Penn Treebank tagset Consult Indonesian grammar books Problems : many inconsistency tags Our tagset has 29 POStags

Fakultas Ilmu Komputer – Universitas Indonesia Tagset for Bahasa Indonesia NumberCategoryPost-namePostag 1NounCountable Common Noun NNC 2NounUncountable Common Noun NNU 3NounGenitive Common Noun NNG 4NounProper Common Noun NNP

Fakultas Ilmu Komputer – Universitas Indonesia Tagset for Bahasa Indonesia NumberCategoryPost-namePostag 5VerbTransitiveVBT 6VerbIntransitiveVBI 7VerbModalMD 8Adjective JJ

Fakultas Ilmu Komputer – Universitas Indonesia Tagset for Bahasa Indonesia NumberCategoryPost-namePostag 9Adverb RB 10Wh-AdverbWRB 11PrepositionIN 12ConjunctionCoordinate Conjuction CC 13ConjunctionSubordinate Conjuction SC

Fakultas Ilmu Komputer – Universitas Indonesia Tagset for Bahasa Indonesia NumberCategoryPost-namePostag 14PronounPersonal Pronoun PRP 15PronounWh-PronounWP 16PronounNumber Pronoun PRN 17PronounLocative Pronoun PRL 18InterjectionUH

Fakultas Ilmu Komputer – Universitas Indonesia Tagset for Bahasa Indonesia NumberCategoryPost-namePostag 19PunctuationPUN 20SymbolSYM 21DeterminerDT 22DeterminerWh-DeterminerWDT 23ParticleRP

Fakultas Ilmu Komputer – Universitas Indonesia Tagset for Bahasa Indonesia NumberCategoryPost-namePostag 24Cardinal Numeral Primary NumeralCDP 25Cardinal Numeral Ordinal NumeralCDO 26Cardinal Numeral Irregular NumeralCDI 27Cardinal Numeral Collective NumeralCDC 28NegationWh-DeterminerNEG 29Foreign WordFW

Fakultas Ilmu Komputer – Universitas Indonesia Example Spalletti/NNP,/, meski/CC belum/NEG seterancam/RB Ranieri/NNP juga/RB harus/MD mulai/VBI memikirkan/VBT cara/NNC mendongkrak/VBT Roma/NNP kembali/RB./. Menang/NNC melawan/VBT Chelsea/NNP akan/MD jadi/VBT tugas/NNP teramat/RB berat/JJ,/, tapi/CC partai/NNC away/FW melawan/VBT Udinese/NNP pekan/NNC depan/IN bisa/MB jadi/VBT awal/NNC baik/JJ bagi/IN Spalletti/NNP untuk/IN mengubah/VBT peruntungan/NNU dirinya/NNG dan/CC klubnya/NNG

Fakultas Ilmu Komputer – Universitas Indonesia Evaluation Corpus : 50 documents 694 sentences (13,465 tokens) The words have been tagged manually Preliminary result CRF : 70% accuracy Brill tagger : 80% accuracy

Fakultas Ilmu Komputer – Universitas Indonesia Thank You