MINI PAPE PROJ R PAPE PROJECT PORTER STEMMER INFORMATION RETRIEVAL.

Slides:



Advertisements
Presentasi serupa
Tugas Praktik Terjemah
Advertisements

Seminar Masalah Internasional
By: Syahirul Alim PENGANTAR EKONOMI
E-PROCUREMENT Sistem Informasi Pengadaan Barang dan Jasa Secara Online
Penullisan kata dan penullisan unsur serapan
1.Ruang lingkip perkuliahan   2.Hakikat Bahasa dan Bahasa Indonesia   3.Penyerapan Bahasa Indonesia   4.Kaidah penulisan Bahasa Indonesia  5.Karakteristik.
VISI-MISI- TUJUAN-SASARAN SEKOLAH
PERMASALAHAN DALAM PTK PENDAHULUAN ( BAB I )
PENULISAN KATA.
Penerjemahan I Materi I.
Analisa & Perancangan Sistem Informasi
BENTUK DAN MAKNA.
APLIKASI PEMBELAJARAN BAHASA INGGRIS UNTUK SEKOLAH Ade Robby Hidayat
BENTUK DAN MAKNA FONEM bunyi terkecil yang dapat membedakan arti, sedangkan huruf adalah lambang bunyi atau lambang fonem. Apakah fonem sama.
Sistem Temu Kembali Informasi/ Information Retrieval
TAKE HOME QUIZ STATISTIKA
Percakapan melalui telepon
Temu Balik Informasi Pertemuan Ke – 12 Presentasi Final Project
Text Pre-Processing M. Ali Fauzi.
Review Jurnal Nasional
ALGORITMA STEMMING DAN STOPLIST
TEMU BALIK INFORMASI ANGGOTA KELOMPOK BAYU ANDRIANTO 21
(konsep, macam-macam, dan algoritma)
Temu balik informasi Stemming dan stoplist
Sistem Temu Kembali Informasi
PENINGKATAN SUBSTANSI ARTIKEL
Natural Language Processing (NLP)
Academic Writing (Essay)
Islamic School Support Network Agustus 2008 – Maret 2009
TEMU BALIK INFORMASI Konsep Thesaurus Dalam Information Retrival dan Macam-Macam Thesaurus Beserta Algoritmanya TI 14 A STMIK AMIKOM PURWOKERTO 2017.
METODE PENELITIAN PSIKOLOGI 1
Bahasa Indonesia Bahasa Indonesia digunakan secara resmi di seluruh wilayah Republik Indonesia. Kaidah penggunaan bahasa Indonesia dituangkan dalam buku.
Temu Balik Informasi Materi Pertemuan Ke – 3 Stoplist dan Stemming
Tugas 2_ Kelompok Dikumpulkan paling lambat:
PENGINDEKSAN.
Stoplist dan Stemming Anggota Kelompok :
STOPLIST DAN STEEMING Temu Balik Informasi.
Text Preprocessing.
PENGABDIAN MASYARAKAT (PM)
“Website Latihan Soal – Soal Mata Pelajaran Bahasa Inggris Untuk Kelas
FINAL PROJECT TEMU BALIK INFORMASI
MORFOLOGI BAHASA INDONESIA (PBIN4106)
Bahasa Indonesia Bahasa Indonesia digunakan secara resmi di seluruh wilayah Republik Indonesia. Kaidah penggunaan bahasa Indonesia dituangkan dalam.
TEMU BALIK INFORMASI Konsep Thesaurus Dalam Information Retrival dan Macam-Macam Thesaurus Beserta Algoritmanya TI 14 A STMIK AMIKOM PURWOKERTO 2017.
Temu Balik Informasi Anggota Kelompok 1. Ikhsan Fauji Irna Oktaviasari Erip Marliana Egi Firmansyah
Steamming & Stoplist Temu balik informasi.
STOPWORDLIST dan STEMMING
Pertemuan 8 : Thesaurus Anggota Kelompok :
Stemming & Stoplist TI14D.
Selamat Datang Para Mahasiswa Pada Mata Kuliah Bahasa Indonesia
Penulisan Makalah dan Penyusunan Presentasi untuk Pameran KAB
Paragraf/ Alinea Karangan yang pendek / singkat yang berisi sebuah pikiran dan didukung himpunan kalimat yang saling berhubungan untuk membentuk satu gagasn.
LOGIKA DAN ALGORITMA BAB 1 PENDAHULUAN LOGIKA
Silabus Aplikasi Komputer Prodi Ilmu Pemerintahan
Kontrak Kuliah Pemrograman Web 2 (Semester Ganjil 2010/2011)
STATISTIKA PENYAJIAN DATA
Dr. Ir. Abdul Madjid Rohim, MS. JURUSAN TANAH FAKULTAS PERTANIAN
VALIDITAS PEMBUKTIAN TATAP MUKA 5
Statistika uji hipotesis (1 populasi)
Jurusan Pendidikan Agama Islam Fakultas Tarbiyah
UKURAN PEMUSATAN (Mean)
Presentasi Bahasa Indonesia Tugas Teknologi Informasi
KUANTOR TATAP MUKA 3 FKIP UNIVERSITAS PANCA MARGA.
SOSIALISASI PEMETAAN KEPALA SEKOLAH
Sistem Temu Kembali Informasi/ Information Retrieval
M Ali Fauzi Indriati Sigit Adinugroho
PERANCANGAN APLIKASI PENGENALAN BAHASA INGGRIS BERBASIS MOBILE (STUDI KASUS SEKOLAH DASAR NEGERI IV DUREN KARAWANG) Disusun oleh : Melfin Richard Sakul.
Information Retrieval “Document Preprocessing”
SEKOLAH MENENGAH ATAS (SMA) KELAS X DENGAN “APLIKASI PEMBELAJARAN AGAMA ISLAM UNTUK TINGKAT for further detail, please visit
Materi bahasa indonesia Pertemuan kedua Di kelas 8 b.
Transcript presentasi:

MINI PAPE PROJ R PAPE PROJECT PORTER STEMMER INFORMATION RETRIEVAL

Stemming Porter Stemmer Porter Stemmer Bahasa Indonesia luas sudah INFORMATION RETRIEVAL PORTER STEMMER Stemming Stemming adalah proses pemetaan dan penguraian berbagai bentuk (variants) dari suatu kata menjadi bentuk kata dasarnya . Proses ini juga disebut sebagai conflation [3]. Proses stemming secara luas sudah Information informasi) digunakan retrieval di dalam (pencarian untuk meningkatkan kualitas informasi yang didapatkan. Porter Stemmer Stemming khusus bahasa Inggris yang ditemukan oleh Martin Porter 1980. Mekanisme algoritma dalam mencari kata dasar suatu kata berimbuhan dengan membuang imbuhan– imbuhan (atau lebih tepatnya akhiran) pada kata–kata bahasa Inggris karena dalam bahasa Inggris tidak mengenal awalan. Karena bahasa Inggris datang dari kelas yang berbeda, beberapa modifikasi telah dilakukan untuk membuat Algoritma Porter sehingga dapat digunakan sesuai dengan bahasa Indonesia Porter Stemmer Bahasa Indonesia Implementasi Porter Stemmer for Bahasa Indonesia berdasarkan English Porter Stemmer yang dikembangkan oleh W.B. Frakes pada tahun 1992. Karena bahasa Inggris datang dari kelas yang berbeda, beberapa modifikasi telah dilakukan untuk membuat Algoritma Porter dapat digunakan sesuai dengan bahasa Indonesia. Desain dari Porter Stemmer for Bahasa Indonesia dapat dilihat pada gambar.

Aturan Algoritma Porter untuk Indonesia INFORMATION RETRIEVAL PORTER STEMMER Desain dari Porter Stemmer for Bahasa Indonesia Algoritma / Langkah-langkah Pada Porter Stemmer 1. 2. 3. Menghapus partikel seperti: -kah, -lah, -tah Mengapus kata ganti (Possesive Pronoun), seperti –ku, -mu, -nya Mengapus awalan pertama. Jika tidak ditemukan, maka lanjut ke langkah 4a, dan jika ada maka lanjut ke langkah 4b. 4 .a. Menghapus awalan kedua, dan dilanjutkan pada langkah ke 5a b. Menghapus akhiran, jika tidak ditemukan maka kata tersebut diasumsikan sebagai kata dasar (root word). Jika ditemukan maka lanjut ke langkah 5b. 5. a. Menghapus akhiran dan kata akhir diasumsikan sebagai kata dasar (root word. b. Menghapus awalan kedua dan kata akhir diasumsikan sebagai kata dasar (root word). Aturan Algoritma Porter untuk Indonesia Terdapat 5 aturan pada Algoritma Porter untuk Bahasa Indonesia. Aturan-aturan tersebut dapat dilihat pada tabel berikut :

Tabel 1: Kelompok rule pertama : inflectional particles INFORMATION RETRIEVAL PORTER STEMMER Tabel 1: Kelompok rule pertama : inflectional particles Tabel 2: Kelompok rule kedua :inflectional possesive pronouns Tabel 3: Kelompok rule ketiga: first order of derivational prefixes Tabel 4: Kelompok rule keempat: second order of derivational prefixes Tabel 5: Kelompok rule kelima: derivational suffixes

Pemaksimalan Porter Stemmer INFORMATION RETRIEVAL PORTER STEMMER Masalah Porter Stemmer dalam Bahasa Indonesia Namun demikian, struktur morfologi dalam bahasa Indonesia memiliki tingkat kerumitan yang lebih tinggi daripada bahasa Inggris. Seperti misalnya,kesulitan dalam membedakan suatu kata yang mengandung imbuhan baik prefiksmaupun sufiks dengan suatu kata dasar yang salah satu suku katanya merupakanbagian dari imbuhan, terutama dengan kata dasar yang mempunyai suku katalebih besar dari dua (Musthafa, Aziz. 2009). Contoh : sekolah  sekolah (kata dasar, tidak dilakukan stemming) duduklah duduk (dilakukan proses stemming) Pemaksimalan Porter Stemmer Untuk menangani masalah pada Porter Stemmer untuk Indonesia perlu ditambahkan beberapa aturan dalam algoritma agar memberikan hasil yang lebih maksimal dan untuk mempermudah proses stem maka dibuatlah beberapa kamus kecil,antara lain sebagai berikut : 1. Kamus kata dasar yang dilekati partikel, untuk menyimpan kata dasar yang memiliki suku kata terakhir (partikel infleksional) serta kata tersebut tidak mendapat imbuhan apapun. Seperti : masalah 2. Kamus kata dasar yang dilekati partikel berprefiks untuk menyimpan kata dasar yang memiliki suku kata terakhir (partikel infleksional) dan mempunyai prefiks. Seperti : menikah 3. Kamus kata dasar yang dilekati kata ganti milik, untuk menyimpan kata dasar yang memiliki suku kata terakhir (kata ganti infleksional) serta kata dasar tersebut tidak mendapatkan imbuhan apapun. Seperti : bangku. 4. Kamus kata dasar yang dilekati kata ganti milik berprefiks, untuk menyimpan kata dasar yang memiliki suku kata terakhir (kata ganti infleksional) dan mempunyai prefiks. Seperti : bersuku. 5. Kamus kata dasar yang dilekati prefiks pertama, untuk menyimpan kata dasar yang memiliki suku kata pertama (prefiks derivasional pertama) serta kata dasar tersebut tidak mendapatkan imbuhan apapun.. Seperti : median.

INFORMATION RETRIEVAL PORTER STEMMER 6. Kamus kata dasar yang dilekati prefiks pertama bersufiks, untuk menyimpan kata dasar yang memiliki suku kata pertama (prefiks derivasional pertama) dan mempunyai sufiks derivasional. Seperti : terapan. 7. Kamus kata dasar yang dilekati prefiks kedua, untuk menyimpan kata dasar yang memiliki suku kata pertama (prefiks derivasional kedua) serta kata dasar tersebut tidak mendapatkan imbuhan apapun. Seperti : percaya 8. Kamus kata dasar yang dilekati prefiks kedua bersufiks, untuk menyimpan kata dasar yang memiliki suku kata pertama (prefiks derivasional) dan mempunyai sufiks derivasional. Seperti : perasaan. 9. Kamus kata dasar yang dilekati sufiks, untuk menyimpan kata dasar yang memiliki suku kata terakhir (sufiks derivasional). Seperti : pantai Sumber Pustaka : Fadillah Z. Tala, A Study of Stemming Effect on Information Retrieval in Bahasa Indonesia,Netherland,Universiteit van Amsterdam Ummul Choiroh, Pembuatan Aplikasi Penerjemah Kalimat Tunggal Bahasa Indonesia Kedalam Kalimat Bahasa Jawa Berbasis Kamus, Universitas Islam Negeri (UIN) Maulana Malik Ibrahim Malang

Tugas paling lambat Hari Minggu, 27 Maret 2016 pukul 0.0 WIB Dikirim ke eri299@gmail.com dengan subyek tugas ir dan kelompok Minggu depan tidak ada kuliah. Silahkan lihat materi dan tugas di http://kungfumas.wordpress.com Konsultasi tugas dapat melalui Facebook messenger