Upload presentasi
Presentasi sedang didownload. Silahkan tunggu
Diterbitkan olehYandi Rachman Telah diubah "6 tahun yang lalu
1
Steamming & Stoplist Temu balik informasi
2
Anggota Kelompok Desi Rahmawati (14.11.0273) (Ketua)
Maulana Akbar ( ) Riki Aji Pamungkas ( ) Kurnia Aswin Nuzul .R ( ) Resni Novelalita ( ) Inggita Al Muharohmah ( ) Pradita Novianty ( ) Samuel Haryanto ( ) Dimas Adhi Nugroho ( )
3
Definisi Steamming Stemming merupakan suatu proses untuk menemukan kata dasar dari sebuah kata, yaitu dengan menghilangkan semua imbuhan (Affixes) baik yang terdiri dari awalan (prefixes), sisipan (infixes), akhiran (suffixes) dan confixes (kombinasi dari awalan dan akhiran ) pada sebuah kata. Stemming digunakan untuk mengganti bentuk dari suatu kata menjadi kata dasar dari kata tersebut sesuai dengan struktur. (bahasa jawa). Sumber : malang.ac.id/3773/1/ pdf
4
Alur / Tahapan Steamming
5
Definisi Stoplist Stoplist atau Stopword adalah proses pembuangan kata yang dibuang seperti; tetapi, yaitu, sedangkan, dan sebagainya.Pada tahapan stopword tahapan disini akan mengambil kata-kata penting dari hasil token. Token tersebut merupakan tahapan untuk melakukan pengecekan dari karakter pertama sampai dengan karakter terakhir. /1319/1288
6
Stopword Stopword Removal merupakan proses yang dilakukan untuk menghilangkan kata-kata “stopword” pada sebuah kalimat/paragraf. Stopword sendiri merupakan kata yang sering atau lazim digunakan dalam kalimat/paragraf. Sehingga pada tahap pertama yang harus kita lakukan adalah mengumpulkan daftar “stopword” atau Stopword List.
7
Contoh dari Stopword List dalam bahasa indonesia antara lain:
Kata penghubung (sesudah,selesai,sebelum) Kata tugas (bagi, dari, dengan, pada) Kata keterangan (sangat, hanya, lebih) Kata bilangan ( beberapa, banyak, sedikit) Kata ganti ( kami, mereka, kita, itu) dan lain sebagainya.
8
Algoritma pada steamming
1. Algoritma Porter Algoritma Porter ditemukan oleh Martin Porter Algoritma tersebut digunakan untuk stemming Bahasa Inggris, kemudian karena proses stemming bahasa Inggris berbeda dengan bahasa Indonesia, maka dikembangkan algoritma Porter khusus untuk bahasa Indonesia (Porter Stemmer for Bahasa Indonesia) oleh W.B Frakes pada tahun 1992.
9
Gambar 1. Porter Stemming untuk Bahasa Indonesia
Sumber :
10
2. Algoritma Nazief dan Adriani Nazief & Adriani Stemmer algoritma ini paling sering dibicarakan dalam stemming bahasa indonesia. Algoritma ini merupakan hasil penelitian Internal UI (Universitas Indonesia) dan tidak dipublish secara umum.
11
Gambar 2. Flowchart Algoritma Nazief Adriani
Sumber :
12
3. Algoritma Confix-Stripping
Gambar 2. Flowchart stemming dengan pendeketan Confix – Stripping Sumberhttp://mmt.its.ac.id/download/SEMNAS/SEMNAS%20XXII/MTI/25.%20Prosiding%20Rinci%20Kembang%20Hapsari%20-%20Ok.pdf
13
4. Algoritma Vega Perbedaan Algoritma Vega ini dibandingkan dengan semua algoritma yang lain yaitu pada algoritma vega tidak menggunakan kamus. Urutan penghilangan imbuhan yang melekat pada kata algoritma vega ini sama dengan seperti urutan penghilangan imbuhan yang diterapkan pada algoritma arifin dan setiono. Sumber : malang.ac.id/3773/1/ pdf
14
5. Algoritma Rule Based Algoritma Rule Based pada aksara jawa menggunakan aturan analisis kontrasif afiksasi verba pada imbuhan. Sumber : mar’atus madia, “Stemming Bahasa Jawa untuk Mencari Akar Kata dalam Bahasa Jawa dengan Aturan Analisis Kontrasif Afiksasi Verba”. Universitas Islam Negeri Maulana Malik Ibrahim, Malang.
Presentasi serupa
© 2024 SlidePlayer.info Inc.
All rights reserved.