Steamming & Stoplist Temu balik informasi
Anggota Kelompok Desi Rahmawati (14.11.0273) (Ketua) Maulana Akbar (14.11.0260) Riki Aji Pamungkas (14.11.0317) Kurnia Aswin Nuzul .R (14.11.0270) Resni Novelalita (14.11.0194) Inggita Al Muharohmah (14.11.0269) Pradita Novianty (14.11.0289) Samuel Haryanto (14.11.0250) Dimas Adhi Nugroho (14.11.0253)
Definisi Steamming Stemming merupakan suatu proses untuk menemukan kata dasar dari sebuah kata, yaitu dengan menghilangkan semua imbuhan (Affixes) baik yang terdiri dari awalan (prefixes), sisipan (infixes), akhiran (suffixes) dan confixes (kombinasi dari awalan dan akhiran ) pada sebuah kata. Stemming digunakan untuk mengganti bentuk dari suatu kata menjadi kata dasar dari kata tersebut sesuai dengan struktur. (bahasa jawa). Sumber : http://etheses.uin- malang.ac.id/3773/1/12650020.pdf
Alur / Tahapan Steamming
Definisi Stoplist Stoplist atau Stopword adalah proses pembuangan kata yang dibuang seperti; tetapi, yaitu, sedangkan, dan sebagainya.Pada tahapan stopword tahapan disini akan mengambil kata-kata penting dari hasil token. Token tersebut merupakan tahapan untuk melakukan pengecekan dari karakter pertama sampai dengan karakter terakhir. http://jurnal.untan.ac.id/index.php/justin/article/download /1319/1288
Stopword Stopword Removal merupakan proses yang dilakukan untuk menghilangkan kata-kata “stopword” pada sebuah kalimat/paragraf. Stopword sendiri merupakan kata yang sering atau lazim digunakan dalam kalimat/paragraf. Sehingga pada tahap pertama yang harus kita lakukan adalah mengumpulkan daftar “stopword” atau Stopword List.
Contoh dari Stopword List dalam bahasa indonesia antara lain: Kata penghubung (sesudah,selesai,sebelum) Kata tugas (bagi, dari, dengan, pada) Kata keterangan (sangat, hanya, lebih) Kata bilangan ( beberapa, banyak, sedikit) Kata ganti ( kami, mereka, kita, itu) dan lain sebagainya.
Algoritma pada steamming 1. Algoritma Porter Algoritma Porter ditemukan oleh Martin Porter 1980. Algoritma tersebut digunakan untuk stemming Bahasa Inggris, kemudian karena proses stemming bahasa Inggris berbeda dengan bahasa Indonesia, maka dikembangkan algoritma Porter khusus untuk bahasa Indonesia (Porter Stemmer for Bahasa Indonesia) oleh W.B Frakes pada tahun 1992.
Gambar 1. Porter Stemming untuk Bahasa Indonesia Sumber : http://repository.amikom.ac.id/files/Publikasi_08.11.2281.pdf
2. Algoritma Nazief dan Adriani Nazief & Adriani Stemmer algoritma ini paling sering dibicarakan dalam stemming bahasa indonesia. Algoritma ini merupakan hasil penelitian Internal UI (Universitas Indonesia) dan tidak dipublish secara umum.
Gambar 2. Flowchart Algoritma Nazief Adriani Sumber : http://repository.uin-suska.ac.id/3524/5/Bab%20IV.pdf
3. Algoritma Confix-Stripping Gambar 2. Flowchart stemming dengan pendeketan Confix – Stripping Sumberhttp://mmt.its.ac.id/download/SEMNAS/SEMNAS%20XXII/MTI/25.%20Prosiding%20Rinci%20Kembang%20Hapsari%20-%20Ok.pdf
4. Algoritma Vega Perbedaan Algoritma Vega ini dibandingkan dengan semua algoritma yang lain yaitu pada algoritma vega tidak menggunakan kamus. Urutan penghilangan imbuhan yang melekat pada kata algoritma vega ini sama dengan seperti urutan penghilangan imbuhan yang diterapkan pada algoritma arifin dan setiono. Sumber : http://etheses.uin- malang.ac.id/3773/1/12650020.pdf
5. Algoritma Rule Based Algoritma Rule Based pada aksara jawa menggunakan aturan analisis kontrasif afiksasi verba pada imbuhan. Sumber : mar’atus madia, 2016. “Stemming Bahasa Jawa untuk Mencari Akar Kata dalam Bahasa Jawa dengan Aturan Analisis Kontrasif Afiksasi Verba”. Universitas Islam Negeri Maulana Malik Ibrahim, Malang. http://etheses.uin-malang.ac.id/3773/1/12650020.pdf