Presentasi sedang didownload. Silahkan tunggu

Presentasi sedang didownload. Silahkan tunggu

Temu balik informasi Stemming dan stoplist

Presentasi serupa


Presentasi berjudul: "Temu balik informasi Stemming dan stoplist"— Transcript presentasi:

1 Temu balik informasi Stemming dan stoplist

2 Anggota kelompok Joko Prayogi (14.11.0191)
Yuliani Dwi Asih ( ) Mujiyati ( ) Uswatun Khasanah ( ) Randito Tuah Randhika ( ) Avief Widya Setyawan ( ) Rizal Anjas Prasetyo ( ) Kharis Ardi Purnomo ( )

3 Stemming Stemming adalah proses mengubah kata menjadi kata dasarnya dengan menghilangkan imbuhan-imbuhan pada kata dalam dokumen. Pada umumnya kata dalam dokumen memiliki variasi kombinasi imbuhan kata yang beragam. Variasi imbuhan dapat berupa prefix (awalan), suffix (akhiran), infix (sisipan), dan confix (kombinasi antara awalan dan akhiran). Dengan menggunakan stemming dapat mengurangi variasi kata yang sebenarnya memiliki kata dasar yang sama.

4 Algoritma untuk proses Stemming:
Algoritma Porter Algoritma Stemming Nazief dan Adriani

5 STOPLIST Berkas  STOPWORD  atau  daftar  stopword  dalam Information  retrieval  system  adalah  suatu  susunan kata  atau  istilah  tertentu  yang  disusun  sedemikian rupa sehingga pada saat proses information retrieval, semua  kata- kata  atau  istilah  yang  terdaftar  dalam berkas  tersebut  diabaikan  atau  dihilangkan  oleh sistem  pencari  (search  enginee). 

6 Pada  umumnya  kata-kata  atau  istilah  yang  didaftar dalam  berkas  stopword   ini  terdiri  atas  kata-kata depan  (atau  artikel  misalnya  di,  ke,  dari,  diatas, dibawah,  a,  an,  at,  from,  for,  on,  of,  off,  with),  atau kata sambung/penghubung (misalnya karena, sebab, walaupun,  tetapi,  because,  although,  but)

7 Stopword dibagi menjadi 2 yaitu Stopword Statis dan Stopword Dinamis :

8 algoritma stoplist atau wordlist
algoritma stoplist atau wordlist. Stoplist yaitu penyaringan (filtering) terhadap kata-kata yang tidak layak untuk dijadikan sebagai pembeda atau sebagai kata kunci dalam pencarian dokumen sehingga kata-kata tersebut dapat dihilangkan dari dokumen. Sedangkan wordlist adalah daftar kata- kata yang mungkin digunakan sebagai kata kunci dalam pencarian dokumen, dengan demikian maka jumlah kata yang termasuk dalam  wordlist akan lebih banyak daripada stoplist. Proses stoplist menghapus kata-kata yang sangat sering ditampilkan dalam dokumen seperti: and, or, not dan sebagainya

9 Sekian Dan Terimakasih


Download ppt "Temu balik informasi Stemming dan stoplist"

Presentasi serupa


Iklan oleh Google