Upload presentasi
Presentasi sedang didownload. Silahkan tunggu
Diterbitkan olehDewi Irawan Telah diubah "7 tahun yang lalu
1
Temu balik informasi Stemming dan stoplist
2
Anggota kelompok Joko Prayogi (14.11.0191)
Yuliani Dwi Asih ( ) Mujiyati ( ) Uswatun Khasanah ( ) Randito Tuah Randhika ( ) Avief Widya Setyawan ( ) Rizal Anjas Prasetyo ( ) Kharis Ardi Purnomo ( )
3
Stemming Stemming adalah proses mengubah kata menjadi kata dasarnya dengan menghilangkan imbuhan-imbuhan pada kata dalam dokumen. Pada umumnya kata dalam dokumen memiliki variasi kombinasi imbuhan kata yang beragam. Variasi imbuhan dapat berupa prefix (awalan), suffix (akhiran), infix (sisipan), dan confix (kombinasi antara awalan dan akhiran). Dengan menggunakan stemming dapat mengurangi variasi kata yang sebenarnya memiliki kata dasar yang sama.
4
Algoritma untuk proses Stemming:
Algoritma Porter Algoritma Stemming Nazief dan Adriani
5
STOPLIST Berkas STOPWORD atau daftar stopword dalam Information retrieval system adalah suatu susunan kata atau istilah tertentu yang disusun sedemikian rupa sehingga pada saat proses information retrieval, semua kata- kata atau istilah yang terdaftar dalam berkas tersebut diabaikan atau dihilangkan oleh sistem pencari (search enginee).
6
Pada umumnya kata-kata atau istilah yang didaftar dalam berkas stopword ini terdiri atas kata-kata depan (atau artikel misalnya di, ke, dari, diatas, dibawah, a, an, at, from, for, on, of, off, with), atau kata sambung/penghubung (misalnya karena, sebab, walaupun, tetapi, because, although, but)
7
Stopword dibagi menjadi 2 yaitu Stopword Statis dan Stopword Dinamis :
8
algoritma stoplist atau wordlist
algoritma stoplist atau wordlist. Stoplist yaitu penyaringan (filtering) terhadap kata-kata yang tidak layak untuk dijadikan sebagai pembeda atau sebagai kata kunci dalam pencarian dokumen sehingga kata-kata tersebut dapat dihilangkan dari dokumen. Sedangkan wordlist adalah daftar kata- kata yang mungkin digunakan sebagai kata kunci dalam pencarian dokumen, dengan demikian maka jumlah kata yang termasuk dalam wordlist akan lebih banyak daripada stoplist. Proses stoplist menghapus kata-kata yang sangat sering ditampilkan dalam dokumen seperti: and, or, not dan sebagainya
9
Sekian Dan Terimakasih
Presentasi serupa
© 2024 SlidePlayer.info Inc.
All rights reserved.