STOPWORDLIST dan STEMMING TEMU BALIK INFORMASI
Anggota Kelompok Dian Santosa 14.11.0134(KETUA) Yayan Andriyana 14.11.0049 Taufik Hidayat N 14.11.0108 Khoerul Azni 14.11.0131 Agung Tri C 14.11.0132 Muhamad Margie A 14.11.0133 Rico Haviananto 12.11.- - - -
Text Transformation Adalah tahapan yang digunakan untuk mengubah kata-kata kedalam bentuk dasar sekaligus untuk mengurangi jumlah kata-kata tersebut. Pedekatan tersebut adalah Stemming dan StopWordList.
StopWordList StopWord List Adalah proses pembuangan atau menghilangkan kata-kata buang, yaitu : Kata depan, kata sambung, kata ganti, dll. seperti : di, dan, tetapi, dia,yaitu, sedangkan, dan sebagainya. Stoplist merupakan tahap proses indexing.
StopWordList Contoh : Bersyukurlah kita bangsa Indonesia yang begitu memasuki pintu gerbang kemerdekaan,telah memiliki bahasa kesatuan yang sekaligus menjadi bahasa nasional Menjadi: Bersyukurlah bangsa Indonesia memasuki pintu gerbang kemerdekaan, memiliki bahasa kesatuan sekaligus menjadi bahasa nasional
Stemming Stemming adalah salah satu cara yang digunakan untuk meningkatkan performa Information Retrieval dengan cara mentransformasi kata- kata dalam sebuah dokumen teks ke kata dasarnya. Dengan kata lain pada proses ini kata-kata yang berimbuhan ini akan dibuang bagian imbuhanya.
Stemming
Stemming Contoh Stemming Algoritma M. Adriani dan B. Nazief, Input : Bersyukurlah bangsa Indonesia memasuki pintu gerbang kemerdekaan, memiliki bahasa kesatuan sekaligus menjadi bahasa nasional. Output : syukur bangsa Indonesia masuk pintu gerbang merdeka, milik bahasa satu sekaligus jadi bahasa nasional.
Stemming Stemming untuk bahasa Indonesia biasanya menggunakan : Portner Stemmer Nazrief dan Adriani Stemmer