Upload presentasi
Presentasi sedang didownload. Silahkan tunggu
Diterbitkan olehHans Huda Telah diubah "9 tahun yang lalu
1
Ranked Retrieval zaini1983@gmail.com
2
Pencarian Boolean Menghasilkan sekumpulan dokumen yang cocok dengan query, yang tidak cocok tidak muncul Pada kasus dokumen dengan jumlah yang sangat banyak, hasil pencarian menjadi sangat banyak (jauh melampaui kemampuan manusia dalam membacanya) Diperlukan mekanisme pemeringkatan untuk dokumen yang cocok dengan pencarian
3
Ranked Retrieval Mengurutkan hasil pencarian berdasarkan kesamaannya dengan kueri Beberapa dok. Hasil pencarian boleh saja sama, namun masing-masing memiliki bobot kesamaan
4
Kriteria untuk kesamaan kueri vs dokumen Dokumen yang sering mengandung term kueri, dianggap lebih memiliki kesamaan (Term frekuensi : tf) Term yang jarang dijumpai lebih informatif dibanding dengan term yang sering dijumpai (Inverse document frequency : idf)
5
Vector Space Model Vocab (V) himpunan term setelah mengalami pre-prcessing (token, stem dll) Masing-masing baik dok. Maupun kueri digambarkan dalam bentuk |V| = Vektor berdimensi T : – dj = [w1j, w2j,..., wTj]. – wij adalah bobot term i pada dok. j.
6
Representasi Grafik
7
Contoh Matrix Bobot Term Kumpulan dokumen dianggap sebagai karungan kata (bag of word), dimana masing- masing kata/term memiliki vector bobot
8
Bobot Term = tf Term yang sering muncul merupakan indikator topik
9
Bobot Term : idf Term yang sering muncul dibeberapa dokumen yang berbeda, semakin tidak mengindikasikan suatu topik (memiliki makna yang kecil)
10
Pembobotan tf.idf Kata yang sering muncul di suatu dokumen namun jarang muncul di dokumen lain memiliki makna (bobot) yang lebih tinggi
Presentasi serupa
© 2024 SlidePlayer.info Inc.
All rights reserved.