VECTOR SPACE MODEL
Model Perolehan Informasi
Pencocokan berdasarkan yang terbaik
Pencocokan dengan Best Match
Model Vector Space
Model Vector Space Asumsi : Dokumen yang berdekatan pada vector space mempunyai isi yang sama
Memetakan basis vektor : dokumen dan query
Model Vector Space
Koefisien Vektor
Vector Space Similarity
Cosine Similarity
Cosine Similarity
Vector Space Model
INGAT KEMBALI
Bobot kata : Frekuensi kata
Bobot kata : Frekuensi kata
Bobot kata tf x idf
Bobot kata
Pencocokan dengan bobot
Contoh tf*idf
Lanjutan Contoh tf*idf
Contoh tf*idf
Hitung Dot Product Perhitungan dot product digunakan untuk mencari cosine similarity (bagian pembilang)
Bobot TF yang lain
Bobot TF yang lain (Contoh)
Inverse Document Frequency
Contoh IDF yang lain Example collection
Pembobotan TF.IDF yang lain
Contoh TF.IDF yang lain Koleksi
Contoh TF.IDF yang lain Koleksi
Variasi TF.IDF
Variasi TF.IDF
Variasi TF.IDF
Normalisasi panjang dokumen
Normalisasi panjang dokumen
Normalisasi panjang dokumen
Normalisasi panjang dokumen
Normalisasi panjang dokumen
Normalisasi “kosinus”
Normalisasi “kosinus”
Contoh Normalisasi Kosinus
Hasil dari Query “perolehan informasi”
Interpretasi pengukuran kosinus
Contoh Vector Space Model… Suppose we query an IR system for the query "gold silver truck". The database collection consists of three documents (D = 3) with the following content D1: "Shipment of gold damaged in a fire" D2: "Delivery of silver arrived in a silver truck" D3: "Shipment of gold arrived in a truck"
Hasil Pembobotan
Similarity Analysis Menghitung semua panjang vektor
Similarity Analysis Menghitung Dot Product
Similarity Analysis Menghitung nilai similarity
Hasil Rank 1: Doc 2 = 0.8246 Rank 2: Doc 3 = 0.3271 Rank 3: Doc 1 = 0.0801
Kekurangan Vector Space Asumsinya antara kata-kata tidak ada saling ketergantungan Tidak memasukkan unsur relevansi, kebutuhan informasi seseorang, model bahasa, dll
Kelebihan Vector Space
KUIS GOOD LUCK….