VECTOR SPACE MODEL.

Slides:



Advertisements
Presentasi serupa
Metode Simpleks Diperbaiki (Revised Simplex Method)
Advertisements

Ratri Enggar Pawening Materi 4 I NFORMATION R ETRIEVAL.
StopList dan Stemming yasmi afrizal
Model Temu-Balik Informasi
RUANG VEKTOR EUCLIDEAN
“Image Retrieval” Shinta P.
Ranked Retrieval Pencarian Boolean Menghasilkan sekumpulan dokumen yang cocok dengan query, yang tidak cocok tidak muncul Pada kasus.
Matakuliah : Kalkulus II
Pertemuan ke-2 Model dalam sistem temu kembali informasi yasmi afrizal
FUZZY INFORMATION RETRIEVAL
Information Retrieval
Gambar Kerangka dari sistem temu-kembali informasi sederhana
Tim Dosen Data Mining Fakultas Informatika
Temu Balik Informasi Materi Pertemuan Ke – 8 Konsep Thesaurus dalam Information Retrival dan Mengenal Macam Thesaurus Beserta Algoritma Anggota : Nama Nim.
Latent Semantic Indexing
Temu Balik Informasi Pertemuan Ke – 12 Presentasi Final Project
Final Project Temu Balik Informasi
MATERI PROJECT TI 2014 B Taufik Ari Arnandan ( )
Review Jurnal Nasional
METODE DAN MODEL TEMU BALIK INFORMASI Luthfi Nurrohman ( )
Anggota Kelompok Dian Santosa (KETUA)
Pertemuan 7 : Latent Semantic Indexing
Temu Balik Informasi Materi Pertemuan Ke – 7 Konsep dan Prinsip Serta Algoritma Latent Semantic Indexing Anggota : Nama Nim Wahyu Septi Anjar
Anggota Kelompok Ikhsan Fauji Irna Oktaviasari Erip Marliana
Konsep dan Model-model Sistem Temu Balik Informasi
Konsep dan model temu balik informasi
SUPPORT VECTOR MACHINE
Sistem Temu Kembali Informasi
Text Mining and Information Retrieval
ABDUL AZIS ABDILLAH ABDUL AZIS ABDILLAH
Implementasi vector space model untuk pencarian dokumen
Natural Language Processing (NLP)
TEMU BALIK INFORMASI Multimedia Dalam Temu Balik Informasi.
Konsep, Metode dan Model Temu Kembali Informasi
Konsep, Metode dan Model dalam Temu Balik Informasi
Temu Balik Informasi Materi Pertemuan Ke – 8 Konsep Thesaurus dalam Information Retrival dan Mengenal Macam Thesaurus Beserta Algoritma Anggota : Nama Nim.
Latent Semantic Indexing (LSI)
Review Jurnal Internasional
Sistem Temu Balik Informasi Multimedia
Anggota Kelompok : Kurniawan Novi Pambudi
PENGINDEKSAN.
TEMU KEMBALI INFORMASI
Document Indexing dan Term Weighting
Temu balik informasi Anggota Kelompok Ikhsan Fauji
Ketua Kelompok Dian Restiani Anggota : Wahyu Septi Anjar
UNIVERSITAS GUNADARMA 2010
TUJUAN (1) Mahasiswa dapat menjelaskan Ilmu Pengolahan Text dan Informasi. (C2) Mahasiswa dapat menjelaskan Model-model Sistem Temu Balik Informasi. (C2)
StopList dan Stemming yasmi afrizal
Laten Semantic Indexing
Temu Balik Informasi Persentasi Final Project
Ir. Julio Adisantoso, M.Kom.
PENYIMPANAN DAN PENGAMBILAN DATA MULTIMEDIA (LANJUTAN) .
Information Retrieval
Penapisan pada Domain Frekuensi 1
Oleh : Rahmat Robi Waliyansyah, M.Kom.
Perkalian vektor Perkalian titik (dot product)
TEXT OPERATION Muhammad Yusuf Teknik Multimedia dan Jaringan
Oleh : Rahmat Robi Waliyansyah, M.Kom.
Kasus 8: Image Segmentation
Similarity Analisis.
Nugraha Iman Santosa ( )
Pembobotan Kata (Term Weighting)
Pengelompokan Dokumen (Document Clustering)
Perkalian vektor Perkalian titik (dot product)
Model Perolehan Informasi
Temu Kembali Informasi
Universitas Gunadarma
Poynting’s Theorem Beberapa Contoh.
Multimedia Information Retrieval
Intro Algoritma K-Nearest Neighbor (K- NN) adalah sebuah metode klasifikasi terhadap sekumpulan data maupun dokumen berdasarkan pembelajaran  data yang.
Transcript presentasi:

VECTOR SPACE MODEL

Model Perolehan Informasi

Pencocokan berdasarkan yang terbaik

Pencocokan dengan Best Match

Model Vector Space

Model Vector Space Asumsi : Dokumen yang berdekatan pada vector space mempunyai isi yang sama

Memetakan basis vektor : dokumen dan query

Model Vector Space

Koefisien Vektor

Vector Space Similarity

Cosine Similarity

Cosine Similarity

Vector Space Model

INGAT KEMBALI

Bobot kata : Frekuensi kata

Bobot kata : Frekuensi kata

Bobot kata tf x idf

Bobot kata

Pencocokan dengan bobot

Contoh tf*idf

Lanjutan Contoh tf*idf

Contoh tf*idf

Hitung Dot Product Perhitungan dot product digunakan untuk mencari cosine similarity (bagian pembilang)

Bobot TF yang lain

Bobot TF yang lain (Contoh)

Inverse Document Frequency

Contoh IDF yang lain Example collection

Pembobotan TF.IDF yang lain

Contoh TF.IDF yang lain Koleksi

Contoh TF.IDF yang lain Koleksi

Variasi TF.IDF

Variasi TF.IDF

Variasi TF.IDF

Normalisasi panjang dokumen

Normalisasi panjang dokumen

Normalisasi panjang dokumen

Normalisasi panjang dokumen

Normalisasi panjang dokumen

Normalisasi “kosinus”

Normalisasi “kosinus”

Contoh Normalisasi Kosinus

Hasil dari Query “perolehan informasi”

Interpretasi pengukuran kosinus

Contoh Vector Space Model… Suppose we query an IR system for the query "gold silver truck". The database collection consists of three documents (D = 3) with the following content D1: "Shipment of gold damaged in a fire" D2: "Delivery of silver arrived in a silver truck" D3: "Shipment of gold arrived in a truck"

Hasil Pembobotan

Similarity Analysis Menghitung semua panjang vektor

Similarity Analysis Menghitung Dot Product

Similarity Analysis Menghitung nilai similarity

Hasil Rank 1: Doc 2 = 0.8246 Rank 2: Doc 3 = 0.3271 Rank 3: Doc 1 = 0.0801

Kekurangan Vector Space Asumsinya antara kata-kata tidak ada saling ketergantungan Tidak memasukkan unsur relevansi, kebutuhan informasi seseorang, model bahasa, dll

Kelebihan Vector Space

KUIS GOOD LUCK….