Ranked Retrieval Pencarian Boolean Menghasilkan sekumpulan dokumen yang cocok dengan query, yang tidak cocok tidak muncul Pada kasus.

Slides:



Advertisements
Presentasi serupa
RUANG VEKTOR II BUDI DARMA SETIAWAN.
Advertisements

Praktikum Sistem Temu Balik Informasi
Ratri Enggar Pawening Materi 4 I NFORMATION R ETRIEVAL.
Vektor GARIS DAN BIDANG DALAM RUANG BERDIMENSI 3
StopList dan Stemming yasmi afrizal
Model Temu-Balik Informasi
Konsep Dasar Sistem Temu Kembali Informasi
Ruang Vektor berdimensi - n
Pertemuan ke-2 Model dalam sistem temu kembali informasi yasmi afrizal
FUZZY INFORMATION RETRIEVAL
Gambar Kerangka dari sistem temu-kembali informasi sederhana
Temu Balik Informasi Materi Pertemuan Ke – 8 Konsep Thesaurus dalam Information Retrival dan Mengenal Macam Thesaurus Beserta Algoritma Anggota : Nama Nim.
Latent Semantic Indexing
Temu Balik Informasi Pertemuan Ke – 12 Presentasi Final Project
Final Project Temu Balik Informasi
MATERI PROJECT TI 2014 B Taufik Ari Arnandan ( )
Review Jurnal Nasional
METODE DAN MODEL TEMU BALIK INFORMASI Luthfi Nurrohman ( )
Pertemuan 7 : Latent Semantic Indexing
Temu Balik Informasi Materi Pertemuan Ke – 7 Konsep dan Prinsip Serta Algoritma Latent Semantic Indexing Anggota : Nama Nim Wahyu Septi Anjar
Konsep dan Model-model Sistem Temu Balik Informasi
Konsep dan model temu balik informasi
Sistem Temu Kembali Informasi
Text Mining and Information Retrieval
Implementasi vector space model untuk pencarian dokumen
Natural Language Processing (NLP)
Konsep, Metode dan Model Temu Kembali Informasi
Konsep, Metode dan Model dalam Temu Balik Informasi
Temu Balik Informasi Materi Pertemuan Ke – 8 Konsep Thesaurus dalam Information Retrival dan Mengenal Macam Thesaurus Beserta Algoritma Anggota : Nama Nim.
Latent Semantic Indexing (LSI)
Review Jurnal Internasional
EFEKTIFITAS SELEKSI FITUR DALAM SISTEM TEMU-KEMBALI INFORMASI
Anggota Kelompok : Kurniawan Novi Pambudi
PENGINDEKSAN.
TEMU KEMBALI INFORMASI
Document Indexing dan Term Weighting
VECTOR SPACE MODEL.
Temu balik informasi Anggota Kelompok Ikhsan Fauji
FINAL PROJECT TEMU BALIK INFORMASI
TEMU BALIK INFORMASI TI 14 A.
Ketua Kelompok Dian Restiani Anggota : Wahyu Septi Anjar
TUJUAN (1) Mahasiswa dapat menjelaskan Ilmu Pengolahan Text dan Informasi. (C2) Mahasiswa dapat menjelaskan Model-model Sistem Temu Balik Informasi. (C2)
Review Konsep Dasar IRS/ STI
StopList dan Stemming yasmi afrizal
Laten Semantic Indexing
TEMU BALIK INFORMASI CONCEPT, PRINCIPLE & ALGORITHMS OF
Temu Balik Informasi Persentasi Final Project
Ir. Julio Adisantoso, M.Kom.
PENYIMPANAN DAN PENGAMBILAN DATA MULTIMEDIA (LANJUTAN) .
Information Retrieval
Oleh : Rahmat Robi Waliyansyah, M.Kom.
Oleh : Rahmat Robi Waliyansyah, M.Kom.
Similarity Analisis.
Oleh : Rahmat Robi Waliyansyah, M.Kom.
Nugraha Iman Santosa ( )
Model Boolean & Advanced Boolean
MODUS.
Model Boolean dan Advanced Boolean
Pembobotan Kata (Term Weighting)
RUANG VEKTOR II BUDI DARMA SETIAWAN.
Prinsip Dan Proses Temu Balik Informasi Model Boolean
Model Probabilistic.
Pengelompokan Dokumen (Document Clustering)
“MODEL BOOLEAN DAN ADVANCED BOOLEAN”
MODEL probabilistik KELOMPOK 6.
Model Perolehan Informasi
Temu Kembali Informasi
Universitas Gunadarma
Intro Algoritma K-Nearest Neighbor (K- NN) adalah sebuah metode klasifikasi terhadap sekumpulan data maupun dokumen berdasarkan pembelajaran  data yang.
近十三年来的中国会计理论研究基本取向态势 ——基于2000~2012年间国家三大基金资助 会计类项目的统计分析与思考
Transcript presentasi:

Ranked Retrieval

Pencarian Boolean Menghasilkan sekumpulan dokumen yang cocok dengan query, yang tidak cocok tidak muncul Pada kasus dokumen dengan jumlah yang sangat banyak, hasil pencarian menjadi sangat banyak (jauh melampaui kemampuan manusia dalam membacanya) Diperlukan mekanisme pemeringkatan untuk dokumen yang cocok dengan pencarian

Ranked Retrieval Mengurutkan hasil pencarian berdasarkan kesamaannya dengan kueri Beberapa dok. Hasil pencarian boleh saja sama, namun masing-masing memiliki bobot kesamaan

Kriteria untuk kesamaan kueri vs dokumen Dokumen yang sering mengandung term kueri, dianggap lebih memiliki kesamaan (Term frekuensi : tf) Term yang jarang dijumpai lebih informatif dibanding dengan term yang sering dijumpai (Inverse document frequency : idf)

Vector Space Model Vocab (V)  himpunan term setelah mengalami pre-prcessing (token, stem dll) Masing-masing baik dok. Maupun kueri digambarkan dalam bentuk |V| = Vektor berdimensi T : – dj = [w1j, w2j,..., wTj]. – wij adalah bobot term i pada dok. j.

Representasi Grafik

Contoh Matrix Bobot Term Kumpulan dokumen dianggap sebagai karungan kata (bag of word), dimana masing- masing kata/term memiliki vector bobot

Bobot Term = tf Term yang sering muncul merupakan indikator topik

Bobot Term : idf Term yang sering muncul dibeberapa dokumen yang berbeda, semakin tidak mengindikasikan suatu topik (memiliki makna yang kecil)

Pembobotan tf.idf Kata yang sering muncul di suatu dokumen namun jarang muncul di dokumen lain memiliki makna (bobot) yang lebih tinggi