Information Retrieval
Contents Konsep Dasar IR Data Retrieval Perkembangan IR
Konsep Dasar IR 1
Istilah Lain Sistem Temu Kembali Informasi Sistem Temu Balik Informasi
(Manning, 2009) “IR is finding material (usually documents) of an unstructured nature (usually text) that satisfies information need from within large collections (usually stored on computer)”
?? Unstructured Nature Information Need Large Collection Berikan contohnya jika teori tersebut diaplikasikan di mesin pencarian Google
Wikipedia Sistem Temu Kembali Informasi (Information Retrieval) digunakan untuk menemukan kembali informasi-informasi yang relevan terhadap kebutuhan pengguna dari suatu kumpulan informasi secara otomatis. Salah satu aplikasi umum dari sistem temu kembali informasi adalah search-engine atau mesin pencarian yang terdapat pada jaringan internet.
?? Berikan contoh 5 search engine beserta hasil pencarian dengan “keyword” yang sama Capture hasil pencariannya, dan temukan perbedaannya
Unstructured Terdiri dari berbagai tipe Tidak mementingkan suatu format atau urutan tertentu Tidak mengikuti aturan tertentu Tidak bisa diprediksi Bisa meliputi text, video, image, audio Contoh : buku, jurnal, dokumen
Structured Similar entities are grouped together (relations or classes) Entities in the same group have the same descriptions (attributes) Contoh : Relational Database
Semi Structured Text mempunyai heading, paragraf, footnote IR juga memfasilitasi pencarian pada semistructured data, misal pencarian dimana judul mengandung kata “Nurul Jadid", body mengandung kata “Kuliah"
Relevan Relevansi merupakan suatu judgment (keputusan) subyektif dan dapat didasarkan pada: Topik yang tepat Waktu (informasi terbaru) Otoritatif (dari suatu sumber terpercaya) Kebutuhan informasi dari pengguna Kriteria relevansi utama: suatu sistem IR sebaiknya (harus) memenuhi kebutuhan informasi pengguna
Konsep Dasar IR
?? Tuliskan poin-poin penjelasan dari ilustrasi di atas
Konsep Dasar IR
?? Jelaskan urutan dari konsep dasar IR pada ilustrasis sebelumnya
Konsep Dasar IR Indexing disimpan di DB server Searching / matching Query user vs index di server Perangkingan relevansi pada keyword query
Tujuan IR Retrieve documents with information that is relevant to user’s information need and helps him complete a task
Query Deskripsi kebutuhan informasi seperti demikian tidak dapat langsung didapatkan meski melalui web search engine. User harus menterjemahkan dahulu kebutuhan informasi yang diharapkan melalui suatu query yang baru akan diproses oleh sebuah sistem IR (ex: search engine)
Disinilah terlihat perbedaan antara information needs dan query. Query penggambaran information needs dari user.
?? Berikan contoh query dan information need, sehingga terlihat perbedaannya
Contoh Pengaplikasian Katalog Online
Data Retrieval 2
Structured Data Structured data tends to refer to information in “tables” Typically allows numerical range and exact match (for text) queries Salary < 60000 AND Manager = Smith
Structured Data Employee Manager Salary Smith Jones 50000 Chang 60000 Ivy .
IR vs Data Retrieval Data retrieval lebih bicara tentang bagaimana menentukan dokumen dalam koleksi yang berisi keyword yang sesuai/tepat dengan permintaan (query) pengguna sistem. Data retrieval bertujuan untuk mencari semua dokumen yang benar-benar sesuai dengan kondisi yang diminta pengguna.
IR vs Data Retrieval Data retrieval digunakan untuk data yang terstruktur dengan baik seperti sebuah relational database. Sedang IR biasanya digunakan untuk data yang natural dan tak terstruktur seperti text, audio, image, dll. Data retrieval hanya mencari “apa yang ada” dalam sebuah koleksi (biasanya database) IR mencari informasi, bahkan mungkin sebuah topik dari sebuah koleksi dokumen teks
IR vs Data Retrieval Kesimpulan untuk Information Retrieval: Berhubungan dengan teks bahasa umum yang tidak selalu terstruktur dan ada kemungkinan memiliki kerancuan arti Informasi mengenai subyek atau topik Kesalahan masih bisa ditoleransi Bukan berupa suatu hal yang tercantum secara eksplisit
IR vs Data Retrieval Kesimpulan untuk Data Retrieval: Isi dokumen pasti mengandung kata kunci/keyword Semantik terdefinisi dengan baik Kesalahan kecil dari sistem menunjukkan suatu kegagalan
Database vs IR
Perkembangan IR 3
IR Cerdas Memanfaatkan pengertian atau makna dari kata yang digunakan. Melibatkan urutan kata di dalam query. Beradaptasi dengan pengguna berdasarkan pada feedback, langsung atau tidak langsung. Memperluas pencarian dengan term terkait. Mengerjakan pemeriksaan ejaaan/perbaikan tanda pengenal otomatis. Memanfaatkan Otoritas dari sumber
Perkembangan IR Klasifikasi Dokumen Clustering Dokumen Peringkasan Teks Question Answering System
?? Berikan penjelasan mengenai masing-masing topic perkembangan IR di atas
?? Berikan penjelasan mengenai SEO