Upload presentasi
Presentasi sedang didownload. Silahkan tunggu
Diterbitkan olehDwipa Lazuardi Telah diubah "10 tahun yang lalu
1
Praktikum Sistem Temu Balik Informasi
D3 Komputer & Sistem Informasi Sekolah Vokasi UGM Oleh Kabul Kurniawan
2
Profil Pengajar Nama : Kabul Kurniawan, A.Md.
Alamat : Jl. Kaliurang KM 5,2 Blok G. 12 A No. HP : Web : KabulKurniawan.Com fb : Twitter YM : kabulkurniawan
3
Aturan Main Presensi : 20% Tugas/Quiz : 20% Presentasi : 10% UAS : 50%
Konversi Nilai : 80 – 100 = A 65 – 79 = B 45 – 64 = C 20 – 44 = D 0 – = E
4
Materi Introduction Boolean Retrieval Dictionary and Postings
Dictionaries and Tollerant Retrieval Index Construction Index Compression Scoring, Term Weighting, Vector Space Model Score Computing Evaluation
5
Tugas Tugas Individu SoftFile, kirim ke :
Subyek : nim_tugas1_PSTBI
6
Tools Notepad ++ XAMPP (Apache, Mysql, PHP)
7
Introduction Sistem Temu-Balik Informasi (Information Retrieval) digunakan untuk menemukan kembali informasi-informasi yang relevan terhadap kebutuhan pengguna dari suatu kumpulan informasi secara otomatis (Wikipedia). Salah satu aplikasi umum dari sistem temu kembali informasi adalah search-engine atau mesin pencarian yang terdapat pada jaringan internet. Contoh : Google, Bing, Baidu, Yahoo Search dsb.
8
Definisi Pencarian materi (biasanya dokumen) dari sesuatu yang sifatnya tak-terstruktur (unstructured, biasanya teks) untuk memenuhi kebutuhan informasi dari dalam koleksi besar (biasanya disimpan dalam komputer). Representasi, penyimpanan, organisasi, pencarian dan akses ke item informasi untuk memenuhi kebutuhan informasi pengguna. Penekanan pada proses retrieval informasi (bukan data). Karakterisasi kebutuhan informasi tidaklah mudah. Harus ditranslasi ke dalam suatu query terlebih dahulu.
9
Proses Utama dalam IR Indexing Seraching
10
Indexing Word Token (mengubah dokumen menjadi kumpulan term dengan cara menghapus semua karakter dalam tanda baca yang terdapat pada dokumen dan mengubah kumpulan term menjadi lowercase), StopWord Removal (Proses penghapusan kata-kata yang sering ditampilkan dalam dokumen seperti:and, or, not dan sebagainya), Stemming (Proses mengubah suatu kata bentukan menjadi kata dasar) dan Term Weighting (Proses pembobotan setiap term di dalam dokumen).
11
Boolean Retrieval Model boolean merepresentasikan dokumen sebagai suatu himpunan kata-kunci (set of keywords). Query direpresentasikan sebagai ekspresi boolean Query dalam ekspresi boolean merupakan kumpulan kata kunci yang saling dihubungkan melalui operator boolean seperti AND, OR dan NOT serta menggunakan tanda kurung untuk menentukan scope operator Hasil pencarian dokumen dari model boolean adalah himpunan dokumen yang relevan
12
Boolean Retrieval Query : Brutus AND Caesar AND NOT Calpurnia
Result : AND AND =
13
Inverted Index Langkah-langkah membuat inverted Index:
Koleksi Dokumen yang akan di index Tokenisasi Text, Ubah setiap dokumen menjadi kumpulan token Lakukan proses linguistik, produksi daftar token yang ternormalisasi yang akan menjadi kata dasar (term) index Buat daftar inverted index yang terdiri dari dictionary dan postings
15
Next: STEMMING
Presentasi serupa
© 2024 SlidePlayer.info Inc.
All rights reserved.