Presentasi sedang didownload. Silahkan tunggu

Presentasi sedang didownload. Silahkan tunggu

Praktikum Sistem Temu Balik Informasi D3 Komputer & Sistem Informasi Sekolah Vokasi UGM Oleh Kabul Kurniawan.

Presentasi serupa


Presentasi berjudul: "Praktikum Sistem Temu Balik Informasi D3 Komputer & Sistem Informasi Sekolah Vokasi UGM Oleh Kabul Kurniawan."— Transcript presentasi:

1 Praktikum Sistem Temu Balik Informasi D3 Komputer & Sistem Informasi Sekolah Vokasi UGM Oleh Kabul Kurniawan

2 Profil Pengajar Nama : Kabul Kurniawan, A.Md. Alamat : Jl. Kaliurang KM 5,2 Blok G. 12 A No. HP : Web: KabulKurniawan.Com fb: YM: kabulkurniawan

3 Aturan Main Presensi: 20% Tugas/Quiz: 20% Presentasi: 10% UAS: 50% Konversi Nilai : 80 – 100 = A 65 – 79 = B 45 – 64 = C 20 – 44 = D 0 – 19 = E

4 Materi Introduction Boolean Retrieval Dictionary and Postings Dictionaries and Tollerant Retrieval Index Construction Index Compression Scoring, Term Weighting, Vector Space Model Score Computing Evaluation

5 Tugas Tugas Individu SoftFile, kirim ke : Subyek : nim_tugas1_PSTBI

6 Tools Notepad ++ XAMPP (Apache, Mysql, PHP)

7 Introduction Sistem Temu-Balik Informasi (Information Retrieval) digunakan untuk menemukan kembali informasi-informasi yang relevan terhadap kebutuhan pengguna dari suatu kumpulan informasi secara otomatis (Wikipedia). Salah satu aplikasi umum dari sistem temu kembali informasi adalah search-engine atau mesin pencarian yang terdapat pada jaringan internet. Contoh : Google, Bing, Baidu, Yahoo Search dsb.

8 Definisi Pencarian materi (biasanya dokumen) dari sesuatu yang sifatnya tak-terstruktur (unstructured, biasanya teks) untuk memenuhi kebutuhan informasi dari dalam koleksi besar (biasanya disimpan dalam komputer). Representasi, penyimpanan, organisasi, pencarian dan akses ke item informasi untuk memenuhi kebutuhan informasi pengguna. Penekanan pada proses retrieval informasi (bukan data). Karakterisasi kebutuhan informasi tidaklah mudah. Harus ditranslasi ke dalam suatu query terlebih dahulu.

9 Proses Utama dalam IR Indexing Seraching

10 Indexing Word Token (mengubah dokumen menjadi kumpulan term dengan cara menghapus semua karakter dalam tanda baca yang terdapat pada dokumen dan mengubah kumpulan term menjadi lowercase), StopWord Removal (Proses penghapusan kata-kata yang sering ditampilkan dalam dokumen seperti:and, or, not dan sebagainya), Stemming (Proses mengubah suatu kata bentukan menjadi kata dasar) dan Term Weighting (Proses pembobotan setiap term di dalam dokumen).

11 Boolean Retrieval Model boolean merepresentasikan dokumen sebagai suatu himpunan kata-kunci (set of keywords). Query direpresentasikan sebagai ekspresi boolean Query dalam ekspresi boolean merupakan kumpulan kata kunci yang saling dihubungkan melalui operator boolean seperti AND, OR dan NOT serta menggunakan tanda kurung untuk menentukan scope operator Hasil pencarian dokumen dari model boolean adalah himpunan dokumen yang relevan

12 Boolean Retrieval Query : Brutus AND Caesar AND NOT Calpurnia Result : AND AND =

13 Inverted Index Langkah-langkah membuat inverted Index: Koleksi Dokumen yang akan di index Tokenisasi Text, Ubah setiap dokumen menjadi kumpulan token Lakukan proses linguistik, produksi daftar token yang ternormalisasi yang akan menjadi kata dasar (term) index Buat daftar inverted index yang terdiri dari dictionary dan postings

14

15 Next:STEMMING


Download ppt "Praktikum Sistem Temu Balik Informasi D3 Komputer & Sistem Informasi Sekolah Vokasi UGM Oleh Kabul Kurniawan."

Presentasi serupa


Iklan oleh Google