Oleh : Rahmat Robi Waliyansyah, M.Kom.

Slides:



Advertisements
Presentasi serupa
Praktikum Sistem Temu Balik Informasi
Advertisements

Ratri Enggar Pawening Materi 4 I NFORMATION R ETRIEVAL.
StopList dan Stemming yasmi afrizal
Model Temu-Balik Informasi
NOTE: To change the image on this slide, select the picture and delete it. Then click the Pictures icon in the placeholder to insert your own image. SISTEM.
ROSI ROSDIANI – XII IPA 5 PROUDLY PRESENT …... Edit the text with your own short phrases. To change a sample image, select a picture and delete it.
Urutan (Sequence) Ery Setiyawan Jullev A.
Tahap Testing Program (lanjutan)
Cakupan Graf (Lanjutan) Pertemuan 7.
Sum Of Product dan Product of Sum.
Ranked Retrieval Pencarian Boolean Menghasilkan sekumpulan dokumen yang cocok dengan query, yang tidak cocok tidak muncul Pada kasus.
Information Retrieval
SQL (Structured Query Language)
NOTE: To change the image on this slide, select the picture and delete it. Then click the Pictures icon in the placeholder to insert your own image. Review.
NOTE: To change the image on this slide, select the picture and delete it. Then click the Pictures icon in the placeholder to insert your own image. HIDUP.
Final Project Temu Balik Informasi
METODE DAN MODEL TEMU BALIK INFORMASI Luthfi Nurrohman ( )
Pertemuan 7 : Latent Semantic Indexing
Konsep dan Model-model Sistem Temu Balik Informasi
Text Mining and Information Retrieval
Ir. Lilik Eko Nuryanto, MKom
SEKOLAH TINGGI TEKNOLOGI TELEMATIKA TELKOM
Konsep, Metode dan Model Temu Kembali Informasi
Review Jurnal Internasional
Menggunakan Subquery untuk Memecahkan Query Query
Anggota Kelompok : Kurniawan Novi Pambudi
BAB 3 EKSPRESI BOOLEAN.
PART 4 Pengenalan Bahasa C
SISTEM TEMU KEMBALI INFORMASI
SQL (Structured Query Language)
Document Indexing dan Term Weighting
Temu balik informasi Anggota Kelompok Ikhsan Fauji
Matriks Grafik Matriks Grafik sangat berguna untuk mengembangkan peranti perangkat lunak yang membantu pengujian basis path Matriks Grafik adalah matriks.
Logika dan Sistem Digital
PROSES PERENCANAAN PARTISIPATIF
ALJABAR BOOLE Aljabar Boole adalah salah satu aljabar yang berkaitan dengan variabel- variabel biner dan operasi-operasi logika. Variabel-variabel dalam.
Struktur Data Jenis – jenis data.
Review Konsep Dasar IRS/ STI
StopList dan Stemming yasmi afrizal
Pseudocode – Tipe Data, Variabel, dan Operator
Penyusunan Anggaran Produk & Kebijaksanaan Persediaan
Information Retrieval
PROGRAM KELAS INTERNASIONAL FAKULTAS EKONOMI DAN BISNIS
MANAJEMEN STRATEGIK PENYELESAIAN SOAL CASE STUDY
Tipe data & Variabel 1. Aturan Leksikal. 2. Operator. 3. Statement
Struktur Kendali Percabangan pada C
Tipe data & Variabel 1. Aturan Leksikal. 2. Operator. 3. Statement
Populasi dan Sampel Pada penelitian kualitatif
sujud dalam islam Oleh: Aidan dan Rhenal NOTE:
Nama Kelompok : 1. Heri Kristanto 2. Fico Arditiasa Saputra
KELOMPOK 9 Festy Kartika Siwi ( )
Edit the text with your own short phrases. To change the sample image, select the picture and delete it. Now click the Pictures icon in the placeholder.
PENATAAN BERSAMA KAWASAN ST. TANAH ABANG
PEMBELAJARAN 4.0 MERESPON ERA REVOLUSI INDUSTRI 4.0
Edit the text with your own short phrases. To change the sample image, select the picture and delete it. Now click the Pictures icon in the placeholder.
Model Boolean & Advanced Boolean
Tata CARa PENATAUSAHAAN PENERIMAAN NEGARA
Tata Letak Judul Subjudul.
Model Boolean dan Advanced Boolean
Konsep Dasar Kehidupan pada Makhluk Hidup
Prinsip Dan Proses Temu Balik Informasi Model Boolean
“MODEL BOOLEAN DAN ADVANCED BOOLEAN”
Model Perolehan Informasi
ANATOMI KONTRAK To change the image on this slide, select the picture and delete it. Then click the Pictures icon in the placeholder to insert your own.
Penyusunan Anggaran Produk & Kebijaksanaan Persediaan
Temu Kembali Informasi
TO MODIFY THIS CHART: Click the organization chart and then use the tools on the Organization Chart toolbar. TO CREATE YOUR OWN CHART: On the Insert menu,
Universitas Gunadarma
PENGAMBILAN KEPUTUSAN DALAM KONDISI PASTI
BAB 7 EKSPRESI BOOLEAN.
Transcript presentasi:

Oleh : Rahmat Robi Waliyansyah, M.Kom. Pemodelan IR NOTE: To change the image on this slide, select the picture and delete it. Then click the Pictures icon in the placeholder to insert your own image. Oleh : Rahmat Robi Waliyansyah, M.Kom.

Proses Temu-Kembali

Konsep IR

Pemodelan IR Model IR didefinisikan sebagai empat komponen [D, F, Q, R(q, dj)] Keterangan: - D adalah kumpulan dokumen - Q adalah query - F menunjukkan pemodelan dokumen dan query - R(q, dj) adalah fungsi peringkat yang dikaitkan dengan suatu nilai €R, dimana q€Q dan dj€D

Model IR

Boolean Model Exact match, pencocokan secara tepat sama. Query berbentuk ekspresi boolean. Dokumen bisa cocok atau tidak cocok dengan query yang diberikan. Hasilnya berupa sekumpulan dokumen yang cocok. Tidak ada peringkat dokumen sesuai dengan query yang diberikan.

Boolean Retrieval Model Model proses pencarian informasi dari query, yang menggunakan ekspresi boolean. Ekspresi boolean dapat berupa operator logika AND, OR dan NOT. Hasil perhitungannya hanya berupa nilai binary (1 atau 0). Ini menyebabkan di dalam Boolean Retrieval Model (BRM), yang ada hanya dokumen relevan atau tidak sama sekali. Tidak ada pertimbangan dokumen yang ‘mirip’.

Boolean Retrieval Model Dalam pengerjaan operator boolean (AND, NOT, OR) ada urutan pengerjaannya (Operator precedence). Urutannya adalah: ()  Prioritas yang berada dalam tanda kurung NOT AND OR Jadi kalau ada query sebagai berikut? (Madding OR crow) AND Killed OR slain (Brutus OR Caesar) AND NOT (Antony OR Cleopatra)

Permasalahan IR Misalkan kita ingin mencari dari cerita-cerita karangan shakespeare yang mengandung kata Brutus AND Caesar AND NOT Calpurnia. Salah satu cara adalah: Baca semua teks yang ada dari awal sampai akhir. Komputer juga bisa disuruh melakukan hal ini (menggantikan manusia). Proses ini disebut grepping. Melihat kemajuan komputer jaman sekarang, grepping bisa jadi solusi yang baik.

PERMASALAHAN IR Tapi, kalau sudah bicara soal ribuan dokumen, kita perlu melakukan sesuatu yang lebih baik. Karena ada beberapa tuntutan yang harus dipenuhi : Kecepatan dalam pemrosesan dokumen yang jumlahnya sangat banyak. Fleksibilitas. Perangkingan. Salah satu cara pemecahannya adalah dengan membangun index dari dokumen.

Incidence Matrix Incidence matrix adalah suatu matrix yang terdiri dari kolom (dokumen) dan baris (token/terms/kata). Pembangunan index akan berbeda untuk tiap metode Retrieval. Untuk boolean model, salah satunya kita akan menggunakan Incidence matrix sebagai index dari korpus (kumpulan dokumen) data kita. Dokumen yang ada di kolom adalah semua dokumen yang terdapat pada korpus data kita.

Incidence Matrix Token/Terms/Kata pada baris adalah semua token unik (kata yang berbeda satu dengan yang lainnya) dalam seluruh dokumen yang ada. Saat suatu token(t) ada dalam dokumen(d), maka nilai dari baris dan kolom (t,d) adalah 1. Jika tidak ditemukan, maka nilai kolom (t,d) adalah 0. Dari sudut pandang kolom, kita bisa tahu token apa saja yang ada di satu dokumen (d). Dari sudut pandang barisnya, kita bisa tahu di dokumen mana saja token (t) ada (posting lists).

Case Study A (1 of 3) Perhatikan tabel berikut. (Vektor baris menyatakan keberadaan suatu Token/Terms/Kata unik yang ada dalam semua dokumen. Vektor kolom menyatakan semua nama dokumen yang digunakan). Diketahui 6 dokumen dengan masing-masing kata yang terdapat di dalamnya. Jika kata tersebut berada dalam dokumen, maka Term Frekuensi Biner/ TFbiner = 1, jika tidak TFbiner = 0. Antony & Cleopatra Julius Caesar The Tempest Hamlet Othello Macbeth Antony 1 Brutus Caesar Calpurnia Cleopatra Mercy Worser ….

Case Study A (2 of 3) Dengan mengunakan Incidence matrix yang sudah dibangun, kita sudah bisa memecahkan masalah yang pertama dihadapi tadi. Kemudian misalkan mencari hasil Boolean Query Retrieval : Brutus AND Caesar AND NOT Calpurnia Maka dapat diketahui dengan mudah, dokumen mana saja yang mengandung kata Brutus dan Caesar, tetapi tidak mengandung kata Calpurnia.

Case Study A (3 of 3) TFbiner(Brutus) = 110100 TFbiner(Caesar) = 110111 TFbiner(Calpurnia) = 010000 Brutus AND Caesar AND NOT Calpurnia = 110100 AND 110111 AND NOT 010000 = 110100 AND 110111 AND 101111 = 100100 Berarti, jawaban hasil Boolean Query Retrieval : Brutus AND Caesar AND NOT Calpurnia adalah Dokumen “Antony & Cleopatra” dan “Hamlet” 1

Boolean Model Keuntungan Implementasi mudah dan sederhana. Query mudah disusun dan dimengerti. Operator AND, OR, NOT sesuai dengan bahasa alami. Kelemahan Pencocokan yang tepat dapat mengambil dokumen terlalu sedikit atau terlalu banyak. Sulit untuk menerjemahkan query ke dalam ekspresi Boolean. Semua istilah sama-sama berbobot.