Model Boolean dan Advanced Boolean

Slides:



Advertisements
Presentasi serupa
Praktikum Sistem Temu Balik Informasi
Advertisements

Ratri Enggar Pawening Materi 4 I NFORMATION R ETRIEVAL.
ORGANISASI INFORMASI Sistem Temu Kembali Informasi
StopList dan Stemming yasmi afrizal
Model Temu-Balik Informasi
Sum Of Product dan Product of Sum.
Ranked Retrieval Pencarian Boolean Menghasilkan sekumpulan dokumen yang cocok dengan query, yang tidak cocok tidak muncul Pada kasus.
LOGIKA FUZZY.
PENGANTAR ORGANISASI INFORMASI Sistem Temu Kembali Informasi (Information Retrieval System) Modul 11 Muslech, Dipl.Lib, MSi 3 Desember 2012.
ARRAY (LARIK) DAN RECORD
LOGIKA FUZZY .
FUZZY INFORMATION RETRIEVAL
BAB I TIPE DATA.
BAB 7 ALJABAR BOOLEAN.
Gambar Kerangka dari sistem temu-kembali informasi sederhana
Latent Semantic Indexing
Final Project Temu Balik Informasi
Pertemuan 3.
Aljabar Boolean IF2120 Matematika Diskrit Oleh: Rinaldi Munir
Logika fuzzy.
METODE DAN MODEL TEMU BALIK INFORMASI Luthfi Nurrohman ( )
Anggota Kelompok Dian Santosa (KETUA)
Pertemuan 7 : Latent Semantic Indexing
Anggota Kelompok Ikhsan Fauji Irna Oktaviasari Erip Marliana
Konsep dan Model-model Sistem Temu Balik Informasi
BAB VII ALJABAR BOOLEAN waniwatining.
Matriks, Relasi, dan Fungsi
Text Mining and Information Retrieval
ALJABAR BOOLEAN DEFINISI :
Konsep, Metode dan Model Temu Kembali Informasi
LOGIKA FUZZY Oleh I Joko Dewanto
LOGIKA FUZZY ABDULAH PERDAMAIAN
Review Jurnal Internasional
EFEKTIFITAS SELEKSI FITUR DALAM SISTEM TEMU-KEMBALI INFORMASI
Anggota Kelompok : Kurniawan Novi Pambudi
BAB 7 ALJABAR BOOLEAN.
Prinsip dan Perancangan Logika
Aljabar Boolean.
dan Transformasi Linear dalam
BAB 7 ALJABAR BOOLEAN.
TEMU KEMBALI INFORMASI
Document Indexing dan Term Weighting
Temu balik informasi Anggota Kelompok Ikhsan Fauji
FINAL PROJECT TEMU BALIK INFORMASI
Logika dan Sistem Digital
Ketua Kelompok Dian Restiani Anggota : Wahyu Septi Anjar
ALJABAR BOOLE Aljabar Boole adalah salah satu aljabar yang berkaitan dengan variabel- variabel biner dan operasi-operasi logika. Variabel-variabel dalam.
Review Konsep Dasar IRS/ STI
Query Query adalah istilah yang dibangun oleh user untuk merepresentasikan kebutuhan informasinya Query dapat berupa istilah tunggal maupun istilah gabungan/kombinasi.
StopList dan Stemming yasmi afrizal
Information Retrieval
<KECERDASAN BUATAN>
PENYEDERHANAAN FUNGSI BOOLEAN
KECERDASAN BUATAN PERTEMUAN 8.
HEMDANI RAHENDRA HERLIANTO
LOGIKA Oleh: Ferawaty, S.Kom.
Oleh : Rahmat Robi Waliyansyah, M.Kom.
PRINSIP & PERANCANGAN LOGIKA
Logika Matematika Teori Himpunan
Pengenalan Temu Balik Informasi.
Model Boolean & Advanced Boolean
Decision Tree Pertemuan : 13.
Logika Fuzzy Dr. Mesterjon,S.Kom, M.Kom.
Prinsip Dan Proses Temu Balik Informasi Model Boolean
“MODEL BOOLEAN DAN ADVANCED BOOLEAN”
Bab II Aljabar Boole Pertemuan Ke-7 : Definisi Aljabar Boole
MODEL probabilistik KELOMPOK 6.
Model Perolehan Informasi
Temu Kembali Informasi
Universitas Gunadarma
Transcript presentasi:

Model Boolean dan Advanced Boolean

Anggota Kelompok Lingga Catur Putra (15.11.0117) Adimas Dwi Nur Hidayah (15.11.0062) Fahrul Rosi (15.11.0108) Damar Nur Sasongko (15.11.0102) Faizal Aji Ramadan (15.11.0107) Kabul Agus Purwanto (14.11.0152)

Pemodelan Sistem Temu Kembali (Boolean) Model Boolean dalam sistem temu kembali merupakan model yang paling sederhana. Model ini berdasarkan teori himpunan dan aljabar Boolean. Dokumen adalah himpunan dari istilah (term) dan kueri adalah pernyataan Boolean yang ditulis pada term. Dokumen diprediksi apakah relevan atau tidak. Model ini menggunakan operator boolean. Istilah (term) dalam sebuah kueri dihubungkan dengan menggunakan operator AND, OR atau NOT. Metode ini merupakan metode yang paling sering digunakan pada`mesin penelusur (search  engine) karena kecepatannya.

Keuntungan menggunakan model Boolean : Model Boolean merupakan model sederhana yang menggunakan teori dasar himpunan sehingga mudah diimplementasikan. Model Boolean dapat diperluas dengan menggunakan proximity operator dan wildcard operator. Adanya pertimbangan biaya untuk mengubah software dan struktur database, terutama pada sistem komersil.

Kerugian menggunakan Model boolean : Model Boolean tidak menggunakan peringkat  dokumen yang terambil. Dokumen yang terambil hanya dokumen yang benar-benar sesuai dengan pernyataan boolean/kueri yang diberikan Sehingga dokumen yang terambil bisa sangat banyak atau bisa sedikit. Akibatnya ada kesulitan dalam mengambil keputusan. Teori himpunan memang mudah, namun tidak demikian halnya dengan pernyataan Boolean yang bisa kompleks. Akibatnya pengguna harus memiliki pengetahuan banyak mengenai kueri dengan boolean agar pencarian menjadi efisien. Tidak bisa menyelesaikan partial matching pada kueri

Dalam pengerjaan operator boolean (AND, NOT, OR) ada urutan pengerjaannya (Operator precedence). Urutannya adalah: –()  Prioritas yang berada dalam tanda kurung –NOT –AND –OR

Model Boolean Model Boolean dibagi menjadi 2 yaitu: 1. Model Himpunan Fuzzy Misalkan U adalah himpunan semesta. Fuzzy subset dari U dikarakteristikkan dengan fungsi keanggotaan (membership function) A, dimana : μA : U → [0,1] setiap uU dipetakan kedalam nilai biner [0,1], atau μA : U → [0,1]. Dengan demikian setiap elemen diberikan nilai biner yang mengindikasikan nilai keanggotaan elemen didalam himpunan.

Pada sistem temu kembali, model himpunan fuzzy merupakan perluasan dari model Boolean retrieval. Ada beberapa perluasan yang diperoleh dengan menggunakan model himpunan fuzzy : Partially matching, berdasarkan term-term correlation matrix Direpresentasikan seperti thesaurus Melakukan perhitungan berdasarkan perbandingan antara dokumen yang mengandung pasangan term (pair of terms) dengan jumlah dokumen yang mengandung term tersebut.

2. Model Extended Boolean Prinsip utama dari teknik Extended Boolean adalah : Dokumen direpresentasikan dalam ruang term berdimensi n Koordinat x, y dan z ditentukan dengan menggunakan bobot term Tergantung pada conjunction atau disjunction : i. Menentukan vektor jarak dari (0,0) ii. Menentukan vektor jarak dari (1,0) iii. Menggunakan konsep p-norm iv. Perluasan karakteristik dari extended boolean v. Menghitung jarak.

Incidence Matrix Incidence matrix adalah suatu matrix yang terdiri dari kolom (dokumen) dan baris (token/terms/kata). Pembangunan index akan berbeda untuk tiap metode Retrieval. Untuk boolean model, salah satunya kita akan menggunakan Incidence matrix sebagai index dari korpus (kumpulan dokumen) data kita.  Dokumen yang ada di kolom adalah semua dokumen yang terdapat pada korpus data kita. Token/Terms/Kata pada baris adalah semua token unik (kata yang berbeda satu dengan yang lainnya) dalam seluruh dokumen yang ada.  Saat suatu token(t) ada dalam dokumen(d), maka nilai dari baris dan kolom (t,d) adalah 1. Jika tidak ditemukan, maka nilai kolom (t,d) adalah 0.  Dari sudut pandang kolom, kita bisa tahu token apa saja yang ada di satu dokumen (d). Dari sudut pandang barisnya, kita bisa tahu di dokumen mana saja token (t) ada (posting lists).

Perhatikan tabel berikut Perhatikan tabel berikut. (Vektor baris menyatakan keberadaan suatu Token/Terms/Kata unik yang ada dalam semua dokumen. Vektor kolom menyatakan semua nama dokumen yang digunakan). Diketahui 6 dokumen dengan masing-masing kata yang terdapat di dalamnya. Jika kata tersebut berada dalam dokumen, maka Term Frekuensi Biner/ TFbiner = 1, jika tidak TFbiner = 0.]

Dengan mengunakan Incidence matrix yang sudah dibangun, kita sudah bisa memecahkan masalah yang pertama dihadapi tadi. Kemudian misalkan mencari hasil Boolean Query Retrieval : Brutus AND Caesar AND NOT Calpurnia. Maka dapat diketahui dengan mudah, dokumen mana saja yang mengandung kata Brutus dan Caesar, tetapi tidak mengandung kata Calpurnia.

Brutus AND Caesar AND NOT Calpurnia = 110100 AND 110111 AND NOT 010000 = 110100 AND 110111 AND 101111 = 100100 Berarti, jawaban hasil Boolean Query Retrieval : Brutus AND Caesar AND NOT Calpurnia adalah Dokumen “Antony & Cleopatra” dan “Hamlet”.

Referensi : http://mybaiti.blogspot.com/2010/11/sekilas-mengenai-grep-di-linux.html http://zero-fisip.web.unair.ac.id/artikel_detail-68838-Digilib-Digilib:%20Sistem%20Temu%20Kembali%20Informasi.html http://imamcs.lecture.ub.ac.id/files/2013/09/03-Pemodelan_IR_ABD_IL1314IC.ppt