Presentasi sedang didownload. Silahkan tunggu

Presentasi sedang didownload. Silahkan tunggu

Model Boolean dan Advanced Boolean

Presentasi serupa


Presentasi berjudul: "Model Boolean dan Advanced Boolean"— Transcript presentasi:

1 Model Boolean dan Advanced Boolean

2 Anggota Kelompok Lingga Catur Putra (15.11.0117)
Adimas Dwi Nur Hidayah ( ) Fahrul Rosi ( ) Damar Nur Sasongko ( ) Faizal Aji Ramadan ( ) Kabul Agus Purwanto ( )

3 Pemodelan Sistem Temu Kembali (Boolean)
Model Boolean dalam sistem temu kembali merupakan model yang paling sederhana. Model ini berdasarkan teori himpunan dan aljabar Boolean. Dokumen adalah himpunan dari istilah (term) dan kueri adalah pernyataan Boolean yang ditulis pada term. Dokumen diprediksi apakah relevan atau tidak. Model ini menggunakan operator boolean. Istilah (term) dalam sebuah kueri dihubungkan dengan menggunakan operator AND, OR atau NOT. Metode ini merupakan metode yang paling sering digunakan pada`mesin penelusur (search  engine) karena kecepatannya.

4 Keuntungan menggunakan model Boolean :
Model Boolean merupakan model sederhana yang menggunakan teori dasar himpunan sehingga mudah diimplementasikan. Model Boolean dapat diperluas dengan menggunakan proximity operator dan wildcard operator. Adanya pertimbangan biaya untuk mengubah software dan struktur database, terutama pada sistem komersil.

5 Kerugian menggunakan Model boolean :
Model Boolean tidak menggunakan peringkat  dokumen yang terambil. Dokumen yang terambil hanya dokumen yang benar-benar sesuai dengan pernyataan boolean/kueri yang diberikan Sehingga dokumen yang terambil bisa sangat banyak atau bisa sedikit. Akibatnya ada kesulitan dalam mengambil keputusan. Teori himpunan memang mudah, namun tidak demikian halnya dengan pernyataan Boolean yang bisa kompleks. Akibatnya pengguna harus memiliki pengetahuan banyak mengenai kueri dengan boolean agar pencarian menjadi efisien. Tidak bisa menyelesaikan partial matching pada kueri

6 Dalam pengerjaan operator boolean (AND, NOT, OR) ada urutan pengerjaannya (Operator precedence). Urutannya adalah: –()  Prioritas yang berada dalam tanda kurung –NOT –AND –OR

7 Model Boolean Model Boolean dibagi menjadi 2 yaitu:
1. Model Himpunan Fuzzy Misalkan U adalah himpunan semesta. Fuzzy subset dari U dikarakteristikkan dengan fungsi keanggotaan (membership function) A, dimana : μA : U → [0,1] setiap uU dipetakan kedalam nilai biner [0,1], atau μA : U → [0,1]. Dengan demikian setiap elemen diberikan nilai biner yang mengindikasikan nilai keanggotaan elemen didalam himpunan.

8 Pada sistem temu kembali, model himpunan fuzzy merupakan perluasan dari model Boolean retrieval. Ada beberapa perluasan yang diperoleh dengan menggunakan model himpunan fuzzy : Partially matching, berdasarkan term-term correlation matrix Direpresentasikan seperti thesaurus Melakukan perhitungan berdasarkan perbandingan antara dokumen yang mengandung pasangan term (pair of terms) dengan jumlah dokumen yang mengandung term tersebut.

9 2. Model Extended Boolean
Prinsip utama dari teknik Extended Boolean adalah : Dokumen direpresentasikan dalam ruang term berdimensi n Koordinat x, y dan z ditentukan dengan menggunakan bobot term Tergantung pada conjunction atau disjunction : i. Menentukan vektor jarak dari (0,0) ii. Menentukan vektor jarak dari (1,0) iii. Menggunakan konsep p-norm iv. Perluasan karakteristik dari extended boolean v. Menghitung jarak.

10 Incidence Matrix Incidence matrix adalah suatu matrix yang terdiri dari kolom (dokumen) dan baris (token/terms/kata). Pembangunan index akan berbeda untuk tiap metode Retrieval. Untuk boolean model, salah satunya kita akan menggunakan Incidence matrix sebagai index dari korpus (kumpulan dokumen) data kita.  Dokumen yang ada di kolom adalah semua dokumen yang terdapat pada korpus data kita. Token/Terms/Kata pada baris adalah semua token unik (kata yang berbeda satu dengan yang lainnya) dalam seluruh dokumen yang ada.  Saat suatu token(t) ada dalam dokumen(d), maka nilai dari baris dan kolom (t,d) adalah 1. Jika tidak ditemukan, maka nilai kolom (t,d) adalah 0.  Dari sudut pandang kolom, kita bisa tahu token apa saja yang ada di satu dokumen (d). Dari sudut pandang barisnya, kita bisa tahu di dokumen mana saja token (t) ada (posting lists).

11 Perhatikan tabel berikut
Perhatikan tabel berikut. (Vektor baris menyatakan keberadaan suatu Token/Terms/Kata unik yang ada dalam semua dokumen. Vektor kolom menyatakan semua nama dokumen yang digunakan). Diketahui 6 dokumen dengan masing-masing kata yang terdapat di dalamnya. Jika kata tersebut berada dalam dokumen, maka Term Frekuensi Biner/ TFbiner = 1, jika tidak TFbiner = 0.]

12 Dengan mengunakan Incidence matrix yang sudah dibangun, kita sudah bisa memecahkan masalah yang pertama dihadapi tadi. Kemudian misalkan mencari hasil Boolean Query Retrieval : Brutus AND Caesar AND NOT Calpurnia. Maka dapat diketahui dengan mudah, dokumen mana saja yang mengandung kata Brutus dan Caesar, tetapi tidak mengandung kata Calpurnia.

13 Brutus AND Caesar AND NOT Calpurnia = AND AND NOT = AND AND = Berarti, jawaban hasil Boolean Query Retrieval : Brutus AND Caesar AND NOT Calpurnia adalah Dokumen “Antony & Cleopatra” dan “Hamlet”.

14 Referensi :


Download ppt "Model Boolean dan Advanced Boolean"

Presentasi serupa


Iklan oleh Google