Konsep dan Model-model Sistem Temu Balik Informasi

Slides:

Advertisements

Presentasi serupa

Konsep Dasar Sistem Temu Kembali Informasi

Advertisements

Praktikum Sistem Temu Balik Informasi

Ratri Enggar Pawening Materi 4 I NFORMATION R ETRIEVAL.

ORGANISASI INFORMASI Sistem Temu Kembali Informasi

StopList dan Stemming yasmi afrizal

Model Temu-Balik Informasi

Ranked Retrieval Pencarian Boolean Menghasilkan sekumpulan dokumen yang cocok dengan query, yang tidak cocok tidak muncul Pada kasus.

PENGANTAR ORGANISASI INFORMASI Sistem Temu Kembali Informasi (Information Retrieval System) Modul 11 Muslech, Dipl.Lib, MSi 3 Desember 2012.

Pertemuan ke-2 Model dalam sistem temu kembali informasi yasmi afrizal

FUZZY INFORMATION RETRIEVAL

Information Retrieval

Gambar Kerangka dari sistem temu-kembali informasi sederhana

KONSEP & DEFINISI KEBUTUHAN PL

Latent Semantic Indexing

Temu Balik Informasi Pertemuan Ke – 12 Presentasi Final Project

Final Project Temu Balik Informasi

MATERI PROJECT TI 2014 B Taufik Ari Arnandan ( )

Review Jurnal Nasional

Temu Balik Informasi Materi Pertemuan Ke – 1 Materi Dasar TBI

METODE DAN MODEL TEMU BALIK INFORMASI Luthfi Nurrohman ( )

Temu Balik Informasi BY : Taufik Ari Arnandan ( )

Anggota Kelompok Dian Santosa (KETUA)

TEMU BALIK INFORMASI.

Pertemuan 7 : Latent Semantic Indexing

Temu Balik Informasi Materi Pertemuan Ke – 7 Konsep dan Prinsip Serta Algoritma Latent Semantic Indexing Anggota : Nama Nim Wahyu Septi Anjar

Anggota Kelompok Ikhsan Fauji Irna Oktaviasari Erip Marliana

Konsep Thesaurus Dwi Ngafifudin ( )

Anggota : Nama Nim Wahyu Septi Anjar Patria Adhyaksa Dian Restiani

Konsep dan model temu balik informasi

Sistem Temu Kembali Informasi Multimedia

Implementasi vector space model untuk pencarian dokumen

TEMU BALIK INFORMASI Multimedia Dalam Temu Balik Informasi.

Konsep, Metode dan Model Temu Kembali Informasi

Latent Semantic Indexing (LSI)

Review Jurnal Internasional

Aditi Agrawal1, Dr. A. J. Agrawal2

EFEKTIFITAS SELEKSI FITUR DALAM SISTEM TEMU-KEMBALI INFORMASI

Anggota Kelompok : Kurniawan Novi Pambudi

Review Jurnal Temu Balik Informasi

TEMU KEMBALI INFORMASI

VECTOR SPACE MODEL.

Temu balik informasi Anggota Kelompok Ikhsan Fauji

FINAL PROJECT TEMU BALIK INFORMASI

TEMU BALIK INFORMASI TI 14 A.

Ketua Kelompok Dian Restiani Anggota : Wahyu Septi Anjar

TUJUAN (1) Mahasiswa dapat menjelaskan Ilmu Pengolahan Text dan Informasi. (C2) Mahasiswa dapat menjelaskan Model-model Sistem Temu Balik Informasi. (C2)

Review Konsep Dasar IRS/ STI

StopList dan Stemming yasmi afrizal

Pertemuan 11 : Aljabar Boole

Laten Semantic Indexing

PENYIMPANAN DAN PENGAMBILAN DATA MULTIMEDIA (LANJUTAN) .

STOPWORDLIST dan STEMMING

Information Retrieval

DOKUMENTASI DAN KEARSIPAN KELAS A Sistem Temu Kembali Informasi

Temu Balik Informasi Anggota Kelomopok :

Learning Outcomes Mahasiswa dapat menjelaskan definisi aljabar boole dan hukum-hukum aljabar boole,duality dan contoh pemakaian aljabar boole. Bina Nusantara.

Sistem TEMU KEMBALI INFORMASI

Oleh : Rahmat Robi Waliyansyah, M.Kom.

Pengenalan Temu Balik Informasi.

Nugraha Iman Santosa ( )

Model Boolean & Advanced Boolean

Model Boolean dan Advanced Boolean

Prinsip Dan Proses Temu Balik Informasi Model Boolean

Gerbang Logika Temu 10.

Model Probabilistic.

“MODEL BOOLEAN DAN ADVANCED BOOLEAN”

MODEL probabilistik KELOMPOK 6.

Temu Kembali Informasi

Universitas Gunadarma

Transcript presentasi:

Konsep dan Model-model Sistem Temu Balik Informasi

Anggota Kelompok Dian Santosa 14.11.0134(KETUA) Yayan Andriyana 14.11.0049 Taufik Hidayat N 14.11.0108 Khoerul Azni 14.11.0131 Agung Tri C 14.11.0132 Muhamad Margie A 14.11.0133 Rico Haviananto 12.11.- - - -

Konsep dan Metode

Metode/Teknik Text Operations (operasi terhadap teks) yang meliputi pemilihan kata-kata dalam query maupun dokumen dalam pentransformasian dokumen atau query menjadi terms index (indeks dari kata-kata). Query Formulation (formulasi terhadap query) yang memberi bobot pada indeks kata-kata query. Ranking, mencari dokumen-dokumen yang relevan terhadap query dan mengurutkan dokumen tersebut berdasarkan kesesuaiannya dengan query. Indexing, membangun data indeks dari koleksi dokumen. Dilkakukan terlebih dahulu sebelum pencarian dokumen, sistem temu balik informasi menerima query dari pengguna, kemudian melakukan perangkingan terhadap pada koleksi berdasarkan kesesuaiannya dengan query. Hasil perangkingan yang diberikan kepada pengguna merupakan dokumen yang sistem, relevan dengan query, namun relevansi dokumen terhadap suatu query merupakan penilaian pengguna yang subjektif dan dipengaruhi banyak faktor.

Model Sistem Temu Balik Informasi Jenis, Fungsi, dan Tujuan Sistem Temu Kembali Informasi Perkembangan Temu Kembali Informasi dari sisi user task ada 2 jenis yaitu: Model Klasik Model Boolean : merupakan model sistem temu kembali informasi sederhana yang berdasarkan atas teori himpunan dan aljabar boolean Model Vector Space : merupakan model sistem temu kembali informasi yang merepresentasikan dokumen dan query dalam bentuk vektor dimensional Model Probabilistic : merupakan model sistem temu kembali informasi yang menggunakan framework probabilistik Model Terstruktur Non Overlapping List: Sistem yang menggunakan model ini akan membagi-bagi dokumen sebagai “wilayah teks” tertentu. Proximal Nodes: model ini menggunakan struktur indeks yang memiliki hirarki independen (non-flet) terhadap sebuah dokumen.

Model Boolean Model ini merupakan model IR sederhana yang berdasarkan atas teori himpunan dan aljabar boolean. Boolean sendiri pertama kali dikembangkan oleh seroang ilmuan matematika bernama George Boole (1815-1864). Yang dikemukakan sebagai suatu struktur logika aljabar yang mencakup operasi Logika AND, OR dan NOT, dan juga teori himpunan untuk operasi union. Ada beberapa teknik temu-kembali informasi yang telah dikembangkan yaitu teknik Boolean sederhana dan teknik Boolean berperingkat (Fitriyanti,1997), serta teknik Extended Boolean berdasarkan p-norm model (Andri,1997). Untuk lebih jelasnya mengenai perbedaan dan keungulan masing-masing teknik ini dapat dilihat pada penjelasan berikut. 1. Teknik Boolean Teknik Boolean merupakan suatu cara dalam mengekspresikan keinginan pemakai ke sebuah kueri dengan mamakai operator-operator Boolean (Salton,1989) yaitu : “and”, “or”, dan “not”. Adapun maksud dari operator “and” adalah untuk menggabungkan istilah-istilah kedalam sebuah ungkapan, dan operator “or” adalah untuk memperlakukan istilah- istilah sebagai sinonim, sedangkan operator “not” merupakan sebuah pembatasan.

Model Boolean Pada teknik Boolean sederhana, kueri diproses sesuai dengan operator yang digunakan dan menampilkan dokumen berdasarkan urutan dokumen ditemukan. Sedangkan pada teknik Boolean berperingkat, dokumen diperingkat berdasarkan bobot dari dokumen. Adapun pembobotan dari masing-masing dokumen berdasarkan aturan sebagai berikut : A and B → D1A∩B, D2A∩B, ...→d1A∩B > d2A∩B > ... dengan dA∩B = min(dA,dB) A or B → D1A∪B, D2A∪B, ...→d1A∪B > d2A∪B > ... dengan dA∪B = max(dA,dB) Not A U – dA

Model Boolean 2. Teknik Extended Boolean Teknik Extended Boolean berdasarkan p-norm model merupakan pengembangan lebih lanjut dari model Boolean. Teknik ini memakai operator yang dikomputasi berdasarkan rumus Savoy(1993), sebagai berikut :

Dimana : • p adalah nilai p-norm yang dimasukkan pada kueri. • Wia adalah bobot istilah A dalam indeks pada dokumen Di . • Wib adalah bobot istilah B dalam indeks pada dokumen Di . Pemeringkatan yang dipakai bisa dua cara : • Langsung mengurutkan dokumen (dari besar ke kecil) berdasarkan bobot dokumen yang didapat dengan rumus RSV (retrieval status value) di atas. • Memakai rumus Learning Scheme.

Model boolean Kelebihan Model Boolean Mudah Untuk di Implementasikan Konsep Yang Terstruktur Kekurangan Model Boolean Pencocokan yang tepat dapat mengambil dokumen terlalu sedikit atau terlalu banyak. Sulit untuk pengindexkan, beberapa dokumen yang lebih penting dari pada yang lain kadang berada dibawah dokumen yang tidak penting. Sulit untuk menerjemahkan query ke dalam ekspresi Boolean Semua istilah sama-sama berbobot Lebih seperti pengambilan data dari pencarian informasi Sumber http://repository.ui.ac.id/dokumen/lihat/6396.pdf

Model Vector Space Model Vector Space adalah Model dalam IR yang berbasis token untuk memungkinkan partial matching dan pemeringkatan dokumen (pengindexan). Dengan prinsip dasar dokumen menjadi sebuah token yang kemudian ti kumpulkan menjadi t(n) token-token, kemudian Query menjadi vector token yang berfungsi untuk mencari token-token yang berhubungan dengan melihat kesamaan vektor dokumen dan query berdasarkan jarak vektor.

Kelebihan Vector Space Model (VSM) Adanya peringkat pengambilan informasi Menampilkan referensi yang sesuai kebutuhan Penyocokan secara partial. Kekurangan Vector Space Model (VSM) Menganggap informasi adalah independen Bobot pemahaman(istilah) tidak lagi diperlukan.

Cara Kerja VSM dan Algoritmanya. Pada VSM, setiap dokumen dan query dari pengguna direpresentasikan sebagai ruang vektor berdimensi n. Biasanya digunakan nilai bobot istilah (term weigthing) sebagai nilai dari vektor pada dokumen nilai 1 untuk setiap istilah yang muncul pada vektor query. Pada model ini, bobot dari query dan dokumen dinyatakan dalam bentuk vektor, seperti: Q = (Wq1, Wq2, Wq3, . . . ,Wqt) dan Di= (Wi1, Wi2, Wi3, . . . , Wit) Dengan Wqj dan Wij sebagai bobot istilah Tj dalam query Q dan dokumen Di. Dengan demikian dokumen yang lebih panjang dengan jumlah istilah yang lebih banyak memiliki kemungkinan lebih besar untuk dianggap relevan dengan istilah-istilah query tertentu dibandingkan dokumen-dokumen yang lebih pendek. Sehingga pada kebanyakan lingkungan penemu-kembalian, vektor dokumen ternormalisasi lebih disukai namun proses normalisasi vektor querytidak diperlukan karena ukurannya yang umumnya pendek dan perbedaan panjang antar-query relatif kecil.

Model Probabilitas Model Probabilitas didasarkan pada Prinsip Ranking Probabilitas, yang menyatakan bahwa sistem pencarian informasi yang seharusnya berdasarkan peringkat probabilitas dokumen mereka yang relevan dengan query, mengingat semua bukti yang tersedia [Belkin dan Croft 1992]. Olehkarena itu dalam metode probabilitas ini, suatu dokumen yang sering di temukan dan diindexing ulang merupakan dokumen yang paling relevan dari kata kunci, sehingga akan selalu muncul ketika katakunci itu di queue.

https://www.academia.edu/6138333/Konsep_Dasar_Sistem_Temu_Kembali_Informasi_Basic_C ocepts_of_Information_Retrieval_System http://suyatmobng.blogspot.co.id/2013/03/metode-cara-kerja-dan-algoritma-ir.html http://repository.ui.ac.id/dokumen/lihat/6396.pdf