Konsep, Metode dan Model Temu Kembali Informasi

Slides:



Advertisements
Presentasi serupa
Konsep Dasar Sistem Temu Kembali Informasi
Advertisements

Praktikum Sistem Temu Balik Informasi
Ratri Enggar Pawening Materi 4 I NFORMATION R ETRIEVAL.
ORGANISASI INFORMASI Sistem Temu Kembali Informasi
StopList dan Stemming yasmi afrizal
Model Temu-Balik Informasi
Penilaian Relevansi Penilaian relevansi bertujuan untuk menentukan dokumen yang relevan (sesuai; cocok) dari antara sejumlah dokumen yang ditemukan (terpanggil)
Ranked Retrieval Pencarian Boolean Menghasilkan sekumpulan dokumen yang cocok dengan query, yang tidak cocok tidak muncul Pada kasus.
PENGANTAR ORGANISASI INFORMASI Sistem Temu Kembali Informasi (Information Retrieval System) Modul 11 Muslech, Dipl.Lib, MSi 3 Desember 2012.
Pengenalan Database Local e-Content Pertemuan 8
Pertemuan ke-2 Model dalam sistem temu kembali informasi yasmi afrizal
FUZZY INFORMATION RETRIEVAL
Information Retrieval
Gambar Kerangka dari sistem temu-kembali informasi sederhana
Latent Semantic Indexing
Temu Balik Informasi Pertemuan Ke – 12 Presentasi Final Project
Final Project Temu Balik Informasi
MATERI PROJECT TI 2014 B Taufik Ari Arnandan ( )
Review Jurnal Nasional
Temu Balik Informasi Materi Pertemuan Ke – 1 Materi Dasar TBI
METODE DAN MODEL TEMU BALIK INFORMASI Luthfi Nurrohman ( )
Temu Balik Informasi BY : Taufik Ari Arnandan ( )
Anggota Kelompok Dian Santosa (KETUA)
Konsep dan Prinsip Latent Semantic Indexing (LSI)
TEMU BALIK INFORMASI.
Pertemuan 7 : Latent Semantic Indexing
SEARCH ENGINE.
Konsep Thesaurus Dwi Ngafifudin ( )
Konsep dan Model-model Sistem Temu Balik Informasi
Anggota : Nama Nim Wahyu Septi Anjar Patria Adhyaksa Dian Restiani
Konsep dan model temu balik informasi
Implementasi vector space model untuk pencarian dokumen
TEMU BALIK INFORMASI Multimedia Dalam Temu Balik Informasi.
Latent Semantic Indexing (LSI)
Review Jurnal Internasional
EFEKTIFITAS SELEKSI FITUR DALAM SISTEM TEMU-KEMBALI INFORMASI
Anggota Kelompok : Kurniawan Novi Pambudi
Review Jurnal Temu Balik Informasi
TEMU KEMBALI INFORMASI
VECTOR SPACE MODEL.
Temu balik informasi Anggota Kelompok Ikhsan Fauji
FINAL PROJECT TEMU BALIK INFORMASI
TEMU BALIK INFORMASI TI 14 A.
Ketua Kelompok Dian Restiani Anggota : Wahyu Septi Anjar
TUJUAN (1) Mahasiswa dapat menjelaskan Ilmu Pengolahan Text dan Informasi. (C2) Mahasiswa dapat menjelaskan Model-model Sistem Temu Balik Informasi. (C2)
Review Konsep Dasar IRS/ STI
Temu kembali informasi
Query Query adalah istilah yang dibangun oleh user untuk merepresentasikan kebutuhan informasinya Query dapat berupa istilah tunggal maupun istilah gabungan/kombinasi.
StopList dan Stemming yasmi afrizal
Laten Semantic Indexing
Pengukuran Resiko Yessica Cahyani
PENYIMPANAN DAN PENGAMBILAN DATA MULTIMEDIA (LANJUTAN) .
Stemming & Stoplist TI14D.
Information Retrieval
DOKUMENTASI DAN KEARSIPAN KELAS A Sistem Temu Kembali Informasi
Oleh : Rahmat Robi Waliyansyah, M.Kom.
Temu Balik Informasi Anggota Kelomopok :
Sistem TEMU KEMBALI INFORMASI
Penilaian Relevansi Penilaian relevansi bertujuan untuk menentukan dokumen yang relevan (sesuai; cocok) dari antara sejumlah dokumen yang ditemukan (terpanggil)
Oleh : Rahmat Robi Waliyansyah, M.Kom.
Pengenalan Temu Balik Informasi.
Model Boolean & Advanced Boolean
SEARCH ENGINE.
Model Boolean dan Advanced Boolean
Prinsip Dan Proses Temu Balik Informasi Model Boolean
Model Probabilistic.
“MODEL BOOLEAN DAN ADVANCED BOOLEAN”
MODEL probabilistik KELOMPOK 6.
Temu Kembali Informasi
Universitas Gunadarma
Transcript presentasi:

Konsep, Metode dan Model Temu Kembali Informasi TI14D

Kelompok Nama Nim Latif Nur Hidayat 14.11.0209 Retno Dwi K.K. 14.11.0211 Aqit Malinzda 14.11.0213 Deni priyadi 14.11.0214 Nur Rahmat Dwi Riyanto 14.11.0216 Laelatul Badriyah 14.11.0217 Arif Setiawan 14.11.0218 Aditya Wahyu Kurniawan 14.11.0219

Konsep dan Metode Temu Kembali Informasi Pendit (2008) berpendapat bahwa OPAC sebagai mesin pencari informasi juga membawa persoalan tentang relevansi karena secanggih apapun sebuah mesin akan sulit untuk memahami rumitnya pikiran manusia. Sehingga ilmuwan berusaha untuk menciptakan formula agar bisa membuat sistem yang bisa diandalkan, mampu mengukur efektifitas sistem dalam memenuhi permintaan informasi serta dapat mengetahui informasi yang relevan dengan kebutuhan pengguna (pencari informasi) dalam sebuah sistem. Oleh sebab itu, akhirnya ilmuwan membuat rumus recall dan precision untuk mengukur efektifitas sistem temu kembali informasi.

Konsep dan Metode Temu Kembali Informasi Ingwersen yang dikutip oleh Hasugian (2006) menjelaskan bahwa temu kembali informasi merupakan proses yang berhubungan dengan representasi, penyimpanan, pencarian dengan pemanggilan informasi yang relevan dengan kebutuhan informasi yang diinginkan pengguna (pencari informasi). Menurut Pao yang dikutip oleh Hasugian (2006), efektivitas dari suatu sistem temu kembali informasi adalah kemampuan dari sistem itu untuk memanggil berbagai dokumen dari suatu basis data sesuai dengan permintaan pemakai informasi. Kemampuan dari sistem tersebut mulai dari dulu hingga sekarang selalu berkaitan dengan apa yang disebut dengan istilah relevansi. Relevansi menurut Pendit (2007) adalah kecocokan apa yang dicari dengan apa yang ditemukan.

Konsep dan Metode Temu Kembali Informasi Sedangkan menurut Bookstein yang dikutip oleh Hasugian (2006) mendefinisikan bahwa relevansi adalah relatedness, atau aboutness dan utility atau value antara dua dokumen, atau antara dokumen dengan permintaan (query). relatedness, atau aboutness yaitu apabila antara dokumen dengan permintaan dikatakan terhubung (related) jika keduanya mengenai (about) sesuatu yang sama, karena keduanya merupakan entitas yang serupa dan memiliki nilai (value) atribut yang sama. Utility menunjuk pada nilai atau guna suatu dokumen bagi pencari informasi.

Konsep dan Metode Temu Kembali Informasi Menurut Abdulmain (2010), ada sebuah perbedaan antara dokumen partinence dengan dokumen relevan. Relevan didefinisikan sebagai hubungan antara dokumen dengan permintaan (rtelationship between a document and an information request), dan pertinence adalah hubungan antara dokumen dengan kebutuhan informasi (relationship between a document and an information need). Dengan kata lain, dokumen relevan adalah dokumen yang cocok dengan pertanyaan penelusur, sedang dokumen pertinence adalah dokumen yang dinilai (judged) berguna oleh pemakai.

Konsep dan Metode Temu Kembali Informasi

Konsep dan Metode Temu Kembali Informasi Selanjutnya Pendit (2007) menjelaskan bahwa salah satu prinsip relevansi yang digunakan dalam sistem temu kembali informasi adalah penggunaan ukuran recall dan precision. Hal ini dikarenakan, menurut Pao (dalam Hasugian, 2006), recall dan precision adalah dua hal penting yang biasanya digunakan dalam mengukur efektivitas sistem temu kembali informasi. Recall menurut Lancaster dalam Pendit (2007) adalah proporsi jumlah dokumen yang dapat ditemukan kembali oleh sebuah proses pencarian dalam sistem temu kembali informasi. Sedangkan, precision adalah proporsi jumlah dokumen yang ditemukan dan dianggap relevan untuk kebutuhan pencari informasi/rasio jumlah dokumen relevan yang ditemukan kembali dengan total jumlah dokumen dalam kumpulan dokumen yang dianggap relevan. Sedangkan recall (perolehan) berdasarkan penjelasan dari Hasugian (2006), dapat diartikan sebagai kemampuan sebuah sistem dalam memanggil kembali dokumen yang dianggap relevan atau sesuai dengan yang diinginkan oleh pengguna dari pangkalan data (database). Sedangkan precision (ketepatan) dapat diartikan sebagai kemampuan sebuah sistem untuk tidak memanggil kembali dokumen yang dianggap tidak relevan atau tidak sesuai dengan yang diinginkan oleh pengguna dari pangkalan data (database).

Konsep dan Metode Temu Kembali Informasi

Konsep dan Metode Temu Kembali Informasi Lancaster dalam Pendit (2007) menjelaskan pencarian recall dan precision dengan rumus sebagai berikut :

Konsep dan Metode Temu Kembali Informasi Efektivitas sistem temu kembali informasi dinilai berdasarkan teori dari Lancaster dalam Pendit (2008) yaitu relevan dan tidak relevan. Dalam teori tersebut juga dijelaskan bahwa efektivitas sistem temu kembali informasi dikategorikan menjadi dua yaitu efektif jika nilainya diatas 50% dan tidak efektif jika nilainya dibawah 50%. Kedua ukuran diatas dinilai dalam bentuk presentase, 1-100%. Sebuah sistem temu kembali informasi akan dianggap baik jika tingkat recall maupun precision-nya tinggi. Kondisi ideal efektivitas sistem temu kembali informasi menurut Pao dalam Hasugian (2006) adalah apabila rasio recall dan precision-nya sama besarnya (1:1).

Model-Model Temu Kembali Informasi Himpunan yang terdiri dari logical view bagi koleksi-koleksi dokumen  D Himpunan yang terdiri dari logical view bagi kebutuhan informasi user. Representasi tersebut disebut query  Q Framework bagi representasi dokumen, query, dan hubungannya  F R(qi, dj) adalah fungsi rangking (peringkat) yang berasosiasi antara bilangan real dengan query qi  Q dan representasi dokumen dj  D. Rangking tersebut mendefinisikan urutan di antara dokumen-dokumen yang diambil dengan menggunakan query qi

Model-Model Temu Kembali Informasi

Model-Model Temu Kembali Informasi Model Klasik Model Boolean Model Vector Space Model Probabilitas Model Terstruktur Model Non Overlapping List Model Proximal Nodes

Model Klasik (Boolean) Model Boolean : merupakan model sistem temu kembali informasi sederhana yang berdasarkan atas teori himpunan dan aljabar boolean. Model ini menggunakan Operator Boolean yaitu AND, OR, dan NOT. Metode ini merupakan metode yang paling sering digunakan pada mesin penelusur (search engine) karena kecepatanya.

Model Klasik (Boolean)

Model Klasik (Vector Space Model VSM) Model Vector Space : merupakan model sistem temu kembali informasi yang merepresentasikan dokumen dan query dalam bentuk vektor dimensional. Pada sistem IR, kemiripan antar dokumen didefinisikan berdasarkan representasi bag of words dan dikonversi ke suatu model ruang vektor (vector space model, VSM). Model ini diperkenalkan oleh Salton [7] dan telah digunakan secara luas. Pada VSM, setiap dokumen di dalam database dan query pengguna direpresentasikan oleh suatu vektor multi-dimensi [2,6]. Dimensi sesuai dengan jumlah term dalam dokumen yang terlibat. Pada model ini: A. Vocabulary merupakan kumpulan semua term berbeda yang tersisa dari dokumen setelah preprocessing dan mengandung t term index. Term-term ini membentuk suatu ruang vektor. B. Setiap term i di dalam dokumen atau query j, diberikan suatu bobot (weight) bernilai real wij. C. Dokumen dan query diekspresikan sebagai vektor t dimensi dj = (w1, w2, ..., wtj) dan terdapat n dokumen di dalam koleksi, yaitu j = 1, 2, ..., n. Contoh dari model ruang vektor tiga dimensi untuk dua dokumen D1 dan D2, satu query pengguna Q1, dan tiga term T1, T2 dan T3 diperlihatkan pada gambar 2 berikut ini,

Model Klasik (Vector Space Model VSM)

Model Klasik(Probabilitas) Model Probabilistic : merupakan model sistem temu kembali informasi yang menggunakan framework probabilistik. Beberapa pendekatan mencoba untuk mendefinisikan istilah yang lebih formal yang didasarkan pada teori probabilitas. Gagasan kemungkinan sesuatu, misalnya kemungkinan relevansi dinotasikan sebagai P (R), biasanya diformalkan melalui konsep percobaan, di mana percobaan adalah proses dimana pengamatan dibuat. Himpunan semua hasil yang mungkin dari percobaan disebut ruang sampel. Dalam kasus P (R) ruang sampel mungkin {Relevan, relevan}, dan kami mungkin mendefinisikan variabel acak R untuk mengambil nilai-nilai {0, 1}, di mana 0 = tidak relevan dan 1 = relevan.

Model Klasik(Probabilitas) Kami mengambil satu dokumen dari koleksi secara acak: Jika kita tahu jumlah dokumen yang relevan dalam koleksi, mengatakan 100 dokumen yang relevan, dan kita tahu jumlah total dokumen dalam koleksi, mengatakan 1 juta, maka hasil bagi dari dua mendefinisikan probabilitas relevansi P (R = 1) = 100 / 1.000.000 = 0,0001.

Model Terstruktur Non Overlapping List: Sistem yang menggunakan model ini akan membagi-bagi dokumen sebagai “wilayah teks” tertentu. Proximal Nodes: model ini menggunakan struktur indeks yang memiliki hirarki independen (non-flet) terhadap sebuah dokumen.

Referensi Dony Prisma Wicaksono. 2014. Recall Dan Precision Dalam Sistem Temu Kembali InformasI. https://donyprisma.wordpress.com/2014/11/01/recall-dan-precision-dalam-sistem-temu- kembali-informasi/.  Dony Prisma Wicaksono. 2014. Jenis, Fungsi Dan Tujuan Sistem Temu Kembali Informasi. https://donyprisma.wordpress.com/2014/01/02/jenis-fungsi-dan-tujuan-sistem-temu- kembali-informasi/. Sugeng Priyanto. 2013. Model Temu Balik Informasi. http://sugengpri.blog.undip.ac.id/files/2013/07/4.-MODEL-TBIE.pdf. Giat Karyono dan Fandy Setyo Utomo. 2012. Temu Balik Informasi Pada Dokumen Teks Berbahasa Indonesia Dengan Metode Vector Space Retrieval Model. ISBN 979-26- 0255-0, Seminar Nasional Teknologi Informasi & Komunikasi Terapan 2012 (Semantik 2012). Djoerd Hiemstra. Information Retrieval Models. University of Twente : http://wwwhome.cs.utwente.nl/~hiemstra/papers/IRModelsTutorial-draft.pdf.