Presentasi sedang didownload. Silahkan tunggu

Presentasi sedang didownload. Silahkan tunggu

Konsep, Metode dan Model Temu Kembali Informasi

Presentasi serupa


Presentasi berjudul: "Konsep, Metode dan Model Temu Kembali Informasi"— Transcript presentasi:

1 Konsep, Metode dan Model Temu Kembali Informasi
TI14D

2 Kelompok Nama Nim Latif Nur Hidayat 14.11.0209 Retno Dwi K.K.
Aqit Malinzda Deni priyadi Nur Rahmat Dwi Riyanto Laelatul Badriyah Arif Setiawan Aditya Wahyu Kurniawan

3 Konsep dan Metode Temu Kembali Informasi
Pendit (2008) berpendapat bahwa OPAC sebagai mesin pencari informasi juga membawa persoalan tentang relevansi karena secanggih apapun sebuah mesin akan sulit untuk memahami rumitnya pikiran manusia. Sehingga ilmuwan berusaha untuk menciptakan formula agar bisa membuat sistem yang bisa diandalkan, mampu mengukur efektifitas sistem dalam memenuhi permintaan informasi serta dapat mengetahui informasi yang relevan dengan kebutuhan pengguna (pencari informasi) dalam sebuah sistem. Oleh sebab itu, akhirnya ilmuwan membuat rumus recall dan precision untuk mengukur efektifitas sistem temu kembali informasi.

4 Konsep dan Metode Temu Kembali Informasi
Ingwersen yang dikutip oleh Hasugian (2006) menjelaskan bahwa temu kembali informasi merupakan proses yang berhubungan dengan representasi, penyimpanan, pencarian dengan pemanggilan informasi yang relevan dengan kebutuhan informasi yang diinginkan pengguna (pencari informasi). Menurut Pao yang dikutip oleh Hasugian (2006), efektivitas dari suatu sistem temu kembali informasi adalah kemampuan dari sistem itu untuk memanggil berbagai dokumen dari suatu basis data sesuai dengan permintaan pemakai informasi. Kemampuan dari sistem tersebut mulai dari dulu hingga sekarang selalu berkaitan dengan apa yang disebut dengan istilah relevansi. Relevansi menurut Pendit (2007) adalah kecocokan apa yang dicari dengan apa yang ditemukan.

5 Konsep dan Metode Temu Kembali Informasi
Sedangkan menurut Bookstein yang dikutip oleh Hasugian (2006) mendefinisikan bahwa relevansi adalah relatedness, atau aboutness dan utility atau value antara dua dokumen, atau antara dokumen dengan permintaan (query). relatedness, atau aboutness yaitu apabila antara dokumen dengan permintaan dikatakan terhubung (related) jika keduanya mengenai (about) sesuatu yang sama, karena keduanya merupakan entitas yang serupa dan memiliki nilai (value) atribut yang sama. Utility menunjuk pada nilai atau guna suatu dokumen bagi pencari informasi.

6 Konsep dan Metode Temu Kembali Informasi
Menurut Abdulmain (2010), ada sebuah perbedaan antara dokumen partinence dengan dokumen relevan. Relevan didefinisikan sebagai hubungan antara dokumen dengan permintaan (rtelationship between a document and an information request), dan pertinence adalah hubungan antara dokumen dengan kebutuhan informasi (relationship between a document and an information need). Dengan kata lain, dokumen relevan adalah dokumen yang cocok dengan pertanyaan penelusur, sedang dokumen pertinence adalah dokumen yang dinilai (judged) berguna oleh pemakai.

7 Konsep dan Metode Temu Kembali Informasi

8 Konsep dan Metode Temu Kembali Informasi
Selanjutnya Pendit (2007) menjelaskan bahwa salah satu prinsip relevansi yang digunakan dalam sistem temu kembali informasi adalah penggunaan ukuran recall dan precision. Hal ini dikarenakan, menurut Pao (dalam Hasugian, 2006), recall dan precision adalah dua hal penting yang biasanya digunakan dalam mengukur efektivitas sistem temu kembali informasi. Recall menurut Lancaster dalam Pendit (2007) adalah proporsi jumlah dokumen yang dapat ditemukan kembali oleh sebuah proses pencarian dalam sistem temu kembali informasi. Sedangkan, precision adalah proporsi jumlah dokumen yang ditemukan dan dianggap relevan untuk kebutuhan pencari informasi/rasio jumlah dokumen relevan yang ditemukan kembali dengan total jumlah dokumen dalam kumpulan dokumen yang dianggap relevan. Sedangkan recall (perolehan) berdasarkan penjelasan dari Hasugian (2006), dapat diartikan sebagai kemampuan sebuah sistem dalam memanggil kembali dokumen yang dianggap relevan atau sesuai dengan yang diinginkan oleh pengguna dari pangkalan data (database). Sedangkan precision (ketepatan) dapat diartikan sebagai kemampuan sebuah sistem untuk tidak memanggil kembali dokumen yang dianggap tidak relevan atau tidak sesuai dengan yang diinginkan oleh pengguna dari pangkalan data (database).

9 Konsep dan Metode Temu Kembali Informasi

10 Konsep dan Metode Temu Kembali Informasi
Lancaster dalam Pendit (2007) menjelaskan pencarian recall dan precision dengan rumus sebagai berikut :

11 Konsep dan Metode Temu Kembali Informasi
Efektivitas sistem temu kembali informasi dinilai berdasarkan teori dari Lancaster dalam Pendit (2008) yaitu relevan dan tidak relevan. Dalam teori tersebut juga dijelaskan bahwa efektivitas sistem temu kembali informasi dikategorikan menjadi dua yaitu efektif jika nilainya diatas 50% dan tidak efektif jika nilainya dibawah 50%. Kedua ukuran diatas dinilai dalam bentuk presentase, 1-100%. Sebuah sistem temu kembali informasi akan dianggap baik jika tingkat recall maupun precision-nya tinggi. Kondisi ideal efektivitas sistem temu kembali informasi menurut Pao dalam Hasugian (2006) adalah apabila rasio recall dan precision-nya sama besarnya (1:1).

12 Model-Model Temu Kembali Informasi
Himpunan yang terdiri dari logical view bagi koleksi-koleksi dokumen  D Himpunan yang terdiri dari logical view bagi kebutuhan informasi user. Representasi tersebut disebut query  Q Framework bagi representasi dokumen, query, dan hubungannya  F R(qi, dj) adalah fungsi rangking (peringkat) yang berasosiasi antara bilangan real dengan query qi  Q dan representasi dokumen dj  D. Rangking tersebut mendefinisikan urutan di antara dokumen-dokumen yang diambil dengan menggunakan query qi

13 Model-Model Temu Kembali Informasi

14 Model-Model Temu Kembali Informasi
Model Klasik Model Boolean Model Vector Space Model Probabilitas Model Terstruktur Model Non Overlapping List Model Proximal Nodes

15 Model Klasik (Boolean)
Model Boolean : merupakan model sistem temu kembali informasi sederhana yang berdasarkan atas teori himpunan dan aljabar boolean. Model ini menggunakan Operator Boolean yaitu AND, OR, dan NOT. Metode ini merupakan metode yang paling sering digunakan pada mesin penelusur (search engine) karena kecepatanya.

16 Model Klasik (Boolean)

17 Model Klasik (Vector Space Model VSM)
Model Vector Space : merupakan model sistem temu kembali informasi yang merepresentasikan dokumen dan query dalam bentuk vektor dimensional. Pada sistem IR, kemiripan antar dokumen didefinisikan berdasarkan representasi bag of words dan dikonversi ke suatu model ruang vektor (vector space model, VSM). Model ini diperkenalkan oleh Salton [7] dan telah digunakan secara luas. Pada VSM, setiap dokumen di dalam database dan query pengguna direpresentasikan oleh suatu vektor multi-dimensi [2,6]. Dimensi sesuai dengan jumlah term dalam dokumen yang terlibat. Pada model ini: A. Vocabulary merupakan kumpulan semua term berbeda yang tersisa dari dokumen setelah preprocessing dan mengandung t term index. Term-term ini membentuk suatu ruang vektor. B. Setiap term i di dalam dokumen atau query j, diberikan suatu bobot (weight) bernilai real wij. C. Dokumen dan query diekspresikan sebagai vektor t dimensi dj = (w1, w2, ..., wtj) dan terdapat n dokumen di dalam koleksi, yaitu j = 1, 2, ..., n. Contoh dari model ruang vektor tiga dimensi untuk dua dokumen D1 dan D2, satu query pengguna Q1, dan tiga term T1, T2 dan T3 diperlihatkan pada gambar 2 berikut ini,

18 Model Klasik (Vector Space Model VSM)

19 Model Klasik(Probabilitas)
Model Probabilistic : merupakan model sistem temu kembali informasi yang menggunakan framework probabilistik. Beberapa pendekatan mencoba untuk mendefinisikan istilah yang lebih formal yang didasarkan pada teori probabilitas. Gagasan kemungkinan sesuatu, misalnya kemungkinan relevansi dinotasikan sebagai P (R), biasanya diformalkan melalui konsep percobaan, di mana percobaan adalah proses dimana pengamatan dibuat. Himpunan semua hasil yang mungkin dari percobaan disebut ruang sampel. Dalam kasus P (R) ruang sampel mungkin {Relevan, relevan}, dan kami mungkin mendefinisikan variabel acak R untuk mengambil nilai-nilai {0, 1}, di mana 0 = tidak relevan dan 1 = relevan.

20 Model Klasik(Probabilitas)
Kami mengambil satu dokumen dari koleksi secara acak: Jika kita tahu jumlah dokumen yang relevan dalam koleksi, mengatakan 100 dokumen yang relevan, dan kita tahu jumlah total dokumen dalam koleksi, mengatakan 1 juta, maka hasil bagi dari dua mendefinisikan probabilitas relevansi P (R = 1) = 100 / = 0,0001.

21 Model Terstruktur Non Overlapping List: Sistem yang menggunakan model ini akan membagi-bagi dokumen sebagai “wilayah teks” tertentu. Proximal Nodes: model ini menggunakan struktur indeks yang memiliki hirarki independen (non-flet) terhadap sebuah dokumen.

22 Referensi Dony Prisma Wicaksono  Recall Dan Precision Dalam Sistem Temu Kembali InformasI. kembali-informasi/.  Dony Prisma Wicaksono  Jenis, Fungsi Dan Tujuan Sistem Temu Kembali Informasi. kembali-informasi/. Sugeng Priyanto Model Temu Balik Informasi. Giat Karyono dan Fandy Setyo Utomo Temu Balik Informasi Pada Dokumen Teks Berbahasa Indonesia Dengan Metode Vector Space Retrieval Model. ISBN , Seminar Nasional Teknologi Informasi & Komunikasi Terapan 2012 (Semantik 2012). Djoerd Hiemstra. Information Retrieval Models. University of Twente :


Download ppt "Konsep, Metode dan Model Temu Kembali Informasi"

Presentasi serupa


Iklan oleh Google