Oleh : Rahmat Robi Waliyansyah, M.Kom.

Slides:



Advertisements
Presentasi serupa
Konsep Dasar Sistem Temu Kembali Informasi
Advertisements

Praktikum Sistem Temu Balik Informasi
ORGANISASI INFORMASI Sistem Temu Kembali Informasi
StopList dan Stemming yasmi afrizal
Penilaian Relevansi Penilaian relevansi bertujuan untuk menentukan dokumen yang relevan (sesuai; cocok) dari antara sejumlah dokumen yang ditemukan (terpanggil)
KOMPONEN SPK.
STBI pada Perpustakaan
PENGANTAR ORGANISASI INFORMASI Sistem Temu Kembali Informasi (Information Retrieval System) Modul 11 Muslech, Dipl.Lib, MSi 3 Desember 2012.
FUZZY INFORMATION RETRIEVAL
Information Retrieval
DASAR – DASAR SISTEM INFORMASI
Sistem Temu-Balik Informasi INFORMATION RETRIEVAL SYSTEMS (IRS)
Review Jurnal Nasional
Temu Balik Informasi Materi Pertemuan Ke – 1 Materi Dasar TBI
METODE DAN MODEL TEMU BALIK INFORMASI Luthfi Nurrohman ( )
KOMPONEN SPK.
Temu Balik Informasi BY : Taufik Ari Arnandan ( )
Anggota Kelompok Dian Santosa (KETUA)
TEMU BALIK INFORMASI.
Anggota Kelompok Ikhsan Fauji Irna Oktaviasari Erip Marliana
SEARCH ENGINE.
Konsep dan Model-model Sistem Temu Balik Informasi
Anggota : Nama Nim Wahyu Septi Anjar Patria Adhyaksa Dian Restiani
TEMU BALIK INFORMASI Multimedia Dalam Temu Balik Informasi.
Konsep, Metode dan Model Temu Kembali Informasi
Latent Semantic Indexing (LSI)
ARSITEKTUR SISTEM TERDISTRIBUSI
Pertemuan 3 MKP Sistem Pakar
IMPLEMENTASI ALGORITME DAMERAU-LEVENSHTEIN UNTUK KOREKSI EJAAN QUERY BAHASA INDONESIA PADA SEARCH ENGINE     Oleh: Utis Sutisna G  
Review Jurnal Internasional
EFEKTIFITAS SELEKSI FITUR DALAM SISTEM TEMU-KEMBALI INFORMASI
Anggota Kelompok : Kurniawan Novi Pambudi
Sistem Temu-Balik Informasi yasmi afrizal
Review Jurnal Temu Balik Informasi
SISTEM TEMU KEMBALI INFORMASI
Temu Balik Informasi Nama Kelompok : Ikhsan Fauji
TEMU KEMBALI INFORMASI
MENCARI WEB DENGAN MENGGUNAKAN SEARCH ENGINE
TEMU BALIK INFORMASI TI 14 A.
StopList dan Stemming yasmi afrizal
Ir. Julio Adisantoso, M.Kom.
Information Retrieval
STBI pada Perpustakaan
ANALISIS DAN DESAIN SISTEM INFORMASI PERTEMUAN -1 RANI SUSANTO, S. KOM
DOKUMENTASI DAN KEARSIPAN KELAS A Sistem Temu Kembali Informasi
Temu Balik Informasi Anggota Kelomopok :
Perancangan Data Logis dan Fisik
Sistem TEMU KEMBALI INFORMASI
Penilaian Relevansi Penilaian relevansi bertujuan untuk menentukan dokumen yang relevan (sesuai; cocok) dari antara sejumlah dokumen yang ditemukan (terpanggil)
Oleh : Rahmat Robi Waliyansyah, M.Kom.
KONSEP DAN RANCANGAN BASIS DATA TERDISTRIBUSI
Validasi dan Verifikasi Software
Sistem Temu-Balik Informasi INFORMATION RETRIEVAL SYSTEMS (IRS)
Web Search Engine (Mesin Pencari Web)
CROSS LANGUAGE INFORMATION RETRIEVAL (CLIR)
Pertemuan 11 PENGANTAR SISTEM PAKAR
Oleh : Rahmat Robi Waliyansyah, M.Kom.
Oleh : Rahmat Robi Waliyansyah, M.Kom.
Pengenalan Temu Balik Informasi.
Model Boolean & Advanced Boolean
Oleh : Rahmat Robi Waliyansyah, M.Kom.
IMPLEMENTASI QUESTION ANSWERING SYSTEM DENGAN METODE RULE-BASED PADA BANYAK DOKUMEN BERBAHASA INDONESIA Disusun Oleh : Romaida Dolarosa S G
Oleh : Rahmat Robi Waliyansyah, M.Kom.
SEARCH ENGINE.
DASAR – DASAR SISTEM INFORMASI
Oleh : Rahmat Robi Waliyansyah, M.Kom.
ARSITEKTUR SISTEM PAKAR
Temu Kembali Informasi
Cross-Language Information Retrieval (CLIR)
1 Search Engine Sumber : A short and easy search engine tutorial oleh Pandia.
Transcript presentasi:

Oleh : Rahmat Robi Waliyansyah, M.Kom. Evaluasi IR Oleh : Rahmat Robi Waliyansyah, M.Kom.

Contoh query : sby

Contoh query: flu burung

Kebutuhan --> Query

EVALUASI SEARCH ENGINE Bagaimana antarmuka search engine tersebut? Seberapa cepat search engine tersebut mengindeks? Seberapa cepat search engine tersebut menelusur? Bagaimana search engine tersebut menterjemahkan Bahasa pengindeksan? Recall sulit diukur dalam search engine.

SEARCH SUBSYSTEM (MATCHING) Search subsystem (matching) merupakan proses menemukan kembali informasi (dokumen) yang relevan terhadap query yang diberikan. Tidak semua dokumen yang diambil (retrieved) oleh system merupakan dokumen yang sesuai dengan keinginan user (relevant).

SEARCH SUBSYSTEM (MATCHING) Gambar disamping ini menunjukkan hubungan antara dokumen relevan, dokumen yang terambil oleh system, dan dokumen relevan yang terambil oleh system.

Pengukuran Performansi Information Retrieval System Nilai performansi dari aplikasi IR menunjukkan keberhasilan dari suatu IRS dalam mengembalikan informasi yang dibutuhkan oleh user. Untuk mengukur performansi dari IRS, digunakan koleksi uji. Koleksi uji terdiri dari tiga bagian, yaitu koleksi dokumen, query, dan relevance judgement. Koleksi dokumen adalah kumpulan dokumen yang dijadikan bahan pencarian oleh sistem. Relevance judgement adalah daftar dokumen-dokumen yang relevan dengan semua query yang telah disediakan.

Parameter yang digunakan dalam performansi sistem, antara lain : Precision (ketepatan) Recall (kelengkapan) Accuracy (akurasi)

Relevansi & Dokumen Yang Ditemukan Kembali

RECALL DAN PRESISI Precision adalah tingkat ketepatan antara informasi yang diminta oleh pengguna dengan jawaban yang diberikan oleh sistem. Recall adalah tingkat keberhasilan sistem dalam menemukan kembali sebuah informasi.

ACCURACY Accuracy didefinisikan sebagai tingkat kedekatan antara nilai prediksi dengan nilai aktual.

Accuracy vs Precision

Misalkan kita ingin mengukur kinerja dari sebuah mesin pemisah ikan yang bertugas memisahkan ikan-ikan salmon dari semua ikan yang telah didapat. Untuk mengujinya kita akan memasukkan 100 ikan salmon dan 900 ikan lain (bukan ikan salmon). Hasilnya mesin tersebut memisahkan 110 yang dideteksi sebagai ikan salmon. Ke 110 ikan tersebut kemudian dicek kembali oleh manusia, ternyata dari 110 ikan tersebut hanya 90 ekor yang merupakan ikan salmon, sedangkan 20 lainnya merupakan ikan lain. CONTOH

Secara umum precision, recall dan accuracy dapat dirumuskan sebagai berikut:

Sehingga untuk kasus mesin pemisah ikan diatas dapat dituliskan sebagai berikut:

Menggunakan precision atau accuracy saja dalam sebuah mengukur kinerja dari sebuah sistem / metode bisa menimbukan bias yang sangat fatal. Contoh, misalnya dari pengujian menggunakan 100 ikan salmon dan 900 ikan lain ternyata mesin hanya memisahkan 1 ikan salmon, dan setelah dicek oleh manusia, 1 ikan tersebut benar merupakan ikan salmon.

Pengujian ini dapat kita tuliskan sebagai berikut:

KESIMPULAN Dari hasil perhitungan kita dapatkan precision sebesar 100% dan accuracy sebesar 90.1%. Sekilas tampak baik, namun perhatikan nilai recall yang hanya sebesar 1%. Hal ini menunjukkan bahwa sistem hanya dapat memisahkan ikan salmon dalam jumlah yang sedikit sekali dan masih banyak ikan-ikan salmon yang lolos dari pemisahan.

Bila digambarkan, kasus pengujian mesin pemisah ikan ini dapat digambarkan seperti ini: Jadi dalam mengukur kinerja dari sebuah sistem / metode dalam pengenalan pola atau temu kembali informasi disarankan menggunakan minimal dua parameter yaitu precision dan recall untuk mendeteksi bias seperti pada kasus diatas.