TEMU KEMBALI INFORMASI

Slides:



Advertisements
Presentasi serupa
Konsep Dasar Sistem Temu Kembali Informasi
Advertisements

Praktikum Sistem Temu Balik Informasi
Ratri Enggar Pawening Materi 4 I NFORMATION R ETRIEVAL.
StopList dan Stemming yasmi afrizal
Model Temu-Balik Informasi
Konsep Dasar Sistem Temu Kembali Informasi
Ranked Retrieval Pencarian Boolean Menghasilkan sekumpulan dokumen yang cocok dengan query, yang tidak cocok tidak muncul Pada kasus.
di Sistem Temu Balik Informasi (STBI) Syafri Arlis, S.Kom, M.Kom
Pertemuan ke-2 Model dalam sistem temu kembali informasi yasmi afrizal
FUZZY INFORMATION RETRIEVAL
Information Retrieval
oleh Rahmani Dwiastuti
Gambar Kerangka dari sistem temu-kembali informasi sederhana
Latent Semantic Indexing
Temu Balik Informasi Pertemuan Ke – 12 Presentasi Final Project
Final Project Temu Balik Informasi
MATERI PROJECT TI 2014 B Taufik Ari Arnandan ( )
Review Jurnal Nasional
Temu Balik Informasi Pertemuan II : Pembahasan Temu Balik Informasi
METODE DAN MODEL TEMU BALIK INFORMASI Luthfi Nurrohman ( )
Anggota Kelompok Dian Santosa (KETUA)
Konsep dan Prinsip Latent Semantic Indexing (LSI)
Pertemuan 7 : Latent Semantic Indexing
Temu Balik Informasi Materi Pertemuan Ke – 7 Konsep dan Prinsip Serta Algoritma Latent Semantic Indexing Anggota : Nama Nim Wahyu Septi Anjar
Anggota Kelompok Ikhsan Fauji Irna Oktaviasari Erip Marliana
Konsep dan Model-model Sistem Temu Balik Informasi
Konsep dan model temu balik informasi
Sistem Temu Kembali Informasi
Implementasi vector space model untuk pencarian dokumen
Natural Language Processing (NLP)
Konsep, Metode dan Model Temu Kembali Informasi
Latent Semantic Indexing (LSI)
EFEKTIFITAS SELEKSI FITUR DALAM SISTEM TEMU-KEMBALI INFORMASI
Anggota Kelompok : Kurniawan Novi Pambudi
Sistem Temu-Balik Informasi yasmi afrizal
Review Jurnal Temu Balik Informasi
TEMU KEMBALI INFORMASI
SISTEM TEMU KEMBALI INFORMASI
Perkenalan Pertemuan ke-1 Sistem Temu-Balik Informasi.
Document Indexing dan Term Weighting
VECTOR SPACE MODEL.
Temu balik informasi Anggota Kelompok Ikhsan Fauji
TEMU KEMBALI INFORMASI
Ketua Kelompok Dian Restiani Anggota : Wahyu Septi Anjar
TUJUAN (1) Mahasiswa dapat menjelaskan Ilmu Pengolahan Text dan Informasi. (C2) Mahasiswa dapat menjelaskan Model-model Sistem Temu Balik Informasi. (C2)
Review Konsep Dasar IRS/ STI
StopList dan Stemming yasmi afrizal
Steamming & Stoplist Temu balik informasi.
Laten Semantic Indexing
TEMU BALIK INFORMASI CONCEPT, PRINCIPLE & ALGORITHMS OF
Temu Balik Informasi Persentasi Final Project
Ir. Julio Adisantoso, M.Kom.
PENYIMPANAN DAN PENGAMBILAN DATA MULTIMEDIA (LANJUTAN) .
Information Retrieval
Oleh : Rahmat Robi Waliyansyah, M.Kom.
Oleh : Rahmat Robi Waliyansyah, M.Kom.
Temu Balik Informasi Anggota Kelomopok :
Sistem TEMU KEMBALI INFORMASI
TEXT OPERATION Muhammad Yusuf Teknik Multimedia dan Jaringan
Oleh : Rahmat Robi Waliyansyah, M.Kom.
Pengenalan Temu Balik Informasi.
M Ali Fauzi Indriati Sigit Adinugroho
Nugraha Iman Santosa ( )
Model Boolean & Advanced Boolean
SEARCH ENGINE.
Model Boolean dan Advanced Boolean
Pembobotan Kata (Term Weighting)
Model Probabilistic.
MODEL probabilistik KELOMPOK 6.
Universitas Gunadarma
Transcript presentasi:

TEMU KEMBALI INFORMASI KONSEP & PRINSIP SERTA ALGORITMA DALAM MODEL LATENT SEMANTIC INDEXING (LSI)

Nama kelompok  : Desi Rahmawati 14.11.0273 Maulana Akbar 14.11.0260 Resni Novelalita 14.11.0258 Riki Aji Pamungkas 14.11.0317 Kurnia Aswin Nuzul .R 14.11.0270 Pradita Novianthy 14.11.0298 Inggita Al Muharomah 14.11.0269 Semuel Haryanto 14.11.0250 Dimas Adhi Nugroho 14.11.0253

Latent Semantic Indexing Latent Semantic Indexing (LSI) adalah sebuah metode baru dalam algoritma search engine yang sedang dikembangkan Google Corporation. Dengan metode ini, Google menganalisis kata kunci dengan cara baru, bukan lagi berdasarkan pencocokkan kata secara leksikal. Kata yang dicari tidak hanya kata kuncinya saja yang terindex seperti pada algoritma pada umumnya, tetapi kata-kata yang berhubungan dengan kata kunci yang akan dicari.

Tujuan untuk mendapatkan suatu pemodelan yang efektif digunakan untuk mempresentasikan sebuah hubungan antara kata kunci yang dicari dan dokumen yang akan dicari. Metode latent semantic : dengan membandingkan dua term membandingkan 2 doumen yang berbeda membandingkan sebuah term dengan dokumen

Konsep Konsep Latent Semantic Indexing (LSI) merupakan metode IR yang membangun koleksi dokumen dalam bentuk ruang vector dengan menggunakan aljabar linier, yaitu singular value decomposition, dan diimplementasikan dalam system Information Retrieval (IR) untuk mencari dan menemukan sbeuah informasi berdasarkan makna secara keseluruhan dari sebuah dokumen bukan hanya makna perkata.

Metode Latent Semantic Indexing Gambar 1. Proses alur dari metode semantic indexing

Konsep konsep LSI meliputi beberapa point sebagai berikut: Text Operations pada Query dan Document Collection. Proses text operations meliputi : Mem-parsing setiap kata dari koleksi dokumen. Membuang kata-kata yang merupakan stop words. Mem-stemming kata-kata yang ada untuk proses selanjutnya. Matrix Creation. Proses matrix creation meliputi : Menghitung frekuensi kemunculan dari kata. Membangun matriks kata-dokumen seperti diilustrasikan.

Konsep konsep LSI meliputi beberapa point sebagai berikut: SVD (Singular Value Decompotion) Decomposition, Hasil SVD serupa 3 (tiga) buah matriks Query Vector Creation Vektor query, q dibentuk seperti membangun sebuah kolom dari matriks kata-dokumen. Query Vector Mapping, Ranking, Ranking dari dokumen relevan ditentukan oleh besar sudut yang dibentuk oleh vektor query dan vektor dokumen. Semakin kecil sudut yang dibentuk, semakin relevan query dengan dokumen.

Konsep konsep LSI meliputi beberapa point sebagai berikut: Hasil Akhir, Nilai cosinus sudut yang terbesar menunjukkan dokumen yang paling relevan dengan query.

Algoritma Algoritma dalam algoritma Latent Semantic Indexing Algoritma Probabilitas algoritma probablistic digunakan untuk pendekatan probabilitas dengan dua model contoh dokumen dan kata. Probabilistic dapat digunakan untuk menidentifikasi kata-kata dengan beberapa arti dan kemudian memetakan kata-kata tersebut dalam berbagai topik.

Algoritma Algoritma yang digunakan : Menentukan jumlah topik (z) yang nantinya didapat melalui Metode Hartigan Index. Menginalisasi secara random 3 parameter dengan p(z), p (d|z), p (w|z). Dimana P (z) = probabilistik topik P (d|z) = probabilitas dokumen yang mengandung topik. P (w|z) = probabilitas kata yang terdapat topik. Menghitung untuk measing-masing parameter menggunakan Expectation Maximization.

SEKIAN TERIMA KASIH