Pertemuan 7 : Latent Semantic Indexing

Slides:



Advertisements
Presentasi serupa
Praktikum Sistem Temu Balik Informasi
Advertisements

Sistem Persamaan Linier
StopList dan Stemming yasmi afrizal
Model Temu-Balik Informasi
Konsep Dasar Sistem Temu Kembali Informasi
Sistem Persamaan Linier
Standar Kompetensi 11. Memahami wacana tulis. melalui kegiatan membaca
Ranked Retrieval Pencarian Boolean Menghasilkan sekumpulan dokumen yang cocok dengan query, yang tidak cocok tidak muncul Pada kasus.
Pertemuan ke-2 Model dalam sistem temu kembali informasi yasmi afrizal
Sistem Persamaan Linier Oleh : Sudaryatno Sudirham
Gambar Kerangka dari sistem temu-kembali informasi sederhana
Pengolahan Citra Digital: Transformasi Citra (Bagian 2 : Wavelet)
Latent Semantic Indexing
Temu Balik Informasi Pertemuan Ke – 12 Presentasi Final Project
Final Project Temu Balik Informasi
MATEMATIKA EKONOMI 2 ANDRI WISNU – MANAJEMEN UMBY
MATERI PROJECT TI 2014 B Taufik Ari Arnandan ( )
Review Jurnal Nasional
METODE DAN MODEL TEMU BALIK INFORMASI Luthfi Nurrohman ( )
Anggota Kelompok Dian Santosa (KETUA)
Konsep dan Prinsip Latent Semantic Indexing (LSI)
Temu Balik Informasi Materi Pertemuan Ke – 7 Konsep dan Prinsip Serta Algoritma Latent Semantic Indexing Anggota : Nama Nim Wahyu Septi Anjar
Anggota Kelompok Ikhsan Fauji Irna Oktaviasari Erip Marliana
Konsep dan Model-model Sistem Temu Balik Informasi
Pertemuan 9 : Temu Balik Informasi Multimedia
Konsep dan model temu balik informasi
Implementasi vector space model untuk pencarian dokumen
Natural Language Processing (NLP)
Konsep, Metode dan Model Temu Kembali Informasi
Konsep, Metode dan Model dalam Temu Balik Informasi
Latent Semantic Indexing (LSI)
Review Jurnal Internasional
EFEKTIFITAS SELEKSI FITUR DALAM SISTEM TEMU-KEMBALI INFORMASI
Anggota Kelompok : Kurniawan Novi Pambudi
Review Jurnal Temu Balik Informasi
BAB V Transformasi Citra
Stoplist dan Stemming Anggota Kelompok :
Text Preprocessing.
TEMU KEMBALI INFORMASI
Document Indexing dan Term Weighting
VECTOR SPACE MODEL.
Temu balik informasi Anggota Kelompok Ikhsan Fauji
FINAL PROJECT TEMU BALIK INFORMASI
TEMU KEMBALI INFORMASI
TUJUAN (1) Mahasiswa dapat menjelaskan Ilmu Pengolahan Text dan Informasi. (C2) Mahasiswa dapat menjelaskan Model-model Sistem Temu Balik Informasi. (C2)
Review Konsep Dasar IRS/ STI
StopList dan Stemming yasmi afrizal
Kelas XII Program IPA Semester 1
Laten Semantic Indexing
TEMU BALIK INFORMASI CONCEPT, PRINCIPLE & ALGORITHMS OF
Ir. Julio Adisantoso, M.Kom.
PENYIMPANAN DAN PENGAMBILAN DATA MULTIMEDIA (LANJUTAN) .
Pertemuan 8 : Thesaurus Anggota Kelompok :
Information Retrieval
Oleh : Rahmat Robi Waliyansyah, M.Kom.
Temu Balik Informasi Anggota Kelomopok :
KONVOLUSI DAN TRANSFORMASI FOURIER
TEXT OPERATION Muhammad Yusuf Teknik Multimedia dan Jaringan
Similarity Analisis.
Oleh : Rahmat Robi Waliyansyah, M.Kom.
Kekurangan Tr. Fourier Tranformasi wavelet (WT) merupakan perbaikan dari transformasi Fourier(FT). FT : hanya dapat menangkap informasi apakah suatu sinyal.
Pengenalan Temu Balik Informasi.
M Ali Fauzi Indriati Sigit Adinugroho
Model Boolean & Advanced Boolean
Model Boolean dan Advanced Boolean
Pembobotan Kata (Term Weighting)
Model Perolehan Informasi
Temu Kembali Informasi
Universitas Gunadarma
Intro Algoritma K-Nearest Neighbor (K- NN) adalah sebuah metode klasifikasi terhadap sekumpulan data maupun dokumen berdasarkan pembelajaran  data yang.
Transcript presentasi:

Pertemuan 7 : Latent Semantic Indexing Anggota Kelompok : Kurniawan Novi Pambudi 14.11.0161 Hijriah Fajar Muhammad Insan 14.11.0162 Raditya Tri Wibowo 14.11.0164 Mei Susanto 14.11.0165 Anggrean Yudistira 14.11.0167 Fanny Tri Pamungkas 14.11.0168 Agus Harianto 14.11.0169

Latent Semantic Indexing Latent Semantic Indexing (LSI) adalah model temu kembali yang mampu memecahkan macalah sinomim. Dengan menggunakan Singular Value Decomposition (SVD) pada sebuah term dengan menggunakan matrik frekuensi term dari dokumen. Dimensi transformasi ruang di-reduce dengan cara memilih nilai singular (singular value) Atau Metode Latent Semantic Indexing (LSI) adalah metode yang diimplementasikan di dalam IR system dalam mencari dan menemukan informasi berdasarkan makna keseluruhan (conceptual topic atau meaning) dari sebuah dokumen bukan hanya makna kata per kata.

Pada umumnya, dokumen dikatakan relevan dengan query apabila dokumen : (1) Memuat kata atau kalimat yang sama dengan query atau (2) Memuat kata atau kalimat yang bermakna sama dengan query. Sebagai contoh, terdapat query satu kata yaitu “sulit”. Pada point 1, informasi yang memuat kata “susah” atau “sukar” dinilai tidak relevan karena informasi yang relevan adalah informasi yang memuat kata “sulit”. Sedangkan pada point 2, informasi yang memuat kata “susah” atau “sukar” dinilai relevan karena “susah” atau “sukar” bermakna sama dengan “sulit”.

Alur proses dari metode Latent Semantic Indexing dibagi 2 (dua) kolom, yaitu kolom sebelah kiri yaitu query dan kolom sebelah kanan kanan yaitu, koleksi dokumen. Pada proses sebelah kiri, query diproses melalui operasi teks, kemudian vektor query dibentuk. Vektor query yang dibentuk dipetakan menjadi vektor query terpeta (mapped query vector). Dalam membentuk query terpeta, diperlukan hasil dekomposisi nilai singular dari koleksi dokumen. Pada koleksi dokumen, dilakukan operasi teks pada koleksi dokumen, kemudian matriks kata-dokumen (terms-documents matrix) dibentuk, selanjutnya dilakukan dekomposisi nilai singular (Singular Value Decomposition) pada matriks kata-dokumen. Hasil dekomposisi disimpan dalam collection index. Proses ranking dilakukan dengan menghitung relevansi antara vektor query terpeta dan collection index. Selanjutnya, hasil perhitungan relevansi ditampilkan ke pengguna.

Latent Semantic Indexing menggunakan teknik Singular Value Decomposition (SVD) untuk mendekomposisikan matriks term dokumen. Dengan mengurangi ruang term dan dokumen menjadi dimensi yang lebih kecil, SVD menampakkan hubungan yang mendasari term dan dokumen dalam semua kombinasi yang memungkinkan dan membuang noise yang ada pada ruang vektor. Keunggulan metode Singular Value Decomposition yaitu hasil akurasi yang cukup baik tetapi terdapat masalah dalam penyimpanan. Proses pencarian dengan metode LSI pada sistem ini menerima masukan berupa sebuah keyword yang akan dicari pada dokumen. Pada proses pencarian dengan metode LSI kata-kata yang unik pada setiap dokumen akan direpresentasikan sebagai baris matriks dan dokumen-dokumen akan direpresentasikan sebagai kolom matriks. Nilai dari matriks tersebut adalah banyaknya kemunculan sebuah kata di setiap dokumen yang akan dibandingkan.

Keuntungan Latent Semantic Indexing Keuntungan menggunakan model LSI adalah model ini fully automatic dan tidak menggunakan language expertise, akibatnya panjang vektor dokumen menjadi lebih pendek. Dengan membandingkan Model LSI dengan multidimensional scaling, ternyata ruang dokumen (document space) dengan model LSI lebih optimal pada saat menggunakan inner product similarity function demikian juga dengan menggunakan ukuran kesamaan lainnya.

Langkah-Langkah LSI Text Preprocessing Preprocessing adalah proses normalisasi teks sehingga informasi yang dimuat merupakan bagian yang padat dan ringkas namun tetap merepresentasikan informasi yang termuat didalamnya Term-document Matrix Setelah melalui stopwords removal dan stemming, matriks term-document dibangun dengan menempatkan kata hasil proses stemming (term) ke dalam baris. Matriks ini disebut term-document matrix Singular Value Decomposition Singular Value Decomposition (SVD) adalah salah satu teknik reduksi dimensi yang bermanfaat untuk memperkecil nilai kompleksitas dalam pemrosesan term-document matrix Cosine Similarity Measurement Cosine similarity digunakan untuk menghitung nilai kosinus sudut antara vektor dokumen dengan vektor kueri.

Referensi http://dokumen.tips/documents/ir-models-55a7540476e31.html http://hbunyamin.itmaranatha.org/Papers/TESIS_hendra_final.pdf http://storage1.123dok.com/cdn/disk1_vdc212_id_pdf/2017/04_12/1491976 3982408627013_pdf.pdf?name=123dok_Penerapan%20Metode%20Latent% 20Semantic%20Indexing%20Pada%20Pencarian%20Fatwa%20Islam%20Berb asis%20Mobile&exp=1496034201&sgn=d32d3861299c316cff739d0fe28c0a0f http://socs.binus.ac.id/2015/08/03/penggunaan-latent-semantic-analysis- lsa-dalam-pemrosesan-teks/ http://www.metode-algoritma.com/2013/06/contoh-algoritma-lsi-latent- semantic.html