Latent Semantic Indexing (LSI)

Slides:



Advertisements
Presentasi serupa
Konsep Dasar Sistem Temu Kembali Informasi
Advertisements

Praktikum Sistem Temu Balik Informasi
StopList dan Stemming yasmi afrizal
Model Temu-Balik Informasi
MATEMATIKA TEKNIK I ZULFATRI AINI, ST., MT
SISTEM PERSAMAAN LINIER
MODEL LINIER Lia Yuliana, S.Si., MT. Tahun Akademik 2011/2012.
Ranked Retrieval Pencarian Boolean Menghasilkan sekumpulan dokumen yang cocok dengan query, yang tidak cocok tidak muncul Pada kasus.
Array dan String.
MATRIX.
Matrik Invers Suatu bilangan jika dikalikan dengan kebalikannya, maka hasilnya adalah 1. Misalkan atau = 1, Demikian juga halnya dengan matrik.
Pertemuan ke-2 Model dalam sistem temu kembali informasi yasmi afrizal
Operasi Aljabar Matriks Pertemuan 02
PERSAMAAN LINEAR MATRIK.
ALJABAR LINEAR DAN MATRIKS
MATRIKS Definisi : Matriks adalah sekumpulan bilangan ril atau bilangan kompleks yang disusun menurut baris dan kolom sehingga membentuk jajaran persegi.
Operasi Matriks Pertemuan 02 Matakuliah: K0292 – Aljabar Linear Tahun: 2008.
Gambar Kerangka dari sistem temu-kembali informasi sederhana
Latent Semantic Indexing
Temu Balik Informasi Pertemuan Ke – 12 Presentasi Final Project
Final Project Temu Balik Informasi
MATEMATIKA EKONOMI 2 ANDRI WISNU – MANAJEMEN UMBY
MATERI PROJECT TI 2014 B Taufik Ari Arnandan ( )
Review Jurnal Nasional
ALJABAR LINIER KONTRAK PERKULIAHAN Title INDAH MANFAATI NUR.
METODE DAN MODEL TEMU BALIK INFORMASI Luthfi Nurrohman ( )
Anggota Kelompok Dian Santosa (KETUA)
Konsep dan Prinsip Latent Semantic Indexing (LSI)
INVERS MATRIKS (dengan adjoint)
Pertemuan 7 : Latent Semantic Indexing
Temu Balik Informasi Materi Pertemuan Ke – 7 Konsep dan Prinsip Serta Algoritma Latent Semantic Indexing Anggota : Nama Nim Wahyu Septi Anjar
Anggota Kelompok Ikhsan Fauji Irna Oktaviasari Erip Marliana
Konsep dan Model-model Sistem Temu Balik Informasi
2. Matriks & Vektor (1) Aljabar Linear dan Matriks
ALJABAR LINIER WEEK 1. PENDAHULUAN
Konsep dan model temu balik informasi
Implementasi vector space model untuk pencarian dokumen
Konsep, Metode dan Model Temu Kembali Informasi
Konsep, Metode dan Model dalam Temu Balik Informasi
EFEKTIFITAS SELEKSI FITUR DALAM SISTEM TEMU-KEMBALI INFORMASI
Anggota Kelompok : Kurniawan Novi Pambudi
TEMU KEMBALI INFORMASI
Document Indexing dan Term Weighting
VECTOR SPACE MODEL.
Temu balik informasi Anggota Kelompok Ikhsan Fauji
Ketua Kelompok Dian Restiani Anggota : Wahyu Septi Anjar
StopList dan Stemming yasmi afrizal
Laten Semantic Indexing
TEMU BALIK INFORMASI CONCEPT, PRINCIPLE & ALGORITHMS OF
Penyelesaian Persamaan Linear (Metode Gauss)
MATRIX.
Temu Balik Informasi Persentasi Final Project
PENYIMPANAN DAN PENGAMBILAN DATA MULTIMEDIA (LANJUTAN) .
MATRIKS EGA GRADINI, M.SC.
Pertemuan 5 Penyelesaian Persamaan Linear (Metode Gauss)
Penyelesaian Persamaan Linear (Metode Gauss)
Operasi Matrik.
Oleh : Rahmat Robi Waliyansyah, M.Kom.
MATEMATIKA FISIKA I Deskripsi
Penyelesaian Persamaan Linear (Metode Gauss)
Similarity Analisis.
ASESMEN PEMAHAMAN KONSEP MATEMATIKA
ALJABAR LINIER DAN MATRIKS
Nugraha Iman Santosa ( )
ASSALAMUALAIKUM WR.WB.
Pembobotan Kata (Term Weighting)
Review Aljabar Matriks
Temu Kembali Informasi
Universitas Gunadarma
Intro Algoritma K-Nearest Neighbor (K- NN) adalah sebuah metode klasifikasi terhadap sekumpulan data maupun dokumen berdasarkan pembelajaran  data yang.
Transcript presentasi:

Latent Semantic Indexing (LSI)

Latent Semantic Indexing (LSI) Latent Semantic Indexing (LSI) adalah metode pengindeksan dan pencarian yang menggunakan teknik matematika yang disebut dekomposisi nilai singular (SVD) untuk mengidentifikasi pola-pola dalam hubungan antara istilah dan konsep yang terkandung dalam koleksi terstruktur dari teks. LSI juga digunakan untuk melakukan kategorisasi dokumen secara otomatis, LSI menggunakan teknik aljabar linear untuk mempelajari kelerasi konseptual dalam kumpulan teks, secara umum, prosesnya meliputi pembuatan matrik kata dokumen berbobot, melakukan dekomposisi nilai singular pada matrik, dan menggunakan matrik untuk mengidentifikasi konsep-konsep yang terkandung di dalam teks.

Konsep Latent Semantic Indexing

Prinsip Latent Semantic Indexing Latent Semantic Indexing (LSI) secara sederhana dengan cara mendeskripsikan proses algoritma yang digunakan oleh search engine untuk mengidentifikasi kata-kata yang berhubungan Pada dasarnyaLSI adalah sebuah prinsip algoritma yang digunakan serach engine untuk memproses persamaan kata atau sinonim dan memahami hubungan antar kata.

Algoritma LSI Algoritma LSI Dilakukan beberapa tahapan untuk melakukan LSI pada dokumen latih dan dokumen uji, Tahap 1 : lakukan serangkaian praproses yang akan mengubah semua dokumen uji dan dokumen latih, masing-masing matriks A dan B. Tahap 2 : lakukan SVD pada matrik A menggunakan persamaan 1. Dengan pemilihan k-tertentu akan memperolh hasil reduksi k-rank. Tahap 3 : gunakan persamaan 6 untuk mendapatkan matrik tereduksi reoresentase dokumen latih.

Dengan demikian bahwa Persamaan 1 dan persamaan 6 dapat dituliskan dengan rumus sebagai berikut : A=U.S. Dengan keterangan : A = Matriks A : dari TDM pembobotan corpus U = Matriks U hasil dekomposisi SVD matriks A S = Matriks singular hasil dekomposisi SVD matriks A = Matriks V transpose

Persamaan 6 Dengan Keterangan : q’ = query vector representasi dari LSI = transpose dari TDM dari pembobotan ternormalisasi TF-IDF query = reduksi dimensi k dari matriks U = inverse dari reduksi dimensi k matriks S

Algoritma SVD LSI menggunakan SVD (Singular Value Decomposition)untuk memodelkan asosiatif antara term. Ide dasar SVD adalah menerima kumpulan data dengan dimensi dan variabel tinggi serta mengurangi ke dalam ruang dimensi yang berukuran lebih kecil untuk menampakan lebih jelas sub struktur dari data asli dan mengurutkanya mulaidari bervariasi sampai dengan tidak bervariasi.