Presentasi sedang didownload. Silahkan tunggu

Presentasi sedang didownload. Silahkan tunggu

TEMU KEMBALI INFORMASI

Presentasi serupa


Presentasi berjudul: "TEMU KEMBALI INFORMASI"— Transcript presentasi:

1 TEMU KEMBALI INFORMASI
KONSEP & PRINSIP SERTA ALGORITMA DALAM MODEL LATENT SEMANTIC INDEXING (LSI)

2 Nama kelompok  : Desi Rahmawati Maulana Akbar Resni Novelalita Riki Aji Pamungkas Kurnia Aswin Nuzul .R Pradita Novianthy Inggita Al Muharomah Semuel Haryanto Dimas Adhi Nugroho

3 Latent Semantic Indexing
Latent Semantic Indexing (LSI) adalah sebuah metode baru dalam algoritma search engine yang sedang dikembangkan Google Corporation. Dengan metode ini, Google menganalisis kata kunci dengan cara baru, bukan lagi berdasarkan pencocokkan kata secara leksikal. Kata yang dicari tidak hanya kata kuncinya saja yang terindex seperti pada algoritma pada umumnya, tetapi kata-kata yang berhubungan dengan kata kunci yang akan dicari.

4 Tujuan untuk mendapatkan suatu pemodelan yang efektif digunakan untuk mempresentasikan sebuah hubungan antara kata kunci yang dicari dan dokumen yang akan dicari. Metode latent semantic : dengan membandingkan dua term membandingkan 2 doumen yang berbeda membandingkan sebuah term dengan dokumen

5 Konsep Konsep Latent Semantic Indexing (LSI) merupakan metode IR yang membangun koleksi dokumen dalam bentuk ruang vector dengan menggunakan aljabar linier, yaitu singular value decomposition, dan diimplementasikan dalam system Information Retrieval (IR) untuk mencari dan menemukan sbeuah informasi berdasarkan makna secara keseluruhan dari sebuah dokumen bukan hanya makna perkata.

6 Metode Latent Semantic Indexing
Gambar 1. Proses alur dari metode semantic indexing

7 Konsep konsep LSI meliputi beberapa point sebagai berikut:
Text Operations pada Query dan Document Collection. Proses text operations meliputi : Mem-parsing setiap kata dari koleksi dokumen. Membuang kata-kata yang merupakan stop words. Mem-stemming kata-kata yang ada untuk proses selanjutnya. Matrix Creation. Proses matrix creation meliputi : Menghitung frekuensi kemunculan dari kata. Membangun matriks kata-dokumen seperti diilustrasikan.

8 Konsep konsep LSI meliputi beberapa point sebagai berikut:
SVD (Singular Value Decompotion) Decomposition, Hasil SVD serupa 3 (tiga) buah matriks Query Vector Creation Vektor query, q dibentuk seperti membangun sebuah kolom dari matriks kata-dokumen. Query Vector Mapping, Ranking, Ranking dari dokumen relevan ditentukan oleh besar sudut yang dibentuk oleh vektor query dan vektor dokumen. Semakin kecil sudut yang dibentuk, semakin relevan query dengan dokumen.

9 Konsep konsep LSI meliputi beberapa point sebagai berikut:
Hasil Akhir, Nilai cosinus sudut yang terbesar menunjukkan dokumen yang paling relevan dengan query.

10 Algoritma Algoritma dalam algoritma Latent Semantic Indexing
Algoritma Probabilitas algoritma probablistic digunakan untuk pendekatan probabilitas dengan dua model contoh dokumen dan kata. Probabilistic dapat digunakan untuk menidentifikasi kata-kata dengan beberapa arti dan kemudian memetakan kata-kata tersebut dalam berbagai topik.

11 Algoritma Algoritma yang digunakan :
Menentukan jumlah topik (z) yang nantinya didapat melalui Metode Hartigan Index. Menginalisasi secara random 3 parameter dengan p(z), p (d|z), p (w|z). Dimana P (z) = probabilistik topik P (d|z) = probabilitas dokumen yang mengandung topik. P (w|z) = probabilitas kata yang terdapat topik. Menghitung untuk measing-masing parameter menggunakan Expectation Maximization.

12 SEKIAN TERIMA KASIH


Download ppt "TEMU KEMBALI INFORMASI"

Presentasi serupa


Iklan oleh Google