KONSEP DAN PRINSIP SERTA ALGORITMA DALAM MODEL LATENT SEMANTIC INDEXING
Anggota Kelompok Dian Santosa 14.11.0134(KETUA) Yayan Andriyana 14.11.0049 Taufik Hidayat N 14.11.0108 Khoerul Azni 14.11.0131 Agung Tri C 14.11.0132 Muhamad Margie A 14.11.0133 Rico Haviananto 12.11.- - - -
Latent Semantic Indexing sebuah metode baru dalam algoritma search engine yang sedang dikembangkan Google Corporation. Dengan metode ini, Google menganalisis kata kunci dengan cara baru, bukan lagi berdasarkan pencocokkan kata secara leksikal. Kata yang dicari tidak hanya kata kuncinya saja seperti pada algoritma pada umumnya, tetapi kata-kata yang berhubungan dengan kata kunci juga dicari.
Latent Semantic Indexing Metode Latent Semantic Indexing (LSI) adalah metode yang diimplementasikan di dalam IR system dalam mencari dan menemukan informasi berdasarkan makna keseluruhan (conceptual topic atau meaning) dari sebuah dokumen bukan hanya makna kata per kata.
Tujuan dari LSI mendapatkan suatu pemodelan yang efektif untuk merepresentasikan hubungan antara kata kunci dan dokumen yang dicari. Dari sekumpulan kata kunci, yang tadinya tidak lengkap dan tidak sesuai, menjadi sekunpulan objek yang berhubungan.
Konsep LSI Text Operations pada Query dan Document Collection. Query dari pengguna dan koleksi dokumen dikenakan proses text operations. Proses text operations meliputi, Matrix Creation. Hasil text operations yang dikenakan pada koleksi dokumen dikenakan proses matrix creation. SVD Decomposition. Query Vector Creation. Vektor query, q dibentuk seperti membangun sebuah kolom dari matriks kata-dokumen
Konsep LSI Ranking Ranking dari dokumen relevan ditentukan oleh besar sudut yang dibentuk oleh vektor query dan vektor dokumen. Semakin kecil sudut yang dibentuk, semakin relevan query dengan dokumen. Hasil akhir. Perhitungan cosinus sudut antara query, diperoleh dan diurutkan berdasarkan dari yang paling besar sampai yang terkecil. Nilai cosinus sudut yang terbesar menunjukkan dokumen yang paling relevan dengan query.
Alur proses dari metode Latent Semantic Indexing dibagi 2 (dua) kolom, yaitu kolom sebelah kiri yaitu query dan kolom sebelah kanan kanan yaitu, koleksi dokumen. Pada proses sebelah kiri, query diproses melalui operasi teks, 17 kemudian vektor query dibentuk. Vektor query yang dibentuk dipetakan menjadi vektor query terpeta (mapped query vector). Dalam membentuk query terpeta, diperlukan hasil dekomposisi nilai singular dari koleksi dokumen. Pada koleksi dokumen, dilakukan operasi teks pada koleksi dokumen, kemudian matriks katadokumen (terms-documents matrix) dibentuk, selanjutnya dilakukan dekomposisi nilai singular (Singular Value Decomposition) pada matriks kata-dokumen. Hasil dekomposisi disimpan dalam collection index. Proses ranking dilakukan dengan menghitung relevansi antara vektor query terpeta dan collection index. Selanjutnya, hasil perhitungan relevansi ditampilkan ke pengguna.
Bagaimana LSI Algoritma Kerja Google akan melihat kosa kata lain pada halaman Anda kemudian melakukan analisis statistik dari konteks dan sintaks dari kosa kata tersebut. Jika pengguna Google mencari 'sejarah kunci keamanan' maka Google akan mengambil kosakata lain dari halaman-halamannya diindeks ke rekening. Jika halaman Anda berisi kata-kata seperti 'kunci,' 'tuas,' dan 'pintu' maka akan mengasosiasikan kosakata ini dengan kunci keamanan. Setelah mengambil faktor peringkat lainnya diperhitungkan, maka akan daftar halaman Anda di halaman hasil pencarian untuk kata kunci tersebut (sejarah kunci keamanan) peringkat sesuai dengan manfaat yang Google percaya akan menawarkan untuk pencari. Sebelum LSI, pencari juga akan diberikan halaman berfokus pada kunci kanal dan bahkan pada rambut.
Manfaat Metode Latent Semantic Indexing (LSI), sangat bermanfaat untuk digunakan pada search engine, karena dengan metode ini search engine dapat mencari dokumen yang diinginkan oleh pengguna dengan lebih akurat. Hal ini terbukti pada search engine Google yang mampu menghasilkan pencarian yang akurat dengan pemanfaatan waktu yang lebih sedikit.
SUMBER Http://hbunyamin.itmaranatha.org/Papers/TESIS_hendra_final.pdf http://id.affdu.com/latent-semantic-indexing.html http://informatika.stei.itb.ac.id/~rinaldi.munir/Stmik/Makalah/Ma kalahStmik37.pdf