TEMU BALIK INFORMASI CONCEPT, PRINCIPLE & ALGORITHMS OF

Slides:



Advertisements
Presentasi serupa
Ranked Retrieval Pencarian Boolean Menghasilkan sekumpulan dokumen yang cocok dengan query, yang tidak cocok tidak muncul Pada kasus.
Advertisements

Text Mining.
Analisa dan Desain dalam Penelitian
Smith-Waterman Pembuatan Aplikasi Pendeteksian Kemiripan Dokumen Teks dengan Algoritma for further detail, please visit
FUZZY INFORMATION RETRIEVAL
Pengantar Sistem Basis Data
Latent Semantic Indexing
Temu Balik Informasi Pertemuan Ke – 12 Presentasi Final Project
Final Project Temu Balik Informasi
MATERI PROJECT TI 2014 B Taufik Ari Arnandan ( )
Review Jurnal Nasional
Temu Balik Informasi Materi Pertemuan Ke – 1 Materi Dasar TBI
Mei, 2017 TI 14 A STMIK AMIKOM PURWOKERTO TEMU BALIK INFORMASI.
METODE DAN MODEL TEMU BALIK INFORMASI Luthfi Nurrohman ( )
Temu Balik Informasi BY : Taufik Ari Arnandan ( )
Anggota Kelompok Dian Santosa (KETUA)
Konsep dan Prinsip Latent Semantic Indexing (LSI)
Pertemuan 7 : Latent Semantic Indexing
Temu Balik Informasi Materi Pertemuan Ke – 7 Konsep dan Prinsip Serta Algoritma Latent Semantic Indexing Anggota : Nama Nim Wahyu Septi Anjar
Anggota Kelompok Ikhsan Fauji Irna Oktaviasari Erip Marliana
Konsep Thesaurus Dwi Ngafifudin ( )
Rizki Pebuardi G Pembimbing : 1. Ir. Agus Buono, M.Si., M.Kom.
THESAURUS DALAM TEMU BALIK INFORMASI
Konsep dan Model-model Sistem Temu Balik Informasi
Anggota : Nama Nim Wahyu Septi Anjar Patria Adhyaksa Dian Restiani
ALGORITMA PEMROGRAMAN LANJUTAN
TEMU BALIK INFORMASI KONSEP TESAURUS PADA INFORMATION RETRIEVAL BESERTA MACAM DAN ALGORITMANYA TI 14 A STMIK AMIKOM PURWOKERTO JUNI 2017.
Konsep dan model temu balik informasi
Sistem Temu Kembali Informasi Multimedia
K-SUPPORT VECTOR NEAREST NEIGHBOR UNTUK KLASIFIKASI BERBASIS K-NN
Implementasi vector space model untuk pencarian dokumen
Natural Language Processing (NLP)
TEMU BALIK INFORMASI Multimedia Dalam Temu Balik Informasi.
TEMU BALIK INFORMASI Konsep Thesaurus Dalam Information Retrival dan Macam-Macam Thesaurus Beserta Algoritmanya TI 14 A STMIK AMIKOM PURWOKERTO 2017.
Konsep, Metode dan Model Temu Kembali Informasi
Latent Semantic Indexing (LSI)
Oleh: Ineza Nur Oktabroni (G )
Review Jurnal Internasional
EFEKTIFITAS SELEKSI FITUR DALAM SISTEM TEMU-KEMBALI INFORMASI
Anggota Kelompok : Kurniawan Novi Pambudi
Review Jurnal Temu Balik Informasi
TEMU BALIK INFORMASI MULTIMEDIA
TEMU KEMBALI INFORMASI
STOPLIST DAN STEEMING Temu Balik Informasi.
Temu Balik Informasi Nama Kelompok : Ikhsan Fauji
TEMU KEMBALI INFORMASI
Document Indexing dan Term Weighting
TEMU BALIK INFORMASI TI 14 A.
Ketua Kelompok Dian Restiani Anggota : Wahyu Septi Anjar
TEMU BALIK INFORMASI Konsep Thesaurus Dalam Information Retrival dan Macam-Macam Thesaurus Beserta Algoritmanya TI 14 A STMIK AMIKOM PURWOKERTO 2017.
Temu kembali informasi
StopList dan Stemming yasmi afrizal
Laten Semantic Indexing
REKAYASA PERANGKAT LUNAK
Pertemuan 10 INVERS MATRIK.
Sistem TEMU KEMBALI INFORMASI
Analisis Klastering K-Means Model Datamining Kelompok 1 Eko Suryana
INTERAKSI MANUSIA DAN KOMPUTER
Dasar Pemrograman Dan Bahasa Pemrograman
PERTEMUAN II PENGANTAR
DATA STRUCTURE DAN DATA TYPES PERTEMUAN 8 NOVIANDI
Pengenalan Temu Balik Informasi.
Nugraha Iman Santosa ( )
Pembobotan Kata (Term Weighting)
Temu Balik Informasi.
A g e n d a Usulan ITS tentang Penyesuaian Skoring SINTA
Temu Kembali Informasi
Universitas Gunadarma
Penyelarasan Arsitektur Enterprise
Intro Algoritma K-Nearest Neighbor (K- NN) adalah sebuah metode klasifikasi terhadap sekumpulan data maupun dokumen berdasarkan pembelajaran  data yang.
Transcript presentasi:

TEMU BALIK INFORMASI CONCEPT, PRINCIPLE & ALGORITHMS OF model Latent Semantic Indexing TI 14 A STMIK AMIKOM PURWOKERTO Mei, 2017

Anggota Kelompok Achmad Amar Ramadhan [14.11.0074] Nurul Khusnah [14.11.0075] Ahmad Wildan Sumbogo [14.11.0076] Asqi Maulana Hidayat [14.11.0077] Mafrikha Nur Afitasari [14.11.0078] Dina Septiana [14.11.0084] Faishal Hanif [14.11.0197]

Overview Konsep Dan Prinsip Serta Algoritma Dalam Model Latent Semantic Indexing

PENGKLASIFIKASIAN DOKUMEN BERBAHASA INDONESIA DENGAN PENGINDEKSAN BERBASIS LSI Achmad Ridok, Indriati Jurnal Teknologi Informasi dan Ilmu Komputer (JTIIK) Vol. 2, No. 2, Oktober 2015, hlm. 87-95

General Idea Pada penelitian ini pendekatan berbasis LSI (latent semantic indexing) digunakan pada KNN untuk mengklasifikasi dokumen berbahasa indonesia. Metode klasifikasi yang akan dicobakan adalah metode KNN pada berbagai variasi k dan mempertimbangkan nilai ambang frekuensi masing- masing term.

Latent Semantic Indexing (LSI) LSI adalah metode yang digunakan untuk mencari hubungan kata yang mempunyai makna atau semantik tersembunyi. Semantik tersembunyi ini dapat digunakan untuk mencari relasi antar kata berdasarkan makna. Dengan demikian LSI sangat bagus digunakan dalam hal sinonim, namun gagal untuk polisemi (bassil and semaan, 2012). Tujuan utama dari pengindekan LSI adalah untuk mengelompokkan term-term hasil ekstraksi dari dokumen latih dan dokumen uji berdasarkan kesamaan semantik antara term, sehingga term-term yang mempunyai kemiripan semantik dikumpulkan dalam satu kelompok.

Continue... LSI merupakan turunan dari teknik VSM yang dalam prosesnya memerlukan tiga tahap yang meliputi pembangunan term document matrix (TDM), pembobotan, dan hasil perangkingan dokumen yang relevan berdasarkan similaritas. LSI akan mereduksi dimensi TDM dari pembobotan matriks kata dan dokumen dengan menggunakan singular value decomposition (SVD)

Singular Value Decomposition (SVD) SVD merupakan sebuah model perkiraan yang digunakan untuk LSA (latent semantic analysis), dimana komponen SVD dapat melakukan dekomposisi matriks sehingga didapatkan nilai dimensi yang lebih rendah (Peter et Al., 2009).

Algoritma Latent Semantic Indexing (LSI) Tahap 1 Lakukan serangkaian praproses yang akan mengubah semua dokumen latih dan dokumen uji masing-masing menjadi matrik A dan B. Tahap 2 Lakukan svd pada matrik a menggunakan persamaan 1. Dengan pemilihan k-rank tertentu akan diperoleh uk hasil reduksi k-rank. Tahap 3 Gunakan persamaan 6 untuk mendapatkan matrik tereduksi representasi dokumen latih. Dalam hal ini q digantikan dengan matrik B sehingga

Proses Indeks Dengan LSI Proses pengindeksan dengan LSI dilakukan dalam beberapa tahap sebagai berikut (Garcia, 2006): Tahap 1. Gunakan algoritma LSI untuk mendapatkan matrik A’ dan B’ representasi masing-masing document latih dan dokumen uji tereduasi k-rank. Tahap 2. Hitung cosine similaritas persamaan 7 antar dokumen latih dan dokumen uji hasil reduksi berdasarkan matrik tereduksi A’ dan B’, dalam hal ini X merepresentasikan dokumen uji dan dj representasi dokumen latih ke j.

ARSITEKTUR SISTEM

PENGEMBANGAN SISTEM Berdasarkan Rancangan Sistem Di Atas, Selanjutnya Dikembangkan Sistem Pengklasifikasian Dokumen Dengan Metode KNN Berbasis LSI.

Rancangan tahap praprosesing Tahap praprosesing tujuan utamanya mengubah representasi data dokumen teks menjadi representasi numerik yang siap untuk diolah lebih lanjut. Pada tahap ini secara umum dapat digambarkan menggunakan flowchart gambar 4 berikut :

Continue... Seluruh uji coba juga akan dievaluasi pada praproses stemming dan non stemming untuk mengetahui sensitifitas stemming pada kedua metode. Skenario sistem secara keseluruhan dapat digambarkan sabagaimana flowchart.

HASIL DAN PEMBAHASAN Sistem dikembangkan dengan bahasa pemrograman java berbasis objek oriented yang disusun dalam class-class dan paket-paket. Organisasi paket-paket disusun sebagaimana pada gambar 6 berikut.

Perbandingan waktu running antara stem dan non stem pada KNN LSI

Perbandingan F1 measure antara KNN dengan steming dan KNN tanpa stemming.

Perbedaan waktu eksekusi antara KNN LSI dan KNN biasa.

Perbandingan Antara KNN Non LSI Dan KNN LSI

KESIMPULAN Berdasarkan hasil dan pembahasan sebagaimana pada bab 5 maka dapat ditarik beberapa kesimpulan : klasifikasi dokumen berbahasa indonesia dengan menggunakan KNN LSI lebih baik dari KNN non LSI, namun demikian kinerja hasil terbaik ditunjukkan pada KNN LSI non stemming pada threshould 2 sedangkan kinerja terbaik dari sisi waktu dicapai ketika sistem menggunakan KNN LSI dengan stemming pada threshould 5.

Daftar Pustaka Achmad Ridok. Indriati. 2015. PENGKLASIFIKASIAN DOKUMEN BERBAHASA INDONESIA DENGAN PENGINDEKSAN BERBASIS LSI . Jurnal Teknologi Informasi dan Ilmu Komputer (JTIIK) Vol. 2, No. 2, Oktober 2015, hlm. 87-95.