Temu Balik Informasi Pertemuan Ke – 12 Presentasi Final Project Anggota : Nama Nim Wahyu Septi Anjar 14.11.0224 Patria Adhyaksa 14.11.0225 Dian Restiani 14.11.0226 Afiatur Rohmah 14.11.0231 Indah Dwi Prawitasari 14.11.0234 Faiz Al-Hamidi 14.11.0235 Bela Crista C L 14.11.0236 Ifal Pandu Kiat 14.11.0237 Nandya Tiara N 14.11.0311
Dasar-dasar Teori Temu Balik Informasi Temu Balik Informasi adalah sebuah sistem pengambilan informasi yang di rancang untuk mengambil suatu dokumen atau informasi yang di perlukan oleh komunitas pengguna Stoplist proses pembuangan kata buang (tidak memiliki makna), seperti: tetapi, yaitu, sedangkan, dan sebagainya. Stemming proses penghilangan / pemotongan dari suatu kata menjadi bentuk dasar yang merupakan salah satu cara yang digunakan untuk meningkatkan performa IR (Information Retrival)
Dasar-dasar Teori Lanjutan Algoritma yang digunakan dalam final project Algoritma Stemming Porter Metode pembobotan yang di pakai adalah Metode Term Frequency Inverse Document Frequence (TF-IDF) Adalah suatu cara untuk memberikan bobot hubungan suatu kata (term) terhadap dokumen (Robertson, 2005). Dalam metode ini terdapat 2 konsep untuk perhitungan bobot, yaitu : Frekuensi kemunculan sebuah kata didalam sebuah dokumen tertentu dan inverse frekuensi dokumen yang mengandung kata tersebut. Dimana D adalah jumlah semua dokumen dalam koleksi sedangkan dtj adalah jumlah dokumen yang mengandung term (tj) IDFj= log (D/dtj)
Project Sumber data yang di gunakan berasal dari web http://www.hirupmotekar.com?json=1 Database Database yang digunakan adalah tbi5_final.sql Terdapat 7 tabel, dapat di lihat pada gambar di bawah ini :
Halaman Beranda Tampilan awal ketika program dijalankan
Halaman download artikel Menampilkan proses dari artikel yang sudah di download, dapat dilihat terdapat 136 artikel dan artikel di download tersebut di insert/sipman ke database local
Halaman Tampilkan Corpus Menampilkan isi corpus dari artikel yang sudah di download, namun isi artikel tidak kami tampilkan karena isinya tidak rapi/tersrtuktur
Halaman Buat Index Untuk buat index diimplementasikan ke dalam sample 10 artikel karena semakin banyak artikel yang diindex semakin lama waktu loadingnya Pengindexan ini sudah menerapakan proses stopword dan stemming dan juga sudah menghitung ada berapa term/kata yang muncul dalam setiap artikel gunanya untuk perhitungan bobot pada setiap term/kata
Halaman Hitung Bobot Hitung bobot digunakan untuk menghitung bobot dari setiap term/kata, disini kami menghitungnya menggunakan pendekatan TF-IDF seperti yang di jelaskan tadi di slide atas
Halaman Hitung Panjang Vektor Berfungsi untuk menghitung artikel yang sudah diindex dengan metode VSM (Vector Space Model)
Halaman Tampilkan Index Berfungsi untuk menampilakn hasil dari pengindexan artikel/dokumen yg sudah di download tadi
Halaman Tampilkan Panjang Vektor Berfungsi untuk menampilkan hasil dari perhitungan panjang vektor pada artikel/dokuman yang telah di index
Halaman Retrieval Berfungsi untuk pencarian dengan keyword yang ada di artikel aslinya, jika kita menggunakan keyword yang tidak sesuai dengan isi artikel maka tidak akan ada hasil dari pencaraianya, namun jika kita memasukan keyword yang sesuai dengan arikel aslinya makan akan muncul hasilnya, hasilnya pun akan urut seuai dengan bobot dari keyword yang kita masukan, semakin besar bobotnya maka artikel tersebuat akan muncul pada bagian paling atas
Halaman Tampilkan Cache Berfungsi untuk menampilkan riwayat pencarian yang pernah kita gunakan
Referensi Agusta, Ledy. 2009. PERBANDINGAN ALGORITMA STEMMING PORTER DENGAN ALGORITMA NAZIEF & ADRIANI UNTUK STEMMING DOKUMEN TEKS BAHASA INDONESIA . Konferensi Nasional Sistem dan Informatika 2009; Bali, November 14. Pratomo, Eko Deni. Sistem Temu Kembali Informasi . seputar-info- it.blogspot.co.id/2015/03/sistem-temu-kembali-informasi.html?m=1. waktu akses : Selasa, 4 April 2017 Siswo, Mardi Utomo. 2015. Stopword Dinamis dengan Pendekatan Statistik. Jurnal Informatika UPGRIS, Volume 1 No. 2 Edisi Desember 2015. https://informatikalogi.com/term-weighting-tf-idf/