Upload presentasi
Presentasi sedang didownload. Silahkan tunggu
Diterbitkan olehAri Gunawan Telah diubah "7 tahun yang lalu
1
Temu Balik Informasi Pertemuan Ke – 12 Presentasi Final Project
Anggota : Nama Nim Wahyu Septi Anjar Patria Adhyaksa Dian Restiani Afiatur Rohmah Indah Dwi Prawitasari Faiz Al-Hamidi Bela Crista C L Ifal Pandu Kiat Nandya Tiara N
2
Dasar-dasar Teori Temu Balik Informasi
Temu Balik Informasi adalah sebuah sistem pengambilan informasi yang di rancang untuk mengambil suatu dokumen atau informasi yang di perlukan oleh komunitas pengguna Stoplist proses pembuangan kata buang (tidak memiliki makna), seperti: tetapi, yaitu, sedangkan, dan sebagainya. Stemming proses penghilangan / pemotongan dari suatu kata menjadi bentuk dasar yang merupakan salah satu cara yang digunakan untuk meningkatkan performa IR (Information Retrival)
3
Dasar-dasar Teori Lanjutan
Algoritma yang digunakan dalam final project Algoritma Stemming Porter Metode pembobotan yang di pakai adalah Metode Term Frequency Inverse Document Frequence (TF-IDF) Adalah suatu cara untuk memberikan bobot hubungan suatu kata (term) terhadap dokumen (Robertson, 2005). Dalam metode ini terdapat 2 konsep untuk perhitungan bobot, yaitu : Frekuensi kemunculan sebuah kata didalam sebuah dokumen tertentu dan inverse frekuensi dokumen yang mengandung kata tersebut. Dimana D adalah jumlah semua dokumen dalam koleksi sedangkan dtj adalah jumlah dokumen yang mengandung term (tj) IDFj= log (D/dtj)
4
Project Sumber data yang di gunakan berasal dari web Database Database yang digunakan adalah tbi5_final.sql Terdapat 7 tabel, dapat di lihat pada gambar di bawah ini :
5
Halaman Beranda Tampilan awal ketika program dijalankan
6
Halaman download artikel
Menampilkan proses dari artikel yang sudah di download, dapat dilihat terdapat 136 artikel dan artikel di download tersebut di insert/sipman ke database local
7
Halaman Tampilkan Corpus
Menampilkan isi corpus dari artikel yang sudah di download, namun isi artikel tidak kami tampilkan karena isinya tidak rapi/tersrtuktur
8
Halaman Buat Index Untuk buat index diimplementasikan ke dalam sample 10 artikel karena semakin banyak artikel yang diindex semakin lama waktu loadingnya Pengindexan ini sudah menerapakan proses stopword dan stemming dan juga sudah menghitung ada berapa term/kata yang muncul dalam setiap artikel gunanya untuk perhitungan bobot pada setiap term/kata
9
Halaman Hitung Bobot Hitung bobot digunakan untuk menghitung bobot dari setiap term/kata, disini kami menghitungnya menggunakan pendekatan TF-IDF seperti yang di jelaskan tadi di slide atas
10
Halaman Hitung Panjang Vektor
Berfungsi untuk menghitung artikel yang sudah diindex dengan metode VSM (Vector Space Model)
11
Halaman Tampilkan Index
Berfungsi untuk menampilakn hasil dari pengindexan artikel/dokumen yg sudah di download tadi
12
Halaman Tampilkan Panjang Vektor
Berfungsi untuk menampilkan hasil dari perhitungan panjang vektor pada artikel/dokuman yang telah di index
13
Halaman Retrieval Berfungsi untuk pencarian dengan keyword yang ada di artikel aslinya, jika kita menggunakan keyword yang tidak sesuai dengan isi artikel maka tidak akan ada hasil dari pencaraianya, namun jika kita memasukan keyword yang sesuai dengan arikel aslinya makan akan muncul hasilnya, hasilnya pun akan urut seuai dengan bobot dari keyword yang kita masukan, semakin besar bobotnya maka artikel tersebuat akan muncul pada bagian paling atas
14
Halaman Tampilkan Cache
Berfungsi untuk menampilkan riwayat pencarian yang pernah kita gunakan
15
Referensi Agusta, Ledy PERBANDINGAN ALGORITMA STEMMING PORTER DENGAN ALGORITMA NAZIEF & ADRIANI UNTUK STEMMING DOKUMEN TEKS BAHASA INDONESIA . Konferensi Nasional Sistem dan Informatika 2009; Bali, November 14. Pratomo, Eko Deni. Sistem Temu Kembali Informasi . seputar-info- it.blogspot.co.id/2015/03/sistem-temu-kembali-informasi.html?m=1. waktu akses : Selasa, 4 April 2017 Siswo, Mardi Utomo Stopword Dinamis dengan Pendekatan Statistik. Jurnal Informatika UPGRIS, Volume 1 No. 2 Edisi Desember 2015.
Presentasi serupa
© 2024 SlidePlayer.info Inc.
All rights reserved.