Upload presentasi
Presentasi sedang didownload. Silahkan tunggu
1
Nugraha Iman Santosa (10109797)
Implementasi TF-IDF Untuk Pencarian Dokumen (Studi Kasus Di PT. eBdesk Indonesia) Nugraha Iman Santosa ( )
2
Abstrak Mesin pencarian dokumen Aplikasi eBdesk Collaboration
Proses penentuan indeks dan pencarian Metode tf-idf
3
Latar Belakang Masalah
Dalam aplikasi eBdesk Collaboration terdapat fasilitas untuk menyimpan dokumen Ingin ditambahkan fungsi pencarian dokumen dalam aplikasi eBdesk Collaboration
4
Identifikasi Masalah Permasalahan yang akan diangkat adalah :
Bagaimana membuat aplikasi pencarian dokumen yang bisa menelusuri query ke dalam isi teks dokumen ? Bagaimana mengimplementasikan algoritma tf-idf pada aplikasi pencarian dokumen tersebut ?
5
Maksud Maksud dari pembuatan skripsi ini yaitu untuk membuat sebuah aplikasi pencarian dokumen yang mengimplementasikan penggunaan algoritma tf-idf.
6
Tujuan Tujuan yang akan dicapai dalam pembuatan skripsi ini adalah :
Membuat aplikasi yang bisa mencari dokumen dari koleksi dokumen berdasarkan query yang diinputkan pengguna, dan memberikan peringkat terhadap hasil pencarian tersebut supaya menghasilkan dokumen yang relevan terhadap query. Membuat aplikasi pencarian dokumen berbasis web yang mengimplementasikan algoritma tf-idf dan akan menampilkan pencarian dokumen dari seluruh dokumen yang ada dalam aplikasi.
7
Batasan Masalah Membuat aplikasi pencarian dokumen yang diletakkan di dalam aplikasi eBdesk Collaboration Menambahkan proses penentuan indeks pada aplikasi upload dokumen dalam eBdesk Collaboration Pencarian berupa teks berbahasa Inggris dan pengujian dilakukan terhadap dokumen teks yang berisi kata (term) Pengideks-an dan pencarian dilakukan terhadap dokumen yang berekstensi *.txt dan *.doc
8
Landasan Teori
9
Text Mining Text mining adalah salah satu bidang khusus dari data mining. Text mining dapat didefinisikan sebagai suatu proses menggali informasi dari data yang berupa teks dimana sumber data biasanya didapatkan dari dokumen. [Khodra, Masayu Leylia. 2003]
10
Text Mining 5 Tahapan dalam text mining yaitu : Tokenizing Filtering
Stemming Tagging Analyzing
11
Pencarian Dokumen Tahap dalam pencarian dokumen :
Proses penentuan indeks Proses pencarian dokumen
12
Metode TF-IDF Algoritma tf*idf adalah suatu algoritma atau formula yang digunakan untuk menghitung bobot masing masing dokumen terhadap kata kunci. [Harlian, Milkha. 2006]. Term frequency * inverse document frequency atau biasa disingkat dengan tf·idf. Term frequency (tf) adalah frekuensi dari kemunculan sebuah term dalam dokumen yang bersangkutan Inverse document frequency (idf) adalah suatu statistik yang mengkarakteristikkan sebuah term dalam keseluruhan koleksi dokumen.
13
Metode TF-IDF – Rumus Keterangan N : Jumlah dokumen dft
Jumlah dokumen yang mengandung term yang bersangkutan tfd,t frekuensi dari kemunculan sebuah term dalam dokumen yang bersangkutan
14
Analisis Dan Perancangan
15
Gambaran Umum Perangkat Lunak
16
Use Case Diagram
17
Sequence Diagram
18
Sequence Diagram Upload Dokumen
19
Sequence Diagram Pencarian File
20
Sequence Diagram Download File
21
Class Diagram
22
Class Diagram Upload Dokumen
23
Class Diagram Pencarian File
24
Activity Diagram
25
Activity Diagram Upload Dokumen
26
Activity Diagram Pencarian File
27
ER Diagram
29
Terima Kasih
Presentasi serupa
© 2024 SlidePlayer.info Inc.
All rights reserved.