Presentasi sedang didownload. Silahkan tunggu

Presentasi sedang didownload. Silahkan tunggu

Nugraha Iman Santosa ( )

Presentasi serupa


Presentasi berjudul: "Nugraha Iman Santosa ( )"— Transcript presentasi:

1 Nugraha Iman Santosa (10109797)
Implementasi TF-IDF Untuk Pencarian Dokumen (Studi Kasus Di PT. eBdesk Indonesia) Nugraha Iman Santosa ( )

2 Abstrak Mesin pencarian dokumen Aplikasi eBdesk Collaboration
Proses penentuan indeks dan pencarian Metode tf-idf

3 Latar Belakang Masalah
Dalam aplikasi eBdesk Collaboration terdapat fasilitas untuk menyimpan dokumen Ingin ditambahkan fungsi pencarian dokumen dalam aplikasi eBdesk Collaboration

4 Identifikasi Masalah Permasalahan yang akan diangkat adalah :
Bagaimana membuat aplikasi pencarian dokumen yang bisa menelusuri query ke dalam isi teks dokumen ? Bagaimana mengimplementasikan algoritma tf-idf pada aplikasi pencarian dokumen tersebut ?

5 Maksud Maksud dari pembuatan skripsi ini yaitu untuk membuat sebuah aplikasi pencarian dokumen yang mengimplementasikan penggunaan algoritma tf-idf.

6 Tujuan Tujuan yang akan dicapai dalam pembuatan skripsi ini adalah :
Membuat aplikasi yang bisa mencari dokumen dari koleksi dokumen berdasarkan query yang diinputkan pengguna, dan memberikan peringkat terhadap hasil pencarian tersebut supaya menghasilkan dokumen yang relevan terhadap query. Membuat aplikasi pencarian dokumen berbasis web yang mengimplementasikan algoritma tf-idf dan akan menampilkan pencarian dokumen dari seluruh dokumen yang ada dalam aplikasi.

7 Batasan Masalah Membuat aplikasi pencarian dokumen yang diletakkan di dalam aplikasi eBdesk Collaboration Menambahkan proses penentuan indeks pada aplikasi upload dokumen dalam eBdesk Collaboration Pencarian berupa teks berbahasa Inggris dan pengujian dilakukan terhadap dokumen teks yang berisi kata (term) Pengideks-an dan pencarian dilakukan terhadap dokumen yang berekstensi *.txt dan *.doc

8 Landasan Teori

9 Text Mining Text mining adalah salah satu bidang khusus dari data mining. Text mining dapat didefinisikan sebagai suatu proses menggali informasi dari data yang berupa teks dimana sumber data biasanya didapatkan dari dokumen. [Khodra, Masayu Leylia. 2003]

10 Text Mining 5 Tahapan dalam text mining yaitu : Tokenizing Filtering
Stemming Tagging Analyzing

11 Pencarian Dokumen Tahap dalam pencarian dokumen :
Proses penentuan indeks Proses pencarian dokumen

12 Metode TF-IDF Algoritma tf*idf adalah suatu algoritma atau formula yang digunakan untuk menghitung bobot masing masing dokumen terhadap kata kunci. [Harlian, Milkha. 2006]. Term frequency * inverse document frequency atau biasa disingkat dengan tf·idf. Term frequency (tf) adalah frekuensi dari kemunculan sebuah term dalam dokumen yang bersangkutan Inverse document frequency (idf) adalah suatu statistik yang mengkarakteristikkan sebuah term dalam keseluruhan koleksi dokumen.

13 Metode TF-IDF – Rumus Keterangan N : Jumlah dokumen dft
Jumlah dokumen yang mengandung term yang bersangkutan tfd,t frekuensi dari kemunculan sebuah term dalam dokumen yang bersangkutan

14 Analisis Dan Perancangan

15 Gambaran Umum Perangkat Lunak

16 Use Case Diagram

17 Sequence Diagram

18 Sequence Diagram Upload Dokumen

19 Sequence Diagram Pencarian File

20 Sequence Diagram Download File

21 Class Diagram

22 Class Diagram Upload Dokumen

23 Class Diagram Pencarian File

24 Activity Diagram

25 Activity Diagram Upload Dokumen

26 Activity Diagram Pencarian File

27 ER Diagram

28

29 Terima Kasih


Download ppt "Nugraha Iman Santosa ( )"

Presentasi serupa


Iklan oleh Google