Upload presentasi
Presentasi sedang didownload. Silahkan tunggu
Diterbitkan olehYanti Sugiarto Telah diubah "6 tahun yang lalu
1
Teknik Informatika Universitas Trunojoyo Semester Genap 2011-2012
INDEXING Teknik Informatika Universitas Trunojoyo Semester Genap
2
INDEXING INVERTED FILES SUFFIX TREE & SUFFIX ARRARYS SIGNATURE FILES
3
INVERTED FILES Terdiri dari Vocabulary (kata)
daftar kata yang berbeda dari sebuah object kalimat/document Occurrences (kemunculan) Daftar posisi kemunculan dalam database dari masing-masing kata
4
Contoh INVERTED FILES Kebutuhan penyimpanan vocabulary lebih kecil
Kemunculan banyak kata mempengaruhi besarnya penyimpanan apalagi kalau tiap kemunculan harus ditampilkan
5
INVERTED FILES – Block Addressing
Suatu teknik yang digunakan untuk menguraingi kebutuhan penyimpanan, dengn jalan: Membagi text menjadi beberapa block Occurance mengacu pada block Kelebihan Mengurangi jumlah pointers Selluruh kemunculan kata dalam single block digabung dalam satu reference yaitu block
6
Contoh Block Addressing
7
Index Size
8
INVERTED FILES Searching
Model pencarian yang dapat dilakukan Single Word Query diakhiri dengan ditemukannya daftar dari posisi kata yang dicari Context Query lebih jika sulit dilakukan dengan inverted files
9
INVERTED FILES Search Algorithm
Vocabulary Search Kata atau paterns query dicari dalam vocabulary Frase dan kedekatan kata query dibagi menjadi single word Retrieval of Occurances Daftar posisi dari kata yang ditemukan ditampilkan Manipulation of Occurances Daftar posisi diproses lagi untuk menemukan kata kedekatan atau operasi boolean Jika block addressing digunakan, maka butuh pencarian text langsung untuk menemukan kesalahan informasi dalam occurances
10
INVERTED FILES - construction
11
Construction – Large Text
12
Suffix Tree Melihat text sebagai sebuah sting yang panjang, setiap posisi dalam text diawali sebuah suffix text, dan setiap suffix text ditandai dengan posisi yang uniq
13
Suffix Trees Structure
14
Suffix Array
15
Supra Indices – Suffix Array
16
Signature Files
17
Implementasi pd IR Model
INVERTED FILES Vocabulary & Occurrences Position index SUFFIX TREE & SUFFIX ARRAY Phrase search & Keyword search SIGNATURE FILES Efficient
Presentasi serupa
© 2024 SlidePlayer.info Inc.
All rights reserved.