Presentasi sedang didownload. Silahkan tunggu

Presentasi sedang didownload. Silahkan tunggu

Pencocokan (Matching)

Presentasi serupa


Presentasi berjudul: "Pencocokan (Matching)"— Transcript presentasi:

1 Pencocokan (Matching)
Proses penyamaan antara query dengan indeks dokumen dalam rangka pemanggilan dokumen dari database (basis data). Pencocokan dilakukan dengan pernyamaan karakter. Ada juga dengan semantik. Contoh: Query: mangga; indeks Mangga (MANGGA) secara karakter berbeda, akan tetapi secara semantik sama. Pencocokan akan menjadikan pemanggilan dokumen. Dokumen terpanggil dari database disebut recall (R).

2 Ada dua jenis pencocokan:
Exact Match: pencocokan yang dilakukan oleh STBI dimana karakter dari query harus sama percis dengan karakter istilah/indeks yang ada atau mewakili dokumen. Kalau tidak sama karakternya, maka tidak terjadi pemanggilan dokumen, tidak recall Partial Match: pencocokan yang dilakukan oleh STBI, dimana sebahagian saja karakter query yang sama dengan karaktet istilah/indeks dalam dokumen sudah terjadi pemanggilan.

3 Lanjutan Partial match, bergantung kepada banyak persamaan yang ditetapkan dalam program. Misal: ditetapkan 4 karakter dari awal istilah/query sama akan terjadi pemanggilan. Query: Argonomy Dokumen terpangil: argonomy, ARGONMY, argonomi, ARGONOMI, Argology, Argomobil, Argosensus, dsb.

4 Keunggulan dan Kelemahan Exact Match
Keunggulan: presisi (precition atau P) tingggi (dokumen relevan dengan kebutuhan pengguna tinggi), dan lebih khusus Kelemahan:Recall rendah (dokumen terpanggil sedikit). Ada kalanya lost (tidak menemukan apa-apa) karena dokumen yang mirip/hampir sama subyek tidak terpanggil. Pencocokan Exact Match biasanya pada database yang bersifat: numerik, dokumen rahasia, berkaitan dengan kesehatan, laboratorium dsb.

5 Keunggulan dan Kelemahan Partial Match
Keunggulan: Dokumen terpanggil (recall atau R) tinggi (termasuk dokumen yang mirip subyeknya akan terpanggil) Kelemahan: Presisi rendah. Pencocokan ini lebih banyak digunakan terutama untuk database berbasis teks. Perlu diketahui bahwa semakin sedikit karakter yang dipersyaratkan untuk dapat pemanggilan, maka semakin tinggi recall. Dan sebaliknya apabila semakin banyak karakter yang dipersyaratkan maka akan semakin tinggi presisi.

6 Truncation: pemenggalan/pemotongan istilah
Akibat pencocokan partial maka dapat dilakukan Limiting searches dengan cara membatasi istilah penelusuran (query) Truncation: pemenggalan/pemotongan istilah Penelusuran dengan cara truncation dimaksudkan untuk memperbolehkan suatu penelusuran dipandu atau diarahkan untuk mendapatkan semua bentuk kata/istilah yang berbeda, akan tetapi mempunyai akar kata yang sama. Dengan menggunakan tanda atau simbol truncation (#, ? atau $, dsb). Suatu kata atau istilah dipenggal atau dipotong pada posisi tertentu, misalnya di kiri, di kanan atau pada keduanya. right truncation Query : Cardi$ maka sistem akan memanggil dokumen yang berisi istilah: Cardiology, Cardiovascular, Cardiotoxin, Cardiovirus, Cardiomyopahty, Cardioverter dsb, asalkan akar katanya Cardi.

7 (b) left truncation #diopilin, akan memanggil dokumen yang berisi istilah: Cardiopilin; Anticardiopilin, dsb, asalkan akhir istilahnya diopilin #FORM akan memanggil dokumen yang berisi istilah Inform, Conform, Deform, Reform dsb. (c) right and left truncation #dio# akan memanggil dokumen yang berisi istilah: Cardiotocography; Cardiotocogram; Cardiotonic; Cardioprotective; Cardiotoxins; cardiovascular dsb., asalkan kata ditengahnya “dio”

8 (d) Pemenggalan di posisi tengah (midle truncated), biasa juga dinamai dengan sebutan Wild Card. Wild Card digunakan untuk memperbolehkan beberapa huruf muncul pada posisi tertentu di dalam suatu kata, atau dapat digunakan untuk memperbolehkan variasi dalam pengucapan. Misalnya: COL#R, akan mendapatkan cantuman yang berisi kata atau istilah COLOUR, COLOR, dsb. WOM#N akan mendapatkan cantuman yang berisi kata WOMAN, WOMEN, dsb. F#ETUS, akan mendapatkan kata FETUS (US spelling) dan FOETUS (British spelling).


Download ppt "Pencocokan (Matching)"

Presentasi serupa


Iklan oleh Google