TEMU BALIK INFORMASI ANGGOTA KELOMPOK BAYU ANDRIANTO 21 SYAIFUL HIDAYAT 25 M. FAIZ NOERIS 27 RIFDHOTUL ALFIANSYAH 33 MASKUR ALASAD 35 YOGI HENDRA GUNAWAN 32 YOUSUA SANDI GARSA 34
Konsep thesaurus dalam information retrieval dan mengenal macam-macam thesaurus beserta algoritmanya.
A. PENGERTIAN THESAURUS Berasal dari bahasa Yunani yaitu “ Thesauros yang artinya kekayaan, harta ataupun gudang tempat menyimpan harta benda atau kekayaan”. (Sri Rohyanti Z.: 2002: 1) Menurut Hornby dikutip Sri Rohyanti Z. (2002: 1) : Thesaurus adalah kamus kata-kata dan ungkapan yang dikumpulkan menurut kesamaan artinya dan sinonimnya. Dalam dunia perpustakaan, dokumntasi dan informasi, thesaurus dapat diartikan menurut fungsi dan strukturnya. Kamus Amerika Webster’s dikutip Sri Rohyanti Z. (2002: 1) mendefinisikan thesaurus sebagai suatu ‘buku yang berisi kata atau informasi mengenai bidang subyek tertentu atau suatu kelompok konsep, seperti kamus sinonim. Tesaurus adalah alat untuk pengawasan kosa kata (vocabulary control). (E. John Leide: 2002: 1) Paul Kleinbart dalam artikel “Prolegomenon to Intelegent Thesaurus Software” mengutip pengertian thesaurus dari (ISO 2788 [4]) dikutip Lalu Anwar (2000) : thesaurus dapat didefinisikan dalam dua pengertian yaitu menurut fungsi dan strukturnya.
Menurut fungsinya Thesaurus dalam daftar istilah untuk mengawasi kosa kata yang dipakai untuk menterjemahkan bahasa sehari-hari (bahasa alami) dari dokumen, pengindeks atau pemakai ke dalam bahasa sistem (bahasa dokumentasi, bahasa informasi).
Menurut Strukturnya Thesaurus adalah daftar kata-kata yang dinamis dan terkendali yang berhubungan satu sama lain secara semantik, dan secara umum mencakup bidang ilmu pengetahuan tertentu. Dalam buku “Guidelines for the Establisment and Develoment of Multilingualual Thesauri” dikutip Lalu Anwar (2000) pengertian thesaurus adalah sekelompok istilah yang dipilih dari bahasa sehari- hari, dan merupakan kosa kata dari bahasa indeks yang terkendali. Disusun sedemikian rupa sehingga hubungan formal antara istilah yang lebih luas (broader terms) dengan istilah yag khusus (narrower terms) dibuat dengan jelas.
Berdasarkan pengertian diatas, thesaurus merupakan himpunan kata-kata terkendali yang berhubungan satu sama lain secara semantik dan hierarkis, yang dapat dipergunakan untuk menterjemahkan bahasa sehari-hari ke dalam bahasa indeks dalam bidang ilmu pengetahuan tertentu. Thesaurus dipergunakan secara luas untuk mengendalikan kosa kata (vocabulary control) dalam sistem terkoordinasi, kemudian menggunakan sistem komputerisasi dan sistem “Pre –coordinate”.
Thesaurus berbeda dengan daftar tajuk suyek, kamus istilah dan klasifikasi hierarkhis. Perbedaannya dengan daftar tajuk subyek bahwa daftar tajuk subyek tidak secara implisit menyebutkan hubungan hierarkhis dari masing-masing subyek melainkan disusun hanya berdasarkan abjad. Dalam tajuk subyek untuk menunjukkan hubungan hierarkhis digunakan acuan “lihat juga”, yang dapat menunjukkan hubungan subyek yang lebih luas dengan subyek yang lebih khusus. Contoh : ADMINISTRASI PENDIDIKAN Lihat juga : ADMINISTRASI SEKOLAH.
Pada thesaurus, acuan yang digunakan lebih eksplisit lagi Pada thesaurus, acuan yang digunakan lebih eksplisit lagi. Istilah- istilah yang terdaftar dinyatakan dengan jelas hubungan hierarkhisnya dengan menggunakan istilah lain. Contoh : ADMINISTRASI PENDIDIKAN BT : ADMINISTRASI. NT : ADMINISTRASI EKOLAH. Secara lebih rinci perbedaan thesaurus dengan daftar tajuk subyek adalah sebagai berikut :………………………..
1. Istilah-istilah pada thesaurus yang berbentuk kata majemuk ditulis 1. Istilah-istilah pada thesaurus yang berbentuk kata majemuk ditulis seperti apa adanya, sedangkan dalam tajuk subyek bisa dibalik. 2. Daftar tajuk subyek dalam penyajiannya terdiri atas satu bagian utama saja, yaitu susunan alpabetis. Sedangkan thesaurus paling tidak terdiri atas dua bagian yaitu bagain hierarkis dan alpabetis. Kadangkala ada bagian berkelas. 3. Daftar tajuk subyek kebanyakan dipergunakan pada katalogisasi konvensional, sedangkan thesaurus lebih tepat untuk sistem terotomasi. Karena itu istilah-istilah dalam thesaurus cenderung bersifat pasca–laras. Dikoordinasikan pada saat pencarian informasi. Hal ini sangat erat kaitannya dengan pengoperasian BOOLEAN LOGIC (salah satu strategi sistem temu kembali informasi yang berbasis komputer).
Perbedaan thesaurus dengan kamus istilah, bahwa kamus istilah hanya memberikan definisi suatu istilah, sedangkan thesaurus memberikan difinisi dalam rangka menunjukkan hubungan suatu istilah dengan istilah yang lain. Contoh : ADMISITRASI PERSONALIA Gunakan : PENGELOLAAN KEPEGAWAIAN. Perbedaan thesaurus dengan klasifikasi hierarkhis seperti DDC atau UDC yaitu sistem klasifikasi hierarkhis berusaha menggambarkan keseluruhan hubungan hierarkhis antara istilah yang terdapat dalam klasifikasi tersebut, sebaliknya thesaurus hanya menggambarkan istilah yang perlu-perlu saja.
B. Struktur Thesaurus. Sebuah thesaurus biasanya paling sedikit terdiri dari dua bagian utama yaitu : (1) Daftar deskriptor (rumusan) menurut abjad; dan (2) Daftar istilah yang merupakan panduan suatu deskriptor.
Istilah yang dipergunakan sebagai deskriptor untuk mengindeks dan menelusuri informasi, yaitu daftar istilah dalam bahasa indeks yang dikelompokkan secara alpabetis yang terdiri dari faset (kategori) yang mempunyai erat antara satu sama lain. Contoh : PERPUSTAKAAN : PERPUSTAKAAN NASIONAL. : PERPUSTAKAAN PERGURUAN TINGGI. : PERPUSTAKAAN SEKOLAH. Istilah-istilah yang merupakan panduan suatu deskriptor (lead in term) yang merupakan pintu masuk kosa kata yang dipakai sebagai deskriptor dan menunjuk hubungan hierarkhis dari masing- masing deskriptor.
C. Bagian Hierarkis Suatu thesaurus memuat sejumlah istilah mulai dari yang spesifik hingga istilah yang umum. Istilah yang satu merupakan bagian dari istilah lainnya yang mengandung makna yang lebih luas dan paling luas, namun masih termasuk dalam cakupan subyek thesaurus dimaksud. Menurut Simanjuntak (1986) dikutip Lalu Anwar (2000) hubungan yang berdasarkan kriteria “sempit – lebih luas – paling luas” ini disebut hubungan hierarkhis.
Menurut buku “Guidekine for the establishment and development monolingual thesauri (1981)” dikutip Lalu Anwar (2000) kedudukan suatu istilah dalam hierarkhis ditentukan berdasarkan aturan sebagai berikut : 1. Hubungan generik (genus-species) merupakan hubungan antar istilah dimana makna istilah yang satu merupakan species atau jenis dari makna istilah yang lain. Contoh : istilah “Banjir” ditempatkan satu tingkat lebih spesifik daripada istilah “Bencana alam”, karena istilah “Banjir” adalah jenis dari “Bencana alam”. 2. Hubungan partitif (Whole-part relationship) merupakan hubungan antar istilah dimana istilah yang satu mewakili istilah yang lain dalam makna. Contoh : hubungan antara “rumah” dan “jendela”.
D. Bagian alfabetis. Bagian ini merupakan perubahan bentuk bagian hirarkhis tadi disusun kembali secara alpabetis serta diperlihatkan hubungannya dengan istilah lain berdasarkan tingakat kesepesifikkan makna, misalnya : 1. Hubungan suatu istilah dengan istilah lain yang satu tingkat lebih luas maknanya dinyatakan dengan BT (Broader Term), 2. Hubungan suatu istilah dengan yang satu tingkat lebih sempit maknanya dinyatakan dengan NT (Narrower Term). Pencantuman BT dan NT pada bagian alpabetis dilengkapi dengan pencantuman istilah lain yang mempunyai hubungan secara asosiatif dan dinyatakan dengan RT (Related Term).
Istilah-istilah yang dipergunakan untuk menyatakan hubungan hierarkhis dari masing-masing deskriptor serta penggunaannya, adalah sebagai berikut : DALAM BAHASA INGGRIS DALAM BAHASA INDONESIA U = Use UF = Use For SN = Scope Note BT = Broader Term NT = Narrowar Term RT = Related Term G = Gunakan GU = Gunakan Untuk RL = Ruang Lingkup IL = Istilah Luas IK = Istilah Khusus IB = Istlah Berhubungan
E. Fungsi Thesaurus. Thesaurus dapat berfungsi sebagai sistem untuk mengolah informasi dan sarana temu kembali informasi yang berbasis komputer. Sebagai sistem pengelolaan informasi, thesaurus dapat berfungsi sebagai pedoman dalam mengolah dokumen seperti pembuatan indeks dan penentuan tajuk. Sebagai sarana temu kembali informasi, thesaurus terdiri dari komponen-komponen pokok yang dapat digunakan dalam sistem temu kembali informasi seperti struktur kosa kata kendali dan sistem acuan (misal ; Gunakan : ….., Gunakan Untuk : …… dsb.). Dalam proses temu kembali informasi berbasis komputer, pemakai harus menyediakan pertanyaan (query) yang diperlukan dengan menggunakan kata kunci (keyword). Thesaurus menyediakan daftar kata- kata kunci yang disusun secra alpabetis dengan sinonim yang berdekatan dan sering dikembangkan untuk mencakup beberapa indikasi dari istilah yang luas (broader term) dan istilah khusus (narrower term). Dengan kata lain bahwa thesaurus dalam fungsinya sebagai sarana temu kembali informasi, bahwa kosa kata yang terdapat dalam thesaurus dapat dipergunakan sebagai kata kunci (key word) untuk membuat pertanyaan (query) dalam proses temu kembali informasi seperti dilakukan dalam pengoperasiaan Boolean Logic.
Seperti kegunaan atau fungsi sebuah kamus atau daftar kata-kata adalah memberikan definisi atau penjelasan arti tentang kata dan istilah tersebut, menurut Sri Rohyanti Z. (2002) maka thesaurus berguna untuk : a. Membantu menentukan dan menemukan istilah yang diberi definisi tersebut. b. Sangat berguna bagi orang yang bertanggungjawab terhadap indexing dan retrieving dalam bidang tertentu. c. Mencapai standardisasi dan konsistensi dalam pengindeksan dokumen.
F. Tujuan Thesaurus Dalam Encyclopedia of Library and Information Science Vol. 30 (1970) dikutip Lalu Anwar (2000) diuraikan bahwa yang menjadi tujuan utama disusunnya thesaurus, antar lain adalah sebagi berikut : 1. Untuk memberikan gambaran tentang bidang ilmu pengetahuan tertentu, menunjukkan pengertian atau ide tentang konsep yang saling berhubungan, untuk membantu pengindeks atau peneliti dalam memahami struktur bidang ilmu pengetahuan tersebut. 2. Untuk menyediakan kosa kata yang standar untuk bidang subyek tertentu yang dipergunakan oleh para pengindeks sacara konsisten pada saat menyusun entri indeks dalam rangka penyimpanan dan atau dalam proses temu kembali informasi. 3. Untuk menyediakan sebuah sistem referensi antara istilah yang telah dipastikan hanya mempunyai satu bentuk sinonim yang digunakan untuk mengindeks sebuah dokumen. 4. Untuk menyediakan panduan bagi para pemakai sistem, sehingga mereka dapat memilih istilah yang benar untuk menelusur subyek tertentu. 5. Untuk menyediakan pengklasifikasian yang hierarkhis sehingga penelusur dapat memperluas atau mempersempit secara sistematis, jika pilihan pertama dalam penelusuran terlalu sedikit atau terlalu banyak petunjuk terhadap bahan yang tersedia.
Algoritma Thesaurus Dalam ditemukannya data oleh thesaurus tidak begitu saja ditemukan. Ini menggunakan algoritma tertentu dan algoritma yang digunakann adalah algoritma stemming. Algoritma Stemming Algoritma ini didahului dengan pembacaan tiap kata dari file sampel. Sehingga input dari algoritma ini adalah sebuah kata yang kemudian dilakukan: 1. Pemeriksaan semua kemungkinan bentuk kata. Setiap kata diasumsikan memiliki 2 awalan / prefiks dan 3 akhiran / sufiks. Sehingga bentuknya menjadi : Prefiks 1 + Prefiks 2 + Kata Dasar + Sufiks 3 + Sufiks 2+ Sufiks 1 Seandainya kata tersebut tidak memiliki imbuhan sebanyak imbuhan di atas, maka imbuhan yangkosong diberi tanda x untuk prefiks dan diberi tanda xx untuk sufiks. Untuk mewujudkannya maka dibuatlah struktur data untuk menampung setiap kata yang bentuknya sebagai berikut http://viplab.if.its.ac.id/