Temu Balik Informasi Materi Pertemuan Ke – 8 Konsep Thesaurus dalam Information Retrival dan Mengenal Macam Thesaurus Beserta Algoritma Anggota : Nama Nim Wahyu Septi Anjar 14.11.0224 Patria Adhyaksa 14.11.0225 Dian Restiani 14.11.0226 Afiatur Rohmah 14.11.0231 Indah Dwi Prawitasari 14.11.0234 Faiz Al-Hamidi 14.11.0235 Bela Crista C L 14.11.0236 Ifal Pandu Kiat 14.11.0237 Nandya Tiara N 14.11.0311
Pengertian Thesaurus (1) Berasal dari bahasa Yunani yaitu “ Thesauros yang artinya kekayaan, harta ataupun gudang tempat menyimpan harta benda atau kekayaan”. (Sri Rohyanti Z.: 2002: 1) Paul Kleinbart dalam artikel “Prolegomenon to Intelegent Thesaurus Software” mengutip pengertian thesaurus dari (ISO 2788 [4]) dikutip Lalu Anwar (2000) : thesaurus dapat didefinisikan dalam dua pengertian yaitu menurut fungsi dan strukturnya. Menurut fungsinya. :Thesaurus dalam daftar istilah untuk mengawasi kosa kata yang dipakai untuk menterjemahkan bahasa sehari-hari (bahasa alami) dari dokumen, pengindeks atau pemakai ke dalam bahasa sistem (bahasa dokumentasi, bahasa informasi). Menurut strukturnya. :Thesaurus adalah daftar kata-kata yang dinamis dan terkendali yang berhubungan satu sama lain secara semantik, dan secara umum mencakup bidang ilmu pengetahuan tertentu.
Pengertian Thesaurus (2) thesaurus merupakan himpunan kata-kata terkendali yang berhubungan satu sama lain secara semantik dan hierarkis, yang dapat dipergunakan untuk menterjemahkan bahasa sehari-hari ke dalam bahasa indeks dalam bidang ilmu pengetahuan tertentu. Thesaurus dipergunakan secara luas untuk mengendalikan kosa kata (vocabulary control) dalam sistem terkoordinasi, kemudian menggunakan sistem komputerisasi dan sistem “Pre –coordinate”.
Thesaurus berbeda dengan daftar tajuk perbedaan thesaurus dengan daftar tajuk subyek adalah sebagai berikut : Istilah-istilah pada thesaurus yang berbentuk kata majemuk ditulis seperti apa adanya, sedangkan dalam tajuk subyek bisa dibalik. Daftar tajuk subyek dalam penyajiannya terdiri atas satu bagian utama saja, yaitu susunan alpabetis. Sedangkan thesaurus paling tidak terdiri atas dua bagian yaitu bagain hierarkis dan alpabetis. Kadangkala ada bagian berkelas. Daftar tajuk subyek kebanyakan dipergunakan pada katalogisasi konvensional, sedangkan thesaurus lebih tepat untuk sistem terotomasi. Karena itu istilah-istilah dalam thesaurus cenderung bersifat pasca–laras.
Komponen Thesaurus Komponen utama dari suatu daftar yang disusun menurut abjad yang terdiri dari: Istilah indeks (index terms) atau deskriptor (descriptor) yaitu istilah-istilah yang dapat digunakan untuk menyatakab suatu konsep dalam sistem simpan pinjam dan temu kembali. Istilah ini disebut juga preferred term. Istilah yang bukan deskriptor (non descriptor) yang berfungsi sebagai entri (entry terms). Istilah entri ini berfungsi sebagai pemandu ke deskriptor. Disebut juga non preferred term.
Struktur Thesaurus Sebuah thesaurus biasanya paling sedikit terdiri dari dua bagian utama yaitu : (1) Daftar deskriptor (rumusan) menurut abjad; dan (2) Daftar istilah yang merupakan panduan suatu deskriptor. Istilah yang dipergunakan sebagai deskriptor untuk mengindeks dan menelusuri informasi, yaitu daftar istilah dalam bahasa indeks yang dikelompokkan secara alpabetis yang terdiri dari faset (kategori) yang mempunyai erat antara satu sama lain. Contoh : PERPUSTAKAAN : PERPUSTAKAAN NASIONAL. : PERPUSTAKAAN PERGURUAN TINGGI. : PERPUSTAKAAN SEKOLAH. Istilah-istilah yang merupakan panduan suatu deskriptor (lead in term) yang merupakan pintu masuk kosa kata yang dipakai sebagai deskriptor dan menunjuk hubungan hierarkhis dari masing-masing deskriptor.
Fungsi Thesaurus (1) Thesaurus dapat berfungsi sebagai sistem untuk mengolah informasi dan sarana temu kembali informasi yang berbasis komputer. Sebagai sistem pengelolaan informasi, thesaurus dapat berfungsi sebagai pedoman dalam mengolah dokumen seperti pembuatan indeks dan penentuan tajuk. Sebagai sarana temu kembali informasi, thesaurus terdiri dari komponen-komponen pokok yang dapat digunakan dalam sistem temu kembali informasi seperti struktur kosa kata kendali dan sistem acuan (misal ; Gunakan : ….., Gunakan Untuk : …… dsb.). Dengan kata lain bahwa thesaurus dalam fungsinya sebagai sarana temu kembali informasi, bahwa kosa kata yang terdapat dalam thesaurus dapat dipergunakan sebagai kata kunci (key word) untuk membuat pertanyaan (query) dalam proses temu kembali informasi seperti dilakukan dalam pengoperasiaan Boolean Logic.
Fungsi Thesaurus (2) Menurut Sri Rohyanti Z. (2002) maka thesaurus berguna untuk : Membantu menentukan dan menemukan istilah yang diberi definisi tersebut. Sangat berguna bagi orang yang bertanggungjawab terhadap indexing dan retrieving dalam bidang tertentu. Mencapai standardisasi dan konsistensi dalam pengindeksan dokumen.
Tujuan Thesaurus tujuan utama disusunnya thesaurus, antar lain adalah sebagi berikut: Untuk memberikan gambaran tentang bidang ilmu pengetahuan tertentu, menunjukkan pengertian atau ide tentang konsep yang saling berhubungan, untuk membantu pengindeks atau peneliti dalam memahami struktur bidang ilmu pengetahuan tersebut. Untuk menyediakan kosa kata yang standar untuk bidang subyek tertentu yang dipergunakan oleh para pengindeks sacara konsisten pada saat menyusun entri indeks dalam rangka penyimpanan dan atau dalam proses temu kembali informasi. Untuk menyediakan sebuah sistem referensi antara istilah yang telah dipastikan hanya mempunyai satu bentuk sinonim yang digunakan untuk mengindeks sebuah dokumen. Untuk menyediakan panduan bagi para pemakai sistem, sehingga mereka dapat memilih istilah yang benar untuk menelusur subyek tertentu. Untuk menyediakan pengklasifikasian yang hierarkhis sehingga penelusur dapat memperluas atau mempersempit secara sistematis, jika pilihan pertama dalam penelusuran terlalu sedikit atau terlalu banyak petunjuk terhadap bahan yang tersedia.
Manfaat Thesaurus Menyediakan sebuah kosakata yang berstandar untuk bidang tertentu, sehingga para pengindeks (manusia) dapat secara konsisten menetapkan istilah yang akan dipakai sebagai pengindeks. Menjadi sebuah panduan bagi pengguna sistem informasi ketika memilih istilah untuk digunakan dalam pencarian berdasarkan subjek. Menjadi sumber bagi istilah-istilah yang sudah terstandardisasi di bidang pengetahuan tertentu. Menyediakan hirarki berkelas sehingga sebuah proses pencarian dapat diperluas atau dipersempit.
Peran Thesaurus Sebagai sarana temu kembali informasi yang berbasis komputer. Sebagai pedoman dalam mengolah dokumen seperti pembuatan indeks dan penentuan tajuk. Mempermudah dalam mengelola data yang telah ada. Mempercepat diketemukannya informasi yang dicari.
Mengenal Thesaurus dan algoritmanya (1) Algoritma Stemming (Vektor Space Model) dalam Makalah yang ditulis oleh (Agus Zainal Arifin, Arif Bramantoro) Kesimpulan: Aplikasi ini diharapkan dapat membantu berbagai pihak (mahasiswa, penulis buku, wartawan, dan sebagainya) dalam mengolah kata menggunakan Bahasa Indonesia. Dengan adanya fasilitas pemeriksa ejaan, pengguna akan mendapatkan kemudahan dalam melakukan pengecekan terhadap kata-kata yang dituliskannya, sehingga mempersingkat waktu penyusunan tulisan karena pengguna tidak perlu lagi membaca satu persatu kata yang telah dituliskannya. Sedangkan fasilitas yang lain, yaitu Thesaurus akan membantu seorang penulis dapat menemukan kata yang tepat dalam menyusun sebuah tulisan menggunakan Bahasa Indonesia.
Mengenal Thesaurus dan algoritmanya (2) Thesaurus untuk Penelusuran Informasi Ilmiah Secara Online Konsep kosa kata atau indeks yang digunakan untuk membangun atau menyusun query yang akan dipakai dalam pencarian informasi, maka konsep tersebut dikonsultasikan kepada thesaurus dan tajuk subjek. Thesaurus dan tajuk subjek yang digunakan ialah Library of Congress Subject Headings. Setelah konsep tersebut dikonsultasikan kepada thesaurus dan tajuk subjek di atas, maka diperoleh rumusan kosa kata atau istilah indeks yang baku (standard) yaitu microalgae dan bioactive dijadikan sebagai kata kunci (keywords).
Mengenal Thesaurus dan algoritmanya (3) Thesaurus berbahasa arab dengan algoritma TF-IDF dalam tesis yang ditulis oleh DIKA RIZKY YUNIANTO Thesaurus merupakan tools yang bermanfaat untuk melakukan query expansion dalam pencarian dokumen. Thesaurus adalah kamus yang dibentuk dengan melihat kemiripan term. Kemiripan term dalam pembentukan thesaurus secara otomatis salah satunya dilakukan dengan pendekatan statistikal dari term ada dokumen-dokumen corpus. Beberapa thesaurus pada bahasa arab dibentuk dengan menggunakan pendekatan statistikal. Dokumen-dokumen corpus dikumpulkan kemudian dilakukan proses preprocessing untuk medaptakan daftar term. Daftar term tersebut akan dihitung nilai TF-IDF nya sebagi fitur untuk melakukan clustering pada dokumen. Dokumen yang telah ter- cluster akan dijadikan patokan untuk menghitung nilai Inverse Class frequncy (ICF)
Mengenal Thesaurus dan algoritmanya (4) Thesaurus database dengan algoritma GVSM (Generalized Vector Space Model) Dokumen yang berupa teks berita hasil pencarian akan di bentuk ringkasannya menggunakan algoritma GVSM adalah ditambahkannya nilai relevansi dengan thesaurus yang akan masuk ke dalam variabel t. Nilai relevansi yang di maksud di dapat dengan melakukan pencocokan kata-kata pada query dengan kata-kata yang ada pada dokumen dari segi makna kata yang dibantu dengan thesaurus. Jika sudah menghasilkan suatu ringkasan dari setiap halaman berita hasil pencarian maka selanjutnya ringkasan-ringkasan tersebut akan di sortir sesuai topiknya. Pembobotan bersifat sederhana dimana jika banyak kata dari database thesaurus pada suatu topik cocok dengan kata-kata dari suatu berita maka dapat dipastikan bobot akan semakin besar. Bobot diberikan sesuai dengan banyaknya kata yang cocok.
Referensi Arifin, Zainal Agus., Bramantoro, Arif. Software Aplikasi Pengolah Kata (Word Processor) Dengan Fasilitas Pemeriksa Ejaan Dan Thesaurus Berbahasa Indonesia. Jurusan Teknik Informatika, Fakultas Teknologi Informasi, Institut Teknologi Sepuluh Nopember (ITS) Hasugian, Jonner. 2006. Penelusuran Informasi Ilmiah Secara Online: Perlakuan terhadap Seorang Pencari Informasi sebagai Real User. Jurnal Studi Perpustakaan dan Informasi, Vol.2, No.1, Juni 2006 Makalah skripsi Sistem Peringkas Berita Otomatis Berbasis Text Mining menggunakan Generalized Vector Space Model Studi Kasus Berita Diambil dari Media Massa Online. Universitas Kristen : Satya Wacana Permatasari, Indah. 2010. THESAURUS SEBAGAI SARANA TEMU KEMBALI INFORMASI UNTUK MENINGKATKAN PELAYANAN KEPADA PENGGUNA DI PERPUSTAKAAN. https://bandonoisi.wordpress.com/2010/12/20/thesaurus- sebagai-sarana-temu-kembali-informasi-untuk-meningkatkan-pelayanan- kepada-pengguna-di-perpustakaan/ diakses 2 Juni 2017 Yunianto, Dika Rizky. 2017. Tesis : PENGUKURAN KEMIRIPAN TERM BERBASIS COOCCURRENCE DAN INVERSE CLASS FREQUENCY PADA PENGEMBANGAN THESAURUS BAHASA ARAB. INSTITUT TEKNOLOGI SEPULUH NOPEMBER SURABAYA http://language-komputer.blogspot.com/2011/12/thesaurus-untuk-temu- kembali-informasi.html (belum ada nama, thn, judul, dan tanggal aksesnya)