Presentasi sedang didownload. Silahkan tunggu

Presentasi sedang didownload. Silahkan tunggu

(konsep, macam-macam, dan algoritma)

Presentasi serupa


Presentasi berjudul: "(konsep, macam-macam, dan algoritma)"— Transcript presentasi:

1 (konsep, macam-macam, dan algoritma)
Thesaurus (konsep, macam-macam, dan algoritma)

2 Anggota Kelompok Joko Prayogi (14.11.0191)
Yuliani Dwi Asih ( ) Mujiyati ( ) Uswatun Khasanah ( ) Randito Tuah Randhika ( ) Avief Widya Setyawan ( ) Rizal Anjas Prasetyo ( ) Kharis Ardi Purnomo ( )

3 THESAURUS Thesaurus berasal dari bahasa Yunani dan Latin yang berarti “sebuah himpunan yang berharga” atau lebih spesifik lagi "sebuah kekayaan" (treasury). Thesaurus dipakai untuk merujuk ke kata “lexicon” atau “treasury of words” alias himpunan kata-kata yang tentunya dianggap sangat berharga. Thesaurus merupakan suatu kosakata terkontrol yang diatur secara terurut dimana relasi ekivalensi, hirarki dan asosiasi antar term ditampilkan secara eksplisit dan diidentifikasikan dengan indikator relasi standard.

4 Thesaurus dalam Information Retrieval
Dalam Information Retrieval, Thesaurus digunakan untuk membantu pengindeksan dan penemuan kembali informasi karena thesaurus dapat menyediakan kosakata yang tepat dan terkontrol sehingga pengguna dapat memilih istilah yang tepat.

5 Konsep Thesaurus Thesaurus memiliki fungsi berdasarkan fungsionalitas-nya yaitu: Thesaurus Stand-alone Berfungsi untuk membantu pengguna memahami arti suatu term beserta relasinya, membantu mencari variasi term dan mencari translasi term. Thesaurus Terintegrasi Memiliki dua fungsi utama yaitu pengambilan informasi dan pengindeksan

6 Struktur thesaurus secara umum (General Thesaurus Ontology) atau GTO

7 Sebuah thesaurus biasanya paling sedikit terdiri dari dua bagian utama yaitu: :
Daftar deskriptor (rumusan) menurut abjad; dan Daftar istilah yang merupakan panduan suatu deskriptor. Istilah yang dipergunakan sebagai deskriptor untuk mengindeks dan menelusuri informasi, yaitu daftar istilah dalam bahasa indeks yang dikelompokkan secara alpabetis yang terdiri dari faset (kategori) yang mempunyai erat antara satu sama lain. Contoh: PERPUSTAKAAN : PERPUSTAKAAN NASIONAL. : PERPUSTAKAAN PERGURUAN TINGGI. : PERPUSTAKAAN SEKOLAH. Istilah-istilah yang merupakan panduan suatu deskriptor (lead in term) yang merupakan pintu masuk kosa kata yang dipakai sebagai deskriptor dan menunjuk hubungan hierarkhis dari masing-masing deskriptor.

8 Hubungan kesetaraan/sinonim
Hubungan hirarkis Hubungan asosiatif Jenis Hubungan

9 Jenis-jenis peragaan hubungan dalam thesaurus
Indikator Hubungan Singkatan Kesetaraan (Sinonim) Hirarkis    Asosiatif G atau Gunakan, sebagai pengganti USE GU atau Gunakan Untuk sebagai pengganti UF(Use For) IL atau Istilah Luas, sebagai pengganti BT(Broader Term) IK atau Istilah Khusus sebagai pengganti NT(Narrower Term) IB atau Isitilah Berhubungan sebagai pengganti RT (Related Term) G GU IL IK IB

10 Peragaan Thesaurus Terdapat tiga macam format tesaurus tercetak yaitu
berabjad:— menunjukkan tiap hubungan terdekat dari tiap istilah hirarkis: — memperlihatkan semua tingkatan hirarki digilir (permuted atau rotated): — berfungsi sebagai indeks dimana tiap kata dalam deskriptor atau istilah entri secara bergilir menjadi titik temu.

11 Algoritma Thesaurus Algoritma yang digunakan dalam thesaurus adalah algoritma stemming yang didahului dengan pembacaan tiap kata dari file sampel. Sehingga input dari algoritma ini adalah sebuah kata yang kemudian dilakukan:  Pemeriksaan semua kemungkinan bentuk kata. Dimana Setiap kata diasumsikan memiliki 2 awalan / prefiks dan 3 akhiran / sufiks. Sehingga bentuknya menjadi : Prefiks 1 + Prefiks 2 + Kata Dasar + Sufiks 3 + Sufiks 2+ Sufiks 1

12 Algoritma Thesaurus (lanjut...)
Dengan struktur data di atas, maka langkah awal pemotongan bisa dari mana saja. Dalam hal ini pemotongan dilakukan secara berurutan sebagai berikut : Awalan I, hasilnya disimpan pada p1  Awalan II, hasilnya disimpan pada p2  Akhiran I, hasilnya disimpan pada s1  Akhiran II, hasilnya disimpan pada s2  Akhiran III, hasilnya disimpan pada s3  Pada setiap tahap pemotongan di atas diikuti dengan pemeriksaan di kamus apakah hasil pemotongan itu sudah berada dalam bentuk dasar. Kalau pemeriksaan ini berhasil maka proses dinyatakan selesai dan tidak perlu melanjutkan proses pemotongan imbuhan lainnya.

13 Algoritma Thesaurus (lanjut...)
3. Namun jika sampai pada pemotongan akhiran III, belum juga ditemukan di kamus, maka dilakukan proses kombinasi. Kata dasar yang dihasilkan dikombinasikan dengan imbuhan-imbuhannya dalam 12 konfigurasi berikut : Kata Dasar Kata Dasar + Akhiran III Kata Dasar + Akhiran III + Akhiran II Kata Dasar + Akhiran III + Akhiran II + Akhiran I Awalan I + Awalan II + Kata Dasar Awalan I + Awalan II + Kata Dasar + Akhiran III Awalan I + Awalan II + Kata Dasar + Akhiran III + Akhiran II Awalan I + Awalan II + Kata Dasar + Akhiran III + AkhiranII + AkhiranI Awalan II + Kata Dasar Awalan II + Kata Dasar + Akhiran III Awalan II + Kata Dasar + Akhiran III + Akhiran II 3   Awalan II + Kata Dasar + Akhiran III + Akhiran II + Akhiran I

14 Sekian dan terimakasih...


Download ppt "(konsep, macam-macam, dan algoritma)"

Presentasi serupa


Iklan oleh Google