Final Project TBI.

Slides:



Advertisements
Presentasi serupa
Peserta mengerti tahap-tahap pada ADC
Advertisements

KIMIA UNSUR-UNSUR TRANSISI
PERTEMUAN 3 Algoritma & Pemrograman
Penyelidikan Operasi 1. Konsep Optimisasi.
KEBIJAKAN PEMERINTAH PROVINSI JAWA TIMUR
Penyusunan Data Baseline dan Perhitungan Capaian Kegiatan Peningkatan Kualitas Permukiman Kumuh Perkotaan DIREKTORAT PENGEMBANGAN KAWASAN PERMUKIMAN DIREKTORAT.
BALTHAZAR KREUTA, SE, M.SI
PENGEMBANGAN KARIR DOSEN Disarikan dari berbagai sumber oleh:
Identitas, persamaan dan pertidaksamaan trigonometri
ANGGOTA KELOMPOK WISNU WIDHU ( ) WILDAN ANUGERAH ( )
METODE PENDUGAAN ALTERNATIF
Dosen Pengampu: Muhammad Zidny Naf’an, M.Kom
GERAK SUGIYO, SPd.M.Kom.
Uji Hipotesis Luthfina Ariyani.
SOSIALISASI PEKAN IMUNISASI NASIONAL (PIN) POLIO 2016
PENGEMBANGAN BUTIR SOAL
Uji mana yang terbaik?.
Analisis Regresi linear berganda
PEERSIAPAN DAN PENERAPAN ISO/IEC 17025:2005 OLEH: YAYAN SETIAWAN
E Penilaian Proses dan Hasil Belajar
b. Kematian (mortalitas)
Ilmu Komputasi BAGUS ADHI KUSUMA
Uji Hipotesis dengan SPSS
OVERVIEW PERUBAHAN PSAK EFFEKTIF 2015
Pengolahan Citra Berwarna
Teori Produksi & Teori Biaya Produksi
Pembangunan Ekonomi dan Pertumbuhan Ekonomi
PERSIAPAN UN MATEMATIKA
Kriptografi.
1 Bab Pembangunan Ekonomi dan Pertumbuhan Ekonomi.
Ekonomi untuk SMA/MA kelas XI Oleh: Alam S..
ANALISIS PENDAPATAN NASIONAL DALAM PEREKONOMIAN TIGA SEKTOR
Dosen: Atina Ahdika, S.Si., M.Si.
Anggaran biaya konversi
Junaidi Fakultas Ekonomi dan Bisnis Universitas Jambi
Pemodelan dan Analisis
Bab 4 Multivibrator By : M. Ramdhani.
Analisis Regresi – (Lanjutan)
Perkembangan teknologi masa kini dalam kaitannya dengan logika fazi
DISTRIBUSI PELUANG KONTINU
FETAL PHASE Embryolgy II
Yusuf Enril Fathurrohman
3D Viewing & Projection.
Sampling Pekerjaan.
Gerbang Logika Dwi Indra Oktoviandy (A )
SUGIYO Fisika II UDINUS 2014
D10K-6C01 Pengolahan Citra PCD-04 Algoritma Pengolahan Citra 1
Perpajakan di Indonesia
Bab 2 Kinerja Perusahaan dan Analisis Laporan Keuangan
Penyusunan Anggaran Bahan Baku
MOMENTUM, IMPULS, HUKUM KEKEKALAN MOMENTUM DAN TUMBUKAN
Theory of Computation 3. Math Fundamental 2: Graph, String, Logic
Strategi Tata Letak.
Theory of Computation 2. Math Fundamental 1: Set, Sequence, Function
METODE PENELITIAN.
(Skewness dan kurtosis)
Departemen Teknik Mesin dan Biosistem INSTITUT PERTANIAN BOGOR
Dasar-dasar piranti photonik
Klasifikasi Dokumen Teks Berbahasa Indonesia
Mekflu_1 Rangkaian Pipa.
Digital to Analog Conversion dan Rekonstruksi Sinyal Tujuan Belajar 1
SEKSI NERACA WILAYAH DAN ANALISIS BPS KABUPATEN TEMANGGUNG
ASPEK KEPEGAWAIAN DALAM PENILAIAN ANGKA KREDIT
RANGKAIAN DIODA TK2092 Elektronika Dasar Semester Ganjil 2015/2016
Ruang Euclides dan Ruang Vektor 1.
Bab Anuitas Aritmetrik dan Geometrik
Penyelidikan Operasi Pemrograman Dinamik Deterministik.
Kesetimbangan Fase dalam sistem sederhana (Aturan fase)
ANALISIS STRUKTUR MODAL
Transcript presentasi:

Final Project TBI

Daftar isi Pengertian TBI Stoplist Stimming Indexing Pembobotan Panjang Vektor Cosin Similarity

TBI Sri Hartinah, 2012: Cara sistematik mencari kembali seluruh atau sebagian informasi ilmiah yang pernah dihasilkan/ditulis/diterbitkan mengenai subjek tertentu untuk jangka waktu tertentu dan ditulis dalam bahasa tertentu.

TBI Proses TBI: Indexing Stopword/ Stoplist : Menghilangkan kata yang tidak diperlukan. Stemming : Menhilangkan imbuhan pada kata yang sudah di stoplist Pembobotan : pemberian nilai pada masing-masing kata Panjang Vektor : pemberian nilai pada dokumen Cosin Similarity : mencari kedekatan antara query dan dokumen

Stoplist Proses stoplist merupakan proses pembuangan kata penghubung atau kata dalam bahasa indonesia, seperti dan, maka, lalu, dalam, yang, akan, dari, pada, itu, telah, dengan, dan sebagainya. Stoplist adalah proses yang dilakukan setelah proses tokenisasi.  Kata hasil token Stemming dibandingkan dengan tabel stopword. Dilakukan pengecekan apakah token sama dengan tabel stopword atau tidak. Jika token sama dengan tabel stopword maka akan di-remove. Jika token tidak sama dengan tabel stopword akan ditampilkan. Yaitu menghasilkan token hasil stopword yang termasuk katapenting (keyword).

Stoplist Preproses : Menghilangkan tanda baca StrToLower : mengubah menjadi huruf kecil Stoplist : Menghilangkan kata yang dianggap tidak diperlukan

Stimming Menurut Pribadi, Adi. W (Pribadi & Hasibuan, 2003, p. 7), proses stemming adalah proses pemotongan atau penghilangan imbuhan dari suatu kata. 

Stimming Stimming Arifin : Cari Awalan Cari Akhiran Cek kata dasar

Indexing Berisi proses stoplist dan stiming kemudian dimasukan ke database dalam bentk perkata. Langkah indexing: Stoplist Stimming Insert to database

Pembobotan Pemberian nilai pada setiap kata yang suadah di stoplist dan stimming. Algoritma yng digunakan :TF.IDF Metode ini akan menghitung nilai Term Frequency (TF) dan Inverse Document Frequency (IDF) pada setiap token (kata) di setiap dokumen dalam korpus. Metode ini akan menghitung bobot setiap token t di dokumen d dengan rumus: Wdt = tfdt * IDFt

Pembobotan Wdt = tfdt * IDFt Dimana : d : dokumen ke-d t : kata ke-t dari kata kunci W : bobot dokumen ke-d terhadap kata ke-t tf : banyaknya kata yang dicari pada sebuah dokumen IDF : Inversed Document Frequency Nilai IDF didapatkan dari IDF : log2 (D/df) dimana : D : total dokumen df : banyak dokumen yang mengandung kata yang dicari Setelah bobot (W) masing-masing dokumen diketahui, maka dilakukan proses pengurutan dimana semakin besar nilai W, semakin besar tingkat similaritas dokumen tersebut terhadap kata kunci, demikian sebaliknya.

Panjang Vektor Menampilkan daftar panjang vektordari setiap dokumen. Di sini pengguna dapat memasukan query dan menerima daftar dokumen yang relevan dengan query tersebut.

Cosin Similarity Cosine similarity merupakan metode yang digunakan untuk menghitug tingkat kesamaan (similarity) antar dua buah objek. Untuk tujuan klastering dokumen, fungsi yang baik adalah fungsi cosine similarity Untuk notasi himpunan digunakan rumus : Dimana : |X∩𝑌| adalah jumlah term yang ada pada dokumen X dan yang ada pada dokumen Y. |X| adalah jumlah term yang ada pada dokumen X. |Y| adalah jumlah term yang ada pada dokumen Y

Terima Kasih