Muhammad Yusuf Teknik Multimedia dan Jaringan UNIVERSITAS TRUNOJOYO.

Slides:



Advertisements
Presentasi serupa
Pencarian informasi di internet
Advertisements

Program Studi Matematika Fakultas Sains dan Matematika Tundjung Mahatma CMS dengan open source weblog.
Gorontalo State University
Pelatihan Pembuatan & Pengelolaan Website
KONSEP DASAR WEB DAN INTERNET
WEB MINING Disusun Oleh : Anre Waluyo ( )
Pengantar Teknologi Mobile 7 Antonius Rachmat C, S.Kom Wireless Markup Language.
Praktikum Sistem Temu Balik Informasi
BASIS DATA LANJUTAN.
Ratri Enggar Pawening Materi 4 I NFORMATION R ETRIEVAL.
SEO (Search Engine Optimization)
Internet dan Infrastruktur
OASE Project Husni Komputasi.wordpress.com oaseproject.trunojoyo.ac.id O pen & A ctive S earch E ngine.
KONSEP DAN ARSITEKTUR SISTEM BASIS DATA
B L O G Joshua Joviando 1. Bagian 2 Membuat Blog di 2.
Konsep Database. S D L C Strategy and Analysis Design Build n Document Transition Production.
Membangun Halaman Web Dinamis dengan PHP
Ontologi dalam Penyebaran Knowledge dan Rekayasa B2B Net Markets Adang Suhendra.
PEMROGRAMAN WEB DASAR Humisar Hasugian, S.Kom.
Mata Kuliah :Web Mining Dosen
di Sistem Temu Balik Informasi (STBI) Syafri Arlis, S.Kom, M.Kom
Pengenalan Database Local e-Content Pertemuan 8
Information Retrieval
oleh Rahmani Dwiastuti
Ganesha digital library : connecting people’s knowledge 2.Wiranto. Membangun perpustakaan digital 3.Marchionni,
Research Methodology Ahmad Rifan F Usep Nugraha.
PERTEMUAN I PENGENALAN HTML Hypertext Markup Language merupakan standard bahasa yang digunakan untuk menampilkan document web, yang bisa dilakukan dengan.
Text Mining Patrick Cash.
Latent Semantic Indexing
Sistem Temu-Balik Informasi INFORMATION RETRIEVAL SYSTEMS (IRS)
Text Pre-Processing M. Ali Fauzi.
Pelatihan Web Untuk Anggota Kepolisian Metro Jaya
Temu Balik Informasi BY : Taufik Ari Arnandan ( )
Anggota Kelompok Dian Santosa (KETUA)
Penambangan data Pertemuan 2.
Pertemuan 7 : Latent Semantic Indexing
AJAX (Asynchronous Javascript And XML)
Pengantar Multimedia #3
Text Mining and Information Retrieval
DATAWAREHOUSING & BUSINESS INTELLIGENT <<Pertemuan – 12>>
AJAX Teguh S.
Membangun Web Site“Cantik”
Sistem Operasi ~ Teknik Informatika ~ STT Wastukancana Purwakarta
Sistem Temu-Balik Informasi yasmi afrizal
SISTEM TEMU KEMBALI INFORMASI
Perkenalan Pertemuan ke-1 Sistem Temu-Balik Informasi.
Cloud Computing The “cloud” = Internet
TEMU KEMBALI INFORMASI
TEMU BALIK INFORMASI TI 14 A.
Pertemuan 04 Materi: Informasi dan database Sumber materi:
Information Extraction and Named Entity Recognition
Information Retrieval
Oleh : Rahmat Robi Waliyansyah, M.Kom.
Diskusi Anggaplah saudara bertanggung jawab untuk menyeleksi DBMS yang akan dibeli oleh perusahaan ditempat saudara bekerja. Sebagai latihan mulailah merumuskan.
Oleh : Inggar Prayoga.,S.I.Kom
Temu Balik Informasi Anggota Kelomopok :
TEXT OPERATION Muhammad Yusuf Teknik Multimedia dan Jaringan
Sistem Temu-Balik Informasi INFORMATION RETRIEVAL SYSTEMS (IRS)
Teknik Informatika Universitas Trunojoyo Semester Genap
CROSS LANGUAGE INFORMATION RETRIEVAL (CLIR)
(Hyper Text Markup Language)
Sistem Operasi ~ Teknik Informatika ~ STT Wastukancana Purwakarta
Text Mining ..
Pengenalan Temu Balik Informasi.
M Ali Fauzi Indriati Sigit Adinugroho
KONSEP-KONSEP DALAM MANAJEMEN BASIS DATA SIG
Konsep Database.
TEXT MINING.
Cross-Language Information Retrieval (CLIR)
TUTORIAL ITHENTICATE: USER
Transcript presentasi:

Muhammad Yusuf Teknik Multimedia dan Jaringan UNIVERSITAS TRUNOJOYO

 Document Collection (Mengumpulkan Document/Informasi)  Document Retrieval (Mengakses Document/Informasi)  Text Mining (analisa berdasarkan linguistic)  Ontologies (pemodelan untuk merepresentasikan object dalam type, properties, dan relasinya)

 Domain (dependent or independent) Ketergantungan dgn dokumen lain  Structured or Non Structured Texts Memiliki struktur khusus or tidak, contoh : HTML  Formated or Non Formated Documents Memiliki format khusus or tidak, contoh : Doc vs Txt  Textual or Multimedia Documents Berupa text atau multimedia

 Monolingual or Multilingual Documents Berupa satu bahasa or banyak bahasa  Centralized or Non Centralized Document Management Lokasi dokumen satu tempat or banyak tempat  Controlled or Free Additional of Doc Pengaksesannya butuh login or tidak  Stable or Non Stable Collections Ketersediaannya tetap or tidak tetap.

 Inconsistent Document  Incomplete descriptions  Duplicates or Worse  Different terminologies/ languange/ perspective/ abriviation

 QUERY INTERPRETATION (Menggunakan Query)  DOCUMENTS INDEXING (Menggunakan Index)  RANGKING OF RETRIEVED DOCUMENTS (mengurutkan sesuai rangkingn tertentu)  LINGUISTIC AND STATISTICAL Contoh : Search Engine

 Google

 AllTheWeb from Fast Search & Transfer (2002)  Index: 2,1 GB documents  Languages supported: 52  Linguistics used: Lemmatization, language identification, phrasing, anti-phrasing, text categorization, clustering, offensive content reduction, finite-state automata  30 mill. queries per hari

 VOLUME DATA Sangat besar dan berkembang dinamis Tersebar dibanyak tempat dan beda platform  MULTITUDE OF LANGUAGES Multilingual web languages used on the web Many text encoding standart

DOCUMENT QUALITY  Missplelings (Salah eja)  Spam and offensive content (isi sampah)  Little text (isi tidak menggmbarkan)  All topics USER BEHAVIOUR  Misspellings (Salah eja)  Query length and query session (panjang dan seberapa sering)  Document yang dilihat umumnya yang diatas

LINGUISTIC ANALYSIS  Merubah bentuk Document or menambahkan information (memilah dalam S,O,P,Pre dls)  Tagging (potongan kata yg memiliki arti), lemmatization (mengindentifikasi satu kata dari berbagai perubahan bentuk) KNOWLEDGE DISCOVERING IN TEXT  Menemukan Bentuk  Memisahkan Dan Menemukan Kesalahan  Statistical and linguistic aproach

 walk, walked, walks, walking -> walk  run, runs, ran, running ->run  go, goes, going, went, gone ->go

 Concept extraction  Ontology construction  TOC construction  Clustering  Text categorization  Subtechniques: - information extraction, text analysis

HUBUNGAN ANTAR BAGIAN DALAM SUATU OBJECT YANG DIGAMBARKAN  Conceptual modelling  Document Analysis & Text Mining  Standarization Work