Upload presentasi
Presentasi sedang didownload. Silahkan tunggu
1
Mata Kuliah :Web Mining Dosen
Nama : Mulaab, Ssi, M.Kom Ruang : Puskom Contact : SKS : 3
2
Materi Kuliah Pengantar Web Mining Dasar-dasar data Mining
Association Rules and Sequential Patterns Supervised Learning Unsupervised Learning Partially Supervised Learning Information Retrieval and Web Search Opinion Mining Web Usage Mining
3
Pengantar Tantangan Web Mining Dasar dasar Web Mining
Klasifikasi Web Minin
4
Web Mining – The Idea Banyaknya dokumen HTML, gambar dan file multimedia yang ada di internet, sehinggan menemukan content yang yang diinginkan adalah tugas yang sangat sulit
5
Web Mining Web adalah salah satu sumber data yang sangat besar
Berbagai bidang yang dipersiapakan: data mining, machine learning, natural language processing, statistics, databases, information retrieval, multimedia, .
6
Peluang dan Tantangan Jumlah informasi di web sangat besar dan mudah diakses Mencari informasi yang beragam. Kita dapat menemukan berbagai macam informasi Information/data dari berbagai bentuk tipe data., structured tables, texts, multimedia data, . Ada banyak hyperlinks dalam website dan antar website Banyak informasi Web information yang redundantis redundant.
7
Peluand dan Tantangan The Web is noisy. Informasi dari web berisi banyak berbagai macam informasi , content utama, iklan, panel navigasi dll. The Web juga ada services. The Web is dynamic. the Web is a virtual society.
8
Web Mining Application dari data mining secara otomatis menemukan dan mengektrak informasi dari data web
9
Data Mining vs. Web Mining
Traditional data mining data terstruktur tabel Web data Semi-structured and unstructured kaya fitur dan pola
10
Klasifikasi Teknik Web Mining
Web Content Mining Web-Structure Mining Web-Usage Mining
11
Web-Structure Mining Menemukan hirarki dari hiperlink dalam website dan strukturnya. Web Mining Web Usage Mining Web Content Web Structure
12
Web-Structure Mining cont…
Menemukan informasi tentang relevansi dan kualitas dari web dari topik dan content
13
Web-Usage Mining Menemukan pola navigasi dari data web : memprediksi interaksi user dengan web, membantu memperbaiki resources. Web Mining Web Usage Mining Web Content Web Structure
14
Web-Usage Mining Teknik Usage Mining Data Preparation Data Collection
Data Selection Data Cleaning Data Mining Navigation Patterns Sequential Patterns
15
Web-Usage Mining cont…
Data Mining Techniques – Navigation Patterns A B C D E
16
Web-Usage Mining Data Mining Techniques – Navigation Patterns
Analysis:
17
Web-Usage Mining cont…
Data Mining Techniques – Sequential Patterns Customer Transaction Time Purchased Items John 6/21/ :30 pm Beer John 6/22/05 10:20 pm Brandy Frank 6/20/05 10:15 am Juice, Coke Frank 6/20/05 11:50 am Beer Frank 6/20/05 12:50 am Wine, Cider Mary 6/20/05 2:30 pm Beer Mary 6/21/05 6:17 pm Wine, Cider Mary 6/22/05 5:05 pm Brandy Example: Supermarket Cont…
18
Web-Usage Mining cont…
Data Mining Techniques – Sequential Patterns Contoh In Google search, dalam minggu terakhir 30% pengguna telah mengunjungi /company/product/ had dengan ‘camera’ sebagai kunci pencarian
19
Web Content Mining Meneumukan informasi dari jutaan content dari berbagai sumber informasi World Wide Web Misalkan, Web data contents: text, Image, audio, video, metadata and hyperlinks
20
Web Content Mining Pre-processing data sebelum web content mining: feature selection Post-processing data untuk mengurangi kebingungan dari hasil pencarian Search Engine Mining Memperbaiki pencarian content.
21
Web Content Mining Web content mining terkaita dengan datamining dan text mining Terkait daengan data mining karena teknik datamining digunakan dalam web content mining. Terkait dengan text mining karena sebagian besar konten adalah text Web data adalah semi-structured dan atau unstructured, karena data mining adalah terstruktur dan text adalah unstructured.
22
Teknik untuk Web Content Mining
Classifications Clustering Association
23
Document Classification
Supervised Learning Klasifikasi dokumen Techniques used are Nearest Neighbor Classifier Feature Selection Decision Tree
24
Feature Selection Menghilang istilah-istilah dalam training documents which yang secara statistik tidak terkait dengan label kelas fdhfirfriefre
25
Thank You!
Presentasi serupa
© 2024 SlidePlayer.info Inc.
All rights reserved.