Upload presentasi
Presentasi sedang didownload. Silahkan tunggu
Diterbitkan olehAndii Arifin Telah diubah "9 tahun yang lalu
1
WEB USAGE MINING mulaab
2
Web usage mining process Bing Liu2
3
web usage mining adalah teknik data mining untuk menemukan pola-pola dari tingkah laku pengunjung sebuah website Setiap klik (clickstream) yang dilakukan oleh seorang pengguna web akan otomatis direkam oleh web server sebagai data log.
4
Data log IP Address dan user ID Tanggal dan jam akses Metode akses Halaman web yang sedang diakses Protokol dan versi yang digunakan Status Ukuran halaman web Referer User agent
5
LogFormat "%h %l %u %t "%r" %>s %b "%{Referer}i" "%{User-Agent}i"" combined Silahkan lihat di /etc/httpd/conf/httpd.conf
6
Contoh
7
Preprocessing content preprocessing, structure preprocessing dan usage preprocessing
8
Data Cleansing : Tahap untuk membersihkan file log dari data yang tidak relevan dengan prosesmining, seperti data multimedia dan script CSS maupun javascript User Identification : Karena beberapa user mungkin menggunakan komputer (host) yang sama,maka perlu dilakukan proses identifikasi user Session identification :Setelah user diidentifikasi, halaman yang diakses pun harus dibagi kedalam sesi tertentu, umumnya berdasarkan waktu tertentu agar didapatkan sesi yang tunggaluntuk setiap user Path Completion Tahapan melengkapi path yang mungkin belum lengkap karena tidak tersimpan dalam file log Transaction Identification : Mengidentifikasi sejumlah sesi tertentu yang menghasilkan satu proses transaksi yang dilakukan oleh user
9
Data web log dari web server yang berbentuk single file di ekstrak dan di konversi menjadi field -field database dengan melakukan pembersihan data Field -field yang tidak perlu, dihapus pada tahap ini, sehingga menghasilkan sebuah database web log
10
Contoh web log conversi ke database
11
Identifkasi session Bing Liu11
12
Identifikasi user: contoh Bing Liu12
13
Identifkasi Page views Pageviews adalah seberapa banyak halaman yang dilihat atau dibaca oleh pengunjung situs atau blog kita Pageview identification adalah proses dalam menentukan halaman web mana saja yang diakses dan siapa saja yang mengakses halaman web tersebut.
14
Dengan P adalah pageview dan p1,p2...pn merupakan jumlah halaman web
16
Identifasi transaksi
17
Identifkasi Transaksi
18
Pattern Step
Presentasi serupa
© 2024 SlidePlayer.info Inc.
All rights reserved.