Presentasi sedang didownload. Silahkan tunggu

Presentasi sedang didownload. Silahkan tunggu

WEB USAGE MINING mulaab. Web usage mining process Bing Liu2.

Presentasi serupa


Presentasi berjudul: "WEB USAGE MINING mulaab. Web usage mining process Bing Liu2."— Transcript presentasi:

1 WEB USAGE MINING mulaab

2 Web usage mining process Bing Liu2

3 web usage mining adalah teknik data mining untuk menemukan pola-pola dari tingkah laku pengunjung sebuah website Setiap klik (clickstream) yang dilakukan oleh seorang pengguna web akan otomatis direkam oleh web server sebagai data log.

4 Data log IP Address dan user ID Tanggal dan jam akses Metode akses Halaman web yang sedang diakses Protokol dan versi yang digunakan Status Ukuran halaman web Referer User agent

5 LogFormat "%h %l %u %t "%r" %>s %b "%{Referer}i" "%{User-Agent}i"" combined Silahkan lihat di /etc/httpd/conf/httpd.conf

6 Contoh

7 Preprocessing content preprocessing, structure preprocessing dan usage preprocessing

8 Data Cleansing : Tahap untuk membersihkan file log dari data yang tidak relevan dengan prosesmining, seperti data multimedia dan script CSS maupun javascript User Identification : Karena beberapa user mungkin menggunakan komputer (host) yang sama,maka perlu dilakukan proses identifikasi user Session identification :Setelah user diidentifikasi, halaman yang diakses pun harus dibagi kedalam sesi tertentu, umumnya berdasarkan waktu tertentu agar didapatkan sesi yang tunggaluntuk setiap user Path Completion Tahapan melengkapi path yang mungkin belum lengkap karena tidak tersimpan dalam file log Transaction Identification : Mengidentifikasi sejumlah sesi tertentu yang menghasilkan satu proses transaksi yang dilakukan oleh user

9 Data web log dari web server yang berbentuk single file di ekstrak dan di konversi menjadi field -field database dengan melakukan pembersihan data Field -field yang tidak perlu, dihapus pada tahap ini, sehingga menghasilkan sebuah database web log

10 Contoh web log conversi ke database

11 Identifkasi session Bing Liu11

12 Identifikasi user: contoh Bing Liu12

13 Identifkasi Page views Pageviews adalah seberapa banyak halaman yang dilihat atau dibaca oleh pengunjung situs atau blog kita Pageview identification adalah proses dalam menentukan halaman web mana saja yang diakses dan siapa saja yang mengakses halaman web tersebut.

14 Dengan P adalah pageview dan p1,p2...pn merupakan jumlah halaman web

15

16 Identifasi transaksi

17 Identifkasi Transaksi

18 Pattern Step


Download ppt "WEB USAGE MINING mulaab. Web usage mining process Bing Liu2."

Presentasi serupa


Iklan oleh Google