Upload presentasi
Presentasi sedang didownload. Silahkan tunggu
Diterbitkan olehIrwan Kurniawan Telah diubah "7 tahun yang lalu
1
VISUALISASI SISTEM REKOMENDASI PENAMBAHAN LINK PADA WEBSITE BERDASARKAN DATA LOG WEBSITE
KURNIAWAN AJI SAPUTRA G Pembimbing : ANNISA, S.Kom., M.Kom
2
LATAR BELAKANG Website merupakan salah satu sarana yang menyediakan informasi pada jaringan internet Struktur yang baik menurut pengembang belum tentu sesuai dengan keinginan pengguna Struktur website yang baik adalah yang mampu mempermudah penggunanya untuk mencari sesuatu yang diinginkannya
3
TUJUAN Membuat sistem rekomendasi website yang diterapkan ke dalam sebuah website artificial dengan menggunakan data log asli website
4
RUANG LINGKUP Data yang diteliti adalah path halaman website hasil kunjungan pengguna website yang diperoleh dari data log website yang menggunakan apache-server.
5
MANFAAT Sistem ini diharapkan mampu membantu pengembang website untuk membuat struktur website yang baik sehingga dapat meningkatkan kepuasan pengguna website.
6
TINJAUAN PUSTAKA
7
WEB MINING Penelitian sebelumnya oleh Nurdian Setyawan (2008) dengan judul “Rekomendasi Penambahan Link Pada Web Berdasarkan Pola Akses Pengguna” telah berhasil mengimplementasikan Algoritme Find Expectation Location dan Algoritme Optimasi (FirstOnly, OptimizeBenefit)
8
DATA LOG Data yang mencatat setiap request halaman website oleh pengguna saat membuka suatu website tertentu (Ivancy & Vajk 2006). Contoh Format Data Log : [16/Feb/2005:14:27: ] "GET / HTTP/1.1" MmTaUg00pdA00001fvkwsM MSIE+6.0 [16/Feb/2005:14:27: ] "GET /scripts/format.css HTTP/1.1" MmTaUg00pdA00001fvkwsM MSIE+6.0 [16/Feb/2005:14:27: ] "GET /images/home-on.gif HTTP/1.1“ MmTaUg00pdA00001fvkwsM MSIE+6.0 [16/Feb/2005:14:27: ] "GET /images/latar.jpg HTTP/1.1" MmTaUg00pdA00001fvkwsM MSIE+6.0 [16/Feb/2005:14:27: ] "GET /images/home-off.gif HTTP/1.1“ MmTaUg00pdA00001fvkwsM MSIE+6.0 [16/Feb/2005:14:27: ] "GET /images/kiri-atas.gif HTTP/1.1" MmTaUg00pdA00001fvkwsM MSIE+6.0 [16/Feb/2005:14:27: ] "GET /images/tengah-kiri.gif HTTP/1.1“ MmTaUg00pdA00001fvkwsM MSIE+6.0 [16/Feb/2005:14:27: ] "GET /images/tengah-tengah.gif HTTP/1.1" MmTaUg00pdA00001fvkwsM MSIE+6.0
9
DATA LOG (Lanjutan) 192.168.19.123 -- [16/Feb/2005:14:27:22 +0700]
“GET /libs/detail.html HTTP/1.1” MmTaUg00pdA00001fvkwsM4000 MSIE+6.0 IP address pengguna informasi waktu pengguna melakukan request menunjukkan metode request halaman yang diminta oleh pengguna Protokol yang digunakan status request yang berarti setuju dan besarnya data (byte) cookie dalam browser URL yang diminta pengguna browser yang digunakan pengguna
10
PREPROCESSING Tahapan Preprocessing (Cooley et al. 1999):
data cleaning session identification transaction identification user identifcation path completion
11
Waktu Kunjungan Paling Lama
HALAMAN TARGET Penentuan Halaman target (Srikant & Yang 2001) : Jelas Perbedaan halaman konten dan halaman isi Halaman Isi Halaman target Tidak Jelas Perbedaan halaman konten dan halaman isi Waktu Kunjungan Paling Lama Halaman target Pada Struktur Website Bertingkat Halaman target Leaf
12
MODEL PENCARIAN PENGGUNA
2B 2C 3A 3B 1 2 5 6 7 8 9 10 Website dan Model Pencarian (Srikant & Yang 2001)
13
METODE PENELITIAN
14
METODE PENELITIAN Input Data Penentuan Halaman Target Lokasi Harapan
Penambahan Tabel Database Pengambilan Data Log Preprocessing Processing Visualisasi & Simulasi Input Data Penentuan Halaman Target Data cleaning User identification Session identification Path completion Transaction identifocation Lokasi Harapan Algoritme Optimasi
15
LINGKUP PENGEMBANGAN SISTEM
Perangkat Keras Processor : Intel Pentium Dual CPU T GHz Memory : 1 GB Harddisk : 120 GB Keyboard & mouse Perangkat Lunak : Microsoft ®Windows Vista Ultimate XAMPP Notepad++ Opera version 9.64
16
BATASAN –BATASAN SISTEM
Data log yang digunakan sebagai input masih data log dari apache-server Format data log harus sesuai dengan contoh yaitu : [20/Mar/2006:00:25: ] "GET /ipb-bhmn HTTP/1.1" MmTaUg00pdA00001fvkwsM4000 Data Log harus berupa file teks Struktur website minimal mempunyai level minimal 4 Sistem tidak dapat digunakan oleh 2 orang atau lebih dalam waktu yang sama
17
HASIL DAN PEMBAHASAN
18
PENAMBAHAN TABEL DATABASE
Tabel yang masih digunakan : tb_exp_locations tb_hsl_firstonly tb_hsl_optbenefit tb_temp Tabel tambahan : data_log url inputdata strukturview
19
PENGAMBILAN DATA LOG Data log yang digunakan adalah dari => januari 2009 Data asli = baris Partisi = baris per file Ukuran per file rata-rata 1 MB Diambil 5 file untuk penelitian Asumsi Halaman Target (Srikant & Yang 2001) “ Halaman yang mempunyai level 4 dalam struktur website dan diambil hanya 15 halaman target yang paling banyak dikunjungi oleh pengunjung website”
20
PENGAMBILAN DATA LOG (lanjutan)
Halaman Target yang dihasilkan : No Halaman Target 1 /berita/palestina/israel-gencatan-senjata-sepihak-gagal-tumbangkan-hamas.htm 2 /berita/palestina/hari-ke pertemuan-doha-dunia-arab-bekukan-hubungan-dengan-israel.htm 3 /berita/dunia/ratusan-ribu-veterang-perang-irak-afghanistan-jadi-gelandangan.htm 4 /berita/analisa/perang-legitimasi.htm 5 /berita/analisa/kegagalan-israel-terhadap-palestina.htm 6 /berita/dunia/pejuang-hamas-fatah-bersatu-abbas-tolak-negosiasi-dengan-israel.htm 7 /berita/dunia/iran-bantu-gaza-bentuk-pasukan-islam-dan-hentikan-ekspor-minyak-ke-as.htm 8 /suara-langit/undangan-surga/merindukan-mati-syahid.htm 9 /berita/rss/int 10 /berita/dunia/petani-israel-rugi-besar-akibat-geraikan-boikot.htm 11 /berita/dunia/yusuf-qardawi-teruslah-turun-ke-jalan.htm 12 /berita/palestina/bangsa-arab-bersatu-untuk-gaza.htm 13 /berita/dunia/aktris-hollywood-boikot-pengusaha-yahudi-zionis-as.htm 14 /syariah/bercermin-salaf/kemenangan-islam-di-syam-iraq-dan-yaman.htm 15 /berita/tahukah-anda/siapa-sebenarnya-suharto-7.htm
21
DATA CLEANING Menghapus baris-baris dalam data log dimana url mengandung format gambar seperti jpg,jpeg,gif,JPG,JPEG dan GIF (Cooley et al. 1999) [16/Feb/2005:14:27: ] "GET /libs/detail.html HTTP/1.1“ MmTaUg00pdA00001fvkwsM MSIE+6.0 [16/Feb/2005:14:27: ] "GET /images/home-off.gif [16/Feb/2005:14:27: ] "GET /libs/detail.html HTTP/1.1“ MmTaUg00pdA00001fvkwsM MSIE+6.0
22
√ X USER IDENTIFICATION 192.168.19.123 192.168.19.123 192.168.28.13
23
USER IDENTIFICATION (lanjutan)
Alamat IP sudah mengalami pengkodean / enkripsi File 1 => pengunjung File 2 => pengunjung File 3 => pengunjung File 4 => pengunjung File 5 => pengunjung Alamat IP
24
SESSION IDENTIFICATION
Penentuan Session (Catledge dan Pitkow 1995) : Terdapat informasi waktu dan lama kunjungan Terdapat cookie di dalam browser yang disimpan Time Out > 30 Menit Session Baru Cookie browser Session
25
SESSION IDENTIFICATION (lanjutan)
Satu pengunjung dapat memiliki lebih dari satu session Namun satu session hanya dimiliki oleh satu pengunjung Alamat IP Session 22es2q9nc0llfb7nr4ep 05km6gkvas6tiqi8r0l1 0tssoih8scmc6s6mmmpe 011fri43ua48u32faqf4 21gkm2v62htb6elut8fk 2e42cst7rt4f62qojkbo 2q7t1btmq6cmo60l7du3 1cak1p26qtnblir11g3j 0u28dncll5s3gf8f491d 265td0sd2t812hreh4o5 02s8uep9h63gh19gca9s 0mtskrc0vpmattm1aotv 283hh86iih3gf40q2igj 1c1o19jh09t0t832ltgp
26
PATH COMPLETION Mengurutkan halaman kunjungan setiap pengguna dan setiap session Contoh : MmTaUg00pdA00001fvkwsM => 1,2,7,17,7,18,7,2,6,14 Mhljljuadjnfalsd ad35fadf => 1,4,10,25,10
27
PATH COMPLETION (lanjutan)
Contoh hasil dari Path Completion : Alamat IP Session Urutan Tingkah Laku Pengunjung 2jnbr1cna7uma0dat0aj /search/?keyword=alat+musik,/search/?keyword=alat+musik&searchB utton.x=11&searchButton.y=10,/berita/palestina/hari-ke pertemuan-doha-dunia-arab-bekukan-hubungan-dengan- israel.htm,/berita/dunia/krisis-gaza-israel-as-tandatangani- kesepakatan-sepihak.htm 0m41nrh2kir9r8ob7uu5 /berita/palestina/israel-gencatan-senjata-sepihak-gagal-tumbangkan- hamas.htm 1b3c5gvae55fk7f9kgvk /berita/dunia/aktris-hollywood-boikot-pengusaha-yahudi-zionis-as.htm 0j5ktdttvvvipua1aqtt /suara-kita/pemuda-mahasiswa/sinkronisasi-moral-mencegah- korupsi.htm,/berita/palestina/israel-gencatan-senjata-sepihak-gagal- tumbangkan-hamas.htm,/suara-kita/pemuda-mahasiswa/sinkronisasi- moral-mencegah-korupsi.htm 2blsgodfcev4qkss254k /berita/dunia/ratusan-ribu-veterang-perang-irak-afghanistan-jadi- gelandangan.htm,/ustadz-menjawab/membenci-yahudi.htm,/suara- kita/suara-pembaca/komentar-siapa-sebenarnya-soeharto.htm,/suara- kita/suara-pembaca/resolusi-1860-bukti-nyata-pengecutnya- penguasa.htm 2hl116me7gieqsjju3pt
28
TRANSACTION IDENTIFICATION
Setelah pengguna menemukan halaman target dan masih melanjutkan pencarian, maka menjadi sebuah transaksi baru Contoh : MmTaUg00pdA00001fvkwsM => 1,2,7,17,7,18,7,2,6,14 MmTaUg00pdA00001fvkwsM => 1,2,7,17, MmTaUg00pdA00001fvkwsM => 7,18, MmTaUg00pdA00001fvkwsM => 7,2,6,14
29
TRANSACTION IDENTIFICATION (lanjutan)
Contoh hasil dari Transaction Identification : Alamat IP Urutan Tingkah Laku Pengunjung /berita/dakwah-mancanegara/yahudi-as-pindah-ke-israel-dan-masuk- islam.htm,/berita/analisa/israel-menggali-kuburnya-sendiri.htm,/berita/analisa/perang- legitimasi.htm /berita/dunia/aktris-hollywood-boikot-pengusaha-yahudi-zionis-as.htm /berita/palestina/israel-gencatan-senjata-sepihak-gagal-tumbangkan-hamas.htm /berita/dunia/petani-israel-rugi-besar-akibat-geraikan-boikot.htm /berita/palestina/hari-ke pertemuan-doha-dunia-arab-bekukan-hubungan-dengan- israel.htm /berita/palestina/hamas-hancurkan-tujuh-tank-zionis.htm,/berita/dunia/iran-bantu-gaza- bentuk-pasukan-islam-dan-hentikan-ekspor-minyak-ke-as.htm /berita/analisa/perang-legitimasi.htm /berita/dunia/bantai-warga-irak-lima-tentara-bayaran-as-siap- diadili.htm,/berita/dunia/ratusan-ribu-veterang-perang-irak-afghanistan-jadi-gelandangan.htm //berita/dunia/rss,/berita/dunia/yusuf-qardawi-teruslah-turun-ke-jalan.htm //berita/dunia/rss,/berita/dunia/pejuang-hamas-fatah-bersatu-abbas-tolak-negosiasi-dengan- israel.htm
30
PROCESSING Pencarian Lokasi Harapan (E1,E2,E3,E4) menggunakan Algoritme Find Expectation Location Penentuan Rekomendasi Halaman menggunakan 2 algoritme : Algoritme FirstOnly Algoritme OptimizeBenefit
31
PROCESSING Algoritme Find Expectation Location tidak menghasilkan lokasi harapan Jika tidak ada lokasi harapan maka Algoritme FirstOnly dan OptimizeBenefit juga tidak akan menghasilkan halaman rekomendasi Penyebab : 1. Karakteristik data (data dummy dan data log) 2. Path Completion yang terlalu pendek 3. Sudah ada hyperlink di halaman utama ke halaman target
32
VISUALISASI
33
VISUALISASI (lanjutan)
Pengujian visualisasi menggunakan hasil akhir penelitian Nurdian Setyawan (2008) yang menggunakan data dummy Algoritme FirstOnly dan OptimizeBenefit dengan nilai threshold 37 dan minsup 7%
34
VISUALISASI (lanjutan)
Tabel hasil algoritme FirstOnly No Target Rek Page Support Hits % 1 20 4 39 7.8% 2 25 3 37 9.1% 26 10 44 10.4% 27 5 38 10.6% 9.4%
35
VISUALISASI (lanjutan)
Tabel hasil algoritme OptimizeBenefit No Target Rek Page Support Hits % 1 17 5 39 7.5% 2 3 37 7.1% 19 42 7.9% 4 40 9 41 7.7% 6 20 44 7.8% 7 24 11 46 8.6% 8 25 48 9.1% 10 No Target Rek Page Support Hits % 11 26 10 59 10.4% 12 2 43 7.6% 13 27 5 56 10.6% 14 3 50 9.4% 15 49 9.2% 16 8.1% 17 28 4 41 18 38 7.1% 19 20 29 44 7.7%
36
VISUALISASI (lanjutan)
37
KESIMPULAN Penelitian ini telah berhasil melakukan tahapan preprocessing dengan menggunakan data log asli website yang disimpan dalam bentuk database mysql Penelitian dengan data log yang digunakan tidak menghasilkan halaman rekomendasi Penelitian mampu memvisualisasikan struktur website yang dinamis
38
SARAN Sistem ini perlu dicoba dengan menggunakan data dari beberapa website lain (dinamis maupun statis) yang sudah dapat dibedakan halaman targetnya
39
TERIMA KASIH
Presentasi serupa
© 2024 SlidePlayer.info Inc.
All rights reserved.