VISUALISASI SISTEM REKOMENDASI PENAMBAHAN LINK PADA WEBSITE BERDASARKAN DATA LOG WEBSITE KURNIAWAN AJI SAPUTRA G64052249 Pembimbing : ANNISA, S.Kom., M.Kom.

Slides:



Advertisements
Presentasi serupa
HTML.
Advertisements

Web : diskual.tnial.mil.id
PENGENALAN INTERNET M. Masrur, SKom.
Pernahkah anda membuka sebuah Website???? What It????
KONSEP DASAR WEB DAN INTERNET
WEB MINING Disusun Oleh : Anre Waluyo ( )
PEMBAGUNAN APLIKASI PERPUSTAKAAN DAN TOKO ONLINE TERINTERGRASI
Perancangan dan Pemrograman Web
Internet & Pemrograman Web Pertemuan I : Pengenalan Internet Oleh : Hadi Santoso.
MODUL 11 MEMBUAT LOGIN USER
III. Pembahasan 3.1 Implementasi Perangkat Lunak
Pertemuan Ke-1 (Konsep Dasar Web)
PENGERTIAN DOMAIN & HOSTING
Tesa Eranti Putri Judul TA Implementasi Analisa Weblog untuk Rekomendasi Link Favorit dengan Kombinasi Algoritma SOM dan Fuzzy.
DESAIN WEB STATIS DAN HTML
Keamanan Sistem World Wide Web
Web server Willy Permana Putra.
PEMROGRAMAN WEB DENGAN HTML & php frame work (code igniter)
MEMBUAT WEB SEDERHANA.
WEB BROWSER.
Matakuliah : Jaringan Komputer 2 Versi Materi Web Server Penyaji
WEB USAGE MINING mulaab. Web usage mining process Bing Liu2.
BAB II DASAR-DASAR WEB & HTML.
Overview Teknologi Internet
Pertemuan 1 Pengenalan Dasar Web.
S1 Teknik Informatika - Unijoyo
PRIHANDOKO S.Kom, MIT, PDH
Pertemuan Ke-1 (Konsep Dasar Web)
Pemrograman WEB Pertemuan I (Teori)
Website Security.
CARA KERJA WEB Rofilde Hasudungan.
Pembahasan Pendahuluan HTTP FTP SMTP DNS Telnet.
Pembimbing : Endang Purnama Giri, S.Kom., M.Kom.
Disusun Oleh: AVE ABDI SARAGIH
Keamanan Web Server.
Pengembangan Sistem Informasi Manajemen Akademik Berbasis Web
Penambahan Operasi OLAP dan Fungsi Agregat pada Temporal Data Warehouse Tanaman Pangan Kabupaten Karo Oleh : Karina Gusriani – G Pembimbing : Ibu.
Pertemuan 3 Khairul Anwar Hafizd
Basis Data Klien Server dan Basis data Internet Materi 7
Keamanan Web Server.
Firman Ardiansyah, S.Kom, M.Si. Imas S. Sitanggang, S.Si., M.Kom
Pemrograman Basis Data Berbasis Web
Pemrograman basis data internet dan client server
Pertemuan 5 Electronic Commerce
Erizal, S.Si, M.Kom Internet dan Web Erizal, S.Si, M.Kom
MENGOPERASIKAN WEB DESIGN
MENGOPERASIKAN WEB DESIGN
DASAR DASAR WEB DAN HTML
PEMROGRAMAN WEB 1 PERTEMUAN 1
Overview Teknologi Internet
Sistem Manajemen Basis Data Web
Keamanan Sistem World Wide Web
Pengenalan Dasar Web dan HTML
Prinsip Dasar Internet & Pemrograman Web
TUGAS AKHIR PERANCANGAN PROGRAM PENJUALAN DAN PEMBELIAN BARANG ELEKTRONIK SECARA TUNAI PERANCANGAN PROGRAM PENJUALAN DAN PEMBELIAN BARANG ELEKTRONIK.
Pengantar Teknologi Informasi
Pemrograman Basis Data Berbasis Web
Matakuliah : Jaringan Komputer 2 Versi Materi Web Server Penyaji
WORLD WIDE WEB (WWW) Kelompok 2 : Rana Meysa Mudazir ( )
Pengantar Teknologi Informasi
PengamananWeb browser
Internet dan Web Erizal, S.Si, M.Kom.
INSTALASI SIMRS GOS Tim IT Direktorat Jenderal Bina Upaya Kesehatan
Firman Ardiansyah S.Komp, M.Si.
Pemrograman WEB Pertemuan I (Teori) Oleh : D. Sinaga, M.Kom.
Oleh: Wahyu Dwi Suryanto G
Pengenalan Dasar Web dan HTML
Pertemuan 1 Pengenalan Dasar Web.
Prinsip Dasar Internet & Pemrograman Web
Pertemuan 1 Pengenalan Dasar Web.
Transcript presentasi:

VISUALISASI SISTEM REKOMENDASI PENAMBAHAN LINK PADA WEBSITE BERDASARKAN DATA LOG WEBSITE KURNIAWAN AJI SAPUTRA G64052249 Pembimbing : ANNISA, S.Kom., M.Kom

LATAR BELAKANG Website merupakan salah satu sarana yang menyediakan informasi pada jaringan internet Struktur yang baik menurut pengembang belum tentu sesuai dengan keinginan pengguna Struktur website yang baik adalah yang mampu mempermudah penggunanya untuk mencari sesuatu yang diinginkannya

TUJUAN Membuat sistem rekomendasi website yang diterapkan ke dalam sebuah website artificial dengan menggunakan data log asli website

RUANG LINGKUP Data yang diteliti adalah path halaman website hasil kunjungan pengguna website yang diperoleh dari data log website yang menggunakan apache-server.

MANFAAT Sistem ini diharapkan mampu membantu pengembang website untuk membuat struktur website yang baik sehingga dapat meningkatkan kepuasan pengguna website.

TINJAUAN PUSTAKA

WEB MINING Penelitian sebelumnya oleh Nurdian Setyawan (2008) dengan judul “Rekomendasi Penambahan Link Pada Web Berdasarkan Pola Akses Pengguna” telah berhasil mengimplementasikan Algoritme Find Expectation Location dan Algoritme Optimasi (FirstOnly, OptimizeBenefit)

DATA LOG Data yang mencatat setiap request halaman website oleh pengguna saat membuka suatu website tertentu (Ivancy & Vajk 2006). Contoh Format Data Log : 192.168.19.123 - - [16/Feb/2005:14:27:22 +0700] "GET / HTTP/1.1" 200 18768 MmTaUg00pdA00001fvkwsM4000 http://www.unipi.it MSIE+6.0 192.168.19.123 - - [16/Feb/2005:14:27:22 +0700] "GET /scripts/format.css HTTP/1.1" 200 2217 MmTaUg00pdA00001fvkwsM4000 http://www.unipi.it MSIE+6.0 192.168.19.123 - - [16/Feb/2005:14:27:22 +0700] "GET /images/home-on.gif HTTP/1.1“ 404 295 MmTaUg00pdA00001fvkwsM4000 http://www.unipi.it MSIE+6.0 192.168.19.123 - - [16/Feb/2005:14:27:22 +0700] "GET /images/latar.jpg HTTP/1.1" 200 1919 MmTaUg00pdA00001fvkwsM4000 http://www.unipi.it MSIE+6.0 192.168.19.123 - - [16/Feb/2005:14:27:22 +0700] "GET /images/home-off.gif HTTP/1.1“ 404 296 MmTaUg00pdA00001fvkwsM4000 http://www.unipi.it MSIE+6.0 192.168.19.123 - - [16/Feb/2005:14:27:22 +0700] "GET /images/kiri-atas.gif HTTP/1.1" 200 14697 MmTaUg00pdA00001fvkwsM4000 http://www.unipi.it MSIE+6.0 192.168.19.123 - - [16/Feb/2005:14:27:22 +0700] "GET /images/tengah-kiri.gif HTTP/1.1“ 200 2809 MmTaUg00pdA00001fvkwsM4000 http://www.unipi.it MSIE+6.0 192.168.19.123 - - [16/Feb/2005:14:27:22 +0700] "GET /images/tengah-tengah.gif HTTP/1.1" 200 27180 MmTaUg00pdA00001fvkwsM4000 http://www.unipi.it MSIE+6.0

DATA LOG (Lanjutan) 192.168.19.123 -- [16/Feb/2005:14:27:22 +0700] “GET /libs/detail.html HTTP/1.1” 200 2809 MmTaUg00pdA00001fvkwsM4000 http://www.unipi.it MSIE+6.0 IP address pengguna informasi waktu pengguna melakukan request menunjukkan metode request halaman yang diminta oleh pengguna Protokol yang digunakan status request yang berarti setuju dan besarnya data (byte) cookie dalam browser URL yang diminta pengguna browser yang digunakan pengguna

PREPROCESSING Tahapan Preprocessing (Cooley et al. 1999): data cleaning session identification transaction identification user identifcation path completion

Waktu Kunjungan Paling Lama HALAMAN TARGET Penentuan Halaman target (Srikant & Yang 2001) : Jelas Perbedaan halaman konten dan halaman isi Halaman Isi Halaman target Tidak Jelas Perbedaan halaman konten dan halaman isi Waktu Kunjungan Paling Lama Halaman target Pada Struktur Website Bertingkat Halaman target Leaf

MODEL PENCARIAN PENGGUNA 2B 2C 3A 3B 1 2 5 6 7 8 9 10 Website dan Model Pencarian (Srikant & Yang 2001)

METODE PENELITIAN

METODE PENELITIAN Input Data Penentuan Halaman Target Lokasi Harapan Penambahan Tabel Database Pengambilan Data Log Preprocessing Processing Visualisasi & Simulasi Input Data Penentuan Halaman Target Data cleaning User identification Session identification Path completion Transaction identifocation Lokasi Harapan Algoritme Optimasi

LINGKUP PENGEMBANGAN SISTEM Perangkat Keras Processor : Intel Pentium Dual CPU T2390 1.86 GHz Memory : 1 GB Harddisk : 120 GB Keyboard & mouse Perangkat Lunak : Microsoft ®Windows Vista Ultimate XAMPP Notepad++ Opera version 9.64

BATASAN –BATASAN SISTEM Data log yang digunakan sebagai input masih data log dari apache-server Format data log harus sesuai dengan contoh yaitu : 172.17.1.146 - - [20/Mar/2006:00:25:12 +0700] "GET /ipb-bhmn HTTP/1.1" 301 324 MmTaUg00pdA00001fvkwsM4000 Data Log harus berupa file teks Struktur website minimal mempunyai level minimal 4 Sistem tidak dapat digunakan oleh 2 orang atau lebih dalam waktu yang sama

HASIL DAN PEMBAHASAN

PENAMBAHAN TABEL DATABASE Tabel yang masih digunakan : tb_exp_locations tb_hsl_firstonly tb_hsl_optbenefit tb_temp Tabel tambahan : data_log url inputdata strukturview

PENGAMBILAN DATA LOG Data log yang digunakan adalah dari www.eramuslim.com => januari 2009 Data asli = 112.219 baris Partisi = 10.000 baris per file Ukuran per file rata-rata 1 MB Diambil 5 file untuk penelitian Asumsi Halaman Target (Srikant & Yang 2001) “ Halaman yang mempunyai level 4 dalam struktur website dan diambil hanya 15 halaman target yang paling banyak dikunjungi oleh pengunjung website”

PENGAMBILAN DATA LOG (lanjutan) Halaman Target yang dihasilkan : No Halaman Target 1 /berita/palestina/israel-gencatan-senjata-sepihak-gagal-tumbangkan-hamas.htm 2 /berita/palestina/hari-ke-21-22-pertemuan-doha-dunia-arab-bekukan-hubungan-dengan-israel.htm 3 /berita/dunia/ratusan-ribu-veterang-perang-irak-afghanistan-jadi-gelandangan.htm 4 /berita/analisa/perang-legitimasi.htm 5 /berita/analisa/kegagalan-israel-terhadap-palestina.htm 6 /berita/dunia/pejuang-hamas-fatah-bersatu-abbas-tolak-negosiasi-dengan-israel.htm 7 /berita/dunia/iran-bantu-gaza-bentuk-pasukan-islam-dan-hentikan-ekspor-minyak-ke-as.htm 8 /suara-langit/undangan-surga/merindukan-mati-syahid.htm 9 /berita/rss/int 10 /berita/dunia/petani-israel-rugi-besar-akibat-geraikan-boikot.htm 11 /berita/dunia/yusuf-qardawi-teruslah-turun-ke-jalan.htm 12 /berita/palestina/bangsa-arab-bersatu-untuk-gaza.htm 13 /berita/dunia/aktris-hollywood-boikot-pengusaha-yahudi-zionis-as.htm 14 /syariah/bercermin-salaf/kemenangan-islam-di-syam-iraq-dan-yaman.htm 15 /berita/tahukah-anda/siapa-sebenarnya-suharto-7.htm

DATA CLEANING Menghapus baris-baris dalam data log dimana url mengandung format gambar seperti jpg,jpeg,gif,JPG,JPEG dan GIF (Cooley et al. 1999) 192.168.19.123 - - [16/Feb/2005:14:27:22 +0700] "GET /libs/detail.html HTTP/1.1“ 404 296 MmTaUg00pdA00001fvkwsM4000 http://www.unipi.it MSIE+6.0 192.168.19.123 - - [16/Feb/2005:14:27:22 +0700] "GET /images/home-off.gif 192.168.19.123 - - [16/Feb/2005:14:27:22 +0700] "GET /libs/detail.html HTTP/1.1“ 404 296 MmTaUg00pdA00001fvkwsM4000 http://www.unipi.it MSIE+6.0

√ X USER IDENTIFICATION 192.168.19.123 192.168.19.123 192.168.28.13 192.168.59. 3

USER IDENTIFICATION (lanjutan) Alamat IP sudah mengalami pengkodean / enkripsi File 1 => 5.583 pengunjung File 2 => 5.399 pengunjung File 3 => 5.645 pengunjung File 4 => 5.665 pengunjung File 5 => 5.363 pengunjung Alamat IP 1123631938 1591339728 3399020594 2107729223 2033469383 3399016549 3399668931 3732719634 1916426500 2108061929 2107701710 1094176879 3395101756 168558991

SESSION IDENTIFICATION Penentuan Session (Catledge dan Pitkow 1995) : Terdapat informasi waktu dan lama kunjungan Terdapat cookie di dalam browser yang disimpan Time Out > 30 Menit Session Baru Cookie browser Session

SESSION IDENTIFICATION (lanjutan) Satu pengunjung dapat memiliki lebih dari satu session Namun satu session hanya dimiliki oleh satu pengunjung Alamat IP Session 990812105 22es2q9nc0llfb7nr4ep 979265853 05km6gkvas6tiqi8r0l1 974889972 0tssoih8scmc6s6mmmpe 974793278 011fri43ua48u32faqf4 703366272 21gkm2v62htb6elut8fk 703219349 2e42cst7rt4f62qojkbo 703179115 2q7t1btmq6cmo60l7du3 703178520 1cak1p26qtnblir11g3j 703178485 0u28dncll5s3gf8f491d 703177562 265td0sd2t812hreh4o5 02s8uep9h63gh19gca9s 703170954 0mtskrc0vpmattm1aotv 701150367 283hh86iih3gf40q2igj 644300602 1c1o19jh09t0t832ltgp

PATH COMPLETION Mengurutkan halaman kunjungan setiap pengguna dan setiap session Contoh : 172.17.0.172 MmTaUg00pdA00001fvkwsM4000 => 1,2,7,17,7,18,7,2,6,14 172.17.0.123 Mhljljuadjnfalsd0970800ad35fadf => 1,4,10,25,10

PATH COMPLETION (lanjutan) Contoh hasil dari Path Completion : Alamat IP Session Urutan Tingkah Laku Pengunjung 1009956329 2jnbr1cna7uma0dat0aj /search/?keyword=alat+musik,/search/?keyword=alat+musik&searchB utton.x=11&searchButton.y=10,/berita/palestina/hari-ke-21-22- pertemuan-doha-dunia-arab-bekukan-hubungan-dengan- israel.htm,/berita/dunia/krisis-gaza-israel-as-tandatangani- kesepakatan-sepihak.htm 1009985486 0m41nrh2kir9r8ob7uu5 /berita/palestina/israel-gencatan-senjata-sepihak-gagal-tumbangkan- hamas.htm 1010047370 1b3c5gvae55fk7f9kgvk /berita/dunia/aktris-hollywood-boikot-pengusaha-yahudi-zionis-as.htm 1010162336 0j5ktdttvvvipua1aqtt /suara-kita/pemuda-mahasiswa/sinkronisasi-moral-mencegah- korupsi.htm,/berita/palestina/israel-gencatan-senjata-sepihak-gagal- tumbangkan-hamas.htm,/suara-kita/pemuda-mahasiswa/sinkronisasi- moral-mencegah-korupsi.htm 1010165768 2blsgodfcev4qkss254k /berita/dunia/ratusan-ribu-veterang-perang-irak-afghanistan-jadi- gelandangan.htm,/ustadz-menjawab/membenci-yahudi.htm,/suara- kita/suara-pembaca/komentar-siapa-sebenarnya-soeharto.htm,/suara- kita/suara-pembaca/resolusi-1860-bukti-nyata-pengecutnya- penguasa.htm 1023754567 2hl116me7gieqsjju3pt

TRANSACTION IDENTIFICATION Setelah pengguna menemukan halaman target dan masih melanjutkan pencarian, maka menjadi sebuah transaksi baru Contoh : 172.17.0.172 MmTaUg00pdA00001fvkwsM4000 => 1,2,7,17,7,18,7,2,6,14 172.17.0.172 MmTaUg00pdA00001fvkwsM4000 => 1,2,7,17, 172.17.0.172 MmTaUg00pdA00001fvkwsM4000 => 7,18, 172.17.0.172 MmTaUg00pdA00001fvkwsM4000 => 7,2,6,14

TRANSACTION IDENTIFICATION (lanjutan) Contoh hasil dari Transaction Identification : Alamat IP Urutan Tingkah Laku Pengunjung 32719939 /berita/dakwah-mancanegara/yahudi-as-pindah-ke-israel-dan-masuk- islam.htm,/berita/analisa/israel-menggali-kuburnya-sendiri.htm,/berita/analisa/perang- legitimasi.htm 3732704554 /berita/dunia/aktris-hollywood-boikot-pengusaha-yahudi-zionis-as.htm 3411020548 /berita/palestina/israel-gencatan-senjata-sepihak-gagal-tumbangkan-hamas.htm /berita/dunia/petani-israel-rugi-besar-akibat-geraikan-boikot.htm /berita/palestina/hari-ke-21-22-pertemuan-doha-dunia-arab-bekukan-hubungan-dengan- israel.htm 3400937929 /berita/palestina/hamas-hancurkan-tujuh-tank-zionis.htm,/berita/dunia/iran-bantu-gaza- bentuk-pasukan-islam-dan-hentikan-ekspor-minyak-ke-as.htm 3399000550 /berita/analisa/perang-legitimasi.htm /berita/dunia/bantai-warga-irak-lima-tentara-bayaran-as-siap- diadili.htm,/berita/dunia/ratusan-ribu-veterang-perang-irak-afghanistan-jadi-gelandangan.htm 3398968658 3398682338 //berita/dunia/rss,/berita/dunia/yusuf-qardawi-teruslah-turun-ke-jalan.htm //berita/dunia/rss,/berita/dunia/pejuang-hamas-fatah-bersatu-abbas-tolak-negosiasi-dengan- israel.htm

PROCESSING Pencarian Lokasi Harapan (E1,E2,E3,E4) menggunakan Algoritme Find Expectation Location Penentuan Rekomendasi Halaman menggunakan 2 algoritme : Algoritme FirstOnly Algoritme OptimizeBenefit

PROCESSING Algoritme Find Expectation Location tidak menghasilkan lokasi harapan Jika tidak ada lokasi harapan maka Algoritme FirstOnly dan OptimizeBenefit juga tidak akan menghasilkan halaman rekomendasi Penyebab : 1. Karakteristik data (data dummy dan data log) 2. Path Completion yang terlalu pendek 3. Sudah ada hyperlink di halaman utama ke halaman target

VISUALISASI

VISUALISASI (lanjutan) Pengujian visualisasi menggunakan hasil akhir penelitian Nurdian Setyawan (2008) yang menggunakan data dummy Algoritme FirstOnly dan OptimizeBenefit dengan nilai threshold 37 dan minsup 7%

VISUALISASI (lanjutan) Tabel hasil algoritme FirstOnly No Target Rek Page Support Hits % 1 20 4 39 7.8% 2 25 3 37 9.1% 26 10 44 10.4% 27 5 38 10.6% 9.4%

VISUALISASI (lanjutan) Tabel hasil algoritme OptimizeBenefit No Target Rek Page Support Hits % 1 17 5 39 7.5% 2 3 37 7.1% 19 42 7.9% 4 40 9 41 7.7% 6 20 44 7.8% 7 24 11 46 8.6% 8 25 48 9.1% 10 No Target Rek Page Support Hits % 11 26 10 59 10.4% 12 2 43 7.6% 13 27 5 56 10.6% 14 3 50 9.4% 15 49 9.2% 16 8.1% 17 28 4 41 18 38 7.1% 19 20 29 44 7.7%

VISUALISASI (lanjutan)

KESIMPULAN Penelitian ini telah berhasil melakukan tahapan preprocessing dengan menggunakan data log asli website yang disimpan dalam bentuk database mysql Penelitian dengan data log yang digunakan tidak menghasilkan halaman rekomendasi Penelitian mampu memvisualisasikan struktur website yang dinamis

SARAN Sistem ini perlu dicoba dengan menggunakan data dari beberapa website lain (dinamis maupun statis) yang sudah dapat dibedakan halaman targetnya

TERIMA KASIH