Syarifah Hanum M
Crawling Indexing Searching DB Sipder DB Word DB Cari
For i=1 to n (Banyaknya URL di DB) If URL > 2 hari then delete For i=1 to n (Banyaknya URL di DB) Ambil URL di DataBase Baca URL per baris j=0 to m (akhir baris) Baca URL per karakter k=0 to p (karakter terakhir tiap baris) If karakter =href Hasil=simpan baris Buang karakter depan Buang karakter belakang Buang tulisan “_files” Buang tulisan “_index” If karakter awal hasil >< http hasil2=url+hasil If hasil2 diakhiri dengan ico,css,pdf… hasil2 tidak disimpan Else Cek apakah hasil2 sudah ada di DB If sudah ada update Else insert
For i=0 to n (n= banyak url di DB spider) Ambil alamat url dari spider fopen=alamat url Baca per baris Explode string dengan karakter “<“ Gabung karakter2 hasil step sebelumnya Explode string dengan karakter lainnya (kecuali spasi) Gabung karakter2 hasil step sebelumnya Replace spasi dengan “#?!” Explode string dengan karakter “#?!“ Cek tabel word If alamat=“” & karakter[i]=“” Insert karakter & alamat tsb & jum=1. Else (sudah ada) Jum=jum+1;
Insert keyword Pecah keyword (pemecah = spasi) Simpan di aray For i=1 to n (banyaknya kata kunci) Cek ketersediaan di tabel cari Jika belum ada insert Jika sudah jumlah =keyword[‘jum’]+ca ri[‘jum’]; Tampilkan hasil (DB cari) order by jum DESC;