Algoritma Pencarian String (String Matching)

Slides:



Advertisements
Presentasi serupa
Teori P, NP, dan NP-Complete
Advertisements

BAHASA REGULAR.
Algoritma Pencarian String (String Matching)
Algoritma Divide and Conquer
Algoritma Divide and Conquer
Bahan Kuliah IF3051 Strategi Algoritma Oleh: Rinaldi Munir
Searching Alpro-2.
Algoritma dan Pemrograman 2C
Algoritma Divide and Conquer
Sudoku IF3051 Strategi Algoritma.
STACK (TUMPUKAN).
Algoritma Brute Force Oleh: Rinaldi Munir
Bahan Kuliah IF5054 Kriptografi
Pertemuan 3 BAHASA REGULAR
TEORI BAHASA DAN AUTOMATA
Serangan Terhadap Kriptografi
Design and Analysis Algorithm
Algoritma Brute Force Oleh: Rinaldi Munir
Design and Analysis Algorithm
Kuliah 2 : Analisis Leksikal
Algoritma Divide and Conquer
Algoritma Brute Force (lanjutan)
Algoritma Brute Force Oleh: Rinaldi Munir
BAHASA REGULAR Bahasa Reguler Bahasa Reguler.
Fungsi String yang sering digunakan antara lain :  Left  untuk mengambil karakter dari sebelah kiri.  Mid  untuk mengambil karakter yang berada di.
Bahan Kuliah IF5054 Kriptografi
12-CRS-0106 REVISED 8 FEB 2013 CSG523/ Desain dan Analisis Algoritma Divide and Conquer Intelligence, Computing, Multimedia (ICM)
Algoritma Brute Force Oleh: Muhammad Musta’in ( )
Pengenalan Type Data Type data dapat dikelompokkan menjadi 2
Penyelidikan Operasi Penyelesaian Numerik
Algoritma Kriptografi Klasik
FUNGSI.
Perbandingan Algoritma Brute Force dan Depth First Search (DFS) dalam Kasus Travelling Salesman Problem (TSP) Ervin Yohannes ( )
4. Undecidabality (Bagian 1)
KOMPUTER DAN SISTEM INFORMASI Anifuddin Azis
Pengantar IF2091 Struktur Diskrit
Algoritma Brute Force.
Algoritma dan Pemrograman STRUKTUR PEMILIHAN (SELECTION) lanjutan
MATERI PERKULIAHAN ALGORITMA & PEMROGRAMAN
2. Review Teori Bahasa Formal dan Otomata
CSG3F3/ Desain dan Analisis Algoritma
Bahan Kuliah IF2211 Strategi Algoritma Oleh: Rinaldi Munir
MATERI PERKULIAHAN ANALISIS ALGORITMA
Algoritma Divide and Conquer
Analisa Algoritma (IF1282)
Algoritma Bruteforce (disarikan dari diktat Strategi Algoritma, Rinaldi Munir) Team Fasilkom.
TEKNIK PENURUNAN.
Pengenalan Type Data Type data dapat dikelompokkan menjadi 2
TEE 2103 Algoritma & Pemrograman
Analisa Algoritma : Pendahuluan
FORMAT CELL PADA MS. EXCEL
Pengantar A Matematika Diskrit
Rekursif- studi kasus.
Algoritma dan Pemrograman (Pertemuan 04)
ALGORITMA BRUTE FORCE Pertemuan 3.
Algoritma Brute Force.
Algoritma Runut-balik (Backtracking)
Algoritma Divide and Conquer
Algoritma dan Pemrograman STRUKTUR PEMILIHAN (SELECTION) lanjutan
Algoritma Divide and Conquer
Algoritma Divide and Conquer
Algoritma Divide and Conquer
Pengantar Matematika Diskrit
Algoritma Divide and Conquer
Pengantar IF2091 Struktur Diskrit
Pengantar Strategi Algoritma
Desain dan Analisis Algoritma
CONTOH SOAL m Q (m3/det) m/(n+1)
Pengantar Matematika Diskrit
THE PATTERN THE PATTERN.
Transcript presentasi:

Algoritma Pencarian String (String Matching) Bahan Kuliah IF3051 Strategi Algoritma Oleh: Rinaldi Munir

Persoalan pencarian string Diberikan: teks (text), yaitu (long) string yang panjangnya n karakter pattern, yaitu string dengan panjang m karakter (m < n) yang akan dicari di dalam teks. Carilah (find atau locate) lokasi pertama di dalam teks yang bersesuaian dengan pattern.

Contoh 1: Pattern: hari Teks: kami pulang hari kamis  target Contoh 2: Pattern: not Teks: nobody noticed him Contoh 3: Pattern: apa Teks: Siapa yang menjemput Papa dari kota Balikpapan?

Algoritma Brute Force Contoh 4: Teks: nobody noticed him Pattern: not s=0 not s=1 not s=2 not s=3 not s=4 not s=5 not s=6 not s=7 not

Contoh 5: Teks: 10010101001011110101010001 Pattern: 001011 10010101001011110101010001 s=0 001011 s=1 001011 s=2 001011 s=3 001011 s=4 001011 s=5 001011 s=6 001011 s=7 001011 s=8 001011

Kompleksitas algoritma brute-force: Kompleksitas kasus terbaik adalah O(n). Kasus terbaik terjadi jika yaitu bila karakter pertama pattern P tidak pernah sama dengan karakter teks T yang dicocokkan Pada kasus ini, jumlah perbandingan yang dilakukan paling banyak n kali misalnya: Teks: String ini berakhir dengan zz Pattern: zz

Kasus terburuk: m(n – m + 1) = O(mn) Teks: aaaaaaaaaaaaaaaaaaaaaaaaaaaaab Pattern: aaaab

Algoritma Knuth-Morris-Pratt (KMP) Dikembangkan oleh D. E. Knuth, bersama-sama dengan J. H. Morris dan V. R. Pratt. Pada algoritma brute force, setiap kali ditemukan ketidakcocokan pattern dengan teks, maka pattern digeser satu karakter ke kanan.

Sedangkan pada algoritma KMP, kita memelihara informasi yang digunakan untuk melakukan jumlah pergeseran. Algoritma KMP menggunakan informasi tersebut untuk membuat pergeseran yang lebih jauh, tidak hanya satu karakter seperti pada algoritma brute force.

123456789… Teks: bimbingan belajar atau bimbel Pattern: bimbel  j = 5 Pattern: bimbel j = 2

Definisi: Misalkan A adalah alfabet dan x = x1x2…xk adalah string yang panjangnya k yang dibentuk dari karakter-karakter di dalam alfabet A. Awalan (prefix) dari x adalah upa-string (substring) u dengan u = x1x2…xj – 1 , j  {1, 2, …, k } dengan kata lain, x diawali dengan u. Contoh 6. Misalkan x = abacab. Awalan dari x adalah: , a, ab, aba, abac, abaca

Akhiran  mempunyai panjang 0, ab mempunyai panjang 2, dan seterusnya. Akhiran (suffix) dari x adalah upa-string (substring) u dengan u = xj – b xj – b + 1 …xk , j  {1, 2, …, k} dengan kata lain, x di akhiri dengan v. Contoh 7. Misalkan x = abacab. Akhiran dari x adalah , b, ab, cab, acab, bacab Akhiran  mempunyai panjang 0, ab mempunyai panjang 2, dan seterusnya.

Pinggiran (border) dari x adalah upa-string r sedemikian sehingga r = x1x2…xj – 1 dan u = xj – b xj – b + 1 …xj , j  {1, 2, …, k} dengan kata lain, pinggiran dari x adalah upa-string yang keduanya awalan dan juga akhiran sebenarnya dari x. Contoh 8. Misalkan x = abacab. Pinggiran dari x adalah: , ab

Fungsi Pinggiran (Border Function)

Iterasi 1: ababbabaaba Contoh 7: T = ‘ababbabaaba’ dan P = ‘ababaa’ upastring yang cocok = abab, panjangnya = 4 pinggiran terpanjangnya = ab, panjangnya = 2 = b(4) jumlah pergeseran = 4 – 2 = 2 Iterasi 2: ababbabaaba’  j 1 2 3 4 5 6 P[j] a b b(j)

Contoh 8: b a c b a b a b a a b c b a T s a b a b a c a P q b a c b a k a b a b a Pq Longest prefix of Pq that is also a suffix of P5 is P3; so b[5]= 3 Pk a b a October 2003 Sanath Jayasena

Border Function i 1 2 3 4 5 6 7 8 9 10 P [i] a b c b[i] October 2003 October 2003 Sanath Jayasena

Kompleksitas Waktu Algoritma KMP Menghitung fungsi pinggiran : O(m), Pencarian string : O(n) Kompleksitas waktu algoritma KMP adalah O(m+n).