Pengenalan Pola secara sintaktis (PPSint) Kuliah 6
Pengantar Pengenalan pola sintaktik dikenal juga dengan linguistik, gramatikal atau struktural Pengenalan pola sintaktik memerlukan struktur yang dapat dikenal sehingga penerapannya pada pola yang dikarakeristikkan dengan bentuk yang dapat dikenal seperti: huruf, khromosom, dll
Konsep dari Teori Bahasa Formal Teori ini mulai dikembangkan sejak pertengahan 1950, dengan pengembangan model matematik grammer oleh Noam Chomsky yang terkait dengan pekerjaannya dalam bidang bahasa alami. Tujuan semula adalah mengembangkan grammer komputasional yang mampu menggambarkan bahasa alami seperti bahasa inggris. melatih komputer menginterpretasikan bahasa natural untuk translasi dan problem solving
Definisi Konsep-konsep yang didefinisikan berikut ini memainkan peranan dalam studi tentang teori bahasa formal Alfabet adalah himpunan terhingga dari simbol. Kalimat adalah string panjang terhingga yang tersusun atas simbol. Misalnya diberikan alfabet {0, 1}, maka berikut ini adalah kalimat yang valid: {0, 1, 00, 01, 10, ...}.
Definisi .. Istilah string dan word juga digunakan untuk kalimat. Suatu kalimat tanpa simbol disebut kalimat kosong (So). Setiap alfabet V digunakan V* untuk menuliskan himpunan semua kalimat yang tersusun atas simbol dari V termasuk kalimat kosong.
Definisi .. Simbol V+ menyatakan himpunan kalimat V* ―so. Misalnya diberikan V={a,b}, maka akan didapat V* ={ so , a, b, aa, ab, bb, ...} dan V+ ={a, b, aa, ab, bb, ...}. Bahasa adalah himpunan kalimat pada suatu alfabet. Dalam bahasa alami bahwa studi teori bahasa formal harus terfokus pada grammar dan sifatnya.
Definisi.. Definisi grammar sebagai fourtuple: G= (VN, VT, P, S) dengan, VN : himpunan non terminal (variabel) VT : himpunan terminal (konstanta) P : himpunan produksi atau aturan penulisan S : awal atau akar simbol
Tinjau kalimat sederhana ”The boy runs” Tinjau kalimat sederhana ”The boy runs”. Maka struktur pohon semantiknya untuk produksi atau aturan penulisan adalah:
Pembuatan sebuah kalimat Konsep abstrak yang disebut <sentence> yang merupakan konsep sintaktik <sentence> diganti dengan <noun phrase> + <verb phrase>. Aturan penulisan <noun phrase> diubah menjadi <article> + <noun> dan <verb phrase> diubah menjadi <intransitive verb>. Memetakann <article> menjadi “the”, <noun> menjadi “boy” dan <instransitive verb> menjadi “runs” ( menghasilkan kalimat yang diinginkan)
Nonterminal dari G sesuai dengan kategori sintaktik <noun phrase> , <verb phrase>, <article>, <noun>, dst. Terminal sesuai dengan kata “the”, “boy”, dan “runs” Bahasa yang dihasilkan oleh G dinotasikan dengan L(G) adalah himpunan string yang memenuhi dua syarat Setiap string hanya tersusun atas terminal (yakni setiap string adalah kalimat terminal) Setiap string dapat diturunkan dari S dengan penerapan produksi yang cocok dari himpunan P
Contoh Tinjau grammar G= (VN, VT, P, S) dengan VN = {s}, VT = {a, b} dan P = {S → aSb, S → ab}. Bila produksi diterapkan m-1, diperoleh dengan penerapan produksi kedua menghasilkan string
Contoh… Bahasa yang dihasilkan oleh grammar terlihat hanya terdiri atas string tipe ini, dimana panjang string tergantung pada m. L(G) dalam bentuk: grammar yang sederhana mampu menghasilkan bahasa dengan string atau kalimat tak terhingga
Tipe Grammar Pada dasarnya bentuk berbagai grammar adalah sama yakni G= (VN, VT, P, S), yang membedakan hanya tipe produksi masing-masing
Tipe produksi unrestricted grammar mempunyai bentuk produksi α→ β dengan α adalah string didalam V+ dan β adalah string didalam V* context-sensitive grammar mempunyai bentuk produksi, dengan, α1 dan α2 didalam V* β didalam V+ A didalam VN Definisi alternatif adalah α→ β dengan α dan β didalam V+ dan panjang α tidak melampaui β.
Tipe produksi Context-free grammar, mempunyai bentuk produksi, A→ β dengan, A didalam VN dan β didalam V+ Regular (finite state grammar) mempunyai bentuk produksi, A→ aB atau A→ a dengan, A dan B adalah variabel didalam VN dan a adalah terminal didalam VT Produksi alternatif yang valid adalah A→ Ba atau A→ a
Tipe produksi Linear grammar, adalah bila setiap produksi suatu contex free grammar adalah dalam bentuk A→ xBw atau A→ w, dengan, A dan B adalah string non terminal x dan w adalah string terminal