Information Extraction & NER Naive Bayes Based NER Information Extraction & NER
Naive Bayes Based NER D1 : Santika akan pergi ke Bali bersama Supriadi D2 : Hotel Santika berada di Jalan Merapi D3 : Supriadi menginap di Hotel Santika sebelum berangkat untuk mendaki Merapi D4 : Jalan Merapi macet sampai Jalan Supriadi
Naive Bayes Based NER D1 : Santika akan pergi ke Bali bersama Supriadi D2 : Hotel Santika berada di Jalan Merapi D3 : Supriadi menginap di Hotel Santika sebelum berangkat ke Merapi Center D4 : Jalan Merapi macet sampai Jalan Supriadi
Naive Bayes Based NER Nama Person : Santika, Supriadi, Supriadi Nama Organisasi : Santika, Santika, Merapi Nama Lokasi : Merapi, Merapi, Bali, Supriadi
Naive Bayes Based NER D5 : Supriadi akan menginap di Hotel Santika
Multinomial Naive Bayes Nama Person (P) : Santika, Supriadi, Supriadi Nama Organisasi (O) : Santika, Santika, Merapi Nama Lokasi (L) : Merapi, Merapi, Bali, Supriadi D5 : Supriadi akan menginap di Hotel Santika
Multinomial Naive Bayes W adalah kata C adalah kategori P(c I w) : Peluang kategori c dengan syarat muncul kata w P(c) : Peluang munculnya kategori c P(w) : Peluang munculnya kata w
Multinomial Naive Bayes Karena nilai P(w) selalu sama, bisa juga dituliskan menjadi cukup : P(w | c)* P(c)
Multinomial Naive Bayes P(w|c) : Peluang munculnya kata w dengan syarat muncul kategori c P(c) : Peluang kemunculan kategori c Count(w,c) : jumlah kata w pada kategori c Count (c) : jumlah seluruh kata pada kategori c |V| : jumlah kata-kata yang unik dalam seluruh dokumen
Multinomial Naive Bayes Nama Person (P) : Santika, Supriadi, Supriadi Nama Organisasi (O) : Santika, Santika, Merapi Nama Lokasi (L) : Merapi, Merapi, Bali, Supriadi D5 : Supriadi akan menginap di Hotel Santika P(P)=1/3, P(O)=1/3, P(L) = 1/3 P(Supriadi | P) = (2)/(3+4) = 2/7 P(Supriadi | O) = (0)/(3+4) = 0/7 P(Supriadi | L) = (1)/(4+4) = 1/8
Multinomial Naive Bayes Nama Person (P) : Santika, Supriadi, Supriadi Nama Organisasi (O) : Santika, Santika, Merapi Nama Lokasi (L) : Merapi, Merapi, Bali, Supriadi D5 : Supriadi akan menginap di Hotel Santika P(P)=1/3, P(O)=1/3, P(L) = 1/3
Multinomial Naive Bayes Terbukti bahwa P(Supriadi) tidak perlu dihitung untuk mencari kelas yang memiliki peluang terbesar. Sehingga cukup memakai rumus
Multinomial Naive Bayes Karena kelas P memiliki peluang terbesar, maka Supriadi masuk ke Entitas Nama Person (P)
Multinomial Naive Bayes Nama Person (P) : Santika, Supriadi, Supriadi Nama Organisasi (O) : Santika, Santika, Merapi Nama Lokasi (L) : Merapi, Merapi, Bali, Supriadi D5 : Supriadi akan menginap di Hotel Santika P(akan | P) = (0)/(3+4) = 0 P(akan | O) = (0)/(3+4) = 0 P(akan | L) = (0)/(4+4) = 0
Multinomial Naive Bayes Nama Person (P) : Santika, Supriadi, Supriadi Nama Organisasi (O) : Santika, Santika, Merapi Nama Lokasi (L) : Merapi, Merapi, Bali, Supriadi D5 : Supriadi akan menginap di Hotel Santika P(P | akan) = P(akan | P) * P(P) = 0 *1/3 = 0 P(O | akan) = P(akan | O) * P(O) = 0 *1/3 = 0 P(L | akan) = P(akan | L) * P(L) = 0 *1/3 = 0 Maka kata akan tidak masuk ke Entitas manapun, begitu juga dengan kata menginap, di, dan Hotel
Multinomial Naive Bayes Nama Person (P) : Santika, Supriadi, Supriadi Nama Organisasi (O) : Santika, Santika, Merapi Nama Lokasi (L) : Merapi, Merapi, Bali, Supriadi D5 : Supriadi akan menginap di Hotel Santika P(Santika | P) = (1)/(3+4) = 1/7 P(Santika | O) = (2)/(3+4) = 2/7 P(Santika | L) = (0)/(4+4) = 0/8
Multinomial Naive Bayes Nama Person (P) : Santika, Supriadi, Supriadi Nama Organisasi (O) : Santika, Santika, Merapi Nama Lokasi (L) : Merapi, Merapi, Bali, Supriadi D5 : Supriadi akan menginap di Hotel Santika P(P | Santika) = P(Santika | P)*P(P) = 1/7 * 1/3 = 1/21 P(O | Santika) = P(Santika | O)*P(O) = 2/7 * 1/3 = 2/21 P(L | Santika) = P(Santika | L)*P(L) = 0/8 * 1/3 = 0 Maka Santika masuk ke Entitas Nama Organisasi (O)