Presentasi sedang didownload. Silahkan tunggu

Presentasi sedang didownload. Silahkan tunggu

Information Extraction & NER

Presentasi serupa


Presentasi berjudul: "Information Extraction & NER"— Transcript presentasi:

1 Information Extraction & NER
Naive Bayes Based NER Information Extraction & NER

2 Naive Bayes Based NER D1 : Santika akan pergi ke Bali bersama Supriadi
D2 : Hotel Santika berada di Jalan Merapi D3 : Supriadi menginap di Hotel Santika sebelum berangkat untuk mendaki Merapi D4 : Jalan Merapi macet sampai Jalan Supriadi

3 Naive Bayes Based NER D1 : Santika akan pergi ke Bali bersama Supriadi
D2 : Hotel Santika berada di Jalan Merapi D3 : Supriadi menginap di Hotel Santika sebelum berangkat ke Merapi Center D4 : Jalan Merapi macet sampai Jalan Supriadi

4 Naive Bayes Based NER Nama Person : Santika, Supriadi, Supriadi
Nama Organisasi : Santika, Santika, Merapi Nama Lokasi : Merapi, Merapi, Bali, Supriadi

5 Naive Bayes Based NER D5 : Supriadi akan menginap di Hotel Santika

6 Multinomial Naive Bayes
Nama Person (P) : Santika, Supriadi, Supriadi Nama Organisasi (O) : Santika, Santika, Merapi Nama Lokasi (L) : Merapi, Merapi, Bali, Supriadi D5 : Supriadi akan menginap di Hotel Santika

7 Multinomial Naive Bayes
W adalah kata C adalah kategori P(c I w) : Peluang kategori c dengan syarat muncul kata w P(c) : Peluang munculnya kategori c P(w) : Peluang munculnya kata w

8 Multinomial Naive Bayes
Karena nilai P(w) selalu sama, bisa juga dituliskan menjadi cukup : P(w | c)* P(c)

9 Multinomial Naive Bayes
P(w|c) : Peluang munculnya kata w dengan syarat muncul kategori c P(c) : Peluang kemunculan kategori c Count(w,c) : jumlah kata w pada kategori c Count (c) : jumlah seluruh kata pada kategori c |V| : jumlah kata-kata yang unik dalam seluruh dokumen

10 Multinomial Naive Bayes
Nama Person (P) : Santika, Supriadi, Supriadi Nama Organisasi (O) : Santika, Santika, Merapi Nama Lokasi (L) : Merapi, Merapi, Bali, Supriadi D5 : Supriadi akan menginap di Hotel Santika P(P)=1/3, P(O)=1/3, P(L) = 1/3 P(Supriadi | P) = (2)/(3+4) = 2/7 P(Supriadi | O) = (0)/(3+4) = 0/7 P(Supriadi | L) = (1)/(4+4) = 1/8

11 Multinomial Naive Bayes
Nama Person (P) : Santika, Supriadi, Supriadi Nama Organisasi (O) : Santika, Santika, Merapi Nama Lokasi (L) : Merapi, Merapi, Bali, Supriadi D5 : Supriadi akan menginap di Hotel Santika P(P)=1/3, P(O)=1/3, P(L) = 1/3

12 Multinomial Naive Bayes
Terbukti bahwa P(Supriadi) tidak perlu dihitung untuk mencari kelas yang memiliki peluang terbesar. Sehingga cukup memakai rumus

13 Multinomial Naive Bayes
Karena kelas P memiliki peluang terbesar, maka Supriadi masuk ke Entitas Nama Person (P)

14 Multinomial Naive Bayes
Nama Person (P) : Santika, Supriadi, Supriadi Nama Organisasi (O) : Santika, Santika, Merapi Nama Lokasi (L) : Merapi, Merapi, Bali, Supriadi D5 : Supriadi akan menginap di Hotel Santika P(akan | P) = (0)/(3+4) = 0 P(akan | O) = (0)/(3+4) = 0 P(akan | L) = (0)/(4+4) = 0

15 Multinomial Naive Bayes
Nama Person (P) : Santika, Supriadi, Supriadi Nama Organisasi (O) : Santika, Santika, Merapi Nama Lokasi (L) : Merapi, Merapi, Bali, Supriadi D5 : Supriadi akan menginap di Hotel Santika P(P | akan) = P(akan | P) * P(P) = 0 *1/3 = 0 P(O | akan) = P(akan | O) * P(O) = 0 *1/3 = 0 P(L | akan) = P(akan | L) * P(L) = 0 *1/3 = 0 Maka kata akan tidak masuk ke Entitas manapun, begitu juga dengan kata menginap, di, dan Hotel

16 Multinomial Naive Bayes
Nama Person (P) : Santika, Supriadi, Supriadi Nama Organisasi (O) : Santika, Santika, Merapi Nama Lokasi (L) : Merapi, Merapi, Bali, Supriadi D5 : Supriadi akan menginap di Hotel Santika P(Santika | P) = (1)/(3+4) = 1/7 P(Santika | O) = (2)/(3+4) = 2/7 P(Santika | L) = (0)/(4+4) = 0/8

17 Multinomial Naive Bayes
Nama Person (P) : Santika, Supriadi, Supriadi Nama Organisasi (O) : Santika, Santika, Merapi Nama Lokasi (L) : Merapi, Merapi, Bali, Supriadi D5 : Supriadi akan menginap di Hotel Santika P(P | Santika) = P(Santika | P)*P(P) = 1/7 * 1/3 = 1/21 P(O | Santika) = P(Santika | O)*P(O) = 2/7 * 1/3 = 2/21 P(L | Santika) = P(Santika | L)*P(L) = 0/8 * 1/3 = 0 Maka Santika masuk ke Entitas Nama Organisasi (O)


Download ppt "Information Extraction & NER"

Presentasi serupa


Iklan oleh Google