Presentasi sedang didownload. Silahkan tunggu

Presentasi sedang didownload. Silahkan tunggu

Information Extraction & NER

Presentasi serupa


Presentasi berjudul: "Information Extraction & NER"β€” Transcript presentasi:

1 Information Extraction & NER
Naive Bayes Based NER Information Extraction & NER

2 Naive Bayes Based NER D1 : Santika akan pergi ke Bali bersama Supriadi
D2 : Hotel Santika berada di Jalan Merapi D3 : Supriadi menginap di Hotel Santika sebelum berangkat untuk mendaki Merapi D4 : Jalan Merapi macet sampai Jalan Supriadi

3 Naive Bayes Based NER D1 : Santika akan pergi ke Bali bersama Supriadi
D2 : Hotel Santika berada di Jalan Merapi D3 : Supriadi menginap di Hotel Santika sebelum berangkat ke Merapi Center D4 : Jalan Merapi macet sampai Jalan Supriadi

4 Naive Bayes Based NER Nama Person : Santika, Supriadi, Supriadi
Nama Organisasi : Santika, Santika, Merapi Nama Lokasi : Merapi, Merapi, Bali, Supriadi

5 Naive Bayes Based NER D5 : Supriadi akan menginap di Hotel Santika

6 Multinomial Naive Bayes
Nama Person (P) : Santika, Supriadi, Supriadi Nama Organisasi (O) : Santika, Santika, Merapi Nama Lokasi (L) : Merapi, Merapi, Bali, Supriadi D5 : Supriadi akan menginap di Hotel Santika

7 Multinomial Naive Bayes
W adalah kata C adalah kategori P(c I w) : Peluang kategori c dengan syarat muncul kata w P(c) : Peluang munculnya kategori c P(w) : Peluang munculnya kata w

8 Multinomial Naive Bayes
Karena nilai P(w) selalu sama, bisa juga dituliskan menjadi cukup : P(w | c)* P(c)

9 Multinomial Naive Bayes
𝑃 𝑀|𝑐 = π‘π‘œπ‘’π‘›π‘‘(𝑀,𝑐) π‘π‘œπ‘’π‘›π‘‘(𝑐) Untuk menghindari adanya nilai 0 (nol), digunakan add-one or Laplace smoothing 𝑃 𝑀|𝑐 = π‘π‘œπ‘’π‘›π‘‘ 𝑀,𝑐 +1 π‘π‘œπ‘’π‘›π‘‘ 𝑐 +|𝑉|

10 Multinomial Naive Bayes
𝑃 𝑀|𝑐 = π‘π‘œπ‘’π‘›π‘‘ 𝑀,𝑐 +1 π‘π‘œπ‘’π‘›π‘‘ 𝑐 +|𝑉| P(w|c) : Peluang munculnya kata w dengan syarat muncul kategori c P(c) : Peluang kemunculan kategori c Count(w,c) : jumlah kata w pada kategori c Count (c) : jumlah seluruh kata pada kategori c |V| : jumlah kata-kata yang unik dalam seluruh dokumen

11 Multinomial Naive Bayes
Nama Person (P) : Santika, Supriadi, Supriadi Nama Organisasi (O) : Santika, Santika, Merapi Nama Lokasi (L) : Merapi, Merapi, Bali, Supriadi D5 : Supriadi akan menginap di Hotel Santika P(P)=1/3, P(O)=1/3, P(L) = 1/3 P(Supriadi | P) = (2)+1/(3+4) = 3/7 P(Supriadi | O) = (0)+1/(3+4) = 1/7 P(Supriadi | L) = (1)+1/(4+4) = 2/8

12 Multinomial Naive Bayes
Nama Person (P) : Santika, Supriadi, Supriadi Nama Organisasi (O) : Santika, Santika, Merapi Nama Lokasi (L) : Merapi, Merapi, Bali, Supriadi D5 : Supriadi akan menginap di Hotel Santika P(P)=1/3, P(O)=1/3, P(L) = 1/3 𝑷 𝑷|π‘Ίπ’–π’‘π’“π’Šπ’‚π’…π’Š = 𝑷 π‘Ίπ’–π’‘π’“π’Šπ’‚π’…π’Š|𝑷 βˆ—π‘·(𝑷) 𝑷 π‘Ίπ’–π’‘π’“π’Šπ’‚π’…π’Š = πŸ‘/πŸ•βˆ—πŸ/πŸ‘ 𝑷 π‘Ίπ’–π’‘π’“π’Šπ’‚π’…π’Š = πŸ‘/𝟐𝟏 𝑷 π‘Ίπ’–π’‘π’“π’Šπ’‚π’…π’Š 𝑷 𝑢|π‘Ίπ’–π’‘π’“π’Šπ’‚π’…π’Š = 𝑷 π‘Ίπ’–π’‘π’“π’Šπ’‚π’…π’Š|𝑢 βˆ—π‘·(𝑢) 𝑷 π‘Ίπ’–π’‘π’“π’Šπ’‚π’…π’Š = 𝟏/πŸ•βˆ—πŸ/πŸ‘ 𝑷 π‘Ίπ’–π’‘π’“π’Šπ’‚π’…π’Š = 𝟏/𝟐𝟏 𝑷 π‘Ίπ’–π’‘π’“π’Šπ’‚π’…π’Š 𝑷 𝑳|π‘Ίπ’–π’‘π’“π’Šπ’‚π’…π’Š = 𝑷 π‘Ίπ’–π’‘π’“π’Šπ’‚π’…π’Š|𝑳 βˆ—π‘·(𝑳) 𝑷 π‘Ίπ’–π’‘π’“π’Šπ’‚π’…π’Š = 𝟐/πŸ–βˆ—πŸ/πŸ‘ 𝑷 π‘Ίπ’–π’‘π’“π’Šπ’‚π’…π’Š = 𝟐/πŸπŸ’ 𝑷 π‘Ίπ’–π’‘π’“π’Šπ’‚π’…π’Š

13 Multinomial Naive Bayes
𝑷 𝑷|π‘Ίπ’–π’‘π’“π’Šπ’‚π’…π’Š = 𝑷 π‘Ίπ’–π’‘π’“π’Šπ’‚π’…π’Š|𝑷 βˆ—π‘·(𝑷) 𝑷 π‘Ίπ’–π’‘π’“π’Šπ’‚π’…π’Š = πŸ‘/πŸ•βˆ—πŸ/πŸ‘ 𝑷 π‘Ίπ’–π’‘π’“π’Šπ’‚π’…π’Š = πŸ‘/𝟐𝟏 𝑷 π‘Ίπ’–π’‘π’“π’Šπ’‚π’…π’Š 𝑷 𝑢|π‘Ίπ’–π’‘π’“π’Šπ’‚π’…π’Š = 𝑷 π‘Ίπ’–π’‘π’“π’Šπ’‚π’…π’Š|𝑢 βˆ—π‘·(𝑢) 𝑷 π‘Ίπ’–π’‘π’“π’Šπ’‚π’…π’Š = 𝟏/πŸ•βˆ—πŸ/πŸ‘ 𝑷 π‘Ίπ’–π’‘π’“π’Šπ’‚π’…π’Š = 𝟏/𝟐𝟏 𝑷 π‘Ίπ’–π’‘π’“π’Šπ’‚π’…π’Š 𝑷 𝑳|π‘Ίπ’–π’‘π’“π’Šπ’‚π’…π’Š = 𝑷 π‘Ίπ’–π’‘π’“π’Šπ’‚π’…π’Š|𝑳 βˆ—π‘·(𝑳) 𝑷 π‘Ίπ’–π’‘π’“π’Šπ’‚π’…π’Š = 𝟐/πŸ–βˆ—πŸ/πŸ‘ 𝑷 π‘Ίπ’–π’‘π’“π’Šπ’‚π’…π’Š = 𝟐/πŸπŸ’ 𝑷 π‘Ίπ’–π’‘π’“π’Šπ’‚π’…π’Š Terbukti bahwa P(Supriadi) tidak perlu dihitung untuk mencari kelas yang memiliki peluang terbesar. Sehingga cukup memakai rumus

14 Multinomial Naive Bayes
𝑷 𝑷|π‘Ίπ’–π’‘π’“π’Šπ’‚π’…π’Š =𝑷 π‘Ίπ’–π’‘π’“π’Šπ’‚π’…π’Š|𝑷 βˆ—π‘· 𝑷 = πŸ‘ πŸ• βˆ— 𝟏 πŸ‘ = πŸ‘ 𝟐𝟏 𝑷 𝑢|π‘Ίπ’–π’‘π’“π’Šπ’‚π’…π’Š =𝑷 π‘Ίπ’–π’‘π’“π’Šπ’‚π’…π’Š|𝑢 βˆ—π‘· 𝑢 = 𝟏 πŸ• βˆ— 𝟏 πŸ‘ = 𝟏 𝟐𝟏 𝑷 𝑳|π‘Ίπ’–π’‘π’“π’Šπ’‚π’…π’Š =𝑷 π‘Ίπ’–π’‘π’“π’Šπ’‚π’…π’Š|𝑳 βˆ—π‘· 𝑳 = 𝟐 πŸ– βˆ— 𝟏 πŸ‘ = 𝟐 πŸπŸ’ Karena kelas P memiliki peluang terbesar, maka Supriadi masuk ke Entitas Nama Person (P)

15 Multinomial Naive Bayes
Nama Person (P) : Santika, Supriadi, Supriadi Nama Organisasi (O) : Santika, Santika, Merapi Nama Lokasi (L) : Merapi, Merapi, Bali, Supriadi D5 : Supriadi akan menginap di Hotel Santika P(akan | P) = (0)+1/(3+4) = 1/7 P(akan | O) = (0)+1/(3+4) = 1/7 P(akan | L) = (0)+1/(4+4) = 1/8

16 Multinomial Naive Bayes
Nama Person (P) : Santika, Supriadi, Supriadi Nama Organisasi (O) : Santika, Santika, Merapi Nama Lokasi (L) : Merapi, Merapi, Bali, Supriadi D5 : Supriadi akan menginap di Hotel Santika P(P | akan) = P(akan | P) * P(P) = 1/7 *1/3 = 1/21 P(O | akan) = P(akan | O) * P(O) = 1/7 *1/3 = 1/21 P(L | akan) = P(akan | L) * P(L) = 1/8 *1/3 = 1/24 Maka kata akan masuk ke Entitas Person atau Organisasi

17 Multinomial Naive Bayes
Nama Person (P) : Santika, Supriadi, Supriadi Nama Organisasi (O) : Santika, Santika, Merapi Nama Lokasi (L) : Merapi, Merapi, Bali, Supriadi D5 : Supriadi akan menginap di Hotel Santika P(Santika | P) = (1)+1/(3+4) = 2/7 P(Santika | O) = (2)+1/(3+4) = 3/7 P(Santika | L) = (0)+1/(4+4) = 1/8

18 Multinomial Naive Bayes
Nama Person (P) : Santika, Supriadi, Supriadi Nama Organisasi (O) : Santika, Santika, Merapi Nama Lokasi (L) : Merapi, Merapi, Bali, Supriadi D5 : Supriadi akan menginap di Hotel Santika P(P | Santika) = P(Santika | P)*P(P) = 2/7 * 1/3 = 2/21 P(O | Santika) = P(Santika | O)*P(O) = 3/7 * 1/3 = 3/21 P(L | Santika) = P(Santika | L)*P(L) = 1/8 * 1/3 = 1/24 Maka Santika masuk ke Entitas Nama Organisasi (O)


Download ppt "Information Extraction & NER"

Presentasi serupa


Iklan oleh Google