Upload presentasi
Presentasi sedang didownload. Silahkan tunggu
1
Information Extraction & NER
Naive Bayes Based NER Information Extraction & NER
2
Naive Bayes Based NER D1 : Santika akan pergi ke Bali bersama Supriadi
D2 : Hotel Santika berada di Jalan Merapi D3 : Supriadi menginap di Hotel Santika sebelum berangkat untuk mendaki Merapi D4 : Jalan Merapi macet sampai Jalan Supriadi
3
Naive Bayes Based NER D1 : Santika akan pergi ke Bali bersama Supriadi
D2 : Hotel Santika berada di Jalan Merapi D3 : Supriadi menginap di Hotel Santika sebelum berangkat ke Merapi Center D4 : Jalan Merapi macet sampai Jalan Supriadi
4
Naive Bayes Based NER Nama Person : Santika, Supriadi, Supriadi
Nama Organisasi : Santika, Santika, Merapi Nama Lokasi : Merapi, Merapi, Bali, Supriadi
5
Naive Bayes Based NER D5 : Supriadi akan menginap di Hotel Santika
6
Multinomial Naive Bayes
Nama Person (P) : Santika, Supriadi, Supriadi Nama Organisasi (O) : Santika, Santika, Merapi Nama Lokasi (L) : Merapi, Merapi, Bali, Supriadi D5 : Supriadi akan menginap di Hotel Santika
7
Multinomial Naive Bayes
W adalah kata C adalah kategori P(c I w) : Peluang kategori c dengan syarat muncul kata w P(c) : Peluang munculnya kategori c P(w) : Peluang munculnya kata w
8
Multinomial Naive Bayes
Karena nilai P(w) selalu sama, bisa juga dituliskan menjadi cukup : P(w | c)* P(c)
9
Multinomial Naive Bayes
π π€|π = πππ’ππ‘(π€,π) πππ’ππ‘(π) Untuk menghindari adanya nilai 0 (nol), digunakan add-one or Laplace smoothing π π€|π = πππ’ππ‘ π€,π +1 πππ’ππ‘ π +|π|
10
Multinomial Naive Bayes
π π€|π = πππ’ππ‘ π€,π +1 πππ’ππ‘ π +|π| P(w|c) : Peluang munculnya kata w dengan syarat muncul kategori c P(c) : Peluang kemunculan kategori c Count(w,c) : jumlah kata w pada kategori c Count (c) : jumlah seluruh kata pada kategori c |V| : jumlah kata-kata yang unik dalam seluruh dokumen
11
Multinomial Naive Bayes
Nama Person (P) : Santika, Supriadi, Supriadi Nama Organisasi (O) : Santika, Santika, Merapi Nama Lokasi (L) : Merapi, Merapi, Bali, Supriadi D5 : Supriadi akan menginap di Hotel Santika P(P)=1/3, P(O)=1/3, P(L) = 1/3 P(Supriadi | P) = (2)+1/(3+4) = 3/7 P(Supriadi | O) = (0)+1/(3+4) = 1/7 P(Supriadi | L) = (1)+1/(4+4) = 2/8
12
Multinomial Naive Bayes
Nama Person (P) : Santika, Supriadi, Supriadi Nama Organisasi (O) : Santika, Santika, Merapi Nama Lokasi (L) : Merapi, Merapi, Bali, Supriadi D5 : Supriadi akan menginap di Hotel Santika P(P)=1/3, P(O)=1/3, P(L) = 1/3 π· π·|πΊππππππ
π = π· πΊππππππ
π|π· βπ·(π·) π· πΊππππππ
π = π/πβπ/π π· πΊππππππ
π = π/ππ π· πΊππππππ
π π· πΆ|πΊππππππ
π = π· πΊππππππ
π|πΆ βπ·(πΆ) π· πΊππππππ
π = π/πβπ/π π· πΊππππππ
π = π/ππ π· πΊππππππ
π π· π³|πΊππππππ
π = π· πΊππππππ
π|π³ βπ·(π³) π· πΊππππππ
π = π/πβπ/π π· πΊππππππ
π = π/ππ π· πΊππππππ
π
13
Multinomial Naive Bayes
π· π·|πΊππππππ
π = π· πΊππππππ
π|π· βπ·(π·) π· πΊππππππ
π = π/πβπ/π π· πΊππππππ
π = π/ππ π· πΊππππππ
π π· πΆ|πΊππππππ
π = π· πΊππππππ
π|πΆ βπ·(πΆ) π· πΊππππππ
π = π/πβπ/π π· πΊππππππ
π = π/ππ π· πΊππππππ
π π· π³|πΊππππππ
π = π· πΊππππππ
π|π³ βπ·(π³) π· πΊππππππ
π = π/πβπ/π π· πΊππππππ
π = π/ππ π· πΊππππππ
π Terbukti bahwa P(Supriadi) tidak perlu dihitung untuk mencari kelas yang memiliki peluang terbesar. Sehingga cukup memakai rumus
14
Multinomial Naive Bayes
π· π·|πΊππππππ
π =π· πΊππππππ
π|π· βπ· π· = π π β π π = π ππ π· πΆ|πΊππππππ
π =π· πΊππππππ
π|πΆ βπ· πΆ = π π β π π = π ππ π· π³|πΊππππππ
π =π· πΊππππππ
π|π³ βπ· π³ = π π β π π = π ππ Karena kelas P memiliki peluang terbesar, maka Supriadi masuk ke Entitas Nama Person (P)
15
Multinomial Naive Bayes
Nama Person (P) : Santika, Supriadi, Supriadi Nama Organisasi (O) : Santika, Santika, Merapi Nama Lokasi (L) : Merapi, Merapi, Bali, Supriadi D5 : Supriadi akan menginap di Hotel Santika P(akan | P) = (0)+1/(3+4) = 1/7 P(akan | O) = (0)+1/(3+4) = 1/7 P(akan | L) = (0)+1/(4+4) = 1/8
16
Multinomial Naive Bayes
Nama Person (P) : Santika, Supriadi, Supriadi Nama Organisasi (O) : Santika, Santika, Merapi Nama Lokasi (L) : Merapi, Merapi, Bali, Supriadi D5 : Supriadi akan menginap di Hotel Santika P(P | akan) = P(akan | P) * P(P) = 1/7 *1/3 = 1/21 P(O | akan) = P(akan | O) * P(O) = 1/7 *1/3 = 1/21 P(L | akan) = P(akan | L) * P(L) = 1/8 *1/3 = 1/24 Maka kata akan masuk ke Entitas Person atau Organisasi
17
Multinomial Naive Bayes
Nama Person (P) : Santika, Supriadi, Supriadi Nama Organisasi (O) : Santika, Santika, Merapi Nama Lokasi (L) : Merapi, Merapi, Bali, Supriadi D5 : Supriadi akan menginap di Hotel Santika P(Santika | P) = (1)+1/(3+4) = 2/7 P(Santika | O) = (2)+1/(3+4) = 3/7 P(Santika | L) = (0)+1/(4+4) = 1/8
18
Multinomial Naive Bayes
Nama Person (P) : Santika, Supriadi, Supriadi Nama Organisasi (O) : Santika, Santika, Merapi Nama Lokasi (L) : Merapi, Merapi, Bali, Supriadi D5 : Supriadi akan menginap di Hotel Santika P(P | Santika) = P(Santika | P)*P(P) = 2/7 * 1/3 = 2/21 P(O | Santika) = P(Santika | O)*P(O) = 3/7 * 1/3 = 3/21 P(L | Santika) = P(Santika | L)*P(L) = 1/8 * 1/3 = 1/24 Maka Santika masuk ke Entitas Nama Organisasi (O)
Presentasi serupa
© 2024 SlidePlayer.info Inc.
All rights reserved.