Upload presentasi
Presentasi sedang didownload. Silahkan tunggu
1
Distribusi Binomial
2
Pendahuluan Diantara sekian banyak distribusi barangkali distribusi normal merupakan distribusi yang secara luas banyak digunakan dalam berbagai penelitian. Banyak kejadian yang dapat dinyatakan dalam data hasil observasi per eksperimen yang mengikuti distribusi normal. Misalkan : tinggi badan, berat badan, isi sebuah botol, nilai hasil ujian dan lain-lain.
3
Definisi Distribusi Binomial adalah suatu distribusi probabilitas yang dapat digunakan bilamana suatu proses sampling dapat diasumsikan sesuai dengan proses Bernoulli. Misalnya, dalam perlemparan sekeping uang logam sebanyak 5 kali, hasil setiap ulangan mungkin muncul sisi gambar atau sisi angka. Begitu pula, bila kartu diambil berturut-turut, kita dapat memberi label "berhasil" bila kartu yang terambil adalah kartu merah atau ”gagal” bila yang terambil adalah kartu hitam. Ulangan-ulangan tersebut bersifat bebas dan peluang keberhasilan setiap ulangan tetap sama, yaitu sebesar 0,5..(Ronald E. Walpole)
4
Ciri-Ciri Distribusi Binomial
Percobaan diulang sebanyak n kali. Hasil setiap ulangan dapat dikategorikan ke dalam 2 kelas, misal : "BERHASIL" atau "GAGAL"; "YA" atau "TIDAK"; "SUCCESS" atau "FAILED"; Peluang berhasil / sukses dinyatakan dengan p dan dalam setiap ulangan nilai p tetap. peluang gagal dinyatakan dengan q, dimana q = 1 - p. Setiap ulangan bersifat bebas (independent) satu dengan yang lainnya. Percobaannya terdiri dari atas n ulangan (Ronald E. Walpole). Nilai n < 20 dan p > 0.05
5
Rumus Distribusi Binomial
b(x;n,p) = ncxpxqn-x dimana : x = 0,1,2,3,.....,n n = banyaknya ulangan x = banyaknya kerberhasilan dalam peubah acak x p = Peluang berhasil dalam setiap ulangan q = Peluang gagal, dimana q = 1 - p dalam setiap ulangan
6
Catatan : Agar anda mudah dalam membedakan p dengan q, anda harus dapat menetapkan mana kejadian SUKSES dan mana kejadian GAGAL. Anda dapat menetapkan bahwa kejadian yang menjadi pertanyaan atau ditanyakan adalah = kejadian SUKSES.
7
Contoh distribusi binomial :
Berdasarkan data biro perjalanan PT Mandala Wisata air, yang khusus menangani perjalanan wisata turis manca negara, 20% dari turis menyatakan sangat puas berkunjung ke Indonesia, 40% menyatakan puas, 25% menyatakan biasa saja dan sisanya menyatakan kurang puas. Apabila kita bertemu dengan 5 orang dari peserta wisata turis manca negara yang pernah berkunjung ke Indonesia, berapakah probabilitas : Paling banyak 2 diantaranya menyatakan sangat puas Paling sedikit 1 di antara menyatakan kurang puas Tepat 2 diantaranya menyatakan biasa saja
8
Jawab : X ≤ 2 Lihat tabel dan lakukan penjumlahan sebagai berikut : b(x; n, p) = b(0; 5, 0.20) + b(1; 5, 0.20) + b(2; 5, 0.20) = = atau b(x=0) = 5C0 (0.20)0 (0.80)5 = b(x=1) = 5C1 (0.20)0 (0.80)4 = b(x=2) = 5C2 (0.20)0 (0.80)3 = Maka hasil x = 2 adalah =
9
X ≥ 1 Lihat tabel dan lakukan penjumlahan sebagai berikut : b(1; 5, 0.15) + b(2; 5, 0.15) + b(3; 5, 0.15) + b(4; 5, 0.15) + b(5; 5, 0.15) = = X = 2 b(2; 5, 0.25) =
10
X = 2 X = 4 Lihat tabel dan lakukan penjumlahan sebagai berikut : b(2; 5, 0.40) + b(3; 5, 0.40) + b(4; 5, 0.40) = =
11
Analisis masing-masing point :
Sebanyak paling banyak 2 dari 5 orang dengan jumlah atau 94,28% yang menyatakan sangat puas adalah sangat besar. Paling sedikit 1 dari 5 orang (berarti semuanya) dengan jumlah 0,5563 atau 55,63% yang menyatakan kurang puas dapat dikatakan cukup besar (karena lebih dari 50%). Tepat 2 dari 5 orang yang menyatakan biasa saja dengan jumlah 0,2637 atau 26,37% adalah kecil (karena dibawah 50%). Ada 2 sampai 4 yang menyatakan puas dengan jumlah 0,6528% atau 65,28% dapat dikatakan cukup besar.
12
Analisis keseluruhan :
Presentase Jika diambil persentase terbesar tanpa memperhatikan jumlah X, maka persentase terbesar ada di point pertama (a) yaitu 94,28% yang menyatakan sangat puas. Hal tersebut menandakan banyak turis manca negara yang sangat menyukai Indonesia.
13
Nilai X Jika dilihat dari jumlah X, maka perlu diperhatikan point kedua (b). Jumlah X adalah paling sedikit 1 dari 5 orang (berarti X>=1) yaitu 55,63% yang menyatakan kurang puas. Hal tersebut berarti kelima (semua) turis manca negara kurang puas terhadap kunjungannya ke Indonesia.
14
Kepala bagian produksi PT SAMSUNG melaporkan bahwa rata - rata produksi televisi yang rusak setiap kali produksi adalah sebesar 15 %. Jika dari total produksi tersebut diambil secara acak sebanyak 4 buah televisi, berapakah perhitungan dengan nilai probabilitas 2 ?
15
Jawab : p ( rusak ) = 0,15, q ( baik ) = 0,85, x = 2, n = 4 Rumus : b ( x ; n ; p ) = nCx px q n-x b (x = 2 ; 4 ; 0,12 ) = 4C2 (0,15)2 (0,85)(4 - 2) = 0,0975
16
Analisis : Dengan jumlah 0,0975 atau 9,75% dari sampel acak sebanyak 4 buah televisi dan rata - rata produk rusak setiap kali produksi adalah sebesar 15%, dapat dikatakan kecil. Namun pada kenyataannya, meskipun dilihat secara persentase kecil (hanya 9,75%) yang namanya produk rusak harus tetap dikurangi atau bahkan dihilangkan untuk mengurangi kerugian.
17
Rata-Rata dan Ragam Distribusi Binomial
Rata-rata µ = n . p Ragam ð2 = n . p . q n : ukuran populasi p : peluang berhasil dalam setiap ulangan q : peluang gagal, dimana q = 1 - p dalam setiap ulangan
18
Contoh Rata - rata dan Ragam Distribusi Binomial : Untuk b (5; 5, 20) dimana x = 5, n = 5 dan p = q = 1-p ; q = = sehingga q = maka : µ = 5 X 0.20 = 1 ð2 = 5 X 0.20 X 0.8 = 0.80 ð = √0.80 =
20
Metode Bayes
21
Mengapa Metode Bayes Metode Bayes ini merupakan metode yang baik di dalam mesin pembelajaran berdasarkan data training, dengan menggunakan probabilitas bersyarat sebagai dasarnya.
22
Probabilitas Bersyarat
X Y XY S Probabilitas X di dalam Y adalah probabilitas interseksi X dan Y dari probabilitas Y, atau dengan bahasa lain P(X|Y) adalah prosentase banyaknya X di dalam Y
23
Probabilitas Bersyarat Dalam Data
# Cuaca Temperatur Kecepatan Angin Berolah-raga 1 Cerah Normal Pelan Ya 2 3 Hujan Tinggi Tidak 4 Kencang 5 6 Banyaknya data berolah-raga=ya adalah 4 dari 6 data maka dituliskan P(Olahraga=Ya) = 4/6 Banyaknya data cuaca=cerah dan berolah-raga=ya adalah 4 dari 6 data maka dituliskan P(cuaca=cerah dan Olahraga=Ya) = 4/6
24
Distribusi Bersama dan Distribusi Marginal
Dari 100 orang mahasiswa menunjukkan 20 orang mahasiswa menyukai keduanya, 30 orang mahasiswa menyukai bulu tangkis tapi tidak menyukai bola volley, 40 orang mahasiswa menyukai bola volley tapi tidak menyukai bulu tangkis, dan 10 orang mahasiswa tidak menyukai kuduanya. Dari data ini dapat disusun bentuk distribusi bersama sebagai berikut: Suka bulu tangkis (X) Suka bola volley (Y) P(X) Ya Tidak 0.2 0.3 0.5 0.4 0.1 P(Y) 0.6 1 Distribusi Bersama Distribusi Marginal X dan Y
25
Probabilitas Bersyarat Dalam Data
# Cuaca Temperatur Berolahraga 1 cerah normal ya 2 tinggi 3 hujan tidak 4 5 6 Banyaknya data berolah-raga=ya adalah 3 dari 6 data maka dituliskan P(Olahraga=Ya) = 3/6 Banyaknya data cuaca=cerah, temperatur=normal dan berolah-raga=ya adalah 4 dari 6 data maka dituliskan P(cuaca=cerah, temperatur=normal, Olahraga=Ya) = 2/6
26
Metode Bayes Xn X2 …. X1 Y Keadaan Posteriror (Probabilitas Xk di dalam Y) dapat dihitung dari keadaan prior (Probabilitas Y di dalam Xk dibagi dengan jumlah dari semua probabilitas Y di dalam semua Xi)
27
HMAP P( Y | X ) P(X) argmax P( S | X ) = xX P(X )
HMAP (Hypothesis Maximum Appropri Probability) menyatakan hipotesa yang diambil berdasarkan nilai probabilitas berdasarkan kondisi prior yang diketahui. P( S | X ) = argmax xX P( Y | X ) P(X) P(X ) HMAP adalah model penyederhanaan dari metode bayes yang disebut dengan Naive Bayes. HMAP inilah yang digunakan di dalam macine learning sebagai metode untuk mendapatkan hipotesis untuk suatu keputusan.
28
Contoh HMAP Diketahui hasil survey yang dilakukan sebuah lembaga kesehatan menyatakan bahwa 30% penduduk di dunia menderita sakit paru-paru. Dari 90% penduduk yang sakit paru-paru ini 60% adalah perokok, dan dari penduduk yang tidak menderita sakit paru-paru 20% perokok. Fakta ini bisa didefinisikan dengan: X=sakit paru-paru dan Y=perokok. Maka : P(X) = 0.9 P(~X) = 0.1 P(Y|X) = 0.6 P(~Y|X) = 0.4 P(Y|~X) = P(~Y|~X) = 0.8 Dengan metode bayes dapat dihitung: P({Y}|X) = P(Y|X).P(X) = (0.6) . (0.9) = 0.54 P({Y}|~X) = P(Y|~X) P(~X) = (0.2).(0.1) = 0.02 Bila diketahui seseorang merokok, maka dia menderita sakit paru-paru karana P({Y}|X) lebih besar dari P({Y}|~X). HMAP diartikan mencari probabilitas terbesar dari semua instance pada attribut target atau semua kemungkinan keputusan. Pada persoalan keputusan adalah sakit paru-paru atau tidak.
29
HMAP Dari Data Training
# Cuaca Temperatur Kecepatan Angin Berolah-raga 1 Cerah Normal Pelan Ya 2 3 Hujan Tinggi Tidak 4 Kencang 5 6 Asumsi: Y = berolahraga, X1 = cuaca, X2 = temperatur, X3 = kecepatan angin. Fakta menunjukkan: P(Y=ya) = 4/6 P(Y=tidak) = 2/6
30
HMAP Dari Data Training
# Cuaca Temperatur Kecepatan Angin Berolah-raga 1 Cerah Normal Pelan Ya 2 3 Hujan Tinggi Tidak 4 Kencang 5 6 Apakah bila cuaca cerah dan kecepatan angin kencang, orang akan berolahraga? Fakta: P(X1=cerah|Y=ya) = 1, P(X1=cerah|Y=tidak) = 0 P(X3=kencang|Y=ya) = 1/4 , P(X3=kencang|Y=tidak) = 1/2 HMAP dari keadaan ini dapat dihitung dengan: P( X1=cerah,X3=kencang | Y=ya ) = { P(X1=cerah|Y=ya).P(X3=kencang|Y=ya) } . P(Y=ya) = { (1) . (1/4) } . (4/6) = 1/6 P( X1=cerah,X3=kencang | Y=tidak ) = { P(X1=cerah|Y=tidak).P(X3=kencang|Y=tidak) } . P(Y=tidak) = { (0) . (1/2) } . (2/6) = 0 KEPUTUSAN ADALAH BEROLAHRAGA = YA
31
Kelemahan Metode Bayes
Metode Bayes hanya bisa digunakan untuk persoalan klasifikasi dengan supervised learning dan data-data kategorikal. Metode Bayes memerlukan pengetahuan awal untuk dapat mengambil suatu keputusan. Tingkat keberhasilan metode ini sangat tergantung pada pengetahuan awal yang diberikan.
32
Beberapa Aplikasi Metode Bayes
Menentukan diagnosa suatu penyakit berdasarkan data-data gejala (sebagai contoh hipertensi atau sakit jantung). Mengenali buah berdasarkan fitur-fitur buah seperti warna, bentuk, rasa dan lain-lain Mengenali warna berdasarkan fitur indeks warna RGB Mendeteksi warna kulit (skin detection) berdarkan fitur warna chrominant Menentukan keputusan aksi (olahraga, art, psikologi) berdasarkan keadaan. Menentukan jenis pakaian yang cocok untuk keadaan-keadaan tertentu (seperti cuaca, musim, temperatur, acara, waktu, tempat dan lain-lain)
34
TABEL BINOMIAL
35
Binomial Table C
36
Table C
Presentasi serupa
© 2024 SlidePlayer.info Inc.
All rights reserved.