Probabilitas & Distribusi Sampling
Probability Distributions Discrete Probability Distributions Continuous Probability Distributions Binomial Normal Poisson Uniform Hypergeometric Exponential
Distribusi Binomial
Distribusi Binomial Karakteristik dari Distribusi Binomial: Suatu percobaan yang hanya mempunyai dua kemungkinan kejadian: “sukses” dan “gagal” Eksperimen terdiri dari n kali pengulangan Suatu percobaan dan percobaan lainnya bersifat independen Jika p merupakan peluang “sukses”, maka (1-p) = q adalah peluang dari “gagal”
Formula Distribusi Binomial ! x n - x P(x) = p q x ! ( n - x ) ! P(x) = Peluang x sukses dalam n kali percobaan, dg peluang sukses p pd setiap percobaan x = banyaknya ‘sukses’ dalam sampel, (x = 0, 1, 2, ..., n) p = peluang “sukses” per percobaan q = peluang “gagal” = (1 – p) n = banyaknya percobaan (sample size) Atau biasa juga ditulis sbb:
Contoh Percobaan pelemparan koin sebanyak 4 kali, mis: x = # kepala: q = (1 - 0.5) = 0.5 x = 3 Maka:
Using Binomial Tables n = 10 x p=.15 p=.20 p=.25 p=.30 p=.35 p=.40 p=.45 p=.50 1 2 3 4 5 6 7 8 9 10 0.1969 0.3474 0.2759 0.1298 0.0401 0.0085 0.0012 0.0001 0.0000 0.1074 0.2684 0.3020 0.2013 0.0881 0.0264 0.0055 0.0008 0.0563 0.1877 0.2816 0.2503 0.1460 0.0584 0.0162 0.0031 0.0004 0.0282 0.1211 0.2335 0.2668 0.2001 0.1029 0.0368 0.0090 0.0014 0.0135 0.0725 0.1757 0.2522 0.2377 0.1536 0.0689 0.0212 0.0043 0.0005 0.0060 0.0403 0.1209 0.2150 0.2508 0.2007 0.1115 0.0425 0.0106 0.0016 0.0025 0.0207 0.0763 0.1665 0.2384 0.2340 0.1596 0.0746 0.0229 0.0042 0.0003 0.0010 0.0098 0.0439 0.1172 0.2051 0.2461 p=.85 p=.80 p=.75 p=.70 p=.65 p=.60 p=.55 Examples: n = 10, p = .35, x = 3: P(x = 3|n =10, p = .35) = .2522 n = 10, p = .75, x = 2: P(x = 2|n =10, p = .75) = .0004
Sifat dari b(x;n,p) sebagai fungsi distribusi probabilitas adalah: Karena seringkali kita memerlukan probabilitas untuk X dalam sebuah interval, misal P(X<r) atau P(a<X≤b) maka, dibuat tabel fungsi distribusi binomial kumulatif sbb:
Contoh Probabilitas seorang pasien yg sakit suatu penyakit flu sembuh adalah 40%. Jikalau 15 orang diketahui telah tertular penyakit ini, berapakah probabilitasnya bahwa (a) paling tidak 10 orang sembuh, (b) antara 3 hingga 8 orang sembuh (c)tepat 5 orang sembuh?
Jawab Probabilitas “sukses”, yaitu sembuh adalah p =0.4. Variabel random X menyatakan banyak orang yang “sukses” = sembuh, sedangkan total percobaannya adalah n=15. a) P (paling tidak 10 sembuh) = P(X≥10) =1- P(X<10)= =1- B(r=9;n=15,p=0.4) = 1 – 0.9662 = 0.0338 b) P (antara 3 sd 8 sembuh) = P(3≤X≤8) =P(X≤8) - P(X<3) = =B(r=8;n=15,p=0.4) - B(r=2;n=15,p=0.4) = 0.9050-0.0271= 0.8779 c) P (5 sembuh) = P(X=5) =P(X≤5) - P(X<5) = =B(r=5;n=15,p=0.4) - B(r=4;n=15,p=0.4) = 0.4032-0.2173=0.1859
Tabel Distribusi Probabilitas Binomial Kumulatif B(r=1;n=2,p=0.30) = 0.9100
Mean & Variance Distribusi Binomial Variance and Standard Deviation Dimana n = sample size p = peluang “sukses” q = (1 – p) = peluang “gagal”
Distribusi Multinomial
Distribusi Multinomial Percobaan binomial menjadi multinomial jika tiap trial/usaha menghasilkan lebih dari 2 kemungkinan untuk muncul. Bila suatu usaha tertentu dapat menghasilkan k macam hasil E1, E2, …Ek dengan peluang p1, p2, ..pk, maka distribusi peluang peubah acak X1, X2, …Xk yang menyatakan banyak terjadinya E1, E2, …Ek dalam n usaha yg independent ialah:
Contoh Dua dadu dilemparkan 6 kali, Berapa peluang mendapat jumlah 7 atau 11 muncul 2 kali, sepasang bilangan yang sama satu kali, dan kombinasi lainnya 3 kali? Jawab: E₁ = Kejadian jumlah 7 atau 11 muncul E₂ = Kejadian sepasang bilangan sama muncul E₃ = Kejadian kombinasi lainnya
Distribusi Poisson
Distribusi Poisson Percobaan yg menghasilkan peubah acak X yang bernilai numerik Banyaknya hasil selama selang waktu tertentu (menit, hari, minggu, bulan atau tahun) Contoh: - banyak hubungan telepon per jam yang diterima sebuah kantor - banyak pasien yang antri perjam - banyak hari sekolah yg ditutup karena banjir
Poisson Distribution Formula where: t = size of the segment of interest x = number of successes in segment of interest = expected number of successes in a segment of unit size e = base of the natural logarithm system (2.71828...)
Poisson Distribution Characteristics Mean Variance and Standard Deviation where = number of successes in a segment of unit size t = the size of the segment of interest
Using Poisson Tables Example: Find P(x = 2) if = 0.005 and t = 100 X 0.10 0.20 0.30 0.40 0.50 0.60 0.70 0.80 0.90 1 2 3 4 5 6 7 0.9048 0.0905 0.0045 0.0002 0.0000 0.8187 0.1637 0.0164 0.0011 0.0001 0.7408 0.2222 0.0333 0.0033 0.0003 0.6703 0.2681 0.0536 0.0072 0.0007 0.6065 0.3033 0.0758 0.0126 0.0016 0.5488 0.3293 0.0988 0.0198 0.0030 0.0004 0.4966 0.3476 0.1217 0.0284 0.0050 0.4493 0.3595 0.1438 0.0383 0.0077 0.0012 0.4066 0.3659 0.1647 0.0494 0.0111 0.0020 Example: Find P(x = 2) if = 0.005 and t = 100
Pendekatan Binomial ke Poisson Misalkan X peubah acak binomial dengan distribusi peluang b(x; n; p). Bila n ~, p 0, μ = np tetap sama, maka b(x; n, p) p(x; μ)
Contoh Rata-rata banyaknya partikel radioaktif yang melewati suatu penghitung selama 1 milidetik dalam suatu percobaan di laboratorium adalah 4. Berapakah peluang 6 partikel melewati penghitung itu dalam 1 milidetik tertentu?
Contoh Di dalam suatu proses produksi kaca, terjadi cacat atau gelembung yang terkadang menyebabkan produk tidak layak dijual. Diketahui rata-rata 1 dalam 1000 kaca yang dihasilkan mempunyai satu gelembung atau lebih. Berapa peluang sebuah sampel acak yang berisi 8000 kaca memuat kurang dari 7 kaca mempunyai gelembung? Jawab: Ini sebuah percobaan binomial dg n = 8000 dan p = 1/1000 = 0,001. Karena n sangat besar dan p mendekati nol maka digunakan hampiran poisson terhadap binomial dengan μ = np = (8000)(0,001) = 8 Bila X = banyak gelembung maka
Distribusi Hipergeometrik
Perbedaan antara distribusi binomial dan distribusi hipergeometrik terletak pada cara pengambilan sampelnya. Dalam binomial proses pengambilan sampel dilakukan dengan pengembalian (tiap kejadian saling bebas), Sedang pengamatan pada hipergeometrik pengambilan sampel dilakukan tanpa pengembalian Aplikasi banyak terdapat pada penerimaan sampel, pengujian elektronik dan pengendalian mutu Dalam pengujian biasanya barang yang diuji menjadi rusak, jadi tidak bisa dikembalikan Jika terdapat N benda, k benda adalah banyaknya sukses dan N – k adalah gagal
HIPERGEOMETRIK Distribusi peluang peubah acak hipergeometrik X, yaitu banyaknya sukses dalam sampel acak ukuran n yang diambil dari N benda yang mengandung k bernama sukses dan N-k bernama gagal
HIPERGEOMETRIK Rataan dan variansi distribusi hipergeometrik h(x;N,n,k) adalah
HIPERGEOMETRIK Contoh: Sebuah kotak berisi 40 suku cadang dikatakan memenuhi syarat penerimaan bila berisi tidak lebih dari 3 yang cacat. Cara sampling kotak ialah dengan memilih 5 suku cadang secara acak dari dalamnya dan menolak kotak tersebut bila diantaranya ada yang cacat. Berapakah peluang mendapatkan tepat satu yang cacat dalam sampel berukuran 5 bila kotak tersebut berisi 3 yang cacat?
HIPERGEOMETRIK Jawab: n = 5, N=40, k=3, x=1
Distribusi Normal
The Normal Distribution ‘Bell Shaped’ Symmetrical Mean, Median and Mode are Equal Location is determined by the mean, μ Spread is determined by the standard deviation, σ The random variable has an infinite theoretical range: + to f(x) σ x μ Mean = Median = Mode
DEFINISI KURVA NORMAL Bila X suatu variabel random normal dengan nilai tengah , dan standar deviasi , maka persamaan kurva normalnya adalah: = 3,14159 e = 2,71828
a b x
Transformasi dari X ke Z TRANSFORMASI DARI NILAI X KE Z Transformasi dari X ke Z x z Di mana nilai Z:
Z > 0 jika x > Z < 0 jika x < Simetri :
Contoh : Diketahui data berdistribusi normal dengan mean = 55 dan deviasi standar = 15 a) P(55≤x≤75) = = = P(0≤Z≤1,33) = 0,4082 (Tabel III) Atau Tabel III A = 0,4082
b) P(60≤x≤80) = = P(0,33≤Z≤1,67) = P(0≤Z≤1,67) – P(0≤Z≤0,33) = 0,4525 – 0,1293 = 0,3232 Z1 = = 0,33 B = 0,1293 Z2 = = 1,67 A = 0,4525 C = A – B = 0,3232
c) P(40≤x≤60)= A + B = = P(-1,00≤Z≤0,33) = P(-1,00≤Z≤0) + P(0≤Z≤0,33) = 0,3412 + 0,1293 = 0,4705 Atau : Z1 = = -1,00 A = 0,3412 Z2 = = 0,33 B = 0,1293
Distribusi Uniform
The Uniform Distribution The uniform distribution is a probability distribution that has equal probabilities for all possible outcomes of the random variable
The Uniform Distribution (continued) The Continuous Uniform Distribution: f(x) = where f(x) = value of the density function at any x value a = lower limit of the interval b = upper limit of the interval
Uniform Distribution Example: Uniform Probability Distribution Over the range 2 ≤ x ≤ 6: 1 f(x) = = .25 for 2 ≤ x ≤ 6 6 - 2 f(x) .25 x 2 6
Distribusi Sampel
Sampel Sampel digunakan untuk mengestimasi Parameter populasi contoh: X adalah nilai estimasi dari rata-rata populasi, μ Masalah: Sampel yang berbeda akan menghasilkan estimasi populasi yang berbeda Hasil sampel mempunyai potensi untuk bervariasi, sehingga muncullah sampling error
Sampling Error Sampling Error: Perbedaan antara nilai sampel (statistik) dengan nilai populasi (parameter) Contoh: (rata-rata) Dimana:
Review Rata-rata populasi: Rata-rata sampel: dimana: x = rata-rata sampel xi = nilai dari populasi atau sampel N = Population size n = sample size
Distribusi Sampel Suatu distribusi sampel adalah suatu distribusi peluang dari statistik sampel
Distribusi Sampel Misal suatu populasi: Jumlah Population N=4 Random variable, x, adalah umur Nilai x: 18, 20, 22, 24 (tahun) D A C B
Distribusi Sampel P(x) x Distribusi populasi: Uniform Distribution (continued) Distribusi populasi: P(x) .3 .2 .1 x 18 20 22 24 A B C D Uniform Distribution
Distribusi Sampel Jika diambil sampel, n=2 (continued) 16 rata-rata sampel 16 possible samples (sampling with replacement)
Distribusi sampel untuk semua rata-rata sampel (continued) Distribusi sampel untuk semua rata-rata sampel Distribusi rata-rata sampel 16 Rata-rata sampel P(x) .3 .2 .1 _ 18 19 20 21 22 23 24 x (no longer uniform)
Summary Measures of this Sampling Distribution: Distribusi Sampel (continued) Summary Measures of this Sampling Distribution:
Perbandingan Populasi dengan Distribusi Sampel Population N = 4 Sample Means Distribution n = 2 P(x) P(x) .3 .3 .2 .2 .1 .1 _ x 18 20 22 24 A B C D 18 19 20 21 22 23 24 x
Jika Populasi Berdistribusi Normal (TEOREMA) Jika suatu populasi berdistribusi normal dg rata-rata μ dan standar deviasi σ, distribusi sampling dari Juga berdistribusi normal dengan and
z-value for Sampling Distribution of x Z-value untuk distribusi sampel dari : dimana: = rata-rata sampel = rata-rata populasi = standar deviasi populasi n = jumlah sampel
Finite Population Correction Apply the Finite Population Correction if: the sample is large relative to the population (n is greater than 5% of N) and… Sampling is without replacement Then
Sampling Distribution Properties Normal Population Distribution (i.e. is unbiased ) Normal Sampling Distribution (has the same mean)
Sampling Distribution Properties (continued) For sampling with replacement: As n increases, decreases Larger sample size Smaller sample size
If the Population is not Normal We can apply the Central Limit Theorem: Even if the population is not normal, …sample means from the population will be approximately normal as long as the sample size is large enough …and the sampling distribution will have and
Central Limit Theorem the sampling distribution becomes almost normal regardless of shape of population As the sample size gets large enough… n↑
If the Population is not Normal (continued) Population Distribution Sampling distribution properties: Central Tendency Sampling Distribution (becomes normal as n increases) Variation Larger sample size Smaller sample size (Sampling with replacement)
Example Suppose a population has mean μ = 8 and standard deviation σ = 3. Suppose a random sample of size n = 36 is selected. What is the probability that the sample mean is between 7.8 and 8.2?
Example (continued) Solution: Even if the population is not normally distributed, the central limit theorem can be used (n > 30) … so the sampling distribution of is approximately normal … with mean = 8 …and standard deviation
Example Solution (continued): (continued) z Population Distribution Sampling Distribution Standard Normal Distribution .1554 +.1554 ? ? ? ? ? ? ? ? ? ? Sample Standardize ? ? -0.4 0.4 7.8 8.2 z
Distribusi Student-t
Digunakan jika σ tidak diketahui Sebaran T menyerupai sebaran Z Jika n ∞, kedua sebaran menjadi sama Dimana: s = standar deviasi dari sampel Dengan derajat bebas v = n-1
Population Proportions, p p = the proportion of population having some characteristic Sample proportion ( p ) provides an estimate of p: If two outcomes, p has a binomial distribution
Sampling Distribution of p Approximated by a normal distribution if: where and Sampling Distribution P( p ) .3 .2 .1 0 . 2 .4 .6 8 1 p (where p = population proportion)
z-Value for Proportions Standardize p to a z value with the formula: If sampling is without replacement and n is greater than 5% of the population size, then must use the finite population correction factor:
Example If the true proportion of voters who support Proposition A is p = .4, what is the probability that a sample of size 200 yields a sample proportion between .40 and .45? i.e.: if p = .4 and n = 200, what is P(.40 ≤ p ≤ .45) ?
Example if p = .4 and n = 200, what is P(.40 ≤ p ≤ .45) ? (continued) Find : Convert to standard normal:
Example if p = .4 and n = 200, what is P(.40 ≤ p ≤ .45) ? (continued) if p = .4 and n = 200, what is P(.40 ≤ p ≤ .45) ? Use standard normal table: P(0 ≤ z ≤ 1.44) = .4251 Standardized Normal Distribution Sampling Distribution .4251 Standardize .40 .45 1.44 p z