Analisa Data Statistik Chap 9a: Estimasi Statistik (Interval Kepercayaan Sampel Tunggal) Agoes Soehianie, Ph.D
Daftar Isi Inferensi Statistik
Sampel Tunggal : Interval Kepercayaan Rata-Rata Populasi (σ diketahui) Case1 : Diberikan sampel berukuran cukup besar (n≥30) yg diambil dari populasi dengan distribusi normal , yang memiliki variansi populasi σ2..Jika rata-rata sampel adalah xs, maka interval keyakinan (confidence interval) 100(1-α)% untuk rata-rata populasi μ akan diberikan oleh: 1-α α/2 -Zα/2 μ Zα/2 Distribusi rata-rata sampel akan normal, dengan nilai rata-rata (populasi) μ dengan STD σ. Terdapat probabilitas (1-α) bahwa rata-rata sampel berukuran n akan terletak antara –zα/2 dan zα/2 : P (–zα/2<Z<zα/2) = 1-α dengan
Arti Interval Kepercayaan Rata-Rata Populasi Apakah arti interval kepercayaan rata-rata populasi yg diperoleh? Sebab tiap sampel berukuran n yg kita ambil akan menghasilkan interval bagi μ yg berbeda! Sedangkan nilai μ yg sebenarnya mungkin tak pernah diketahui? No sampel 5 4 3 2 1 μ
Taksiran Error bagi μ dan ukuran sampel Teorema: Jika dipakai sebagai taksiran untuk μ, maka kita bisa yakin (confident) dengan tingkat keyakinan (confidence level) 100(1-α)% bahwa error (E= x-μ ) yg terjadi tidak akan lebih besar dari Kita bisa yakin dengan tingkat keyakinan 100(1- α)% bahwa error dalam menaksir μ dengan memakai rata-rata sampel tidak melebihi (errornya!) E (=x-μ) jikalau ukuran sampelnya:
Contoh. Rata-rata konsentrasi kandungan Zinc sebuah sungai yg diambil dari 36 lokasi adalah 2.6 gr/ml. Carilah interval kepercayaan 95% dan 99% untuk menaksir nilai rata-rata konsentrasi kandungan Zinc sungai tsb, jikalau dari survei-survei sebelumnya diketahui standard deviasinya adalah 0.3 gr/ml. Jawab. Xs = 2.6, σ=0.3
Contoh. Berapakah ukuran sampel yg harus dipakai, jikalau taksiran rata-rata populasi dalam contoh sebelumnya diinginkan tak lebih dari 0.05 dengan tingkat keyakinan 95%?
Sampel Tunggal : Interval Kepercayaan Sebelah untuk Rata-Rata Populasi Case2 : Diberikan sampel berukuran cukup besar (n≥30) yg diambil dari populasi dengan distribusi normal , yang memiliki variansi populasi σ2..Jika rata-rata sampel adalah xs, maka interval keyakinan sebelah (confidence interval) 100(1-α)% untuk rata-rata populasi μ akan diberikan oleh: 1-α α μ Zα 1-α α -Zα μ Kasus-kasus interval kepercayaan dengan ekor tunggal seperti ini terjadi bilamana kesalahan taksiran dalam satu arah (terlalu tinggi) atau terlalu rendah penting.
Contoh. Ekor tunggal Dalam sebuah eksperimen psikologi untuk mengukur kecepatan waktu reaksi sesorang, dilakukan percobaan thd 25 orang secara acak. Data dari survei survei sebelumnya menunjukkan variansi waktu reaksi adalah 4 detik2 dengan distribusi waktu reaksi normal. Dari percobaan ini didapati rata-rata waktu reaksi adalah 6.2 detik. Berikanlah batas atas dengan tingkat kepercayaan 95% bagi waktu reaksi populasi. –tα/2 Jawab. n=25, σ2 = 4, xs = 6.2 Batas atas dengan tingkat kepercayaan 95% (jadi α=5%) adalah: Ini berarti kita bisa yakin 95% bahwa rata-rata waktu reaksi sebenarnya < 6.858 detik
Sampel Tunggal : Interval Kepercayaan Rata-Rata Populasi (σ TAK diketahui tapi ukuran sampel n>30) Jika standard deviasi populasi (σ) .TAK diketahui, asalkan ukuran sampel besar maka standard deviasi sampel S bisa dipakai sebagai pengganti. Hal ini bahkan cukup baik walaupun distribusi populasinya tidak normal. Seluruh rumus yg telah diturunkan yg melibatkan σ bisa dipakai dengan mengganti σ dengan S dari sampel. Confidence interval untuk rata-rata Taksiran besar Error Ukuran sampel diperlukan
Sampel Tunggal : Interval Kepercayaan Rata-Rata Populasi (σ TAK diketahui dan ukuran sampel kecil) Jika diberikan sampel berukuran kecil (n<30) tapi diambil dari populasi dengan distribusi normal , dan tidak diketahui variansi populasi, maka variansi populasi S2 bisa dipakai sebagai pengganti σ2, akan tetapi distribusi yg dipergunakan adalah distribusi student t..Jika rata-rata sampel adalah xs, maka interval keyakinan (confidence interval) 100(1-α)% untuk rata-rata populasi μ akan diberikan oleh: 1-α α/2 -tα/2 μ tα/2 bahwa rata-rata sampel berukuran n akan terletak antara –tα/2 dan tα/2 : Dengan probabilitas: P (–zα/2<Z<zα/2) = 1-α dimana variabel t adalah: tα/2 adalah nilai variabel t dengan luas ekor kanan α/2
Sampel Tunggal : Interval Kepercayaan Rata-Rata Populasi (σ TAK diketahui dan ukuran sampel kecil) Confidence interval untuk rata-rata Taksiran besar Error Ukuran sampel diperlukan
Interval untuk Prediksi Dalam pengukuran yg dilakukan dari data yg terdistribusi normal dan rata-rata populasi tidak diketahui μ dan variansi yg diketahui σ2, maka interval prediksi nilai yg akan muncul dari 1 kali pengukuran di masa depan dengan interval kepercayaan 100(1-α)% adalah: Dalam pengukuran yg dilakukan dari data yg terdistribusi normal dan rata-rata populasi tidak diketahui μ dan dan variansi populasi juga tak diketahui, maka interval prediksi nilai yg akan muncul dari 1 kali pengukuran di masa depan dengan interval kepercayaan 100(1-α)% adalah: Dengan derajat kebebasan bagi distribusi student t adalah n-1
Problem Seorang petugas QC meneliti sampel 29 pak daging sapi yg diklaim mengandung lemak dibawah 5%, jadi dagingnya 95%. Ternyata rata-rata sampel kandungan dagingnya 96.2%, dengan standard deviasi sampel 0.8%. Jika diasumsikan kandungan daging terdistribusi normal, buatlah interval prediksi 99% untuk hasil pengukuran kandungan daging pada 1 kali pengukuran berikutnya.
Contoh Sampel 50 buah dari kredit yg diberikan oleh Bank FirstBank ternyata rata-rata sampel Rp. 257 300 ribu. Asumsikan standard deviasi populasi untuk besar kredit adalah Rp. 25 000 ribu. Carilah interval prediksi 95% besarnya kredit yg diinginkan oleh seorang nasabah yg akan mengajukan kredit berikutnya? Jawab: n=50, σ = 25 000, xs= 257 α = 0.05 dengan nilai α ini maka zα/2 = z0,.025= 1.96 Kita hitung Dan 257 300 – 49980 < x0 < 257 300 + 49 980
Sampel Tunggal : Interval Kepercayaan untuk Rata-Rata Proporsi dalam distribusi Binomial Dalam sebuah distribusi binomial, misalnya di populasi fraksi atau proporsi yang “sukses” adalah P. Sedangkan dari sampel random n buah didapat jumlah “sukses” adalah x, maka proporsi sampel p=x/n menjadi taksiran bagi proporsi populasi P. Jika proporsi populasi yg “sukses” P tidak terlalu dekat ke-0 atau 1 maka kita bisa mempergunakan distribusi normal untuk membuat interval kepercayaan bagi proporsi P populasi dari proporsi sampel p. “Rata-rata” proporsi populasi = μP = P Rata-rata sampel untuk proporsi = p dengan p+q=1 Variansi distribusi “rata-rata” proporsi σP2 = pq/n Maka interval kepercayaan 100(1-α)% untuk sampel besar (n≥30) untuk proporsi populasi p (yg menyatakan prosentasi “sukses”) diberikan oleh
Sampel Tunggal : Interval Kepercayaan untuk Rata-Rata Proporsi dalam distribusi Binomial Keterangan: Variabel normal (standardize) untuk proporsi sampel “sukses” p yg diambil dari populasi dengan proporsi “sukse” P dengan variansi σP2 adalah : Rumus ini berlaku untuk p atau q yg tidak terlalu dekat 0 atau 1. Sebagai patokan rumus ini dipakai bilamana pn atau qn ≥5
Contoh. Sampel random 500 keluarga pemilik pesawat TV mendapati 340 berlangganan saluran HBO. Tentukan interval kepercayaan 95% bagi prosentase yg sebenarnya dari pelanggan HBO. Jawab. Diket. p = 340/500 = 0.68 berarti q= 1-p = 0.32 dan α = 5% Sehingga zα/2 = Z0.025 = 1.96, Dan σP = √(pq/n)= √(0.68*0.32/500) Maka interval kepercayaan 95% p - Z0.025 σP < P < p + Z0.025 σP 0.64 < P < 0.72
Sampel Tunggal : Interval Kepercayaan untuk Rata-Rata Proporsi dalam distribusi Binomial ERROR JIka p adalah proporsi “sukses” dalam sampel maka kita yakin 100(1-α)% bahwa error dalam menggunakan p sebagai penaksir proporsi di populasi tidak akan lebih dari Zα/2 √(pq/n) UKURAN SAMPEL JIka ditentukan tingkat ERROR yg ditolerir maksimum adalah E, maka kita bisa yakin proporsi sampel p sebagai penaksir proporsi populasi dengan tingkat keyakinan 100 (1-α)% jika ukuran sampel yg dipakai sekitar: Rumus ini berlaku untuk p atau q yg tidak terlalu dekat 0 atau 1. Sebagai patokan rumus ini dipakai bilamana pn atau qn ≥5
Contoh Bilamana dalam survei TV (HBO) sebelumnya yg memiliki proporsi yg berlangganan (p) di sampel = 0.68, berapakah ukuran sampel yg harus digunakan jikalau diinginkan dengan tingkat kepercayaan 95% taksiran terhadap prosentase pelanggan HBO (P) akurat dalam batas ±2%. Jawab. Kita pakai rata-rata sampel yaitu p=0.68 sebagai penaksir parameter P populasi, berarti E = 0.02, dan α=5% sehingga Zα/2 = Z0.025 =1.96 Berarti ukuran sampel dengan tingkat kepercayaan 95% adalah:
Batas Atas Error dan Ukuran Sampel Seringkali kita tak punya taksiran untuk P, sehingga dalam menentukan ukuran sampel kita pakai “worst case scenario”. Nilai pq maksimum bilamana p=1/2 dan berarti q=1/2 yaitu pq=1/4. Jadi untuk menentukan ukuran sampel n yg diperlukan agar dengan tingkat keyakinan 100(1-α)% diperoleh ketelitian hasil (error) tidak melebihi E (error margin) maka ukuran sampel yg harus digunakan adalah:
Sampel Tunggal : Interval Kepercayaan untuk estimasi Variansi JIka sampel ukuran n diambil dari populasi dengan variansi σ2, kemudian dari sampel dihitung variansinya S2, maka taksiran interval bagi σ2 diperoleh dari distribusi variabel statistik X2 Terdapat probabilitas 1-α, maka X2 akan terletak antara χ21-α/2 dan χ2α/2 : P(χ21-α/2 < X2 < χ2α/2) = 1-α, dimana χ2α/2 adalah nilai variabel chi-squared dengan luas ekor kanan α/2 dan derajat kebebasan n-1. Berarti interval kepercayaan 100(1-α)% untuk σ2 yg ditaksir berdasarkan sampel ukuran n yg diambil dari populasi dengan distribusi normal dan memiliki variansi sampel s2 adalah:
Sampel Tunggal : Interval Kepercayaan untuk estimasi Variansi 1-α α/2 α/2 χ1-α/22 χα/22 χ2
Contoh. Berikut adalah bobot dari 10 sampel obat-obatan yg didistribusikan sebuah perusahaan: 46.4, 46.1 , 45.8, 47.0, 46.1 45.9 45.8 46.9 45.2 dan 46.0 kg. Asumsikan distribusi bobot adalah normal, tentukan interval kepercayaan 95% bagi variansi dari bobot obat-obatan tsb. Jawab: Pertama kita hitung variansi sampel: No Xk Xk^2 1 46.4 2152.96 2 46.1 2125.21 3 45.8 2097.64 4 47 2209 5 6 45.9 2106.81 7 8 46.9 2199.61 9 45.2 2043.04 10 46 2116 SUM 461.2 21273.12 Sum^2 212705.4 n= S^2= (nSxx- Sx^2)/(n(n-1)) Sx^2= 0.286222
Contoh. Interval kepercayaan 95% berarti α=5%, jumlah data n=10, berarti derajat kebebasan v=n-1= 9. Dari tabel diperoleh untuk v=9: χ0.0252 = 19.023 dan χ0.9752 = 2.7 Sehingga interval kepercayaan 95% bagi taksiran nilai variansi populasi σ2 adalah: Atau 0.135 < σ2 < 0.953