Analisa Data Statistik Chap 9a: Estimasi Statistik (Interval Dua Sampel) Agoes Soehianie, Ph.D
Daftar Isi Inferensi Statistik
Interval Kepercayaan Selisih Rata-Rata Populasi (σ diketahui) Diperoleh dua sampel berukuran cukup besar (n≥30) yg diambil dari dua buah populasi yang memiliki variansi populasi σ12 dan σ22..Jika rata-rata sampel adalah xs1 dan xs2, maka distribusi selisih rata-rata sampel xs1-xs2 akan memiliki rata-rata: μxs1-xs2 = μ1- μ2 dengan variansi yg adalah jumlahannya: σ2xs1-xs2 = σ12/n1+ σ22/n2 sehingga bisa dinyatakan bahwa variabel normal standard Z: Akan memiliki probabilitas 1- α untuk terletalk antara –zα/2 dan zα/2 : P (–zα/2<Z<zα/2) = 1-α
Interval Kepercayaan Selisih Rata-Rata Populasi (σ diketahui) Jika xs1dan xs2 adalah rata-rata sampel dengan ukuran n1 dan n2 yg diambil dari populasi dengan variansi σ12 dan σ22 maka Interval kepercayaan dengan tingkat kepercayaan 1-α bagi selisih rata-rata populasi, diberikan oleh: Contoh. Dua buah mesin A dan B dibandingkan dlm konsumsi BBM-nya. Random sampling mesin A sejumlah 50 dan B sejumlah 75 dipakai. Ternyata rata-rata konsumsi BBM mesin A adalah 36 mil/galon dan mesin B 42 mile/galon. Carilah interval kepearcayaan 96% bagi μB- μA bilamana diketahui standard deviasi populasi bagi A= 6 dan B = 8 mil/galon
Interval Kepercayaan Selisih Rata-Rata Populasi (σ diketahui) XsA=36, XsB = 42; nA=50 dan nB =75. σA=6 dan σB=8 Interval kepercayaan 96% bagi μvB- μA : 3.43 < μB- μA < 8.57 . Jadi probabilitasnya tinggi bsahwa sampel A ditarik dari populasi yg memang rata-ratanya lebih tinggi dibandingkan B
Interval Kepercayaan Selisih Rata-Rata Populasi (σ tak diketahui , sampel besar n>30) Jika xs1dan xs2 adalah rata-rata sampel dengan ukuran n1 dan n2 (> 30) yg diambil dari populasi yg tidak diketahui variansinya, tapi variansi sampel diketahui S12 dan S22 maka Interval kepercayaan dengan tingkat kepercayaan 1-α bagi selisih rata-rata populasi, diberikan oleh:
Interval Kepercayaan Selisih Rata-Rata Populasi (σ tak diketahui tapi SAMA besar, sampel kecil n<30) Jika xs1dan xs2 adalah rata-rata sampel kecil dengan ukuran n1 dan n2 (< 30) yg diambil dari populasi NORMAL yg tidak diketahui variansinya tapi diasumsikan variansinya SAMA, dengan variansi sampel diketahui S12 dan S22 maka Interval kepercayaan dengan tingkat kepercayaan 1-α bagi selisih rata-rata populasi, diberikan oleh: Dimana Sp adalah pooled variance yg besarnya adalah: Dan tα/2 adalah variabel student t dengan derajat kebebasan v=n1+n2-2
Contoh Dalam sebuah studi tentang biodiversity index sebuah sungai. Dua set sampel independen diambil. Sampel pertama terdiri dari 12 buah sampel yg diambil dari hilir sungai, dan menghasilkan rata-rata biodiversity index = 3.11 dengan standard deviasi 0.771. Sedangkan sampel kedua terdiri dari 10 buah yg berasal dari hulu sungai menghasilkan rata-rata biodiversity index 2.04 dan standard deviasi 0.448. Asumsikan bahwa populasi data kedua sampel tersebut terdistribusi normal dan memiliki standard deviasi yg sama. Buatlah interval kepercayaan 90% bagi selisih rata-rata biodiversity index dari kedua populasi (hulu dan hilir) tsb.
SOlusi Jawab:
Interval Kepercayaan Selisih Rata-Rata Populasi (σ tak diketahui dan BEDA) Jika xs1dan xs2 adalah rata-rata sampel dengan ukuran n1 dan n2 (< 30) yg diambil dari populasi NORMAL yg tidak diketahui variansinya tapi diasumsikan variansinya BEDA, dengan variansi sampel diketahui S12 dan S22 maka Interval kepercayaan dengan tingkat kepercayaan 1-α bagi selisih rata-rata populasi, diberikan oleh: Dan tα/2 adalah variabel student t dengan derajat kebebasan v= Sangat mungkin ν pecahan, dalam hal ini dibulatkan ke bawah!
Soal Sebuah studi dilakukan untuk mempelajari kandungan phospor (mg/L) di sebuah sungai. Sampel-sampel dikumpulkan dari dua buah lokasi A dan B. Dari lokasi A dikumpulkan 15 sampel dan menghasilkan rata-rata kandungan phospor 3.84 mg/L dan standard deviasi 3.07 mg/L, sedangkan sampel dari lokasi B ada 12 sampel yg menghasilkan rata-rata 1.49 mg/L dan standard deviasi 0.80 mg/L. Asumsikan sampel-sampel tsb berasal dari populasi normal dengan variansi yg berbeda. Buatlah interval kepercayaan 95% dari selisih rata-rata kandungan phospor di kedua lokasi tsb.
Solusi XAS =3.84 nA =15 SA = 3.07 XBS =1.49 nB =12 SB = 0.80 Variansi berbeda dan populasi normal. Interval kepercayaan 95% berarti memerlukan nilai t0.025 dengan derajat kebebasan v sbb: Derajat kebebasan dibulatkan ke bawah v= 16. Nilai t0.025 untuk v=16 adalah t0.025 =2.120
Solusi Interval kepercayaan bagi μA- μB adalah Atau 0.6 < μA- μB < 4.10 sehingga nampaknya dengan interval kepercayaan 95% rata-rata populasi A lebih besar dibandingkan daripada rata-rata populasi B.
Pengamatan Berpasangan Dalam suatu studi bisa jadi justru data yg berasal dari 1 populasi tidak independen dari populasi yg kedua. Mereka membentuk pasangan yg saling terkait. Sebagai contoh: studi bobot orang sebelum dan sesudah menjalani program diet. Maka data populasi berat sebelum diet justru terkait dengan berat setelah diet. Oleh karena itu untuk melihat efektivitas program dietnya yg dipelajari adalah selisih pasangan bobotnya (sebelum dan sesudah diet): d1, d2, …., dn Data selisih bobot ini diasumsikan berasal dari populasi normal dengan rata-rata selisih μD= μ1- μ2 dengan variansi σ2D, dengan nilai variansi ini diestimasi memakai S2D yg berasal dari sampel yg dipelajari.
Interval Kepercayaan Selisih Data Berpasangan JIka pengamatan n buah data berpasangan yg diambil secara random, dan ds adalah rata-rata sampel selisih pasangan data dengan standard deviasi sampel Sd maka interval kepercayaan 100(1-α)% bagi selisih rata-rata populasi μD = μ1- μ2 adalah: Dan tα/2 adalah variabel student t dengan derajat kebebasan v=n-1
Contoh Dalam sebuah studi tentang level kandungan dioxin di dalam plasma darah dan jaringan lemak 20 orang veteran perang Vietnam USA dibandingkan. Datanya sbb: Veteran ke Dioxin di Plasma Dioxin di Lemak Selisih =d 1 2.5 4.9 -2.4 11 6.9 7 -0.1 2 3.1 5.9 -2.8 12 3.3 2.9 0.4 3 2.1 4.4 -2.3 13 4.6 4 3.5 -3.4 14 1.6 1.4 0.2 5 -3.9 15 7.2 7.7 -0.5 6 1.8 4.2 16 1.1 0.7 10 -4 17 20 9 8 5.5 -2.5 18 36 41 -5 19 2.3 4.7 0.3 4.1
Solusi Perhitungan rata-rata d dan standard deviasinya: Veteran ke d d-ds (d-ds)^2 1 -2.4 -1.53 2.3409 2 -2.8 -1.93 3.7249 3 -2.3 -1.43 2.0449 4 -3.4 -2.53 6.4009 5 -3.9 -3.03 9.1809 6 7 -4 -3.13 9.7969 8 -2.5 -1.63 2.6569 9 -5 -4.13 17.0569 10 0.3 1.17 1.3689 11 -0.1 0.77 0.5929 12 0.4 1.27 1.6129 13 0.87 0.7569 14 0.2 1.07 1.1449 15 -0.5 0.37 0.1369 16 0.7 1.57 2.4649 17 9.87 97.4169 18 19 20 1.6 2.47 6.1009 Sum -17.4 168.422 average -0.87 8.4211 Perhitungan rata-rata d dan standard deviasinya:
Solusi Nilai t untuk interval kepercayaan 95% dengan derajat kebebasan v=20-1=19 adalah t0.025 = 2.093 Sehingga interval kepercayaan bagi selisih rata-rata kandungan dioxin tsb adalah: Atau -2.2634 < μD< 0.5234 Jadi tak ada perbedaan antara kandungan dioxin di plasma darah dengan jaringan lemak.
Interval Kepercayaan Selisih Proporsi Populasi
Interval Kepercayaan Selisih Proporsi Populasi Jika proporsi “sukses” di sampel random sampel n1 adalah p1 dan di sampel n2 adalah p2, sehingga proporsi “gagal” yg terkait adalah q1=1-p1 dan q2=1-p2. Maka selisih p1-p2 akan terdistribusi normal dengan rata-rata μp1-p2 = P1-P2, dan Variansinya: Maka variable Z berikut ini akan terdistribusi normal standard:
Interval Kepercayaan Selisih Proporsi Populasi Maka interval kepercayaan 100(1-α)% untuk selisih proporsi populasi P1-P2 (yg menyatakan prosentasi “sukses”) diberikan oleh Asalkan n1p1 ,, n2p2 ≥ 5
Contoh Dua buah metoda pembuatan spare-parts dibandingkan. Random sampel 1500 dari metoda A ternyata menghasilkan 75 spareparts yg cacat, sedangkan sampel random sebanyak 2000 dari metoda B menghasilkan 80 spareparts yg cacat. Buatlah interval kepercayaan 90% bagi selisih yg sesungguhnya rata-rata persentase spareparts yg cacat antara metoda A dan B.
Solusi xA = 75 (banyak cacat), nA=1500 , pA=xA/nA = 75/1500 = 0.05 qA=0.95 xB = 80 (banyak cacat), nB=2000 , pB=xB/nB = 80/2000 = 0.04 qB=0.96 Untuk interval kepercayaan 90% diperlukan nilai Z0.05 = 1.645. Intervalnya adalah: Atau -0.0017 <P1-P2< 0.0217. Dengan interval kepercayaan 90% tak ada perbedaan berarti persentase spareparts cacat yg dihasilkan oleh metoda A dan B.