Presentasi sedang didownload. Silahkan tunggu

Presentasi sedang didownload. Silahkan tunggu

Analisa Data Statistik Chap 10b: Hipotesa Testing (Proporsi) Agoes Soehianie, Ph.D.

Presentasi serupa


Presentasi berjudul: "Analisa Data Statistik Chap 10b: Hipotesa Testing (Proporsi) Agoes Soehianie, Ph.D."— Transcript presentasi:

1 Analisa Data Statistik Chap 10b: Hipotesa Testing (Proporsi) Agoes Soehianie, Ph.D

2 Test Statistik Berkenaan dengan Proporsi 1 Populasi Situasi : Dari sampel diketahui proporsi “sukses” adalah p, ingin diketahui apakah proporsi di populasi P. Asumsikan ukuran sampel yg besar dapat dipergunakan aproksimasi distribusi normal. Variabel statistik untuk ditest adalah: Dengan q=1-p

3 Contoh Sebuah obat hipertensi yg biasa dipakai orang dipercaya efektif 60%. Sampel random 100 penderita hipertensi yg diberi obat jenis baru ternyata 70 orang mengalami perbaikan.Apakah cukup bukti untuk menyatakan bahwa obat baru tsb lebih baik dibandingkan obat yg biasa dipakai? Pergunakan tingkat signifikan 5%.

4 Solusi 1. H0:p=0.6 dan H1: p > α = Daerah kritis (1 ekor, distribusi normal) dengan Z: ` nilai kritis Z untul α =0.05 adalah z=1.645 Tolak H0 jika Z> Hitung statistik: diketahui p=0.7, q=1-p=0.3, n= Keputusan : Tolak H0 sebab Z hitung > Kesimpulan: Obat baru lebih efektif

5 Solusi 1. H0:p=0.6 dan H1: p > α = Daerah kritis (1 ekor, distribusi normal) dengan Z: ` nilai kritis Z untul α =0.05 adalah z=1.645 Tolak H0 jika Z> Hitung statistik: diketahui p=0.7, q=1-p=0.3, n= Keputusan : Tolak H0 sebab Z hitung > Kesimpulan: Obat baru lebih efektif

6 Test Statistik Berkenaan dengan Proporsi 2 Populasi Situasi : Dari sampel ukurannya cukup besar yg berasal dari 2 populasi diketahui proporsi “sukses” adalah p 1 dan p 2, ingin diketahui apakah proporsi di populasi juga sama P 1 =P 2.. Asumsikan ukuran sampel yg besar dapat dipergunakan aproksimasi distribusi normal. Variabel statistik untuk ditest adalah: Dengan q=1-p. JIka yg diperiksa adalah H 0 : P 1 =P 2, maka standard deviasi di rumus diatas bisa diperbaiki dg menggunakan Pooled estimate bagi p. Dalam hal ini p 1 =p 2 =p dengan p adalah nilai proporsi bersama dari sampel: Dengan x 1 dan x 2 adalah banyaknya “sukses” Di sampel 1 dan 2.

7 Test Statistik Berkenaan dengan Proporsi 2 Populasi Dengan ini maka rumus bagi variabel Z adalah:

8 Contoh Sebuah pabrik kimia akan didirikan di batas kota dekat dengan desa. Sebuah survei dilakukan untuk mengetahui penerimaan penduduk kota dan desa thd rencana pembangunan tsb. Dari sampel random 500 penduduk desa 240 menyetujuinya, sedangkan dari 200 penduduk kota yg disampel sebanyak 120 menyetujuinya. Periksalah apakah persentase penduduk kota yg menyetujui pendirian pabrik tsb lebih besar daripada penduduk desa pada tingkat signifikan 5%.

9 Solusi 1. H0:P 1 = P 2 dan H1: P 1 > P 2 dengan P 1 : proporsi penduduk kota yg setuju, dan P 2 proporsi pdd desa yg setuju. 2. α = Daerah kritis (1 ekor, distribusi normal) dengan Z: ` nilai kritis Z untul α =0.05 adalah z=1.645 Tolak H0 jika Z> 1.645

10 Solusi 4. Perhitungan Dari sampel diperoleh p 1 = 120/200=60% ; p 2 =240/200=48%. Pooled estimate p: 5. Keputusan: Karena Z > 1.645, maka Ho ditolak 6. Kesimpulan : Persentase pdd kota yg setuju > persentase pdd desa

11 Test Statistik Berkenaan dengan Variansi 1 Populasi Situasi : Dari sampel dengan variansi S 2 yg berasal dari populasi normal ingin diperiksa apakah variansi populasinya = σ 0 2. Variabel statistik untuk di test adalah χ 2 : Adalah variable chi-squares dengan derajat kebebasan v=n-1. Sebagai catatan test ini sangat bergantung pada asumsi normalitas penyimpangan dari normalitas berakibat pada ketidak akurasian hasilnya.

12 Soal Pabrik aki mobil menyatakan bahwa umur akinya memiliki standard deviasinya 0.9 tahun, dan distribusi umur akinya normal. Untuk memeriksa kebenaran klaimnya sampel random 10 aki ditest ternyata standard deviasinya 1.2 tahun. Melihat hasil ini apakah cukup bukti untuk menyatakan bahwa standard devias umur akinya > 0.9 tahun. Periksalah dengan tingkat signifikan 5%

13 Solusi 1. Hipotesa H0: σ 2 = H1: σ 2 > α = Daerah kritis : Variabel statistik untuk dites adalah: Dari tabel nilai kritis χ (v=10-1) = Tolak H0 jika χ 2 > Perhitungan

14 Solusi 5. Keputusan Karena χ 2 < maka H0 tidak bisa ditolak pada tingkat signifikan 5%. Sebenarnya selisihnya terlalu tipis, untuk membuat kesimpulan yg kuat! 6. Kesimpulan Tidak cukup bukti untuk menyatakan bahwa standard deviasi aki produksi pabrik tsb > 0.9.

15 Test Statistik Berkenaan dengan perbandingan Variansi 2 Populasi Situasi : Sampel dari dua buah populasi memiliki variansi S 1 2 dan S 2 2 yg berasal dari populasi normal ingin diperiksa apakah variansi kedua populasi sama H 0 : σ 1 2 = σ 2 2 Variabel statistik untuk di test adalah F : Adalah variable dengan distribusi F yg memiliki derajat kebebasan v 1 =n 1 -1 (pembilang) dan v 2 =n 2 -1 (penyebut).

16 Contoh Sampel dari dua buah populasi memiliki variansi dan Dengan masing-masing ukuran sampelnya n 2 = 12 dan n 1 =10. Periksalah kebenaran hipotesa H 0 :yaitu kedua sampel berasal dari populasi dengan variansi yang sama, terhadap, H 1 :`pada tingkat signifikan 10%

17 Solusi Ini adalah test 2 ekor, akan tetapi karena kita sudah susun s 1 >s 2 maka nanti hanya perlu diperiksa ekor kanannya saja! 1. Hipotesa: H0 : H1: 2. α = Daerah kritis Variabel statistik untuk ditest :F = s 1 2 /s 2 2 dari tabel distribusi F untuk v 1 =10-1=9 dan v 2 =12-1=11, bagi nilai α/2 = 0.05 adalah F 0.05 (9,11) = 2.90 Tolak H0, jika F > Perhitungan: F = s 1 2 /s 2 2 = 25/16 = Keputusan Karena F < 2.90 tidak bisa menolak H0 pada tingkat signifikan 10%. 6. Kesimpulan, Kedua sampel berasal dari populasi dengan variansi yg sama!

18 Goodness of Fit test

19 Test statistik untuk kecocokan thd distribusi teoretik Situasi: Ingin diketahui seberapa mirip distribusi data yg diperoleh di dalam sampel terhadap distribusi teoretis yg diasumsikan dimiliki oleh populasi asal sampel tsb. Test ini disebut goodness of fit test. Test statistiknya adalah chi-squares: Dengan O k adalah frekuensi sampel yg terobservasi, E k adalah frekuensi teoretis (expected) untuk sel yang sama (k). Derajat kebebasannya v=N-1 Hipotesa yg diuji adalah H0: Distribusi sampel = distribusi teoretis (nilai chi-squares kecil) terhadap H1 : distribusi sampel menyimpang dari distribusi teoretis (nilai chi-squares besar)

20 Contoh. Sebuah dadu bermuka 6 dilemparkan sebanyak 120 kali, hasilnya adalah sbb: Muka dadu frek (obs) frek (exp) distribusi teoretis (expected ) f(x) =1/6 dengan x=1,2,3,…6, sehingga untuk 120 kali pelemparan frek (teoretis) = 1/6*120=20 untuk tiap mata dadu. 1. Hipotesa H0: Distribusi frekuensi mata dadu sesuai distribusi teoretis H1: Distribusi frekuensi mata dadu menyimpang dari teoretis

21 Contoh. 2. Tingkat signifikan Misal diambil α =5%. 3. Daerah kristis Variabel statistik untuk diuji: dengan v=N-1=6-1=5. Nilai kritis, menurut tabel χ (v=5) = Tolak H0, jika χ 2 > Perhitungan Obs Exp20 (O- E) 2 /E

22 Contoh. 4. Perhitungan 5. Keputusan Karena χ 2 < maka H0 tidak bisa ditolak pada tingkat signifikan 5%. 6. Kesimpuan: Tidak bisa dikatakan bahwa distribusi frekuensi kemunculan mata dadu berasal dari populasi yg menyimpang dari distribusi teoretis yg seharusnya. Atau tidak cukup bukti menyatakan dadunya tidak fair!

23 Test untuk independensi (data kategorikal) Situasi: Ingin diketahui independensi antara dua buah variabel kategorikal. H0: Tidak ada hubungan (dua buah variabel tsb independen) H1 : Ada hubungan antara kedua buah variabel Sebagai distribusi teoretisnya adalah berdasarkan H0 yaitu distribusi yg akan terjadi jikalau kedua variabel yg diperiksa independen. Sedangkan test statistik yg dipergunakan adalah χ 2 :

24 Contoh. Ingin diketahui apakah tingkat pendapatan berpengaruh pada opini terhadap rencana reformasi perpajakan yg akan dilakukan pemerintah. Untuk itu dilakukan sampling terhadap 1000 orang wajib pajak. Kepada mereka ditanyakan apakah setuju dengan reformasi perpajakan yg akan dilakukan. Hasilnya ditabelkan dalam tabel kontingensi berikut ini: Tingkat Pendapatan RendahMediumTinggiTotal Row Setuju Tidak Total Col

25 Contoh. Periksalah hipotesa H0: tidak ada hubungan antara tingkat pendapatan dan opini thd reformasi perpajakan, dengan tingkat signifikan 5%.

26 Solusi. 1. Hipotesa H0: tidak ada hubungan antara tingkat pendapatan dan opini thd reformasi perpajakan, H1: Ada hubungan …. 2. α = 5%. 3. Daerah kritis Variabel untuk ditest: dengan derajat kebebasan v= (row-1)*(col-1)= (2-1)*(3-1)=2 Nilai kritis, dari tabel χ (ν=2) =5.991 Tolak H0, jika χ 2 > 5.991

27 Solusi. 4. Perhitungan Menentukan frekuensi teoretis tiap cell berdasarkan asumsi bahwa variabel pendapatan independen thd variabel opini, sehingga probabilitas untuk cell dengan pendapatan P a dan opini O b akan diberikan oleh: P (P a ∩ O b )= P(P a )*P(O b ) Jika total datanya N, maka expected frequency untuk cell tsb adalah: n (P a ∩ O b )= P(P a )*P(O b ) * N Bagaimana menentukan P a dan O b dari tabel kontingensi? Misal dari data, jumlah org yg pendapatannya a,b dan c masing- masing n a, n b dan n c. Maka, probabilitas menemukan 1 orang dengan pendapatan a adalah : P (P a ) = n a /(n a +n b +n c ), dst.

28 Solusi. Tingkat Pendapatan RendahMediumTinggiTotal Row Setuju 598 Tidak 402 Total Col Perhitungan Disebelah kiri adalah tabel yg diperlukan untuk menghitung expected frequency, sebelah kanan adalah hasilnya : expected frequency. Contoh perhitungan expected freq. orang yg berpendapatan rendah dan setuju. P(rendah) = 336/1000P(setuju)=598/1000 n(rendah dan setuju) = P(rendah)*P(setuju)*1000= = 336/1000*598/1000*1000 = Tingkat Pendapatan RendahMediumTinggiTotal Row Setuju Tidak Total Col

29 Solusi. 4. Perhitungan Untuk menghemat perhitungan tidak perlu semua dihitung, misalkan seluruh baris “setuju” dihitung, maka jumlah expected yg di baris “tidak” bisa diperoleh dengan pengurangan. Contoh expected freq. yg pendapatan rendah dan tidak setuju: n(rendah & tidak) = 336 – n(rendah & setuju) = 336 – 200.9=135.1 Tahap berikutnya menghitung chi-squares: 5. Keputusan Karena χ 2 > maka cukup bukti untuk menolak H0 6. Kesimpulan Ada hubungan antara variabel pendapatan dan opini.

30 Catatan 1. Metoda ini bekerja baik jika jumlah expected freq di tiap cell ≥ Untuk mempermudah perhitungan biasanya dalam tiap cell dicantumkan observed freq dan expected freq. Tingkat Pendapatan RendahMediumTinggiTotal Row Setuju182 (200.9)213 (209.9) 203 (187.2)598 Tidak154 (135.1)138 (141.1)110 (125.8)402 Total Col

31 Test Beberapa Proporsi Sekaligus Situasi: Ingin diketahui apakah proporsi untuk “sukses” di berbagai populasi semuanya sama. Jadi H0 : P 1 =P 2 =P 3 =… H1: paling tidak ada 1 proporsi yg tidak sama Variabel testnya adalah chi-squares:

32 Contoh Sebuah pabrik yg memiliki 3 shift pekerja ingin mengetahui apakah persentase produk yg cacat dari berbagai shift tersebut sama. Sampel data disusun dalam tabel berikut ini: Pergunakan tingkat signifikan 2.5% untuk memeriksa apakah persentase yg cacat sama di segala shift. ShiftPagiSiangMalam Cacat Baik

33 Solusi 1. Hipotesa H0 : p 1 =p 2 =p 3 H1: tidak semua p 1,p 2 dan p 3 sama 2. α = Daerah Kritis Test statistiknya : dengan derajat kebebasan v= (2-1)*(3-1)=2 Nilai kritis, dari tabel diperoleh χ (v=2) = Tolak H0 jika χ 2 > 7.378

34 Solusi ShiftPagiSiangMalamTotal Cacat45 (57.0)55 (56.7)70 (56.4)170 Baik905 (893.0)890 (888.3)870 (883.6)2665 Total Perhitungan expected frequency seperti contoh-contoh sebelumnya. Sehingga chi-squares bisa dihitung: Χ 2 = Perhitungan

35 Solusi 5. Keputusan Karena χ 2 <7.378, maka H0 tidak bisa ditolak. 6. Kesimpulan Tidak cukup bukti untuk menyatakan bahwa ada perbedaan proporsi produksi yg cacat di berbagai shift yg berbeda


Download ppt "Analisa Data Statistik Chap 10b: Hipotesa Testing (Proporsi) Agoes Soehianie, Ph.D."

Presentasi serupa


Iklan oleh Google