Analisa Data Statistik Chap 10b: Hipotesa Testing (Proporsi)

Slides:



Advertisements
Presentasi serupa
PENGUJIAN HIPOTESIS Pertemuan 10.
Advertisements

Analisa Data Statistik Chap 6: Distribusi Probabilitas Kontinu
Kuswanto, Uji Normalitas  Untuk keperluan analisis selanjutnya, dalam statistika induktif harus diketahui model distribusinya  Dalam uji.
Sebuah perusahaan pembuat pakan ikan merekomendasikan bahwa dengan pakan buatannya pada umur 3 bulan ikan patin bisa mempunyai berat badan rata-rata 500.
Bab 14 CHI-SQUARE.
Analisa Data Statistik Chap 5: Distribusi Probabilitas Diskrit
Analisa Data Statistik Chap 5: Distribusi Probabilitas Diskrit
STATISTIKA INFERENSI : UJI HIPOTESIS (SAMPEL GANDA)
Sebuah pembibitan ikan merekomendasikan bahwa bibit ikan produk hatcherynya pada umur 3 bulan mempunyai berat badan rata-rata 450 gram/ekor. Selanjutnya.
Analisa Data Statistik
Analisa Data Statistik Chap 10a: Hipotesa Testing (Mean)
Analisa Data Statistik Chap 9a: Estimasi Statistik (Interval Dua Sampel) Agoes Soehianie, Ph.D.
Analisa Data Statistik Chap 9a: Estimasi Statistik (Interval Kepercayaan Sampel Tunggal) Agoes Soehianie, Ph.D.
PENGUJIAN HIPOTESIS SAMPEL BESAR
Pertemuan 6 UJI HIPOTESIS
Uji kesamaan proporsi p populasi
PENGUJIAN HIPOTESIS SAMPEL KECIL
Pengujian Hipotesis.
Analisis Variansi.
UJI SAMPEL TUNGGAL.
Statistik Non-Parametrik Satu Populasi
Modul 7 : Uji Hipotesis.
BAB 10 DISTRIBUSI TEORITIS
BAB 13 PENGUJIAN HIPOTESA.
ANOVA DUA ARAH.
STATISTIKA INFERENSI : UJI HIPOTESIS (SAMPLE TUNGGAL)
PENGUJIAN HIPOTESIS.
PENGUJIAN HYPOTESIS Tujuan Pembelajaran : Memahami makna hypotesis
Uji Normalitas.
STATISTIK NON PARAMETRIK
ANOVA DUA ARAH.
Pengujian Hipotesis.
Pendugaan Parameter dan Besaran Sampel
Pengujian Hipotesis Parametrik 2
VIII. UJI HIPOTESIS Pernyataan Benar Salah Ada 2 Hipotesis Hipotesis H
Aprilia uswatun chasanah I/
Probabilitas dan Statistika BAB 9 Uji Hipotesis Sampel Tunggal
Uji Hypotesis Materi Ke.
Uji Hipotesa.
PENGUJIAN HIPOTESIS Pertemuan 11.
Kuliah ke 12 DISTRIBUSI SAMPLING
DISTRIBUSI NORMAL.
PENGUJIAN HIPOTESA Probo Hardini stapro.
Ramadoni Syahputra, ST, MT
HIPOTESIS & UJI PROPORSI
PENDUGAAN PARAMETER.
STATISTIK NONPARAMETRIK Kuliah 4: Uji Chi Squares untuk Dua Sampel independen dan Uji Tanda Dosen: Dr. Hamonangan Ritonga, MSc Sekolah Tinggi.
PENGUJIAN HIPOTESIS RATA-RATA (MEAN) 1 SAMPEL
HIPOTESIS DAN UJI RATA-RATA
HIPOTESIS & UJI VARIANS
BAB V PENGUJIAN HIPOTESIS
UJI CHI-KUADRAT.
SAMPLING DAN DISTRIBUSI SAMPLING
PENGUJIAN HIPOTESIS SAMPEL BESAR
UJI CHI KUADRAT (2) Topik Bahasan: Universitas Gunadarma
Distribusi Sampling Tujuan Pembelajaran :
DISTRIBUSI CHI SQUARE (Kai kuadrat)
PENGUJIAN HIPOTESIS SAMPEL BESAR
Analisa Data Statistik Chap 6: Distribusi Probabilitas Kontinu
STATISTIKA INFERENSI : UJI HIPOTESIS (SAMPEL TUNGGAL)
UJI BEDA PROPORSI Chi Square.
UJI TANDA UJI WILCOXON.
Resista Vikaliana, S.Si.MM
UJI HIPOTESIS (3).
STATISTIKA INFERENSI : UJI HIPOTESIS (SAMPEL TUNGGAL)
DISTRIBUSI SELISIH PROPORSI
LUKMAN HARUN IKIP PGRI SEMARANG
Distribusi Sampling Tujuan Pembelajaran :
UJI RATA-RATA.
Pengujian Sampel Tunggal (1)
Transcript presentasi:

Analisa Data Statistik Chap 10b: Hipotesa Testing (Proporsi) Agoes Soehianie, Ph.D

Test Statistik Berkenaan dengan Proporsi 1 Populasi Situasi : Dari sampel diketahui proporsi “sukses” adalah p, ingin diketahui apakah proporsi di populasi P. Asumsikan ukuran sampel yg besar dapat dipergunakan aproksimasi distribusi normal. Variabel statistik untuk ditest adalah: Dengan q=1-p

Contoh Sebuah obat hipertensi yg biasa dipakai orang dipercaya efektif 60%. Sampel random 100 penderita hipertensi yg diberi obat jenis baru ternyata 70 orang mengalami perbaikan.Apakah cukup bukti untuk menyatakan bahwa obat baru tsb lebih baik dibandingkan obat yg biasa dipakai? Pergunakan tingkat signifikan 5%.

Solusi 1. H0:p=0.6 dan H1: p > 0.6 2. α = 0.05 3. Daerah kritis (1 ekor, distribusi normal) dengan Z: ` nilai kritis Z untul α=0.05 adalah z=1.645 Tolak H0 jika Z> 1.645 4. Hitung statistik: diketahui p=0.7, q=1-p=0.3, n=100 5. Keputusan : Tolak H0 sebab Zhitung > 1.645 6. Kesimpulan: Obat baru lebih efektif

Solusi 1. H0:p=0.6 dan H1: p > 0.6 2. α = 0.05 3. Daerah kritis (1 ekor, distribusi normal) dengan Z: ` nilai kritis Z untul α=0.05 adalah z=1.645 Tolak H0 jika Z> 1.645 4. Hitung statistik: diketahui p=0.7, q=1-p=0.3, n=100 5. Keputusan : Tolak H0 sebab Zhitung > 1.645 6. Kesimpulan: Obat baru lebih efektif

Test Statistik Berkenaan dengan Proporsi 2 Populasi Situasi : Dari sampel ukurannya cukup besar yg berasal dari 2 populasi diketahui proporsi “sukses” adalah p1 dan p2, ingin diketahui apakah proporsi di populasi juga sama P1=P2.. Asumsikan ukuran sampel yg besar dapat dipergunakan aproksimasi distribusi normal. Variabel statistik untuk ditest adalah: Dengan q=1-p. JIka yg diperiksa adalah H0: P1=P2, maka standard deviasi di rumus diatas bisa diperbaiki dg menggunakan Pooled estimate bagi p. Dalam hal ini p1=p2=p dengan p adalah nilai proporsi bersama dari sampel: Dengan x1 dan x2 adalah banyaknya “sukses” Di sampel 1 dan 2.

Test Statistik Berkenaan dengan Proporsi 2 Populasi Dengan ini maka rumus bagi variabel Z adalah:

Contoh Sebuah pabrik kimia akan didirikan di batas kota dekat dengan desa. Sebuah survei dilakukan untuk mengetahui penerimaan penduduk kota dan desa thd rencana pembangunan tsb. Dari sampel random 500 penduduk desa 240 menyetujuinya, sedangkan dari 200 penduduk kota yg disampel sebanyak 120 menyetujuinya. Periksalah apakah persentase penduduk kota yg menyetujui pendirian pabrik tsb lebih besar daripada penduduk desa pada tingkat signifikan 5%.

Solusi 1. H0:P1 = P2 dan H1: P1 > P2 dengan P1 : proporsi penduduk kota yg setuju, dan P2 proporsi pdd desa yg setuju. 2. α = 0.05 3. Daerah kritis (1 ekor, distribusi normal) dengan Z: ` nilai kritis Z untul α=0.05 adalah z=1.645 Tolak H0 jika Z> 1.645

Solusi 4. Perhitungan Dari sampel diperoleh p1= 120/200=60% ; p2=240/200=48%. Pooled estimate p: 5. Keputusan: Karena Z > 1.645, maka Ho ditolak 6. Kesimpulan : Persentase pdd kota yg setuju > persentase pdd desa

Test Statistik Berkenaan dengan Variansi 1 Populasi Situasi : Dari sampel dengan variansi S2 yg berasal dari populasi normal ingin diperiksa apakah variansi populasinya = σ02. Variabel statistik untuk di test adalah χ2 : Adalah variable chi-squares dengan derajat kebebasan v=n-1. Sebagai catatan test ini sangat bergantung pada asumsi normalitas penyimpangan dari normalitas berakibat pada ketidak akurasian hasilnya.

Soal Pabrik aki mobil menyatakan bahwa umur akinya memiliki standard deviasinya 0.9 tahun, dan distribusi umur akinya normal. Untuk memeriksa kebenaran klaimnya sampel random 10 aki ditest ternyata standard deviasinya 1.2 tahun. Melihat hasil ini apakah cukup bukti untuk menyatakan bahwa standard devias umur akinya > 0.9 tahun. Periksalah dengan tingkat signifikan 5%

Solusi 1. Hipotesa H0: σ2 = 0.92 H1: σ2 > 0.92 2. α = 0.05 3. Daerah kritis : Variabel statistik untuk dites adalah: Dari tabel nilai kritis χ20.05 (v=10-1) = 16.919. Tolak H0 jika χ2 > 16.919 4. Perhitungan

Solusi 5. Keputusan Karena χ2 < 16.919 maka H0 tidak bisa ditolak pada tingkat signifikan 5%. Sebenarnya selisihnya terlalu tipis, untuk membuat kesimpulan yg kuat! 6. Kesimpulan Tidak cukup bukti untuk menyatakan bahwa standard deviasi aki produksi pabrik tsb > 0.9.

Test Statistik Berkenaan dengan perbandingan Variansi 2 Populasi Situasi : Sampel dari dua buah populasi memiliki variansi S12 dan S22 yg berasal dari populasi normal ingin diperiksa apakah variansi kedua populasi sama H0 : σ12 = σ22 Variabel statistik untuk di test adalah F : Adalah variable dengan distribusi F yg memiliki derajat kebebasan v1 =n1 -1 (pembilang) dan v2=n2-1 (penyebut).

Contoh Sampel dari dua buah populasi memiliki variansi dan Dengan masing-masing ukuran sampelnya n2= 12 dan n1=10. Periksalah kebenaran hipotesa H0 : yaitu kedua sampel berasal dari populasi dengan variansi yang sama, terhadap, H1:` pada tingkat signifikan 10%

Solusi Ini adalah test 2 ekor, akan tetapi karena kita sudah susun s1>s2 maka nanti hanya perlu diperiksa ekor kanannya saja! 1. Hipotesa: H0 : H1: 2. α = 0.1 3. Daerah kritis Variabel statistik untuk ditest : F = s12/s22 dari tabel distribusi F untuk v1=10-1=9 dan v2=12-1=11, bagi nilai α/2 = 0.05 adalah F0.05 (9,11) = 2.90 Tolak H0, jika F > 2.90 4. Perhitungan: F = s12/s22 = 25/16 = 1.56 5. Keputusan Karena F < 2.90 tidak bisa menolak H0 pada tingkat signifikan 10%. 6. Kesimpulan, Kedua sampel berasal dari populasi dengan variansi yg sama!

Goodness of Fit test

Test statistik untuk kecocokan thd distribusi teoretik Situasi: Ingin diketahui seberapa mirip distribusi data yg diperoleh di dalam sampel terhadap distribusi teoretis yg diasumsikan dimiliki oleh populasi asal sampel tsb. Test ini disebut goodness of fit test. Test statistiknya adalah chi-squares: Dengan Ok adalah frekuensi sampel yg terobservasi, Ek adalah frekuensi teoretis (expected) untuk sel yang sama (k). Derajat kebebasannya v=N-1 Hipotesa yg diuji adalah H0: Distribusi sampel = distribusi teoretis (nilai chi-squares kecil) terhadap H1 : distribusi sampel menyimpang dari distribusi teoretis (nilai chi-squares besar)

Contoh. Sebuah dadu bermuka 6 dilemparkan sebanyak 120 kali, hasilnya adalah sbb: Muka dadu 1 2 3 4 5 6 frek (obs) 20 22 17 18 19 24 frek (exp) 20 20 20 20 20 20 distribusi teoretis (expected ) f(x) =1/6 dengan x=1,2,3,…6, sehingga untuk 120 kali pelemparan frek (teoretis) = 1/6*120=20 untuk tiap mata dadu. 1. Hipotesa H0: Distribusi frekuensi mata dadu sesuai distribusi teoretis H1: Distribusi frekuensi mata dadu menyimpang dari teoretis

Contoh. 2. Tingkat signifikan Misal diambil α =5%. 3. Daerah kristis Variabel statistik untuk diuji: dengan v=N-1=6-1=5. Nilai kritis, menurut tabel χ20.05 (v=5) = 11.070. Tolak H0, jika χ2 > 11.070 4. Perhitungan Obs 20 22 17 18 19 24 Exp (O-E)2/E 0.2 0.45 0.05 0.8

Contoh. 4. Perhitungan 5. Keputusan Karena χ2 < 11.070 maka H0 tidak bisa ditolak pada tingkat signifikan 5%. 6. Kesimpuan: Tidak bisa dikatakan bahwa distribusi frekuensi kemunculan mata dadu berasal dari populasi yg menyimpang dari distribusi teoretis yg seharusnya. Atau tidak cukup bukti menyatakan dadunya tidak fair!

Test untuk independensi (data kategorikal) Situasi: Ingin diketahui independensi antara dua buah variabel kategorikal. H0: Tidak ada hubungan (dua buah variabel tsb independen) H1 : Ada hubungan antara kedua buah variabel Sebagai distribusi teoretisnya adalah berdasarkan H0 yaitu distribusi yg akan terjadi jikalau kedua variabel yg diperiksa independen. Sedangkan test statistik yg dipergunakan adalah χ2 :

Contoh. Ingin diketahui apakah tingkat pendapatan berpengaruh pada opini terhadap rencana reformasi perpajakan yg akan dilakukan pemerintah. Untuk itu dilakukan sampling terhadap 1000 orang wajib pajak. Kepada mereka ditanyakan apakah setuju dengan reformasi perpajakan yg akan dilakukan. Hasilnya ditabelkan dalam tabel kontingensi berikut ini:   Tingkat Pendapatan Rendah Medium Tinggi Total Row Setuju 182 213 203 598 Tidak 154 138 110 402 Total Col 336 351 313 1000

Contoh. Periksalah hipotesa H0: tidak ada hubungan antara tingkat pendapatan dan opini thd reformasi perpajakan, dengan tingkat signifikan 5%.

Solusi. 1. Hipotesa H0: tidak ada hubungan antara tingkat pendapatan dan opini thd reformasi perpajakan, H1: Ada hubungan …. 2. α = 5%. 3. Daerah kritis Variabel untuk ditest: dengan derajat kebebasan v= (row-1)*(col-1)= (2-1)*(3-1)=2 Nilai kritis, dari tabel χ0.052(ν=2)=5.991 Tolak H0, jika χ2 > 5.991

Solusi. 4. Perhitungan Menentukan frekuensi teoretis tiap cell berdasarkan asumsi bahwa variabel pendapatan independen thd variabel opini, sehingga probabilitas untuk cell dengan pendapatan Pa dan opini Ob akan diberikan oleh: P (Pa ∩ Ob)= P(Pa)*P(Ob) Jika total datanya N, maka expected frequency untuk cell tsb adalah: n (Pa ∩ Ob)= P(Pa)*P(Ob) * N Bagaimana menentukan Pa dan Ob dari tabel kontingensi? Misal dari data, jumlah org yg pendapatannya a,b dan c masing-masing na, nb dan nc. Maka, probabilitas menemukan 1 orang dengan pendapatan a adalah : P (Pa) = na/(na+nb+nc), dst.

Solusi. 4. Perhitungan Disebelah kiri adalah tabel yg diperlukan untuk menghitung expected frequency, sebelah kanan adalah hasilnya : expected frequency. Contoh perhitungan expected freq. orang yg berpendapatan rendah dan setuju. P(rendah) = 336/1000 P(setuju)=598/1000 n(rendah dan setuju) = P(rendah)*P(setuju)*1000= = 336/1000*598/1000*1000 = 200.9   Tingkat Pendapatan  Rendah Medium Tinggi Total Row Setuju 598 Tidak 402 Total Col 336 351 313 1000   Tingkat Pendapatan Rendah Medium Tinggi Total Row Setuju 200.9 209.9 187.2 598 Tidak 135.1 141.1 125.8 402 Total Col 336 351 313 1000

Solusi. 4. Perhitungan Untuk menghemat perhitungan tidak perlu semua dihitung, misalkan seluruh baris “setuju” dihitung, maka jumlah expected yg di baris “tidak” bisa diperoleh dengan pengurangan. Contoh expected freq. yg pendapatan rendah dan tidak setuju: n(rendah & tidak) = 336 – n(rendah & setuju) = 336 – 200.9=135.1 Tahap berikutnya menghitung chi-squares: 5. Keputusan Karena χ2 > 5.991 maka cukup bukti untuk menolak H0 6. Kesimpulan Ada hubungan antara variabel pendapatan dan opini.

Catatan 1. Metoda ini bekerja baik jika jumlah expected freq di tiap cell ≥ 5. 2. Untuk mempermudah perhitungan biasanya dalam tiap cell dicantumkan observed freq dan expected freq.   Tingkat Pendapatan Rendah Medium Tinggi Total Row Setuju 182 (200.9) 213 (209.9) 203 (187.2) 598 Tidak 154 (135.1) 138 (141.1) 110 (125.8) 402 Total Col 336 351 313 1000

Test Beberapa Proporsi Sekaligus Situasi: Ingin diketahui apakah proporsi untuk “sukses” di berbagai populasi semuanya sama. Jadi H0 : P1=P2=P3=… H1: paling tidak ada 1 proporsi yg tidak sama Variabel testnya adalah chi-squares:

Contoh Sebuah pabrik yg memiliki 3 shift pekerja ingin mengetahui apakah persentase produk yg cacat dari berbagai shift tersebut sama. Sampel data disusun dalam tabel berikut ini: Pergunakan tingkat signifikan 2.5% untuk memeriksa apakah persentase yg cacat sama di segala shift. Shift Pagi Siang Malam Cacat 45 55 70 Baik 905 890 870

Solusi 1. Hipotesa H0 : p1=p2=p3 H1: tidak semua p1,p2 dan p3 sama 2. α =0.025 3. Daerah Kritis Test statistiknya : dengan derajat kebebasan v= (2-1)*(3-1)=2 Nilai kritis, dari tabel diperoleh χ0.0252(v=2) = 7.378 Tolak H0 jika χ2 > 7.378

Solusi 4. Perhitungan Shift Pagi Siang Malam Total Cacat 45 (57.0) 55 (56.7) 70 (56.4) 170 Baik 905 (893.0) 890 (888.3) 870 (883.6) 2665 950 945 940 2835 Perhitungan expected frequency seperti contoh-contoh sebelumnya. Sehingga chi-squares bisa dihitung: Χ2 = 6.23

Solusi 5. Keputusan Karena χ2 <7.378, maka H0 tidak bisa ditolak. 6. Kesimpulan Tidak cukup bukti untuk menyatakan bahwa ada perbedaan proporsi produksi yg cacat di berbagai shift yg berbeda