Statistika Nonparametrik PERTEMUAN KE-2 Statistika Nonparametrik FITRI CATUR LESTARI, M. Si. 2013
Hal yang perlu diingat Default: alpha = 5% Urutan prosedur pengujian hipotesis
Alur 1 Sampel kecil Uji Binomial 2 Sampel besar N>25* Uji Run Diskrit Kontinu “+” jika data >= median n>20 atau m>20 3 4 5 Median Rata-rata Modus Customize * di buku referensi (bahasa Inggris) N>35
UJI BINOMIAL
Fungsi dan Esensi Fungsi: Esensi menguji perbedaan proporsi pada populasi yang hanya memiliki dua buah kategori (skala nominal) berdasarkan proporsi yang berasal dari sampel tunggal Esensi Apakah sampel yang kita ambil berasal dari populasi yang memiliki distribusi binomial? -goodness of fit- Apakah proporsi atau frekuensi dua kategori pada sampel berasal dari populasi yang memiliki distribusi binomial?
Soal Metode yang Digunakan Sebuah penelitian tentang efek stress, sebanyak 18 mahasiswa diajarkan dua metode (A dan B) mengikat tali. Secara acak, separuh dari mahasiswa tersebut diajarkan dengan metode A kemudian metode B. Sementara itu separuh mahasiswa lainnya diajarkan dengan urutan sebaliknya. Setelah 4 jam ujian akhir, mahasiswa diminta untuk mengikat tali. Mahasiswa diamati apakah menggunakan metode yang pertama kali diajarkan atau yang kedua. Berikut datanya: Metode yang Digunakan A B Frekuensi 16 2
Penyelesaian Hipotesis Statistik uji : Uji Binomial Ho : p=q=1/2 H1 : p>q Statistik uji : Uji Binomial Tingkat signifikansi: alpha=10% Distribusi sampling : karena N<=35 sudah tersedia pada table maka tidak perlu menghitung distribusi sampling Daerah Penolakan Daerah penolakan terdiri atas semua nilai Y dimana dalam kasus ini Y adalah jumlah mahasiswa yang menggunakan metode kedua Keputusan N=18 k adalah frekuensi yang lebih kecil=2 Maka nilai tabel atau peluangnya 0.001 (p value) karena peluang terebut kurang dari alpha 10% maka Ho ditolak. Artinya p>q artinya dalam keadaan stress (setelah mengikuti ujian 4 jam) mahasiswa cenderung menggunakan metode yang pertama kali diajarkan.
SAMPEL BESAR Semakin besar N maka distribusi binomial cenderung mendekati distribusi normal. Kecenderungannya semakin tinggi ketika p mendekati ½ dan cenderung rendah ketika p mendekati 0 atau 1. Selisih p dan q tinggi akan membutuhkan sampel yang lebih besar untuk pendekatan ke distribusi normal. Jika p mendekati ½ pendekatan distribusi normal akan baik digunakan jika N>25 Jika p mendekati 0 atau 1 maka (a rule of thumbs) Npq>9 supaya pendekatan normal lebih akurat.
Formula =?
Contoh
SOAL review
SOAL 1 Mesin pesawat bekerja tidak tergantung satu dengan lainnya dan peluang mesin itu rusak adalah q=1/5. Seandainya pesawat selamat bila sekurang-kurangnya separuh dari jumlah mesinnya bekerja dengan baik, maka: Berapa peluang selamat pesawat bermesin 4? Berapa peluang selamat pesawat bermesin 2? Sebaiknya pesawat menggunakan 4 mesin atau 2 mesin?
SOAL 2 Dari setiap 100 unit barang yang diproduksi oleh suatu mesin diperkirakan gagal sebesar 30%, selanjutnya seorang manajer dari perusahaan itu ingin mengetahui kebenaran atas prakiraan tersebut dan kemudian diambil sampel sebanyak 10 buah unit barang yang dihasilkan dari produk mesin tersebut untuk diteliti. Tentukan probabilitasnya dari 10 unit barang tersebut akan berada dalam kondisi: Rusak sebanyak 6 buah Setidaknya ada sebanyak 7 buah yang rusak Paling banyak ada sebanyak 3 buah yang baik Tidak ada satupun yang baik Tidak ada satupun yang rusak
RESUME UJI BINOMIAL Dengan Ho : p=q=1/2: Tentukan N=jumlah observasi Tentukan frekuensi pada tiap kategori Untuk mencari probabilitas maka: Jika N<=35 maka menggunakan table binomial Jika N>35 maka menggunakan table normal Karena table adalah table 1 arah maka jika uji menggunakan 2 arah , probabilitas hasil tabelnya tinggal dikalikan 2. Jika : probabilitas <= alpha maka tolak Ho probabilitas > alpha maka terima Ho 25 ya Bisa menggunakan p-value atau probabilitas, bisa juga menggunakan Zhitung. Saran: Gunakan Zhitung saja
Silakan duduk secara acak UJI RUN
Fungsi dan Esensi Fungsi: Esensi: menguji keacakan dalam suatu sampel -randomness- Esensi: Apakah data kita acak?esensi acak Keacakan biasanya berkaitan dengan independensi. Sedikit run, tren waktu menunjukkan dependensi. Terlalu banyak run, mungkin terjadi fluktuatif siklis yang sistematik. Koinmungkin kurang fair atau kurang seimbang. Bukan konsen pada frekuensinya namun pada urutannya/keacakannya.
Kata Kunci Kata kunci: Notasi : m=plus n=minus N=m+n order atau sequence…urutan..susunan Run adalah satu atau lebih lambang-lambang yang identik yang didahului atau diikuti oleh suatu lambang yang berbeda atau tidak ada lambang sama sekali. Run adalah rangkaian symbol-simbol yang identic yang sesudah dan sebelumnya berbeda simbolnya atau tidak ada simbolnya sama sekali. Jumlah run=r Misal: LLL PPP L P L PPPP L P LLLLLL terdapat 9 runs Notasi : m=plus n=minus N=m+n
Contoh Soal 3 4 5 … Soal ke-3 di buku catatan Soal ke-1 kuis Uji Run Sampel kecil Sampel besar Diskrit Kontinu “+” jika data >= median n>20 atau m>20 3 4 5 Median Rata-rata Modus Customize
3 Apakah 35 mahasiswa kelas “CERDAS” duduk secara acak menurut jenis kelamin? Berikut urutan duduk 16 mahasiswa yang menjadi sampel: LLLPPPPPPPPPLLLL Jawab: Hipotesis: Ho: Mahasiswa kelas “CERDAS” duduk secara acak menurut jenis kelamin H1: Mahasiswa kelas “CERDAS” duduk secara tidak acak menurut jenis kelamin Alpha: 5% Stat uji/hitung: r=banyaknya run rhitung=3; m=7; n=9 Daerah kritis: Ho ditolak jika rhitung<= 4 atau rhitung>=14 Keputusan: Karena rhitung<=4 maka Ho ditolak Kesimpulan: Dengan tingkat kepercayaan 95% dapat disimpulkan bahwa mahasiswa kelas “CERDAS” duduk secara tidak acak menurut jenis kelamin
4 Apakah mahasiswa tingkat II duduk secara acak menurut jenis kelamin? Berikut urutan duduk 35 mahasiswa yang menjadi sampel: LPPLPPLPPLPPLPPPPLPPLLPPPPLLLPPPLPP Jawab: Hipotesis: Ho: Mahasiswa tingkat II duduk secara acak menurut jenis kelamin H1: Mahasiswa tingkat II duduk secara tidak acak menurut jenis kelamin Alpha: 5% Stat uji/hitung: r=18; m=12; n=23 Myu=16.7714; Sigma=2.6176; Zhitung=0.4694 Daerah kritis: Ho ditolak jika Zhitung<-1.96 atau Zhitung>1.96 Keputusan: Karena -1.96<Zhitung<1.96 maka Ho diterima Kesimpulan: Dengan tingkat kepercayaan 95% dapat disimpulkan bahwa mahasiswa tingkat II duduk secara acak menurut jenis kelamin
5 Data di bawah ini menunjukkan jumlah murid yang tidak masuk sekolah selama 24 hari berturut-turut: 29,25,31,18,30,28,33,31,35,29,31,33,35,28,36,30,33,26,30,28,32,31,38,27 Apakah urutan data tersebut bisa dikatakan acak? Jawab: Hipotesis: Ho: Urutan data jumlah murid yang tidak masuk sekolah bisa dikatakan acak H1: Urutan data jumlah murid yang tidak masuk sekolah tidak bisa dikatakan acak Alpha: 5% Stat uji/hitung: Median=30.5 (-),(-),(+),(-),(-), (-),(+),(+),(+),(-), (+),(+),(+),(-),(+), (-),(+), (-),(-), (-),(+),(+),(+),(-) rhitung=13; m=12; n=12 Daerah kritis: Ho ditolak jika rhitung<= 7 atau rhitung>=19 Keputusan: Karena 7<rhitung<19 maka Ho diterima Kesimpulan: Dengan tingkat kepercayaan 95% dapat disimpulkan bahwa data jumlah murid yang tidak masuk sekolah bisa dikatakan acak
Penyusunan Hipotesis Alternatif untuk Uji 1 Sisi Ketika datanya sudah di cluster atau grupkan maka jika data random maka akan ada lebih sedikit runs daripada yang diharapkan. Jika researcher menghipotesiskan karena pengaruh pengacakan maka jika datanya sudah random maka runs nya akan lebih banyak dari yang diharapkan. Pada kedua kasus tersebut disarankan menggunakan satu sisi. Intinya adalah ketika ada prior information baik dari referensi maupun expert judgement, maka bisa digunakan uji 1 sisi. Tapi kalau tidak ada informasi apapun sebelumnya dan untuk peneliti pemula, sebaiknya gunakan uji 2 sisi.
SAMPEL BESAR h=
Terima kasih