Hipotesis dan uji hipotesis Abdul Rohman Fakultas Farmasi UGM
BAHASAN Pengertian Hypothesis dan Hypothesis Testing Langkah Pengujian Hipotesis Tipe Kesalahan dalam Pengujian Hipotesis Pengujian: Dua Sisi dan Satu Sisi Uji Hipotesis: Rata-Rata Uji Hipotesis: Proporsi
Hipotesis Hipotesis : Kesimpulan sementara atau dugaan logis tentang keadaan populasi Secara statistik Hipotesis menyatakan parameter populasi dari suatu variabel yang terdapat dalam populasi dan dihitung berdasarkan statistik sampel. Karena merupakan dugaan sementara, maka hipotesis mungkin benar, tetapi mungkin juga tidak benar
PENGUJIAN HIPOTESIS Suatu prosedur pengujian hipotesis tentang parameter populasi menggunakan informasi dari sampel dan teori probabilitas untuk menentukan apakah hipotesis tersebut secara statistik dapat diterima atau ditolak tujuan pengujian hipotesis adalah kita ingin mendapatkan kesimpulan mengenai suatu populasi berdasarkan sampel yang kita miliki
Pengujian Hipotesis Bila kita ingin mengetahui pendapat mahasiswa tentang khasiat tempuyung sebagai diuretik dan menanyakan kepada seluruh mahasiswa observasi analisis deskriptif tidak perlu uji hipotesis. Tetapi bila kita hanya mengambil sampel mahasiswa uji hipotesis untuk membuktikan jawaban dari sampel bisa mewakili jawaban seluruh mahasiswa
Pengujian Hipotesis Kesimpulan dari pengujian hipotesis secara statistik hanya berupa menerima atau menolak hipotesis dan ini tidak membuktikan kebenaran hipotesis karena statistika sama sekali tidak melakukan pembuktian Penerimaan suatu hipotesis terjadi karena TIDAK CUKUP BUKTI untuk MENOLAK hipotesis tersebut dan BUKAN karena HIPOTESIS ITU BENAR
Hipotesis alternatif (H1) PASANGAN HIPOTESIS Hipotesis nol (H0) hipotesis yang diartikan sebagai tidak adanya perbedaan antara ukuran populasi dan ukuran sampel Hipotesis alternatif (H1) Lawannya hipotesis nol, adanya perbedaan data populasi dgn data sampel
Tipe Kesalahan dalam Pengujian Hipotesis Type I error Besarnya probabilitas menolak hipotesis yang benar. Besarnya kesalahan tipe I adalah Type II error Besarnya probabilitas menerima hipotesis yang salah. Besarnya kesalahan tipe II adalah 1- = Statistika Induktif - Uji Hipotesis
JENIS KESALAHAN keputusan Ho benar Ho salah Terima Ho Tepat Salah jenis II (β) Tolak Ho Salah jenis I (α) tepat Kesalahan jenis I. adalah kesalahan yg dibuat pd waktu menguji hipotesis di mana kita menolak Ho pd hal sesungguhnya Ho itu benar. Dengan kata lain adalah peluang menolak Ho yg benar Kesalahan jenis II. adalah kesalahan yg dibuat pd waktu menguji hipotesis di mana kita menerima Ho pd hal sesungguhnya Ho itu salah. Dengan kata lain adalah peluang menolak Ho yg salah
langkah Pengujian Hipotesis 1. Merumuskan Hipotesis (H0 dan HA) 2. Menentukan nilai kritis (; df) 3. Menentukan nilai hitung (nilai statistik) 4. Pengambilan keputusan 5. Membuat kesimpulan
I. MERUMUSKAN HIPOTESIS Ada 3 bentuk rumusan hipotesis: Hipotesis Deskriptif Hipotesis komparatif Hipotesis hubungan (asosiatif)
1. Hipotesis Deskriptif Merupakan hipotesis tentang nilai suatu variabel mandiri, tidak membuat perbandingan atau hubungan. Sebagai contoh bila rumusan masalah penelitian sbb: Seberapa tinggi kandungan parasetamol dalam tabel x? Berapa lama expired date produk A pada T refri? Rumusan hipotesis: Kandungan parasetamol dalam tablet X adalah 500 mg/tablet. Expired date produk X A pada suhu refri 10 hari.
2. Hipotesis Komparatif Pernyataan yg menunjukkan dugaan nilai dalam satu variabel atau lebih pada sampel yang berbeda. Sebagai contoh rumusan hipotesis komparatif: Apakah ada perbedaan kandungan parasetamol dalam tablet X dan tablet Y? Apakah ada perbedaan viskositas larutan A dan B? Rumusan hipotesis: Tidak ada perbedaan kandungan parasetamol dalam tablet X dan tablet. Ho: 1 = 2 Ha: 1 2 Viscositas larutan A tidak berbeda dibandingkan larutan B. Ho: 1 = 2 Ha: 1 2.
3. Hipotesis Komparatif Pernyataan yg menunjukkan dugaan tentang hubungan antara dua variabel atau lebih. Sebagai contoh rumusan hipotesis asosiatif: Apakah ada hubungan antara dosis obat dengan aktivitas? Apakah ada pengaruh penambahan CMC terhadap viskositas larutan? Rumusan hipotesis: Tidak ada hubungan antara jumlah iklan dengan volume penjualan. Ho: = 0 Ha: 0 Tidak ada pengaruh penambahan CMC terhadap viscositas sari buah tomat . Ho: = 0 Ha: 0.
II. MENENTUKAN NILAI KRITIS Perhatikan tingkat signifikansi () yang digunakan. Biasanya 1%, 5%, dan 10%. Untuk pengujian 2 sisi, gunakan /2, dan untuk pengujian 1 sisi, gunakan . Banyaknya sampel (n) digunakan untuk menentukan degree of freedom (df). Satu sampel: df. = n – 1 Dua sampel: df. = n1 + n2 – 2 Nilai Kritis ditentukan menggunakan tabel t atau tabel Z
Pengujian Dua Sisi dan Pengujian Satu Sisi Pengujian dua sisi (two tail) digunakan jika parameter populasi dalam hipotesis dinyata-kan sama dengan (=). Pengujian satu sisi (one tail) digunakan jika parameter populasi dalam hipotesis dinya-takan lebih besar (>) atau lebih kecil (<).
KURVA DISTRIBUSI NORMAL: PENGUJIAN DUA SISI Penerimaan Ho PenolakanHo PenolakanHo - z/2 +z/2
PEGUJIAN SATU SISI: SISI KANAN PenolakanHo Penerimaan Ho +z
PENGUJIAN SATU SISI: SISI KIRI Statistika Induktif - Uji Hipotesis PenolakanHo Penerimaan Ho - z
III. Menentukan nilai hitung Nilai hitung suatu variabel yang akan digunakan untuk uji hipotesis dapat dihitung: manual Perangkat lunak komputer SPSS Excel Minitab SAS
iv. MENENTUKA N KEPUTUSAN Membandingkan antara Nilai Hitung dengan Nilai Kritis. Jika |t hitung| > t kritis, keputusan menolak H0. Sebaliknya …. Atau menggunakan gambar kurva distribusi normal. Jika nilai hitung berada pada daerah penolakan H0, maka keputusannya adalah menolak H0. Sebaliknya, ….
BERDASARKAN KEPUTUSAN V. MEMBUAT KESIMPULAN KESIMPULAN DIBUAT BERDASARKAN KEPUTUSAN DENGAN MEMPERHATIKAN RUMUSAN HIPOTESIS
Berbagai jenis uji hipotesis Uji RATA-RATA Rata-rata sampel dengan rata-rata hipotesis Beda dua rata-rata untuk data independen (sampel besar) Beda dua rata-rata untuk data independen (sampel kecil) Beda dua rata-rata untuk data observasi yang berpasangan (paired observations) Uji ANOVA Uji KORELASI
Uji Rata-rata sampel dengan nilai sebenarnya Digunakan uji t untuk membandingkan antara nilai rata-rata eksperimental dengan nilai sebenarnya (true value) μ S adalah standar deviasi N adalah banyaknya data (replikasi) Keputusan: Jika t hitung < t-kritik = μ Jika t hitung > t-kritik ≠ μ
Contoh uji nilai rata-rata vs true value: Spesifikasi ally tertentu mensyaratkan bahwa kandungan vanadiumnya adalah 2,30 %. Sebanyak 10 kali replikasi analisis alloy menghasilkan rata-rata kandungan vanadium sebesar 2,33 % dengan suatu standar deviasi (s) = 0,02. Uji pada level propabilitas P = 0,01 (1 %) dan P = 0,05 (5 %), apakah kandungan vanadium berbeda dari spesifikasi yang dipersyaratkan? = 2,33 %; μ = 2,30 %; s = 0,02; dan N = 10 t = 4,74 DALAM CONTOH DI ATAS KITA MENGGUNAKAN UJI SATU SISI (one-tailed) atau DUA SISI (two-tailed)?
Jawab Uji dua sisi harus digunakan dalam hal ini karena kita ditanya apakah alloy berbeda dari spesifikasinya, yang berakibat bahwa nilai percobaan di atas atau di bawah dari nilai yang dispesifikasi ujinya adalah dua sisi Jika pertanyaannya adalah “ apakah kandungan vanadium lebih tinggi dibanding nilai spesifikasinya” Uji satu sisi Perhatikan bahwa derajat bebas (degrees of freedom) atau d.f adalah N-1. Jika N = 10 d.f = 9.
Nilai t-tabel (Miller and Miller, 2005) Nilai t-kritik atau t-tabel di atas adalah sesuai untuk uji dua-sisi. Untuk uji satu-sisi, nilai t- diambil dari P yang nilainya adalah 2 kali dari nilai P pada uji dua sisi.
Contoh soal Berapakah nilai t-kritik dengan df 9 pada uji dua- sisi dan uji satu-sisi dengan P = 0,05? Dengan tabel di atas dapat diketahui bahwa nilai t-kritik, d.f = 9 (dua sisi) dan P = 0,05 adalah 2,26. Untuk satu sisi berarti diambil dari P = (2 x 0,05) = 0,1 t = 1,83. Nilai t-hitung pada contoh 1 adalah sebesar 4,73 yang berarti lebih besar dibanding dengan t-kritik (P = 0,05; dua-sisi; N = 9) yang nilainya 2,26. TERDAPAT PERBEDAAN ANTARA NILAI PENGUKURAN PERCOBAAN (2,33 %) DENGAN NILAI SPESIFIKASINYA (2,30 %)
PERBANDINGAN RATA-RATA DUA SAMPEL Digunakan untuk membandingkan rata-rata hasil pengukuran suatu metode baru dengan metode standar (metode yang telah established). Dalam kasus ini, kita menggunakan uji t- untuk membanding rata-rata 2 sampel n1 dan n2 adalah banyaknya data dari sampel 1 dan 2 s dalam hal ini sering disebut dengan pooled standard deviation df = (n1 + n2 – 2)
Contoh Perbandingan dua rata-rata Adanya krom dalam suatu sampel ditentukan kadarnya dengan 2 metode. Metode 1: rata-rata = 1,48; standar deviasi = 0,28 Metode 2: rata-rata = 2,33; standar deviasi 0,31 Untuk tiap metode dilakukan 5 kali penentuan. Apkah kedua metode menghasilkan rata-rata yang berbeda? Hipotesis null: rata2 metode 1 = rata-rata metode 2. Nilai pooled standard deviasi-nya Nilai t-kritik untu (df = 8; P = 0,05) adalah 2,31. t-hitung (4,56) > t-kritik (2,31) hipotesis null ditolak DUA RATA-RATA DARI DUA METODE ADALAH BERBEDA BERMAKNA
Dengan derajat bebas (df) = Uji ini juga dapat digunakan untuk mengetahui apakah 2 kondisi percobaan mempengaruhi pada hasil. Sebagai contoh, apakah kondisi refluks dengan suhu yang berbeda (60 dan 75 oC) berpengaruh secara signifikan kepada hasil akhir. Persamaan uji t- di atas valid jika standar deviasi populasi sama. Jika SD tidak sama, maka tidak direkomendasikan untuk mem-pool-kan SD sampel dengan tujuan untuk memberikan suatu SD perkiraan keseluruhan. Untuk menguji hipotesis null, maka tidak dapat diasumsikan bahwa 2 sampel berasal dari populasi dengan SD yang sama. Nilai t- untuk keadaan semacam ini adalah: Dengan derajat bebas (df) = NILAI df YANG DIPEROLEH DIINTEGRASIKAN KE BILANGAN UTUH TERDEKAT
Contoh... Data di bawah memberikan konsentrasi tiol (mM) dalam lisat darah 2 kelompok sukarelawan. Kelompok pertama adalah normal dan yang kedua adalah penderita reumatoid artritis. Normal (1) : 1,84; 1,92; 1,94; 1,92; 1,85; 1,91; dan 2,07 Penderita (2) : 2,81; 4,06; 3,62; 3,27; 3,27; 3,76 Hipotesis null: konsentrasi rata-rata kedua kelompok adalah sama n1 = 7; rata-rata kel. Normal = 1,921; s1 = 0,076 n1 = 6; rata-rata kel. Penderita = 3,465; s2 = 0,440 t = -8,48 df = df = 5,3--jadi 5 Nilai t-kritik untuk (df = 5; dan P = 0,01) adalah 4,03 TERDAPAT PERBEDAAN ANTARA NILAI TIOL DALAM KELOMPOK NORMAL DENGAN PENDERITA
UJI t BERPASANGAN (paired t-test) Digunakan untuk membandingkan 2 metode untuk mengukur sampel dengan variasi yang berbeda. Sebagai contoh analisis parasetamol dengan 2 metode dari 10 batch yang berbeda. Dalam kasus ini, uji t di atas (untuk membandingkan 2 rata-rata) adalah tidak sesuai, karena variasi hasil mungkin disebabkan oleh variasi batch. Hal ini diatasi dengan melihat perbedaan (d) antar tiap pasang hasil yang diberikan oleh kedua metode. Hipotesis null-nya adalah: μd = 0 Yang mana: d : rata-rata dari d (perbedaan antar pasangan) sd : standar deviasi dari d Banyaknya derajat bebas t adalah n-1
Contoh... Uji apakah terdapat perbedaan yang bermakna antara hasil-hasil yang diperoleh oleh 2 metode (spektroskopi dan NIR) untuk penentuan kandungan parasetamol (% b/b) dalam suatu tablet dari 10 batch
UJI F Uji F- digunakan untuk membandingkan standar deviasi (kesalahan random antara 2 set data) Dapat digunakan untuk menguji apakah metode A lebih precise dibanding metode B satu sisi Atau untuk menguji apakah metode A mempunyai presisi yang berbeda dengan metode B dua sisi Untuk menguji apakah varians 2 sampel berbeda, maka dilakukan uji hipotesis null Ho: σ21 = σ22 s1 dan s2 diatur sedemikian rupa sehingga F ≥ 1 df untuk pembilang = n1-1; dan penyebut n2-2 UJI INI BERASUMSI BAHWA POPULASI, TEMPAT SAMPEL DIAMBIL ADALAH NORMAL
Jika hipotesis null benar rasio varians dekat dengan 1. Perbedaan dari 1 dapat terjadi karena adanya kesalahan random; jika perbedaannya sangat jauh berarti bukan karena random error. Jika F-hitung > F-tabel hipotesis null ditolak Nilai T-tabel tergantung pada ukuran/banyaknya sampel (N), level signifikasi (P), dan jenis uji yang digunakan (satu sisi vs dua sisi)
NILAI F-tabel UNTUK UJI SATU SISI DAN P = 0,05
NILAI F-tabel UNTUK UJI DUA SISI DAN P = 0,05
Contoh 6. Suatu metode baru telah diusulkan untuk penentuan kebutuhan oksigen air limbah dan hasilnya dibandingkan dengan metode standar (garam merkuri). Hasil analisisnya adalah sebagai berikut: Untuk tiap metode dilakukan 8 kali pengukuran. Apakah metode yang dihasilkan mempunyai presisi yang lebih besar dibanding metode baku Rata-rata SD (mg/L) Metode baku Metode usulan 72 3,31 1,51 Dalam kasus ini digunakan uji satu sisi Nilai F-tabel untuk pembilang 7 (8-1) dan penyebut 7 atau F7,7 (satu sisi; P = 0,05) adalah 3,787). F-hitung > F-tabel VARIANS METODE STANDAR > DIBANDING METODE YANG DIUSULKAN
UJI INI BERASUMSI BAHWA POPULASI ADALAH NORMAL PENCILAN (OUTLIER) Seringkali dalam suatu percobaan terdapat suatu nilai yang menyimpang dari nilai lainnya. Nilai yang menyimpang ini disebut dengan Pencilan Misal dalam suatu titrasi diperoleh volume titran: 12,12; 12,15; 12,13; 13,14; 12,12 ml ISO merekomendasikan untuk menggunakan uji Grubbs’. Uji ini membandingkan penyimpangan nilai yang dicurigai dari nilai rata-rata sampel dengan SD sampel. Nilai yang dicurigai adalah nilai yang jaraknya paling jauh dari mean Rata-rata dan s dihitung dengan memasukkan nilai yang dicurigai UJI INI BERASUMSI BAHWA POPULASI ADALAH NORMAL
Nilai G-kritik pada P = 0,05 dan untuk uji 2 sisi Jika G-hitung > G-kritik NILAI YANG DICURIGAI DIBUANG
Contoh 7.