ANALISIS DATA KATEGORIK Pertemuan III Inferensia Tabel Kontingensi Ukuran Asosiasi : Cohen’s Kappa Ukuran Asosiasi Data Ordinal Marginal dan Conditional Association (Tabel Kontingensi 3 Arah)
Inferensia Tabel Kontingensi Penduga Selang Parameter Ukuran Asosiasi (sampel besar) Uji Independensi tabel 2 arah Chi-Square Test Tabel 2 arah data ordinal Tabel 3 arah Uji eksak untuk data sampel kecil Namun dilihat dulu mengenai inferensia untuk proporsi, Agresti Bab 1.3 Novi Hidayat Pusponegoro
Interval Konfidensi untuk selisih proporsi CI (1-α )x100% untuk menduga 𝜋 1 − 𝜋 2 : dengan Novi Hidayat Pusponegoro
Interval Konfidensi untuk θ Distribusi sampling nilai penduga OR tidak simetris, meliputi nilai nol s.d positif tak hingga Solusi: menggunakan log (θ) atau log ( 𝜃 ), nilainya meliputi negatif tak hingga s.d positif tak hingga dan distribusinya menjadi asymptotic normal sehingga memudahkan dalam inferensi CI (1-α )x100% untuk menduga log (θ) : Novi Hidayat Pusponegoro
Interval Konfidensi untuk RR Jika RR (r), maka CI (1-α)x100% untuk menduga r adalah : Dengan Novi Hidayat Pusponegoro
Novi Hidayat Pusponegoro Interval Konfidensi Yang biasa digunakan adalah interval konfidensi 95%, yang berarti bahwa estimasi range yang kita lakukan memiliki 95% kesempatan mengandung nilai populasi yang benar atau Masih memiliki 5% kesempatan bahwa range yang kita buat tidak mengandung nilai populasi yang benar Novi Hidayat Pusponegoro
Novi Hidayat Pusponegoro Interval Konfidensi Jika kita menginginkan peluang yang lebih kecil untuk terjadinya error, maka bisa digunakan interval konfidensi 99%. Konsekuensinya adalah range-nya lebih lebar Jika peluang terjadinya error lebih besar masih bisa diterima maka bisa menggunakan interval konfidensi 90% Novi Hidayat Pusponegoro
Novi Hidayat Pusponegoro INFERENSIA TABEL 2X2 Secara umum, uji hipotesis yang ingin diuji dalam tabel kontingensi 2x2 adalah: Ho: Tidak terdapat hubungan antara variabel X dan Y H1: Terdapat hubungan antara variabel X dan Y Novi Hidayat Pusponegoro
Novi Hidayat Pusponegoro Statistik Uji Pearson 𝝌 𝟐 Untuk tabel kontingensi i x j, rumus umunya dinyatakan sebagai: 𝜒 2 = 𝑖 𝑗 𝑂 𝑖𝑗 − 𝐸 𝑖𝑗 2 𝐸 𝑖𝑗 i = indeks baris dan j = indeks kolom 𝐸 𝑖𝑗 = frekuensi harapan jika Ho diterima, dinyatakan sebagai 𝐸 𝑖𝑗 = 𝑛 𝑖 𝑚 𝑗 𝑛 𝑡𝑜𝑡𝑎𝑙 , dengan 𝑛 𝑖 merupakan jumlah observasi berdasarkan baris ke-i dan 𝑚 𝑗 menyatakan jumlah observasi berdasarkan kolom ke-j Novi Hidayat Pusponegoro
Novi Hidayat Pusponegoro Statistik Uji Bentuk statistik uji 𝜒 2 khusus untuk tabel 2x2: 𝜒 2 = 𝑎𝑑−𝑏𝑐 2 𝑛 𝑚 1 𝑚 2 𝑛 1 𝑛 2 Distribusi statistik uji 𝜒 2 mendekati distribusi chi-square dengan derajat bebas (banyak baris dikurangi satu) dikalikan dengan (banyak kolom dikurangi satu), jika Ho benar. (Karl Pearson, 1904) Novi Hidayat Pusponegoro
Novi Hidayat Pusponegoro Statistik Uji Untuk tabel 2x2, statistik uji 𝜒 2 akan mendekati distribusi chi-square dengan derajat bebas 1, jika tidak ada hubungan antara paparan dan penyakti, sehingga tabel untuk distribusi ini dapat digunakan untuk mendapatkan tingkat signifikansi (p-value) Statistik uji 𝜒 2 valid digunakan jika tidak ada sel yang memiliki frekuensi cukup kecil. SPSS, expected count kurang dari 5 Novi Hidayat Pusponegoro
Novi Hidayat Pusponegoro Statistik Uji Khusus untuk tabel 2x2, Yates (1934) mengusulkan rumus yang memuat koreksi (continuity correction) ketidaksesuaian pendekatan distribusi kontinu chi-square pada distribusi sampling statistik uji 𝜒 2 yang bersifat diskrit: 𝜒 2 = 𝑠𝑒𝑙 𝑂−𝐸 − 1 2 2 𝑒 atau 𝜒 2 = 𝑎𝑑−𝑏𝑐− 𝑛 2 2 𝑛 1 𝑛 2 𝑚 1 𝑚 2 Novi Hidayat Pusponegoro
Novi Hidayat Pusponegoro Statistik Uji Uji Rasio Likelihood 𝑮 𝟐 =𝟐 𝒊 𝒋 𝑶 𝒊𝒋 𝒍𝒏 𝑶 𝒊𝒋 𝑬 𝒊𝒋 Kriteria pengambilan keputusan sama dengan apabila digunakan statistik 𝜒 2 , karena distribusi pendekatan 𝐺 2 adalah juga 𝜒 2 (𝑏−1)(𝑘−1) Jarang digunakan, rumit Nilai 𝐺 2 tidak akan jauh berbeda dengan 𝜒 2 Novi Hidayat Pusponegoro
Novi Hidayat Pusponegoro Cross Sectional Study Untuk menguji hipotesis ada tidaknya hubungan diantara paparan dan penyakit, digunakan uji chi-square (sda) Novi Hidayat Pusponegoro
Novi Hidayat Pusponegoro Contoh 1: Tabel berikut adalah hasil dari case control study yang dilakukan di sebuah restaurant. OR = ad = (218)(85) = 19.6 bc (45)(21) Novi Hidayat Pusponegoro
Novi Hidayat Pusponegoro Interval konfidensi 95% adalah 11.0-34.9 (Peluang range 11.0-34.9 mengandung OR yang benar adalah 95%) Batas Bawah CI = 11.0 (>1) Kesimpulan: orang yang makan salsa benar-benar lebih cenderung untuk menderita Hepatitis A dibandingkan dengan orang yang tidak makan salsa Novi Hidayat Pusponegoro
Novi Hidayat Pusponegoro Contoh 2: Penelitian berkaitan dengan wabah Salmonella di sebuah kapal pesiar Adakah perbedaan signifikan pada jumlah orang yang terkena wabah Salmonella antara orang yang makan tomat dengan yang tidak Novi Hidayat Pusponegoro
Novi Hidayat Pusponegoro Untuk melakukan uji chi-square, kondisi ini harus terpenuhi: Jumlah observasi total minimal adalah 30 Setiap sel dalam tabel harus berisi 5 atau lebih Untuk melakukan uji Chi-Square, kita membandingkan data observasi (hasil penelitian) dengan data yang kita harapkan Novi Hidayat Pusponegoro
Novi Hidayat Pusponegoro Penghitungan frekuensi harapan: Row Total x Column Total Grand Total Novi Hidayat Pusponegoro
Novi Hidayat Pusponegoro Menghitung statistik chi-square-nya: [(Observed – Expected)2/Expected] untuk tiap sel di dalam tabel The chi-square (χ2) adalah 19.2 8.7 + 2.2 + 6.6 + 1.7 = 19.2 (Chi square tabel dengan df 1 = 3.84) Tolak Ho, ada hubungan antara makan tomat dengan wabah salmonella Novi Hidayat Pusponegoro
Novi Hidayat Pusponegoro Contoh 3: Dalam suatu studi longitudinal yang dilaksanakan di suatu perusahaan, karyawan perusahaan ditanya tentang berbagai pertanyaan mengenai lingkungan kerjanya dan kemudian karyawan ini diikuti selama periode waktu 10 tahun. Data hasil pengamatan disajikan dalam tabel berikut. Kejadian CHD Total Ya Tidak Apakah anda bekerja di bawah tekanan? 97 307 404 200 1409 1609 297 1716 2013 Novi Hidayat Pusponegoro
Nilai statistik uji chi-square P-value Novi Hidayat Pusponegoro
interval konfidensi 95% untuk RR 𝑅 𝑅 interval konfidensi 95% untuk RR Novi Hidayat Pusponegoro
Novi Hidayat Pusponegoro Catatan: Uji Chi Square mengasumsikan bahwa observasinya adalah independent (nilai dari satu observasi tidak bergantung dari nilai observasi lainnya) Jangan gunakan Chi-Square pada: Pengulangan observasi pada kelompok orang yang sama (misalnya: pre dan post tes) Matched pair design ( case dan control akan dicocokkan pada variabel seperti JK dan usia. Novi Hidayat Pusponegoro
Ukuran Asosiasi Data Ordinal Jika X dan Y ordinal, maka asosiasi antara X dan Y, bisa sejalan X naik, Y naik - vice versa. Selanjutnya, untuk masing-masing pasangan variabel dinyatakan sebagai pasangan; Concordant, jika subjek memberikan ranking tinggi pada variabel X dan Y Discordant, jika subjek memberikan ranking tinggi pada variabel X namun memberikan ranking rendah pada Y Novi Hidayat Pusponegoro
Ukuran Asosiasi Data Ordinal (2) Ukuran Asosiasi Gamma dengan estimasi : ContohP: Agresti, page 57-59 Interpretasi nilai Gamma Novi Hidayat Pusponegoro
Uji Independensi tabel 2 Arah data ordinal Agresti, page 86-87 Novi Hidayat Pusponegoro
Uji Independensi tabel 2 Arah data ordinal (2) Novi Hidayat Pusponegoro
Ukuran Asosiasi (lanjutan): Cohen’s Kappa Digunakan jika variabel kolom dan baris memiliki level/kategori yang sama, maka asosiasi terhadap variabel tersebut adalah ukuran kesepakatan. Contoh: penelitian untuk melihat penilaian terhadap produk Penilaian juri kontes X Factor Interpretasi nilai Cohen’s Kappa: Independent, jika nilainya sama dengan nol Akan menunjukkan hubungan jika lebih dari nol Menunjukkan hubungan yang kuat jika mendekati 1 Contoh : Azen, page 61 Novi Hidayat Pusponegoro
Tabel Kontingensi 3 Arah Marginal dan Conditional Association Simpson;s Paradox, jika marginal association berbeda arah dengan cond. Association Cond. asc marginal. asc Novi Hidayat Pusponegoro
Marginal dan Conditional Odds Ratio Simpson;s Paradox, juga dapat tergambarkan melalui ukuran odds Conditional Odds Ratio: Marginal Odds Ratio: Dari tabel 2.6 diatas: Nilai Odds ratio digunakan untuk memperlihatkan kecenderungan pemberian hukuman pada pelaku berkulit putih dan hitam Nilai COR untuk Z=White adalah 0.43, dan Z= Black adalah 0 -> keduanya menunjukkan pelaku kulit hitam lebih cenderung untuk dihukum Nilai MOR (tanpa mempedulikan ras dari korban ), adalah 1,45 -> menunjukkan pelaku kulit putih lebih cenderung untuk dihukum Novi Hidayat Pusponegoro
Marginal dan Conditional Independence Novi Hidayat Pusponegoro
Homogenous Association/ Asosiasi homogen Hubungan antara variabel X, Y dan Z ,merupakan asosiasi homogen jika: Menyatakan: Tidak ada efek interaksi antara 2 variable, berdasakan level pada variabel ke3 Tidak ada interaksi 3 variabel Cond. Indep. merupakan contoh khusus dari asosiasi homogen Jika salah satu dari syarat diatas tidak terpenuhi, maka cond. Odds ratio bergantung pada kategori variabel ke3 Novi Hidayat Pusponegoro
Uji Independensi tabel 3 Arah Azen, page 89-94 Novi Hidayat Pusponegoro
Uji Independensi tabel 3 Arah (2) Complete Independence Marginal Independence Novi Hidayat Pusponegoro
Uji Independensi tabel 3 Arah (3) Conditional Independence Novi Hidayat Pusponegoro
Novi Hidayat Pusponegoro Suatu penelitian retrospective telah dilakukan pada semua orang laki-laki yang berumur 50-54 tahun selama periode 1 bulan menunjukkan bahwa 55 orang yang meninggal karena cardio vascular disease (CVD), 15 orang pada kelompok high salt diet sebelum meninggal; sedangkan dari 35 orang meninggal karena penyebab lain, 5 dalam kelompok high salt diet. Buatlah : tabel 2x2 kemudian hitung ukuran keeratan hubungan antara high salt diet dengan kematian karena CVD hitung 95% interval konfidensi untuk ukuran keeratan hubungan tsb, selanjunya lakukan uji asosiasi apakah ada hubungan antara high salt diet dengan CVD La t I han Novi Hidayat Pusponegoro
Novi Hidayat Pusponegoro Seorang dokter ingin meneliti apakah penyakit Cervical Cancer pada wanita disebabkan oleh usia pada kehamilan pertama. Dari 48 wanita penderita kanker ternyata ada 36 wanita yang usia kehamilan pertamanya ≤25 tahun. Sedangkan dari 77 wanita bukan penderita kanker, ternyata ada 35 wanita yang usia kehamilan pertamanya>25 tahun. Buatlah tabel kontingensi 2 x 2 Kemudian hitung ukuran keeratan hubungan antara usia perkawinan pertama dengan Cervical Cancer Hitung 95% interval konfidensi untuk ukuran keeratan hubungan tsb Lakukan uji asosiasi, apakah ada hubungan antara cervical cancer dengan usia kehamilan pertama La t I han Novi Hidayat Pusponegoro