Presentasi sedang didownload. Silahkan tunggu

Presentasi sedang didownload. Silahkan tunggu

ANALISIS DATA KATEGORIK

Presentasi serupa


Presentasi berjudul: "ANALISIS DATA KATEGORIK"— Transcript presentasi:

1 ANALISIS DATA KATEGORIK
Pertemuan III Inferensia Tabel Kontingensi Ukuran Asosiasi : Cohen’s Kappa Ukuran Asosiasi Data Ordinal Marginal dan Conditional Association (Tabel Kontingensi 3 Arah)

2 Inferensia Tabel Kontingensi
Penduga Selang Parameter Ukuran Asosiasi (sampel besar) Uji Independensi tabel 2 arah Chi-Square Test Tabel 2 arah data ordinal Tabel 3 arah Uji eksak untuk data sampel kecil Namun dilihat dulu mengenai inferensia untuk proporsi, Agresti Bab 1.3 Novi Hidayat Pusponegoro

3 Interval Konfidensi untuk selisih proporsi
CI (1-α )x100% untuk menduga 𝜋 1 − 𝜋 2 : dengan Novi Hidayat Pusponegoro

4 Interval Konfidensi untuk θ
Distribusi sampling nilai penduga OR tidak simetris, meliputi nilai nol s.d positif tak hingga Solusi: menggunakan log (θ) atau log ( 𝜃 ), nilainya meliputi negatif tak hingga s.d positif tak hingga dan distribusinya menjadi asymptotic normal sehingga memudahkan dalam inferensi CI (1-α )x100% untuk menduga log (θ) : Novi Hidayat Pusponegoro

5 Interval Konfidensi untuk RR
Jika RR (r), maka CI (1-α)x100% untuk menduga r adalah : Dengan Novi Hidayat Pusponegoro

6 Novi Hidayat Pusponegoro
Interval Konfidensi Yang biasa digunakan adalah interval konfidensi 95%, yang berarti bahwa estimasi range yang kita lakukan memiliki 95% kesempatan mengandung nilai populasi yang benar atau Masih memiliki 5% kesempatan bahwa range yang kita buat tidak mengandung nilai populasi yang benar Novi Hidayat Pusponegoro

7 Novi Hidayat Pusponegoro
Interval Konfidensi Jika kita menginginkan peluang yang lebih kecil untuk terjadinya error, maka bisa digunakan interval konfidensi 99%. Konsekuensinya adalah range-nya lebih lebar Jika peluang terjadinya error lebih besar masih bisa diterima maka bisa menggunakan interval konfidensi 90% Novi Hidayat Pusponegoro

8 Novi Hidayat Pusponegoro
INFERENSIA TABEL 2X2 Secara umum, uji hipotesis yang ingin diuji dalam tabel kontingensi 2x2 adalah: Ho: Tidak terdapat hubungan antara variabel X dan Y H1: Terdapat hubungan antara variabel X dan Y Novi Hidayat Pusponegoro

9 Novi Hidayat Pusponegoro
Statistik Uji Pearson 𝝌 𝟐 Untuk tabel kontingensi i x j, rumus umunya dinyatakan sebagai: 𝜒 2 = 𝑖 𝑗 𝑂 𝑖𝑗 − 𝐸 𝑖𝑗 𝐸 𝑖𝑗 i = indeks baris dan j = indeks kolom 𝐸 𝑖𝑗 = frekuensi harapan jika Ho diterima, dinyatakan sebagai 𝐸 𝑖𝑗 = 𝑛 𝑖 𝑚 𝑗 𝑛 𝑡𝑜𝑡𝑎𝑙 , dengan 𝑛 𝑖 merupakan jumlah observasi berdasarkan baris ke-i dan 𝑚 𝑗 menyatakan jumlah observasi berdasarkan kolom ke-j Novi Hidayat Pusponegoro

10 Novi Hidayat Pusponegoro
Statistik Uji Bentuk statistik uji 𝜒 2 khusus untuk tabel 2x2: 𝜒 2 = 𝑎𝑑−𝑏𝑐 2 𝑛 𝑚 1 𝑚 2 𝑛 1 𝑛 2 Distribusi statistik uji 𝜒 2 mendekati distribusi chi-square dengan derajat bebas (banyak baris dikurangi satu) dikalikan dengan (banyak kolom dikurangi satu), jika Ho benar. (Karl Pearson, 1904) Novi Hidayat Pusponegoro

11 Novi Hidayat Pusponegoro
Statistik Uji Untuk tabel 2x2, statistik uji 𝜒 2 akan mendekati distribusi chi-square dengan derajat bebas 1, jika tidak ada hubungan antara paparan dan penyakti, sehingga tabel untuk distribusi ini dapat digunakan untuk mendapatkan tingkat signifikansi (p-value) Statistik uji 𝜒 2 valid digunakan jika tidak ada sel yang memiliki frekuensi cukup kecil. SPSS, expected count kurang dari 5 Novi Hidayat Pusponegoro

12 Novi Hidayat Pusponegoro
Statistik Uji Khusus untuk tabel 2x2, Yates (1934) mengusulkan rumus yang memuat koreksi (continuity correction) ketidaksesuaian pendekatan distribusi kontinu chi-square pada distribusi sampling statistik uji 𝜒 2 yang bersifat diskrit: 𝜒 2 = 𝑠𝑒𝑙 𝑂−𝐸 − 𝑒 atau 𝜒 2 = 𝑎𝑑−𝑏𝑐− 𝑛 𝑛 1 𝑛 2 𝑚 1 𝑚 2 Novi Hidayat Pusponegoro

13 Novi Hidayat Pusponegoro
Statistik Uji Uji Rasio Likelihood 𝑮 𝟐 =𝟐 𝒊 𝒋 𝑶 𝒊𝒋 𝒍𝒏 𝑶 𝒊𝒋 𝑬 𝒊𝒋 Kriteria pengambilan keputusan sama dengan apabila digunakan statistik 𝜒 2 , karena distribusi pendekatan 𝐺 2 adalah juga 𝜒 2 (𝑏−1)(𝑘−1) Jarang digunakan, rumit Nilai 𝐺 2 tidak akan jauh berbeda dengan 𝜒 2 Novi Hidayat Pusponegoro

14 Novi Hidayat Pusponegoro
Cross Sectional Study Untuk menguji hipotesis ada tidaknya hubungan diantara paparan dan penyakit, digunakan uji chi-square (sda) Novi Hidayat Pusponegoro

15 Novi Hidayat Pusponegoro
Contoh 1: Tabel berikut adalah hasil dari case control study yang dilakukan di sebuah restaurant. OR = ad = (218)(85) = bc (45)(21) Novi Hidayat Pusponegoro

16 Novi Hidayat Pusponegoro
Interval konfidensi 95% adalah (Peluang range mengandung OR yang benar adalah 95%) Batas Bawah CI = 11.0 (>1) Kesimpulan: orang yang makan salsa benar-benar lebih cenderung untuk menderita Hepatitis A dibandingkan dengan orang yang tidak makan salsa Novi Hidayat Pusponegoro

17 Novi Hidayat Pusponegoro
Contoh 2: Penelitian berkaitan dengan wabah Salmonella di sebuah kapal pesiar Adakah perbedaan signifikan pada jumlah orang yang terkena wabah Salmonella antara orang yang makan tomat dengan yang tidak Novi Hidayat Pusponegoro

18 Novi Hidayat Pusponegoro
Untuk melakukan uji chi-square, kondisi ini harus terpenuhi: Jumlah observasi total minimal adalah 30 Setiap sel dalam tabel harus berisi 5 atau lebih Untuk melakukan uji Chi-Square, kita membandingkan data observasi (hasil penelitian) dengan data yang kita harapkan Novi Hidayat Pusponegoro

19 Novi Hidayat Pusponegoro
Penghitungan frekuensi harapan: Row Total x Column Total Grand Total Novi Hidayat Pusponegoro

20 Novi Hidayat Pusponegoro
Menghitung statistik chi-square-nya: [(Observed – Expected)2/Expected] untuk tiap sel di dalam tabel The chi-square (χ2) adalah 19.2 = 19.2 (Chi square tabel dengan df 1 = 3.84) Tolak Ho, ada hubungan antara makan tomat dengan wabah salmonella Novi Hidayat Pusponegoro

21 Novi Hidayat Pusponegoro
Contoh 3: Dalam suatu studi longitudinal yang dilaksanakan di suatu perusahaan, karyawan perusahaan ditanya tentang berbagai pertanyaan mengenai lingkungan kerjanya dan kemudian karyawan ini diikuti selama periode waktu 10 tahun. Data hasil pengamatan disajikan dalam tabel berikut. Kejadian CHD Total Ya Tidak Apakah anda bekerja di bawah tekanan? 97 307 404 200 1409 1609 297 1716 2013 Novi Hidayat Pusponegoro

22 Nilai statistik uji chi-square P-value
Novi Hidayat Pusponegoro

23 interval konfidensi 95% untuk RR
𝑅 𝑅 interval konfidensi 95% untuk RR Novi Hidayat Pusponegoro

24 Novi Hidayat Pusponegoro
Catatan: Uji Chi Square mengasumsikan bahwa observasinya adalah independent (nilai dari satu observasi tidak bergantung dari nilai observasi lainnya) Jangan gunakan Chi-Square pada: Pengulangan observasi pada kelompok orang yang sama (misalnya: pre dan post tes) Matched pair design ( case dan control akan dicocokkan pada variabel seperti JK dan usia. Novi Hidayat Pusponegoro

25 Ukuran Asosiasi Data Ordinal
Jika X dan Y ordinal, maka asosiasi antara X dan Y, bisa sejalan X naik, Y naik - vice versa. Selanjutnya, untuk masing-masing pasangan variabel dinyatakan sebagai pasangan; Concordant, jika subjek memberikan ranking tinggi pada variabel X dan Y Discordant, jika subjek memberikan ranking tinggi pada variabel X namun memberikan ranking rendah pada Y Novi Hidayat Pusponegoro

26 Ukuran Asosiasi Data Ordinal (2)
Ukuran Asosiasi Gamma dengan estimasi : ContohP: Agresti, page Interpretasi nilai Gamma Novi Hidayat Pusponegoro

27 Uji Independensi tabel 2 Arah data ordinal
Agresti, page 86-87 Novi Hidayat Pusponegoro

28 Uji Independensi tabel 2 Arah data ordinal (2)
Novi Hidayat Pusponegoro

29 Ukuran Asosiasi (lanjutan): Cohen’s Kappa
Digunakan jika variabel kolom dan baris memiliki level/kategori yang sama, maka asosiasi terhadap variabel tersebut adalah ukuran kesepakatan. Contoh: penelitian untuk melihat penilaian terhadap produk Penilaian juri kontes X Factor Interpretasi nilai Cohen’s Kappa: Independent, jika nilainya sama dengan nol Akan menunjukkan hubungan jika lebih dari nol Menunjukkan hubungan yang kuat jika mendekati 1 Contoh : Azen, page 61 Novi Hidayat Pusponegoro

30 Tabel Kontingensi 3 Arah Marginal dan Conditional Association
Simpson;s Paradox, jika marginal association berbeda arah dengan cond. Association Cond. asc marginal. asc Novi Hidayat Pusponegoro

31 Marginal dan Conditional Odds Ratio
Simpson;s Paradox, juga dapat tergambarkan melalui ukuran odds Conditional Odds Ratio: Marginal Odds Ratio: Dari tabel 2.6 diatas: Nilai Odds ratio digunakan untuk memperlihatkan kecenderungan pemberian hukuman pada pelaku berkulit putih dan hitam Nilai COR untuk Z=White adalah 0.43, dan Z= Black adalah 0 -> keduanya menunjukkan pelaku kulit hitam lebih cenderung untuk dihukum Nilai MOR (tanpa mempedulikan ras dari korban ), adalah 1,45 -> menunjukkan pelaku kulit putih lebih cenderung untuk dihukum Novi Hidayat Pusponegoro

32 Marginal dan Conditional Independence
Novi Hidayat Pusponegoro

33 Homogenous Association/ Asosiasi homogen
Hubungan antara variabel X, Y dan Z ,merupakan asosiasi homogen jika: Menyatakan: Tidak ada efek interaksi antara 2 variable, berdasakan level pada variabel ke3 Tidak ada interaksi 3 variabel Cond. Indep. merupakan contoh khusus dari asosiasi homogen Jika salah satu dari syarat diatas tidak terpenuhi, maka cond. Odds ratio bergantung pada kategori variabel ke3 Novi Hidayat Pusponegoro

34 Uji Independensi tabel 3 Arah
Azen, page 89-94 Novi Hidayat Pusponegoro

35 Uji Independensi tabel 3 Arah (2)
Complete Independence Marginal Independence Novi Hidayat Pusponegoro

36 Uji Independensi tabel 3 Arah (3)
Conditional Independence Novi Hidayat Pusponegoro

37 Novi Hidayat Pusponegoro
Suatu penelitian retrospective telah dilakukan pada semua orang laki-laki yang berumur tahun selama periode 1 bulan menunjukkan bahwa 55 orang yang meninggal karena cardio vascular disease (CVD), 15 orang pada kelompok high salt diet sebelum meninggal; sedangkan dari 35 orang meninggal karena penyebab lain, 5 dalam kelompok high salt diet. Buatlah : tabel 2x2 kemudian hitung ukuran keeratan hubungan antara high salt diet dengan kematian karena CVD hitung 95% interval konfidensi untuk ukuran keeratan hubungan tsb, selanjunya lakukan uji asosiasi apakah ada hubungan antara high salt diet dengan CVD La t I han Novi Hidayat Pusponegoro

38 Novi Hidayat Pusponegoro
Seorang dokter ingin meneliti apakah penyakit Cervical Cancer pada wanita disebabkan oleh usia pada kehamilan pertama. Dari 48 wanita penderita kanker ternyata ada 36 wanita yang usia kehamilan pertamanya ≤25 tahun. Sedangkan dari 77 wanita bukan penderita kanker, ternyata ada 35 wanita yang usia kehamilan pertamanya>25 tahun. Buatlah tabel kontingensi 2 x 2 Kemudian hitung ukuran keeratan hubungan antara usia perkawinan pertama dengan Cervical Cancer Hitung 95% interval konfidensi untuk ukuran keeratan hubungan tsb Lakukan uji asosiasi, apakah ada hubungan antara cervical cancer dengan usia kehamilan pertama La t I han Novi Hidayat Pusponegoro


Download ppt "ANALISIS DATA KATEGORIK"

Presentasi serupa


Iklan oleh Google