SPSS ADVANCED Muhammad Reza Al Hakim
Tahapan Analisis Deskriptif Bivariat Multivariat Regresi logistik Regresi linier Variabel terikat: numerik regresi linear Variabel terkiat: kategorikal regresi logistik
Masalah Skala Pengukuran Uji Hipotesis Masalah Skala Pengukuran Jenis Hipotesis Komparatif Korelatif Tidak berpasangan Berpasangan Numerik 2 kelompok >2 kelompok Uji T tidak berpasangan One way Anova Uji T berpasangan Repeated Anova Pearson Kategorik Mann Whitney Kruskall-Walis Wilcoxon Friedman Spearson Chi-Square Fisher Kolm Smirnov (BxK) McNemar, Cohcran, marginal homogeinity, wilcoxon, friedman (PxK) Koefisien kontigensi lambda
Langkah Multivariat Seleksi variabel dengan uji bivariat p<0,25 Analisis multivariat: Metode: 3 (enter, forward, backward) Interpretasi hasil Variabel berpengaruh: Nilai p Urutan kekuatan hubungan: korelasi Regresi logistik: nilai OR; regresi linier (koefisien korelasi) Rumus prediksi variabel terikat: Regresi logistik: p = 1/(1+e-y) Regresi linier: y = konstanta + a1x1 + a2x2 + ..... aixi Menilai rumus: Regresi logistik: diskriminasi (AUC-metode receiver operating curve/ROC) dan kalibrasi (Hosmer and Lameshow) Regresi linier: nilai diskriminasi (nilai R2), kalibrasi: uji ANOVA Menilai syarat atau asumsi Analisis multivariat lain: analisis diskriminan; analisis faktor; analisis klaster p= probabilitas terjadinya suatu kejadian, contoh: penyakit e= bilangan natural 2,7 a= nilai koefisien tiap variabel x= nilai variabel bebas Logistik: Diskriminasi baik: dekati nilai 1 dan Kalibrasi baik: p>0,05 Linier: R2 dekati nilai 1, uji ANOVA <0,05 Linier: asumsi linieritas, normalitas, independensi, homogenitas, multikolinieriti
Discrimination and Calibration (1) “Discrimination is the ability of the model to correctly separate the subjects into different groups.” “Calibration is the degree of correspondence between the estimated probability produced by the model and the actual observed probabillity”
Discrimination and Calibration (2) Good calibration is essential for good decision-making. A model is well calibrated if, for every 100 individuals given a risk of x%, close to x will indeed have the event of interest. Calibration concerns average risk in a population and a well-calibrated model may assist in prevention decisions, but a miscalibrated model may lead to situations where an individual at high risk is assigned a low predicted probability, and thus forgoes effective preventive intervention. The statistical measure of how well a model separates risk is known as discrimination. But traditional analyses of risk factors are, on their own, not well suited to discriminate prognostic groups in a way that is useful for clinical decision-making. Discrimination is often described in terms of the area under the receiver operating characteristic curve (AUC), taken from the receiver operating characteristics. The AUC is often a useful first step in evaluating a model or in comparing two diagnostic or prognostic models against each other.
Discrimination and Calibration (3) Discrimination: a model’s ability to correctly distinguish the two classes outcomes. A model with good discrimination ability produces higher predicted probabilities to subjects who had events than subjects who did not have events. Perfect: result in two non overlapping sets of predicted probabilities from the model, positive and negative outcomes. Calibration: how closely the predicted probabilities agree numerically with the actual outcomes. Discrimination > calibration Model with good calibration will tend to have good discrimination and vice versa. Good discrimination can be recalibrated in a different population Balakrishnan N. Handbook of statistics: advances in survival analysis. 1st ed; USA: Elsevier; 2004.
Ukuran Kekuatan Hubungan OR atau RR Koefisien korelasi Variabel terikat Ya Tidak Risk factor a b a+b c d c+d a+c b+d N Risiko relatif: perbandingan antara risiko (insidens) pada subjek terapajan dibandingkan dengan insiden pada kelompok tidak terpajan (kohort) Odds ratio: berangkat dari kasus dan kontrol lalu ditelusuri ke belakang, di lihat seberapa sering pajanan pda kasus dibandingkan pada kontrol. Proporsi kasus dengan faktor risiko:proporsi kasus tanpa faktor risiko / proporsi kontrol dengan faktor risiko:proporsi kontrol tanpa fator risiko. RR atau OR = 1 menyatakan tidak ada beda, di bawah 1 protektif, di atas 1 faktor risiko atau penyebab IK untuk proporsi atau beda: 0 IK untuk perbandingan R/OR: 1 a/(a+b) : c/(c+d)
Regresi Logistik: prediktor syok Variabel Skala pengukuran Kategori variabel Syok 1 ya Kategorik 2 tidak Jenis kelamin 1 laki-laki 2 perempuan Perdarahan 1 positif 2 negatif Trombosit 1 < 50.000/uL 2 > 50.000/uL Hematokrit 1 > 42% 2 < 42% Hepatomegali
Regresi Logistik Variabel Skala pengukuran P Jenis kelamin 1 laki-laki 0,7525 2 perempuan Perdarahan 1 positif 0,002 2 negatif Trombosit 1 < 50.000/uL 0,001 2 > 50.000/uL Hematokrit 1 > 42% 0,052 2 < 42% Hepatomegali 1 ya 2 tidak Pembanding: variabel tidak berisiko
Regresi Logistik Kategori variabel terikat yang diprediksikan: harus bernilai 1
Regresi Logistik
Persamaan y = konstanta + a1x1 + a2x2 + ..... aixi p = 1/(1+e-y) y = -2,675 + 1,189 (perdarahan) + 1,233 (hepatomegali) + 1,137 (hematokrit)
Kualitas Persamaan Kalibrasi: Diskriminasi AUC 50-60% sangat lemah 70-80% sedang 80-90% kuat 90-100% sangat kuat
Regresi Linier Variabel Skala Pengukuran Satuan 1. Bersihan kreatinin Numerik ml/menit 2. Berat badan kg 3. Usia tahun 4. Kadar kreatinin serum mg/dl Cara sederhana menghitung nilai bersihan kreatinin
Regresi Linier
Regresi Linier Persamaan: y = konstanta + a1x1 + a2x2 + ..... aixi y = 118,663 – 49.510 (kreatinin serum)
Kualitas Persamaan Diskriminasi Kalibrasi
Terpenuhi atau tidaknya regresi linier Persamaan: y = 118,663 – 49,510 (kreatnin serum) + residu/errorr
Komponen Syarat Kata Kunci Deteksi Variabel independen dan dependen Hubungannya linear Linier Grafik scatter plot Residu Residu distribusinya normal Normal Uji normalitas p>0,05 Rerata residu 0 Mean = 0 Statisik residu Residu-variabel independen Residu tidak berkorelasi kuat dengan variabel independen Independen Uji Durbin-Watson sekitar 2, korelasi <0,8 Varian dari residu konstan Konstan Scatter plot stad residual-std pred value Variabel independen Tidak ada korelasi kuat antara variabel independen Autokorelasi Collinierity diagnostic: nilai tollerance <0,4 Korelasi <0,8
Residu dan variabel bebas tidak mempunyai korelasi yang kuat dan antarvariabel bebas tidak mempunyai korelasi yang kuat
Terima Kasih