Korelasi/Regresi Linier Nurhalina, SKM.M.Epid Analisis Kesehatan UMP
Korelasi Menilai Hubungan antara 2 variabel numerik, Contoh: Apakah ada hubungan antara umur dan tekanan darah Hubungan TPA dengan IPK mahasiswa Hubungan antara tinggi badan dan FEV1(Force Expiratory Volume 1 dalam menit)
Cara sederhana Memakai Diagram Tebar ( Scatter Diagram) Y x x V. Dependen x x + x x + x X V. Independen
Contoh diagram tebar antara TB FEV1
Ukuran Hubungan 2 Var Pearson’s Correlation Coefficient ( r ) Kekuatan hubungan Berkisar antara 0 dan 1 0= tidak ada hubungan linier antara Var X dg Var Y 1= hubungan kedua variabel linier sempurna Yang sering berada antara 0 dan 1
Kekuatan hubungan Dapat dilihat dari scatter plot Y Y x x x x x x x x
Arah hubungan Ditandai oleh + dan – + = Hubungan direct: korelasi positif yang berarti semakin besar nilai X semakin besar juga nilai Y - = Hubungan terbalik ( inverse): korelasi negatif berarti kenaikan variabel X diikuti penurunan var Y atau sebaliknya
Arah hubungan Y Y x x x x x x x x x x X X Hubungan positif (+) Hubungan negatif (-)
Hubungan Non linier Y Y x x x x x x x x x x x x x x x x x x x x x x X -Parabolik -Bisa juga hub Exponensial Tidak jelas polanya (Tidak ada hub linier)
Interpretasi Koef Korelasi Kekuatan hub (subjektif) r<0,4 : Hub lemah 0,4 < r < 0,8 : Sedang r > 0,8 : Kuat Korelasi tidak selalu berarti hubungan sebab akibat( Causality) Korelasi yang lemah atau mendekati 0 berarti tidak ada hub linier, mungkin hub parabol atau exponensial
Korelasi: Data Lay-out dan perhitungan r Subjek X X2 Y Y2 X.Y 1 X1 X12 Y1 Y12 XY1 . X. X. 2 Y. Y. 2 XY. n Xn Xn2 Yn Yn2 XYn (X) = … (X2) … (Y)… (Y2)… (XY) = …
CONTOH KORELASI 100 180 125 245 320 Subjek (X) Usia (Y) Lama hari rawat X.Y 1 20/ 100 5 100 2 30/ 0 6 180 3 25/ 25 125 4 35/ 25 7 245 40/ 100 8 320 (X) = 150/ 250 (X) = 31 (XY) = 970 (X2) = 4750 (Y2) = 199 vx =
Koefisien Determinasi (r2) Koefisien determinasi mengukur proporsi varians Y yang dapat diterangkan oleh X Nilai r2 berkisar antara 0 ( tidak ada varians Y yang dijelaskan) sampai 1 ( seluruh varians Y dapat dijelaskan) Dari contoh didapat r=0,97…..r2=0,94…artinya 94 % lama hari rawat dipengaruhi oleh umur
Regresi Linier Mencari garis terbaik Adabeberapa cara mencari garis regresi antara lain: Free Hand Metode Ordinary Least Square Metode OLS persamaan garis yang dibuat sedemikian rupa sehingga kuadrat selisih nilai observasi ke nilai di garis regresi adalah minimum Persamaan y’=a + bx+e
Y’= a + bX +e Y’= nilai Y yang di prediksi a = intercept…nilai y pada saat x=0…titik potong garis regresi dengan sumbu Y b= slope kemiringan garis…perubahan variabel y pada saat var x berubah satu unit e = Error dari model dalam memprediksi nilai Y
Garis regresi y’=a+bx Y + Y’=a+bX + + b + + a X a= intercept b= slope Koef Reg
Fungsi Pers Regresi Untuk memprediksi nilai y kalau x diketahui Contoh: Berapa tek sistolik jika umur 50 tahun Berapa IPK mahasiswa kalau TPA nya 500 Berapa lama hari rawat kalau pasien berumur 40 tahun Berapa level FEV1 pada orang dengan tinggi badan 170 cm
Asumsi pada Regresi Linier Nilai mean dari Y adalah fungsi garis lurus (Linierity) X……….. Y’= a+ bX+e Nilai Y terdistribusi normal untuk setiapnilai X (normality) Varian Y adalah sama untuk setiap nilai X (homoscedasticity) Nilai X dan Y tidak saling berkaitan (independency)
Persamaan Regresi Y’=α+β X Y= rata-rata Y X=rata-rata X
100 180 125 245 320 Subjek (X) Usia (Y) Lama hari rawat X.Y 1 20 5 2 30 6 180 3 25 125 4 35 7 245 40 8 320 (X) = 150 (X) = 31 (XY) = 970 (X2) = 4750 S2Y=62.5 (Y2) = 199 S2X=1.7
Persamaan garis regresi linier: Lama hari rawat (Y) = a + b1Xi Y’ = 1.4 + 0.16 (Usia)
INFERENSI KOEF KORELASI Estimasi r Dari contoh r=0,97pada CI 95% Batas bawah r Batas atas r
Uji hipotesis r Ho Γ=0 Ha Γ≠0 α=0,05 Uji stat Uji t t=6,91df n-2….pv ,0,005 Ho ditolak
Inferens Koef Reg β Lama hari rawat (Y) = a + b1Xi Yi = 1.4 + 0.16 (Usia) CI =95 95% CI
UJi hipotesis β Ho β=0 Ha: β≠0 a=0,05 Uji Hipotesis: t=18,54 df=n-2 pv < 0,005 Keputusan uji Ho ditolak Kesimpulan koef β tidaknsama dengan 0