Korelasi dan Regresi Linier Jurusan BIOSTATISTIKA Fakultas Kesehatan Masyarakat Universitas Indonesia 2009
Jur. Biostatistika, FKM UI, 2001 Korelasi Menilai hubungan 2 variabel numerik Contoh: 1. Apakah ada hubungan antara umur dengan tekanan darah sistolik 2. Apakah ada hubungan antara income keluarga dengan IP mhs 3. Apakah ada hubungan antara umur pasien dengan lama hari rawat 4. Apakah ada hubungan antara tinggi badan (TB) dengan FEV1 Diagram tebar (scatter-plot) Sumbu X Variabel Independen Sumbu Y Variabel Dependen Jur. Biostatistika, FKM UI, 2001
Diagram tebar & garis regresi Contoh Garis regresi FEV1 dengan tinggi badan Jur. Biostatistika, FKM UI, 2001
Jur. Biostatistika, FKM UI, 2001 Korelasi Pola hubungan antara 2 variabel numerik 1. Linier: - Positif - Negatif 2. Non-Linier: - Parabolik - Exponensial Jur. Biostatistika, FKM UI, 2001
Jur. Biostatistika, FKM UI, 2001 Korelasi Menilai kekuatan hubungan linier 2 var numerik: Pearson’s Coefisien Correlation (r) Dari nilai r kita dapat menentukan: a. Kekuatan hubungan(0 s.d 1) b. Arah hubungan: (+/-) Kisaran nilai r antara 0 s.d 1: 0 = Tidak ada hubungan linier 1 = Ada hubungan linier sempurna Arah hubungan: + = Hubungan direct:semakin besar nilai X semakin besar nilai Y - = Hubungan inverse:semakin besar nilai X semakin kecil nilai Y Jur. Biostatistika, FKM UI, 2001
Jur. Biostatistika, FKM UI, 2001 Korelasi ASUMSI Pearson’s Coef. Correlation hanya valid jika asumsi berikut terpenuhi: 1. Untuk setiap nilai X, Nilai Y terdistribusi secara normal 2. Untuk setiap nilai Y, Nilai X terdistribusi secara normal 3. Perkalian antara nilai X dan Y terdistribusi secara normal (bivariate normal distr.) Koefisien Determinasi (r2): Melihat besarnya variasi variabel Y (dalam persen) yang dapat dijelaskan oleh variabel X. Misal r=0.8, r2=0.64. Artinya sebesar 64% variasi nilai Y dapat dijelaskan oleh variabel X Jur. Biostatistika, FKM UI, 2001
Korelasi: Data Lay-out dan perhitungan r Subjek X X2 Y Y2 X.Y 1 X1 X12 Y1 Y12 XY1 . X. X. 2 Y. Y. 2 XY. n Xn Xn2 Yn Yn2 XYn (X) = … (X2) … (Y)… (Y2)… (XY) = … Jur. Biostatistika, FKM UI, 2001
Jur. Biostatistika, FKM UI, 2001 Korelasi INTERPRETASI KOEF. KORELASI Kekuatan hubungan: (Subjektif) r < 0.4 : Lemah 0.4< r <0.8 : Sedang r > 0.8 : Kuat Korelasi tidak selalu berarti hubungan sebab akibat (causality) Korelasi yang lemah tidak selalu berarti tidak adanya hubungan Korelasi yang kuat tidak selalu berarti adanya garis lurus Jur. Biostatistika, FKM UI, 2001
Jur. Biostatistika, FKM UI, 2001 Korelasi CONTOH KORELASI: Subjek (X) Usia (Y) Lama hari rawat X.Y 1 20 5 2 30 6 3 25 4 35 7 40 8 (X) = 150 (Y) = 31 (XY) = 970 (X2) = 4750 (Y2) = 199 Jur. Biostatistika, FKM UI, 2001
Jur. Biostatistika, FKM UI, 2001 Korelasi CONTOH KORELASI: Subjek (X) Usia (Y) Lama hari rawat X.Y 1 20 5 2 30 6 3 25 4 35 7 40 8 (X) = 150 (Y) = 31 (XY) = 970 (X2) = 4750 (Y2) = 199 Jur. Biostatistika, FKM UI, 2001
Jur. Biostatistika, FKM UI, 2001 Korelasi Uji hipotesis Koef. Korelasi (r): 1. Ho: = 0 (Tidak ada hubungan/korelasi) Ha: 0 (Ada hubungan/korelasi) 2. Uji statistik: 3. Critical Region: Ho ditolak jika, | t (hitung) | > t (tabel: /2, df=n-2) > 3.182 p<0.005 4. Keputusan: Ho ditolak 5. Kesimpulan:Koef. Korelasi populasi () tidak sama dengan nol Ada korelasi antara umur dg lama hr rawat atau p-value < Jur. Biostatistika, FKM UI, 2001
Jur. Biostatistika, FKM UI, 2001 Regresi Linier Memprediksi nilai Y dari X: 1. Berapa tekanan darah sistolik, jika umur = 30 th 2. Berapa IP mhs, jika income keluarga = Rp 2 juta 3. Berapa lama hari rawat, jika pasien berumur 40 th 4. Berapa level FEV1, pada orang dengan TB=170 cm Asumsi pada regresi linier: 1. Nilai mean dari Y adalah fungsi garis lurus (linierity) dari X Yi = a + b1Xi + 2. Nilai Y terdistribusi sec. Normal untuk setiap nilai X (normality) 3. Varian Y adalah sama untuk setiap nilai X (homoscedasticity) 4. Nilai X dan Y adalah tidak saling berkait (independency) Jur. Biostatistika, FKM UI, 2001
Jur. Biostatistika, FKM UI, 2001 Regresi Linier Mencari garis terbaik regresi linier: Metoda Least Square (Persamaan garis dibuat sedemikian rupa sehingga jumlah kuadrat dari selisih nilai observasi dengan nilai pada garis adalah minimum) Persamaan garis regresi linier: Yi = a + b1Xi + Yi adalah nilai Y yang diprediksi a adalah intercept dan b1 adalah slope a adalah posisi dimana garis regresi memotong sumbu y b1 mengukur kemiringan garis = koefisien regresi Nilai Y meningkat sebesar b1 unit untuk setiap kenaikan nilai X sebesar 1 unit adalah error dari model dalam memprediksi rata-rata Y Jur. Biostatistika, FKM UI, 2001
Regresi Linier: Data Lay-out Subjek X Y X.Y 1 X1 X12 Y1 Y12 XY1 . X. X. 2 Y. Y. 2 XY. n Xn Xn2 Yn Yn2 XYn (X) = … (X2) … (Y)… (Y2)… (XY) = … Persamaan garis regresi linier: Yi = a + b1Xi Jur. Biostatistika, FKM UI, 2001
Regresi Linier: Data Lay-out Subjek X Y X.Y 1 X1 X12 Y1 Y12 XY1 . X. X. 2 Y. Y. 2 XY. n Xn Xn2 Yn Yn2 XYn (X) = … (X2) … (Y)… (Y2)… (XY) = … Persamaan garis regresi linier: Yi = a + b1Xi Jur. Biostatistika, FKM UI, 2001
Jur. Biostatistika, FKM UI, 2001 Regresi CONTOH REGRESI: Subjek (X) Usia (Y) Lama hari rawat X.Y 1 20 5 2 30 6 3 25 4 35 7 40 8 (X) = 150 (Y) = 31 (XY) = 970 (X2) = 4750 (Y2) = 199 Jur. Biostatistika, FKM UI, 2001
Jur. Biostatistika, FKM UI, 2001 Regresi Linier Persamaan garis regresi linier: Lama hari rawat (Y) = a + b1Xi Lama hari rawat = 1.4 + 0.16 (Usia) Jur. Biostatistika, FKM UI, 2001
Jur. Biostatistika, FKM UI, 2001 Regresi Linier Komputer Out-put: Jur. Biostatistika, FKM UI, 2001
Jur. Biostatistika, FKM UI, 2001 Regresi Linier Komputer Out-put: Jur. Biostatistika, FKM UI, 2001
Jur. Biostatistika, FKM UI, 2001 Contoh garis linier Jur. Biostatistika, FKM UI, 2001
Diagram tebar dan regresi Diagram tebar FEV1 dengan tinggi badan Jur. Biostatistika, FKM UI, 2001
Jur. Biostatistika, FKM UI, 2001 Prediksi dan residual height (cm) 200 190 180 170 160 150 140 Force expiratoty volume in 1 min (ml) 600 500 400 300 100 (X130,Y130) e130 e105 (X105,Y105) Jur. Biostatistika, FKM UI, 2001
Koefisien determinasi Koefisien determinasi mengukur proporsi varians Y yang dapat diterangkan oleh X: Nilai R2 berkisar antara 0 (tidak ada varians Y yang dijelaskan) sampai 1 (seluruh varians Y dapat dijelaskan) Untuk data FEV1, nilai R2 = 0,546 berarti persamaan linier antara FEV1 dengan tinggi badan dapat menjelaskan 54,6% varians FEV1. Jadi sisa varians 45,4% tidak dapat dijelaskan atau residual. Jur. Biostatistika, FKM UI, 2001
Jur. Biostatistika, FKM UI, 2001 Koefisien korelasi Jadi koefisien korelasi merupakan ukuran yang terstandarisasi dari kuatnya hubungan linier antara Y dengan X Nilai koefisien korelasi berkisar antara -1 (hubungan negatif sempurna) sampai +1 (hubungan positif sempurna) Koefisien korelasi negatif: semakin besar nilai X semakin kecil nilai Y Koefisien korelasi positif: semakin besar nilai X semakin besar nilai Y Contoh koefisien korelasi antara FEV1 dengan tinggi badan adalah 0,739 Jur. Biostatistika, FKM UI, 2001
Prosedur regresi linier sederhana pada SPSS/Windows Statistics > Regression >Linear Jur. Biostatistika, FKM UI, 2001
Hasil analisis regresi SPSS/Win Jur. Biostatistika, FKM UI, 2001
Hasil analisis regresi SPSS/Win Jur. Biostatistika, FKM UI, 2001
TUGAS: Gunakan data 15 karyawan Apakah ada hubungan antara umur (X) dan lama hari absen (Y) tahun 2009? Jika seorang karyawan berumur 35 tahun, hitunglah perkiraan lama hari absennya.
TUGAS: Gunakan data Kecamatan Ikan gabus Apakah ada hubungan antara umur anak (X) dengan Tinggi Badannya (Y)? Jika seorang anak berumur 15 bulan, hitunglah perkiraan tinggi badannya. Apakah ada perbedaan proporsi jenis kelamin anak menurut kelompok umur ibu (3 kelompok)