Korelasi dan Regresi 2011 Program Studi Magister Biomedik Oleh: Anwar, Dita, Erna Program Studi Magister Biomedik Fakultas Kedokteran Universitas Sumatera Utara 2011
Pendahuluan Beberapa penelitian di bidang kedokteran sering ingin menilai apakah ada hubungan antara dua variabel (dependent dan independent) yang numerik. contoh : Hubungan Index Massa Tubuh dengan kadar kolesterol. Hubungan antara KGD dengan Kadar LDL pada pasien DM.
Analisis regresi dapat diketahui bentuk hubungan antara dua variabel (Prediksi dari data yang ada). Analisis korelasi untuk mengetahui eratnya hubungan antara dua variabel. Semakin erat hubungannya maka semakin yakin bahwa hubungan dua variabel tersebut adalah hubungan sebab akibat. Analisis regresi dan korelasi didasarkan atas hubungan yang terjadi antara dua variabel atau lebih.
Variabel yang digunakan untuk meramal disebut variabel bebas (independen). Dapat lebih dari satu variabel. Variabel yang akan diramal variabel respons (dependen). Terdiri dari satu variabel.
A. Diagram Tebar (Scatter plot) Diagram tebar adalah diagram dengan memakai garis koordinat dengan axis X dan ordinat Y. Tiap pengamatan diwakili oleh satu titik. Hubungan antara variabel dapat berupa garis lurus (linier), garis lengkung (kurva linier) atau tdk terlihat pola tertentu. Dapat berupa garis regresi positif atau negatif.
Contoh linier positif linier negatif
Kekuatan Hubungan Bila titik-titik menbar pada satu garis lurus, maka kekuatan hubungan antara kedua variabel tersebut sangat sempurna. Kekuatan hubungan dapat dikuantifikasi melalui suatu koefisien yaitu koefisien korelasi (r pearson). Koefisien ini akan berkisar antara 0 – 1. bila r = 0 tidak ada hubungan linier. r = 1 hubungan linier sempurna. 0-1 = bila mendekati 1 semakin kuat hubungannya, bila mendekati 0 semakin lemah hubungannya. Lihat tandanya apakah korelasi positif atau negatif.
Interval Koefisien Tingkat Hubungan 0.000 – 0.199 Sangat rendah 0.200 – 0.399 Rendah 0.400 – 0.599 Sedang 0.600 – 0.799 Kuat 0.800 – 1.000 Sangat kuat
Rumus koefisien korelatif (Pearson) n(∑XY) – (∑X) (∑Y) r = √[(n∑X2) – (∑X)2] [(n∑Y2) – (∑Y)2] Ket: n = jumlah sampel X = nilai pada ordinat X Y = nilai pada ordinat Y
Contoh.. No X (SGOT) Y (HDL) XY X2 Y2 1. 2. 3. 4. 5. 6. 7. 12.7 11.3 13.5 15.1 17.9 19.3 15.5 42.2 41.2 42.3 42.8 43.8 44.5 45.5 535.94 465.56 571.05 646.28 784.02 858.85 705.25 161.29 127.69 182.25 228.01 320.41 372.49 240.25 1780.84 1697.84 1789.29 1831.84 1918.44 1980.25 2070.25 ∑ 105.3 302.3 4566.95 1632.39 13068.35 n(∑XY) – (∑X) (∑Y) r = √[(n∑X2) – (∑X) 2] [(n∑Y2) – (∑Y)2] 7 (4566.95) – (105.3) (302.3) r = = 0.768 √[(7x1632.39) – (105.3)2] [(7x13068.35) – (302)2]
Scatter Plot
Kesimpulan hasil Dilihat dari besarnya r yang mendekati 1, maka hubungan antara SGOT dengan HDL adalah kuat. Berpola linier positif Maka makin tinggi SGOT maka akan semakin tinggi kadar HDL.
Koefisien Determinasi R = r2 Yaitu besarnya proporsi variasi Y yang dapat dijelaskan oleh variabel X. Apabila r = 1 maka R = 100% X memegang peranan dalam perubahan Y. bila terjadi perubahan X, maka Y akan berubah. Pada kasus diatas r = 0.768 maka R = r2 R= (0.768)2 = 0.59 59%. Hal ini berarti HDL dapat dijelaskan oleh Variabel SGOT sebesar 59%.
Uji Hipotesis koefisien Korelasi Pengujian signifikansi Selain menggunakan tabel r, juga dapat dihitung dengan uji t. rumusnya: r√(n-2) t= √(1-r2) df= n-2 bila t hitung > t tabel, Ho di tolak bila t hitung < t tabel, Ho diterima
B. Regresi Linier Persamaan garis Linier : Y = a + bX Pada persamaan ini harus jelas dan tentukan mana variabel Y (dependen) dan variabel X (independen). Penetapan disesuaikan dengan tujuan analisis. Biasanya variabel Y lebih sulit diukur Variabel X lebih mudah diukur Mengapa?
Karena dari persamaan garis regresi linier, kita dapat melakukan banyak hal. Contohnya : menduga satu nilai variabel dependen berdasarkan nilai variabel bebasnya. Dari contoh kasus diatas, SGOT merupakan variabel bebas dan HDL merupakan variabel terikat. Sehingga: HDL = a + b SGOT Garis linier dapat digambarkan bila koefisien a dan b diperoleh.
Metode kuadrat terkecil n(∑XY) – (∑X) (∑Y) b= n∑(X)2 – (∑X)2 Koefisien b = besarnya perubahan nilai variabel Y apakah nilai variabel X berubah sebesar satu unit (satuannya) Koefisien a = nilai awal/intercept besarnya nilai variabel Y, bila variabel X = 0 a = y - bx
Maka dari contoh soal diatas dapat dihitung: n(∑XY) – (∑X) (∑Y) b= n∑(X)2 – (∑X)2 7x4566.95 – (105.3x302.3) b= = 0.403 7x1632.39 – (105.3)2 a= y – bX = (302.3/7) – (0.403)(105.3/7) = 37.123 Maka HDL = 37.123 + 0.403 SGOT
Regresi Linier Ganda Contoh kasus diatas adalah Regresi linier sederhana. Hubungan 1 variabel dependen biasanya tidak hanya dengan satu variabel saja. Variabel X lebih dari 1. maka : Y = a + b1X1 + b2X2 + …….+bpXp Hasilnya sudah terkontrol koefisien b terhadap variabel bebas lain yang berada dalam model. Dalam hal ini koefisien determinasi (R) cukup penting. Untuk menjelaskan variabel X yang kita pilih dapat menjelaskan vaiasi Y.
TERIMA KASIH
Soal… Seorang dokter ingin mengetahui apakah ada hubungan antara berat badan seseorang dengan tinggi badan sesorang, untuk keperluan tsb dilakukan penelitian terhadap 10 orang dengan data sbb: Tinggi (cm) Berat Badan (kg) 161 46 158 68 166 57 171 48 160 62 156 41 143 47 136 52 132 39 140 42 Buat persamaan regresinya dan koefisien korelasinya!
40 385 20 400 25 395 20 365 30 475 50 440 40 490 20 420 50 560 40 525 25 480 50 510