Presentasi sedang didownload. Silahkan tunggu

Presentasi sedang didownload. Silahkan tunggu

Korelasi dan Regresi Linier

Presentasi serupa


Presentasi berjudul: "Korelasi dan Regresi Linier"— Transcript presentasi:

1 Korelasi dan Regresi Linier
Jurusan BIOSTATISTIKA Fakultas Kesehatan Masyarakat Universitas Indonesia 2009

2 Jur. Biostatistika, FKM UI, 2001
Korelasi Menilai hubungan 2 variabel numerik Contoh: 1. Apakah ada hubungan antara umur dengan tekanan darah sistolik 2. Apakah ada hubungan antara income keluarga dengan IP mhs 3. Apakah ada hubungan antara umur pasien dengan lama hari rawat 4. Apakah ada hubungan antara tinggi badan (TB) dengan FEV1 Diagram tebar (scatter-plot) Sumbu X  Variabel Independen Sumbu Y  Variabel Dependen Jur. Biostatistika, FKM UI, 2001

3 Diagram tebar & garis regresi
Contoh Garis regresi FEV1 dengan tinggi badan Jur. Biostatistika, FKM UI, 2001

4 Jur. Biostatistika, FKM UI, 2001
Korelasi Pola hubungan antara 2 variabel numerik 1. Linier: - Positif - Negatif Non-Linier: - Parabolik - Exponensial Jur. Biostatistika, FKM UI, 2001

5 Jur. Biostatistika, FKM UI, 2001
Korelasi Menilai kekuatan hubungan linier 2 var numerik:  Pearson’s Coefisien Correlation (r) Dari nilai r kita dapat menentukan: a. Kekuatan hubungan(0 s.d 1) b. Arah hubungan: (+/-) Kisaran nilai r antara 0 s.d 1: 0 = Tidak ada hubungan linier 1 = Ada hubungan linier sempurna Arah hubungan: + = Hubungan direct:semakin besar nilai X semakin besar nilai Y - = Hubungan inverse:semakin besar nilai X semakin kecil nilai Y Jur. Biostatistika, FKM UI, 2001

6 Jur. Biostatistika, FKM UI, 2001
Korelasi ASUMSI Pearson’s Coef. Correlation hanya valid jika asumsi berikut terpenuhi: 1. Untuk setiap nilai X, Nilai Y terdistribusi secara normal 2. Untuk setiap nilai Y, Nilai X terdistribusi secara normal 3. Perkalian antara nilai X dan Y terdistribusi secara normal (bivariate normal distr.) Koefisien Determinasi (r2): Melihat besarnya variasi variabel Y (dalam persen) yang dapat dijelaskan oleh variabel X. Misal r=0.8, r2=0.64. Artinya sebesar 64% variasi nilai Y dapat dijelaskan oleh variabel X Jur. Biostatistika, FKM UI, 2001

7 Korelasi: Data Lay-out dan perhitungan r
Subjek X X2 Y Y2 X.Y 1 X1 X12 Y1 Y12 XY1 . X. X. 2 Y. Y. 2 XY. n Xn Xn2 Yn Yn2 XYn (X) = … (X2) … (Y)… (Y2)… (XY) = … Jur. Biostatistika, FKM UI, 2001

8 Jur. Biostatistika, FKM UI, 2001
Korelasi INTERPRETASI KOEF. KORELASI Kekuatan hubungan: (Subjektif) r < : Lemah 0.4< r < : Sedang r > : Kuat Korelasi tidak selalu berarti hubungan sebab akibat (causality) Korelasi yang lemah tidak selalu berarti tidak adanya hubungan Korelasi yang kuat tidak selalu berarti adanya garis lurus Jur. Biostatistika, FKM UI, 2001

9 Jur. Biostatistika, FKM UI, 2001
Korelasi CONTOH KORELASI: Subjek (X) Usia (Y) Lama hari rawat X.Y 1 20 5 2 30 6 3 25 4 35 7 40 8 (X) = 150 (Y) = 31 (XY) = 970 (X2) = 4750 (Y2) = 199 Jur. Biostatistika, FKM UI, 2001

10 Jur. Biostatistika, FKM UI, 2001
Korelasi CONTOH KORELASI: Subjek (X) Usia (Y) Lama hari rawat X.Y 1 20 5 2 30 6 3 25 4 35 7 40 8 (X) = 150 (Y) = 31 (XY) = 970 (X2) = 4750 (Y2) = 199 Jur. Biostatistika, FKM UI, 2001

11 Jur. Biostatistika, FKM UI, 2001
Korelasi Uji hipotesis Koef. Korelasi (r): 1. Ho:  = 0 (Tidak ada hubungan/korelasi) Ha:   0 (Ada hubungan/korelasi) 2. Uji statistik: Critical Region: Ho ditolak jika, | t (hitung) | > t (tabel: /2, df=n-2) > p< Keputusan: Ho ditolak 5. Kesimpulan:Koef. Korelasi populasi () tidak sama dengan nol Ada korelasi antara umur dg lama hr rawat atau p-value <  Jur. Biostatistika, FKM UI, 2001

12 Jur. Biostatistika, FKM UI, 2001
Regresi Linier Memprediksi nilai Y dari X: 1. Berapa tekanan darah sistolik, jika umur = 30 th 2. Berapa IP mhs, jika income keluarga = Rp 2 juta 3. Berapa lama hari rawat, jika pasien berumur 40 th 4. Berapa level FEV1, pada orang dengan TB=170 cm Asumsi pada regresi linier: 1. Nilai mean dari Y adalah fungsi garis lurus (linierity) dari X  Yi = a + b1Xi +  2. Nilai Y terdistribusi sec. Normal untuk setiap nilai X (normality) 3. Varian Y adalah sama untuk setiap nilai X (homoscedasticity) 4. Nilai X dan Y adalah tidak saling berkait (independency) Jur. Biostatistika, FKM UI, 2001

13 Jur. Biostatistika, FKM UI, 2001
Regresi Linier Mencari garis terbaik regresi linier:  Metoda Least Square (Persamaan garis dibuat sedemikian rupa sehingga jumlah kuadrat dari selisih nilai observasi dengan nilai pada garis adalah minimum) Persamaan garis regresi linier: Yi = a + b1Xi +  Yi adalah nilai Y yang diprediksi a adalah intercept dan b1 adalah slope a adalah posisi dimana garis regresi memotong sumbu y b1 mengukur kemiringan garis = koefisien regresi Nilai Y meningkat sebesar b1 unit untuk setiap kenaikan nilai X sebesar 1 unit  adalah error dari model dalam memprediksi rata-rata Y Jur. Biostatistika, FKM UI, 2001

14 Regresi Linier: Data Lay-out
Subjek X Y X.Y 1 X1 X12 Y1 Y12 XY1 . X. X. 2 Y. Y. 2 XY. n Xn Xn2 Yn Yn2 XYn (X) = … (X2) … (Y)… (Y2)… (XY) = … Persamaan garis regresi linier: Yi = a + b1Xi Jur. Biostatistika, FKM UI, 2001

15 Regresi Linier: Data Lay-out
Subjek X Y X.Y 1 X1 X12 Y1 Y12 XY1 . X. X. 2 Y. Y. 2 XY. n Xn Xn2 Yn Yn2 XYn (X) = … (X2) … (Y)… (Y2)… (XY) = … Persamaan garis regresi linier: Yi = a + b1Xi Jur. Biostatistika, FKM UI, 2001

16 Jur. Biostatistika, FKM UI, 2001
Regresi CONTOH REGRESI: Subjek (X) Usia (Y) Lama hari rawat X.Y 1 20 5 2 30 6 3 25 4 35 7 40 8 (X) = 150 (Y) = 31 (XY) = 970 (X2) = 4750 (Y2) = 199 Jur. Biostatistika, FKM UI, 2001

17 Jur. Biostatistika, FKM UI, 2001
Regresi Linier Persamaan garis regresi linier: Lama hari rawat (Y) = a + b1Xi Lama hari rawat = (Usia) Jur. Biostatistika, FKM UI, 2001

18 Jur. Biostatistika, FKM UI, 2001
Regresi Linier Komputer Out-put: Jur. Biostatistika, FKM UI, 2001

19 Jur. Biostatistika, FKM UI, 2001
Regresi Linier Komputer Out-put: Jur. Biostatistika, FKM UI, 2001

20 Jur. Biostatistika, FKM UI, 2001
Contoh garis linier Jur. Biostatistika, FKM UI, 2001

21 Diagram tebar dan regresi
Diagram tebar FEV1 dengan tinggi badan Jur. Biostatistika, FKM UI, 2001

22 Jur. Biostatistika, FKM UI, 2001
Prediksi dan residual height (cm) 200 190 180 170 160 150 140 Force expiratoty volume in 1 min (ml) 600 500 400 300 100 (X130,Y130) e130 e105 (X105,Y105) Jur. Biostatistika, FKM UI, 2001

23 Koefisien determinasi
Koefisien determinasi mengukur proporsi varians Y yang dapat diterangkan oleh X: Nilai R2 berkisar antara 0 (tidak ada varians Y yang dijelaskan) sampai 1 (seluruh varians Y dapat dijelaskan) Untuk data FEV1, nilai R2 = 0,546 berarti persamaan linier antara FEV1 dengan tinggi badan dapat menjelaskan 54,6% varians FEV1. Jadi sisa varians 45,4% tidak dapat dijelaskan atau residual. Jur. Biostatistika, FKM UI, 2001

24 Jur. Biostatistika, FKM UI, 2001
Koefisien korelasi Jadi koefisien korelasi merupakan ukuran yang terstandarisasi dari kuatnya hubungan linier antara Y dengan X Nilai koefisien korelasi berkisar antara -1 (hubungan negatif sempurna) sampai +1 (hubungan positif sempurna) Koefisien korelasi negatif: semakin besar nilai X semakin kecil nilai Y Koefisien korelasi positif: semakin besar nilai X semakin besar nilai Y Contoh koefisien korelasi antara FEV1 dengan tinggi badan adalah 0,739 Jur. Biostatistika, FKM UI, 2001

25 Prosedur regresi linier sederhana pada SPSS/Windows
Statistics > Regression >Linear Jur. Biostatistika, FKM UI, 2001

26 Hasil analisis regresi SPSS/Win
Jur. Biostatistika, FKM UI, 2001

27 Hasil analisis regresi SPSS/Win
Jur. Biostatistika, FKM UI, 2001

28 TUGAS: Gunakan data 15 karyawan
Apakah ada hubungan antara umur (X) dan lama hari absen (Y) tahun 2009? Jika seorang karyawan berumur 35 tahun, hitunglah perkiraan lama hari absennya.

29 TUGAS: Gunakan data Kecamatan Ikan gabus
Apakah ada hubungan antara umur anak (X) dengan Tinggi Badannya (Y)? Jika seorang anak berumur 15 bulan, hitunglah perkiraan tinggi badannya. Apakah ada perbedaan proporsi jenis kelamin anak menurut kelompok umur ibu (3 kelompok)


Download ppt "Korelasi dan Regresi Linier"

Presentasi serupa


Iklan oleh Google