Dosen pengasuh: Moraida hasanah, S.Si.,M.Si STATISTIKA EKONOMI II Pertemuan Ke 9 Regresi Sederhana (lanjutan) Dosen pengasuh: Moraida hasanah, S.Si.,M.Si
Korelasi Menilai hubungan 2 variabel numerik Contoh: 1. Apakah ada hubungan antara umur dengan tekanan darah sistolik 2. Apakah ada hubungan antara income keluarga dengan IP mhs 3. Apakah ada hubungan antara umur pasien dengan lama hari rawat Diagram tebar (scatter-plot) Sumbu X Variabel Independen Sumbu Y Variabel Dependen
Korelasi Pola hubungan antara 2 variabel numerik 1. Linier: - Positif - Negatif 2. Non-Linier: - Parabolik - Exponensial
Korelasi Menilai kekuatan hubungan linier 2 var numerik: Pearson’s Coefisien Correlation (r) Dari nilai r kita dapat menentukan: a. Kekuatan hubungan(0 s.d 1) b. Arah hubungan: (+/-) Kisaran nilai r antara 0 s.d 1: 0 = Tidak ada hubungan linier 1 = Ada hubungan linier sempurna Arah hubungan: + = Hubungan direct:semakin besar nilai X semakin besar nilai Y - = Hubungan inverse:semakin besar nilai X semakin kecil nilai Y
Korelasi ASUMSI Pearson’s Coef. Correlation hanya valid jika asumsi berikut terpenuhi: 1. Untuk setiap nilai X, Nilai Y terdistribusi secara normal 2. Untuk setiap nilai Y, Nilai X terdistribusi secara normal 3. Perkalian antara nilai X dan Y terdistribusi secara normal (bivariate normal distr.) Koefisien Determinasi (r2): Melihat besarnya variasi variabel Y (dalam persen) yang dapat dijelaskan oleh variabel X. Misal r=0.8, r2=0.64. Artinya sebesar 64% variasi nilai Y dapat dijelaskan oleh variabel X
Korelasi: Data Lay-out dan perhitungan r Subjek X X2 Y Y2 X.Y 1 X1 X12 Y1 Y12 XY1 . X. X. 2 Y. Y. 2 XY. n Xn Xn2 Yn Yn2 XYn (X) = … (X2) … (Y)… (Y2)… (XY) = …
Korelasi INTERPRETASI KOEF. KORELASI Kekuatan hubungan: (Subjektif) r < 0.4 : Lemah 0.4< r <0.8 : Sedang r > 0.8 : Kuat Korelasi tidak selalu berarti hubungan sebab akibat (causality) Korelasi yang lemah tidak selalu berarti tidak adanya hubungan Korelasi yang kuat tidak selalu berarti adanya garis lurus
Korelasi CONTOH KORELASI: Subjek (X) Usia (Y) Lama hari rawat X.Y 1 20 5 2 30 6 3 25 4 35 7 40 8 (X) = 150 (Y) = 31 (XY) = 970 (X2) = 4750 (Y2) = 199
Korelasi CONTOH KORELASI: Subjek (X) Usia (Y) Lama hari rawat X.Y 1 20 5 2 30 6 3 25 4 35 7 40 8 (X) = 150 (Y) = 31 (XY) = 970 (X2) = 4750 (Y2) = 199
Korelasi Uji hipotesis Koef. Korelasi (r): 1. Ho: = 0 (Tidak ada hubungan/korelasi) Ha: 0 (Ada hubungan/korelasi) 2. Uji statistik: 3. Critical Region: Ho ditolak jika, | t (hitung) | > t (tabel: /2, df=n-2) > 3.182 p<0.005 4. Keputusan: Ho ditolak 5. Kesimpulan:Koef. Korelasi populasi () tidak sama dengan nol Ada korelasi antara umur dg lama hr rawat atau p-value <
Regresi Linier Memprediksi nilai Y dari X: 1. Berapa tekanan darah sistolik, jika umur = 30 th 2. Berapa IP mhs, jika income keluarga = Rp 2 juta 3. Berapa lama hari rawat, jika pasien berumur 40 th 4. Berapa level FEV1, pada orang dengan TB=170 cm Asumsi pada regresi linier: 1. Nilai mean dari Y adalah fungsi garis lurus (linierity) dari X Yi = a + b1Xi + 2. Nilai Y terdistribusi sec. Normal untuk setiap nilai X (normality) 3. Varian Y adalah sama untuk setiap nilai X (homoscedasticity) 4. Nilai X dan Y adalah tidak saling berkait (independency)
Regresi Linier Mencari garis terbaik regresi linier: Metoda Least Square (Persamaan garis dibuat sedemikian rupa sehingga jumlah kuadrat dari selisih nilai observasi dengan nilai pada garis adalah minimum) Persamaan garis regresi linier: Yi = a + b1Xi + Yi adalah nilai Y yang diprediksi a adalah intercept dan b1 adalah slope a adalah posisi dimana garis regresi memotong sumbu y b1 mengukur kemiringan garis = koefisien regresi Nilai Y meningkat sebesar b1 unit untuk setiap kenaikan nilai X sebesar 1 unit adalah error dari model dalam memprediksi rata-rata Y
Regresi Linier: Data Lay-out Subjek X Y X.Y 1 X1 X12 Y1 Y12 XY1 . X. X. 2 Y. Y. 2 XY. n Xn Xn2 Yn Yn2 XYn (X) = … (X2) … (Y)… (Y2)… (XY) = … Persamaan garis regresi linier: Yi = a + b1Xi
Regresi Linier: Data Lay-out Subjek X Y X.Y 1 X1 X12 Y1 Y12 XY1 . X. X. 2 Y. Y. 2 XY. n Xn Xn2 Yn Yn2 XYn (X) = … (X2) … (Y)… (Y2)… (XY) = … Persamaan garis regresi linier: Yi = a + b1Xi
Regresi CONTOH REGRESI: Subjek (X) Usia (Y) Lama hari rawat X.Y 1 20 5 30 6 3 25 4 35 7 40 8 (X) = 150 (Y) = 31 (XY) = 970 (X2) = 4750 (Y2) = 199
Regresi Linier Persamaan garis regresi linier: Lama hari rawat (Y) = a + b1Xi Lama hari rawat = 1.4 + 0.16 (Usia)
Regresi Linier Komputer Out-put:
Regresi Linier Komputer Out-put:
Contoh garis linier
Diagram tebar dan regresi Diagram tebar FEV1 dengan tinggi badan
Prediksi dan residual (X130,Y130) e130 e105 (X105,Y105) height (cm) 200 190 180 170 160 150 140 Force expiratoty volume in 1 min (ml) 600 500 400 300 100 (X130,Y130) e130 e105 (X105,Y105)
Koefisien determinasi Koefisien determinasi mengukur proporsi varians Y yang dapat diterangkan oleh X: Nilai R2 berkisar antara 0 (tidak ada varians Y yang dijelaskan) sampai 1 (seluruh varians Y dapat dijelaskan) Untuk data FEV1, nilai R2 = 0,546 berarti persamaan linier antara FEV1 dengan tinggi badan dapat menjelaskan 54,6% varians FEV1. Jadi sisa varians 45,4% tidak dapat dijelaskan atau residual.
Koefisien korelasi Jadi koefisien korelasi merupakan ukuran yang terstandarisasi dari kuatnya hubungan linier antara Y dengan X Nilai koefisien korelasi berkisar antara -1 (hubungan negatif sempurna) sampai +1 (hubungan positif sempurna) Koefisien korelasi negatif: semakin besar nilai X semakin kecil nilai Y Koefisien korelasi positif: semakin besar nilai X semakin besar nilai Y Contoh koefisien korelasi antara FEV1 dengan tinggi badan adalah 0,739
Prosedur regresi linier sederhana pada SPSS/Windows Statistics > Regression >Linear
Hasil analisis regresi SPSS/Win
Hasil analisis regresi SPSS/Win
CUKUP SEKIAN DULU MINGGU DEPAN KITA SAMBUNG LAGI WASSALAMUALAIKUM WR. WB. DAN TERIMA KASIH