Lektion ACHT(#8) – analisis regresi Statistika Lektion ACHT(#8) – analisis regresi Verfasser bei Usmania Institute
Analisis regresi Regresi: kembali ke tahap perkembangan sebelumnya (psi.). Analisis regresi: analisis yang digunakan untuk mengetahui relasi dependensi (pengaruh) dari satu atau beberapa variabel independen terhadap sebuah variabel dependen. Analisis regresi: Analisis regresi linier → hubungan antar variabel mengarah pada hubungan linier (garis lurus) Analisis regresi nonlinier → hubungan antar variabel mengarah pada hubungan nonlinier.
Analisis regresi linier Analisis regresi linier sederhana (simple regression): regresi linier dengan sebuah variabel independen. Model: 𝒀 = 𝒃 𝟎 + 𝒃 𝟏 𝑿 Analisis regresi linier berganda (multiple regression): regresi linier dengan lebih dari 1 variabel independen. Model: 𝒀 = 𝒃 𝟎 + 𝒃 𝟏 𝑿 𝟏 + 𝒃 𝟐 𝑿 𝟐 +…+ 𝒃 𝒏 𝑿 𝒏 X : Variabel independen/prediktor/bebas Y : Variabel dependen /respon/terikat 𝒀 : Prediksi Y b0 : intersep regresi b1 , b2 ,.. bn : slope regresi Koefisien regresi
REGRESI LINIER SEDERHANA ANALISIS REGRESI LINIER SEDERHANA
Regresi linier sederhana Kegunaan (umum): mengetahui relasi dependensi (pengaruh) sebuah variabel independen (X) terhadap sebuah variabel dependen (Y). Kegunaan (khusus) untuk mengetahui: Apakah X berpengaruh terhadap Y. Apakah pengaruh tersebut positif ataukah negatif. Seberapa besar pengaruh tersebut. Prediksi nilai Y bilamana nilai X diketahui. Syarat data: Kedua variabel metrik (I,R), dan Ukuran sampelnya besar.
Model regresi linier sederhana Bagan: X → Y Persamaan: Y = b0 + b1X + e 𝑌 = b0 + b1X
Contoh penerapan Apakah durasi belajar dalam seminggu berpengaruh terhadap IPK mahasiswa? Seberapa besar pengaruh tersebut? Jika seorang mahasiswa belajar 12 jam seminggu, berapa prediksi IPKnya? Apakah besarnya upah berpengaruh terhadap tingkat produktivitas? Jika upah sebesar Rp. 10.000 per jam, berapa prediksi tingkat produktivitasnya? Apakah usia bangunan berpengaruh terhadap harga rumah? Seberapa besar pengaruh tersebut? Jika sebuah rumah berusia 5 tahun, berapa prediksi harga jualnya? Apakah profitabilitas berpengaruh terhadap return saham? Seberapa besar pengaruh tersebut?
PENGEMBANGAN MODEL REGRESI LINIER SEDERHANA
FUNGSI LINIER 𝒃=𝒎= ∆𝒚 ∆𝒙 = 𝒚 𝟐 − 𝒚 𝟏 𝒙 𝟐 − 𝒙 𝟏 b > 0 ? a > 0 ? Y Y = a + b·X 𝒃=𝒎= ∆𝒚 ∆𝒙 = 𝒚 𝟐 − 𝒚 𝟏 𝒙 𝟐 − 𝒙 𝟏 (x2, y2) (x1, y1) Δy (0, a) a > 0 ? a = 0 ? a < 0 ? b > 0 ? b < 0 ? b = 0 ? b = ∞ ? Δx a X (1, 3) dan (2, 5) → y = ? a = 2, b = 0 → y = ?; x = 1 → y = ?; x = 50 → y = ?; x = 49.000 → y = ?
Sampel 2 titik persamaan: y = 2 + x x = 1 → y = 3 x = 3 → y = 5 Y 3 5 Observasi: X Y 1 3 5 X 1 3 x = 1 → y = 3 x = 3 → y = 5
Sampel 3 titik persamaan: y = 2 + x x = 1 → y = 3 x = 3 → y = 5 6 y = 2 + x Observasi: X Y 1 3 5 4 6 X 1 3 4 x = 1 → y = 3 x = 3 → y = 5 x = 4 → y = 6
Hasil observasi Hasil mana yang umum terjadi sebagai hasil observasi (sampel)? X Y 1 3 5 4 X Y 1 3 5 4 6 vs
Sampel 3 titik persamaan: y = 2 + x ???? x = 1 → y = 3 x = 3 → y = 5 Apakah ada sebuah garis yang melewati ketiga titik secara sekaligus? Y 3 5 4 Observasi: X Y 1 3 5 4 persamaan: y = 2 + x ???? X 1 3 4 x = 1 → y = 3 x = 3 → y = 5 x = 4 → y = 6 SALAH
Membuat garis prediksi Y 3 5 4 Observasi: X Y 1 3 5 4 X 1 3 4 Garis mana yang paling baik dalam mewakili ketiga titik tersebut?
Membuat garis prediksi Y Garis mana yang paling baik dalam mewakili ketiga titik tersebut? Mengapa? X Tahap utama analisis regresi: mencari persamaan garis prediksi ( 𝒀 ). Garis prediksi ( 𝒀 ) adalah garis yang terbaik dalam mewakili seluruh observasi (titik-titik) yang ada.
Membuat garis prediksi Y X Y x1 y1 x2 y2 ⁞ Xn yn (xn , yn) (x1, y1) 𝒚 = a + bx en (x2, 𝒚 2) e1 (xn, 𝒚 n) e2 ei = error = residual ei = yi - 𝑦 i (x1, 𝒚 1) (x2, y2) X Garis prediksi yang terbaik adalah garis yang.....???
Garis regresi (prediksi) terbaik → 𝒆𝟏 𝟐 + 𝒆𝟐 𝟐 + Garis regresi (prediksi) terbaik → 𝒆𝟏 𝟐 + 𝒆𝟐 𝟐 + ... + 𝒆𝒏 𝟐 menghasilkan nilai yang paling minimum. 𝒆𝟏 𝟐 + 𝒆𝟐 𝟐 + ... 𝒆𝒏 𝟐 = ∑ 𝒆𝒊 𝟐 = S S : jumlah kuadrat error (= jumlah kuadrat residual) S = 𝒆𝟏 𝟐 + 𝒆𝟐 𝟐 + ... + 𝒆𝒏 𝟐 = (y1 - 𝒚 𝟏)2 + (y2 - 𝒚 𝟐)2 + .... + (yn - 𝒚 𝒏)2 = (y1 – a – bx1)2 + (y2 – a – bx2)2 +... + (yn – a – bxn)2 Garis prediksi terbaik → S paling minimum S minimum jika: 𝜕𝑺 𝜕𝒂 = 0 ; dan 𝜕𝑺 𝜕𝒃 = 0
𝜕𝑺 𝜕𝒂 = 0 → yi = na + b xi ......... (persamaan 1) ? 𝜕𝑺 𝜕𝒂 = 0 → yi = na + b xi ......... (persamaan 1) 𝜕𝑺 𝜕𝒃 = 0 → xi yi = a xi + b xi 𝟐 ......... (persamaan 2) Dari persamaan (1) dan (2) diperoleh: 𝒂= yi xi xi yi xi 𝟐 𝒏 xi xi xi 𝟐 = xi 𝟐 yi−xi xi yi 𝒏 xi 𝟐 − xi 𝟐 𝒃= 𝒏 yi xi xi yi 𝒏 xi xi xi 𝟐 = 𝒏xi yi−xi yi 𝒏 xi 𝟐 − xi 𝟐 ?
Jadi, 𝒃= 𝒏xi yi−xi yi 𝒏 xi 𝟐 − xi 𝟐 Karena garis regresi (prediksi) selalu melalui titik ( 𝒙 , 𝒚 ), maka: 𝒚 = a + b 𝒙 → a = 𝒚 ‒ b 𝒙 . Ternyata, 𝒃= 𝒏xi yi−xiyi 𝒏 xi 𝟐 − xi 𝟐 = 𝑺 𝒙𝒚 𝑺 𝒙 𝟐 Kaitan b dan r : Karena r = 𝑺𝒙𝒚 𝑺𝒙 𝑺𝒚 → b = r . ?? dan r = b . ??
Interpretasi koefisien regresi Arah pengaruh: b > 0 → X berpengaruh positif terhadap Y. b < 0 → X berpengaruh negatif terhadap Y b = 0 → ?? Besar pengaruh: b > 0 → untuk setiap X naik (turun) sebesar 1 satuan, maka Y naik (turun) sebesar b satuan. b < 0 → untuk setiap X naik (turun) sebesar 1 satuan, maka Y turun (naik) sebesar b satuan. Prediksi: Jika diketahui nilai X = c, maka prediksi nilai Y adalah: 𝑌 = a + b.c
Contoh soal Diketahui data sampel tentang insentif per pekan (X) dalam ratusan ribu rupiah dan jumlah unit yang diproduksi (Y) dalam ratusan unit sebagai berikut: i X Y 1 2 4 3 5 7 Tentukan persamaan regresinya. Bagaimana interepretasinya? Jika seorang karyawan diberi insentif sebesar 500 ribu rupiah per pekan, berapa prediksi dari jumlah unit yang diproduksi oleh karyawan tersebut?
KOEFISIEN REGRESI TERSTANDARISIR Koefisien regresi terstandarisir diperoleh ketika semua variabel dinyatakan dalam skor terstandarisir (Z). → skor terstandarisir → model regresi terstandarisir → koefisien regresi terstandarisir Jadi, pada regresi linier sederhana berlaku: koefisien regresi terstandarisir = koefisien korelasi pearson
Koefisien determinasi (R2) Koefisien determinasi (R2) adalah ukuran kebaikan model regresi (seberapa baik model regresi yang dihasilkan dalam menjelaskan data). Nilai R2 : 0 ‒ 1 R2 = 0 : model sama sekali tidak bisa menjelaskan data R2 = 1 : model regresi secara sempurna dapat menjelaskan data R2 = 0,87 → 87% variabilitas Y dapat dijelaskan oleh variabilitas X. 3 cara menghitung R2: Jadi, untuk regresi linier sederhana berlaku:
Soal 1 Diketahui: 𝑿 = 4; 𝒀 = 5; SX = 1; SY = 2; rXY = 0,5 Tentukanlah: Persamaan regresinya. Interpretasi dari persamaan regresi tersebut. Jika diketahui X = 10, tentukanlah berapa perkiraan harga Y. Berapa nilai koefisien regresi terstandarisirnya? Hitung besarnya koefisien determinasi! Bagaimana interpretasi dari koefisien determinasi tersebut?
Soal 2 Diketahui output SPSS sebagai berikut: Tentukanlah: Persamaan regresinya. Interpretasi dari persamaan regresi tersebut. Jika diketahui usia bangunan rumah tersebut 10 tahun, tentukanlah berapa perkiraan harga rumah tersebut.
Soal 3 Diketahui output SPSS sebagai berikut: Tentukanlah: Persamaan regresinya. Interpretasi dari persamaan regresi tersebut. Jika diketahui banyaknya kamar 4 unit, tentukanlah berapa perkiraan harga rumah tersebut.