Bahan Kuliah Statistika Terapan
Analisis Regresi Linier Bagian 1 Analisis Regresi Linier
Hubungan variabel i. 1 iNTRODUCTION
Upaya untuk menjelaskan sebuah variabel melalui beberapa variabel sekaligus. Contoh Pertumbuhan udang; seperti berat (Y), berkaitan dengan keadaan temperatur (X1) dan salinitas (X2) air tempat pemeliharaan.
Tampilan grafis hubungan X1 Harga X2 Y Quality Vol. Penjualan X3 Iklan Dependen Response Independen Explanatory
Model Hubungan Simetris A simetris X1 Y Regresi X1 Y Korelasi
Representasi model Hubungan Statistis Y Random X Fix atau random Probabilistik Matematis Y Fix X Fix Deterministik
y slope 2 intercept 1 x Δ = 1 Model hubungan matematis x y 1+2×0 =1 1 1+2×0 =1 1 1+2×1 =3 2 1+2×2 =5 3 1+2×3 =7 2 slope intercept 1 x Δ = 1
y x Model hubungan statistis Titik tidak tpt pada garis Garis merupakan ringkasan pola (sistematik) sebaran titik Untuk x yang sama, y bisa berbeda (error) x
Analisis Regresi dan Korelasi Y Random X Fix atau random Sistematis Error Bagaimana bentuknya ? Apa saja variabelnya ?
Model Regresi Linear Y = 0 + 1 X1 + …+ p Xp + p = 1, Regresi linier sederhana p 2, Regresi linier multipel Nonlinear Y = /(1 + e X ) +
Contoh plot fungsi nonlinier dalam β (koefisien regresi Derivatif juga tidak konstan (fungsi dari x). Tetapi transformasi dari x menghasilkan sebuah fungsi linier.
p = 1, Regresi linier sederhana (populasi) y x
Assumsi Y = 0 + 1 X + E (Y | X =xi ) = 0 + 1 xi 1. Xi nonrandom 2. i normal dengan rata - rata 0 dan varians konstan 2 E (Y | X =xi ) = 0 + 1 xi
i. 2 Regresi linier sederhana SAMPEL i. 2 Regresi linier sederhana
Penaksiran Koefisien Regresi Data 0 = ?, 1 = ? y x y1 x1 y2 x2 . yn xn Least squares estimates yi y ei x xi
Prinsip Least Squares Koefisien regresi sampel ditetapkan dengan Meminimumkan jumlah kuadrat residu (JKE) terhadap garis regresi sampel.
Persamaan penaksiran Tabel perhitungan No y x yx x2 1 2 i n Jumlah
Solusi software (statistica) Statistics Multiple Regression Ikuti tab selanjutnya
Latihan 1 In a study conducted to examine the quality of fish after 7 days in ice storage, ten raw fish of the same kind and approximately the same size were caught and prepared for ice storage. Two of the fish were placed in storage immediately after being caught, two were placed in storage 3 hours after being caught, and two each were placed in storage at 6, 9, and 12 hours after being caught. Let y denote a measurement of fish quality (on a 10-point scale) after the 7 days of storage, and let x denote the time after being caught That the fish were placed in ice packing. The sample data appear here: a. Plot the sample data in a scatter diagram. b. Use the method of least squares to obtain estimates of the parameters in the model y 0 1x . c. Interpret the value of ˆ 1 in the context of this problem.
Pengujian Koeffisien Regresi Masalah : 1. Apakah X; variabel regresi, menjelaskan Y; variabel respons ? 2. Bagaimana kesesuaian data terhadap model, memadai ? 3. Apakah prediksi melalui model memadai ? Masalah No. 1 H0 : 1 = 0 vs. H0 : 1 0 Statistik uji t atau F Keputusan : tolak H0 jika |t| t/2
y error total regresi x Latar belakang pengujian Jika H0 benar, model regresi bentuknya: Jika H1 benar, model regresi bentuknya: x y error total regresi
Jika penambahan variabel X kedalam model dapat menjelaskan Y, maka “total” error dalam Y besarnya berkurang oleh bagian yang dapat dijelaskan oleh X; yaitu =bagian “regresi”, sisanya yang masih ada merupakan bagian yang tidak dapat dijelaskan; yaitu “error”. Total = Regresi + Error Table 1 ANOVA Sumber variasi df JK (Jumlah kuadrat) MS (RJK) F Regresi P JKreg MSreg =JKreg/p MSreg/MSE Error n-p-1 JKE MSE=JKE/(n-p-1) Total n-1 JKT
Contoh: Untuk menyusun kebutuhan tenaga, ditelaah hubungan antara jumlah pekerjaan yang terselesaikan dengan jam kerja/bln. yang dibutuhkannya. Dari pengamatan di sejumlah kantor cabang diperoleh data berikut. Periksa apakah pengetahuan mengenai jumlah pekerjaan terselesaikan ada hubungnannya dengan jam kerja/bln.
Masalah No. 3 (Kualitas Prediksi) Masalah No. 2 (kualitas Fit) Sebuah indeks yang mencerminkan baik tidaknya model mendeskripsi data adalah Koeffisien Determinasi R2 Masalah No. 3 (Kualitas Prediksi)
Analisis Residu 1 Mendeteksi assumsi - assumsi mengenai error I Rata - rata 0 Varians konstan Plot residu dengan Kondisi ideal ei x
Model misspect Non constant variance x e Normal error e Ukuran sampel Non constant variance Model misspecification Outliers x