TEKNIK ANALISIS REGRESI Oleh: Kastana Sapanli, S.Pi, M.Si Bahan Kuliah Pengantar Komputasi Untuk Sumberdaya dan Lingkungan Departemen Ekonomi Sumberdaya dan Lingkungan FEM - IPB
Sejarah Istilah Regresi Istilah regresi diperkenalkan oleh Francis Galton Hukum regresi semesta (Law of universal regression) : “Rata-rata tinggi anak laki-laki kelompok ayah tinggi kurang dari pada tinggi ayah mereka dan rata-rata tinggi anak laki-laki kelompok ayah pendek lebih besar dari pada tinggi ayah mereka. Jadi ” mundurnya” (“regressing”) anak laki-laki yang tinggi maupun pendek serupa kearah tinggi semua laki-laki
Penafsiran Modern Regresi Analisis regresi berkenaan dengan studi ketergantungan satu variable. Keterkaitan variable tak bebas (dependent variable) dengan variable yang menjelaskan (explanatory variable). Menaksir dan atau meramalkan nilai rata-rata hitung (mean) atau rata-rata (populasi) variable tak bebas,
ANALISIS REGRESI BERGANDA (Multiple Regression Analysis) Jika masalah penelitian menyangkut 1 dependent (metrik) dipengaruhi oleh 2 atau lebih variabel independent (metrik atau gabungan). Ingin didapat model yg merepresentasikan hubungan variabel dependent & independent dg baik (akurat). Model terbaik dpt dimanfaatkan untuk: Unt memprediksi besar, arah & sensitifitas perubahan variabel dependent sbg respon krn perubahan variabel independent. Memprediksi nilai variabel dependent, berdasarkan variabel independent yg diketahui.
STEPS IN REGRESSION ANALYSIS Spesifikasi Model Teoritis Spesifikasi Bentuk Fungsional Model Pengumpulan Data Pendugaan Model Validasi Model Dugaan Interpretasi Perencanaan Peramalan dan Monitoring Model
Seorang analis agribisnis, ingin mengetahui faktor-faktor yg mempengaruhi Jumlah Ekspor Tomat Indonesia (Y, dlm ton). Ekspor Tomat Indonesia diduga dipengaruhi oleh Produksi Tomat Indonesia (X1, dlm ributon/tahun), Harga Ekspor (X2, dlm USD/kwintal), Harga Tomat dalam Negeri (X3, dlm Rp/Kg), dan Dummy untuk periode krisis moneter (D=0 untuk periode tahun sebelum 1997, D=1 untuk periode tahun lainnya). a) Untuk permasalahan tersebut, tuliskan model analisisnya (gunakan model linier). b) Menggunakan data time series, 21 tahun terakhir (terlampir), dengan computer package yang tersedia, dugalah model regresi di atas. c) Interpretasikan koefisien determinasi yang diperoleh.
MODEL ANALISIS REGRESI Model Analisis Regresi Linier Berganda (data populasi) Yt = o + 1X1t + 2X2t + … + jXjt +… + kXkt + t Dimana: Y = Variabel dependent (respond) X1, X2, …, Xk = Variabel Independent (predictor) 1, 2, …, k = Slope Parameter regresi o = Intercept t = Error (galat) t = 1, 2, …, n = Nomor pengamatan Model Dugaan-nya (data sampel) Yt = bo + b1X1t + b2X2t + … + bjXjt +… + bkXkt + et Yt = Ŷt + et bo, b1, b2, …, bk = Koefisien regresi dugaan et = Dugaan untuk Error Yt = Nilai pengamatan Y ke-t Ŷt = Nilai dugaan Y ke-t
UNSUR ERROR (t) DALAM MODEL, MEWAKILI: Variabel yg tidak dimasukkan ke model, Komponen nonlinearitas hubungan independent dan dependent variable, Salah ukur saat observasi dilakukan, Kejadian yg sifatnya acak.
MODEL LINIER: The regression equation is: Y = - 81 + 4.05 X1 + 40.0 X2- 0.251 X3 - 1424 D Predictor Coef SE Coef T P VIF Constant -81.2 476.9 -0.17 0.867 X1 4.045 2.147 1.88 0.078 4.7 X2 39.99 32.77 1.22 0.240 3.2 X3 -0.251 0.548 -0.46 0.653 4.7 D -1424.1 801.4 -1.78 0.095 4.7 S = 800.0 R-Sq = 59.3% R-Sq(adj) = 49.1% Analysis of Variance Source DF SS MS F P Regression 4 14932516 3733129 5.83 0.004 Residual Error 16 10241134 640071 Total 20 25173651 Predicted Values for New Observations New Obs Fit SE Fit 95.0% CI 95.0% PI 1 2147 476 ( 1138, 3156) (173, 4121) Values of Predictors for New Observations New Obs X1 X2 X3 D 1 650 40 2300 1 Durbin-Watson statistic = 1.19
EVALUASI MODEL REGRESI DUGAAN Akurasi Model Dugaan: Standard Error of Estimate (S) sekecil mungkin (minimal = 0) dan atau Koefisien Determinasi atau (R2) sebesar mungkin (maksimal = 100%) Signifikansi Model & Parameter Model Model dan Independent variable yang terlibat berpengaruh nyata terhadap dependent variable. Asumsi OLS: Model Linier (dalam Parameter) Komponen Error menyebar acak, normal dgn nilai tengah 0 ragamnya homogen dan tdk ada autokorelasi Tidak terdapat multikolinier diantara independent variable
MODEL DOUBLE LOG: The regression equation is Ln(Y) = - 0.35 +1.19 Ln(X1) +0.490 Ln(X2) -0.091 Ln(X3) -0.973 D Predictor Coef SE Coef T P VIF Constant -0.345 2.703 -0.13 0.900 Ln(X1) 1.1892 0.6231 1.91 0.074 6.6 Ln(X2) 0.4899 0.6191 0.79 0.440 4.6 Ln(X3) -0.0911 0.5225 -0.17 0.864 9.1 D -0.9725 0.6893 -1.41 0.177 6.3 S = 0.5942 R-Sq = 61.8% R-Sq(adj) = 52.3% Analysis of Variance Source DF SS MS F P Regression 4 9.1511 2.2878 6.48 0.003 Residual Error 16 5.6500 0.3531 Total 20 14.8011 Durbin-Watson statistic = 1.14
MEMBANDING 2 MODEL BERDASAR R2 Dependent variable harus sama, independent variable bisa berbentuk apa saja. Misalkan: Ln(Yt) = bo + b1X1t + b2X2t + et Yt = ao + a1X1t + a2X2t + vt R2 kedua model tidak bisa dibandingkan, karena definisi R2 mengukur proporsi variasi dependent variable yg diakibatkan oleh independent variable. Jadi pada model-1, R2 mengukur proporsi variasi dalam Ln(Y) yg dijelaskan oleh X1 dan X2 Sedangkan pada model-2, R2 mengukur proporsi variasi dlm Y, dan kedua hal tadi tidak sama. (Gujarati, D. 1993. Ekonometrika Dasar. Penterjemah Sumarno Zain. Erlangga, Jakarta. Hal. 102).
MASALAH ASUMSI OLS Indikasi adanya pelanggaran asumsi Multikolinier antara lain: dari segi tanda & besar koefisien regresi, tidak sesuai dgn teori yg mendasarinya. R2 besar namun hanya sedikit sekali independent variable yg berpengaruh nyata thd dependent variable. Bila ada pelanggaran asumsi OLS, perlu ada tindakan perbaikan pada model dugaan.
Pendugaan Koefisien Regresi dengan OLS Cari bo, b1, b2, …, bk, sedemikian rupa sehingga et2 Minimum et2 = (Yt-Ŷt)2 = {Yt – (bo + b1X1t + b2X2t +…+ bjXjt +… +bkXkt)}2 δ(et2 )/δbo = 0 δ(et2 )/δb1 = 0 … δ(et2 )/ δbk = 0 Diperoleh (k+1) persamaan dengan (k+1) bilangan tidak diketahui (yakni bo, b1, …, bk) dengan Eliminasi bertahap akan diperoleh solusinya.
Dekomposisi Variasi Total Data Dependent Variable Identitas Jumlah Kuadrat (Sum of Squares)(SS) Yt = Ŷt + et (Yt - Ÿ) = (Ŷt - Ÿ) + (Yt - Ŷt) (Yt - Ÿ)2 = {(Ŷt - Ÿ) + (Yt - Ŷt)}2 (Yt - Ÿ)2 = (Ŷt - Ÿ)2 + (Yt - Ŷt)2 (Kuadrat Total)= (Kuadrat Regresi) + (Kuadrat Error) SSTotal = SSRegression + SSError Identitas Derajat Bebas (Degrees of Freedom) (DF) DFTotal = DFRegression + DFError (n-1) = k + (n-k-1)
Apakah independent variable secara simultan berpengaruh nyata terhadap dependent variable Uji F Hipotesa: Ho: 1 = 2 = … = k = 0 H1: Minimal ada satu yang 0 Statistik Uji: Fhit = (SSReg/DFReg)/(SSError/DFError) = (SSReg/k)/(SSError/(n-k-1)) = MSReg/MSError Sebaran Fhit di bawah Ho: Menyebar mengikuti sebaran F dengan derajat bebas pembilang (v1) = k, dan derajat bebas penyebut (v2) = (n-k-1). Untuk taraf nyata = , v1=k, dan v2=(n-k-1) tertentu, dari Tabel F, diperoleh nilai F(v1, v2) Kriteria uji: Bila Fhit > F(v1, v2) disimpulkan tolak Ho
Apakah secara parsial independent variable berpengaruh nyata terhadap dependent variable Uji T Hipotesa: Ho: j = 0 H1: a) j > 0; b) j < 0; c) j 0 Statistik Uji: Thit = (bj - j(Ho) )/(Stdev(bj )) Sebaran Thit di bawah Ho: Menyebar mengikuti sebaran T dengan derajat bebas = DFError = (n-k-1). Untuk taraf nyata = , dan (n-k-1) tertentu, dari Tabel T, diperoleh nilai T(n-k-1) Kriteria uji: Untuk: H1: a) j > 0, bila Thit > T(n-k-1) disimpulkan tolak Ho H1: b) j < 0, bila Thit < -T(n-k-1) disimpulkan tolak Ho H1: c) j 0, bila Thit > T(/2, n-k-1) atau Thit < -T(/2, n-k-1) disimpulkan tolak Ho
TERIMA KASIH