Korelasi & Regresi Oleh: Bambang Widjanarko Otok
Klasifikasi Pemodelan Regresi
Satu variabel independent Regresi Linear Sederhana Model Regresi: Satu variabel independent Regresi Linear Sederhana Lebih dari satu variabel independent Regresi Linear Berganda. Tujuan: mendapatkan pola hubungan secara matematis antara variabel X dan Y mengetahui besarnya perubahan variabel X terhadap Y memprediksi Y jika nilai X diketahui
Tahap-Tahap dalam Analisis Regresi Plot data identifikasi bentuk hubungan secara grafik Koefisien Korelasi identifikasi hubungan linear dengan suatu angka 3. Pendugaan (estimasi) model regresi 4. Evaluasi (diagnostic check) kesesuain model regresi 5. Prediksi (forecast) suatu nilai Y pada suatu X tertentu , -1 rxy 1
Korelasi : Nilai Korelasi: Bila r = 0, atau mendekati 0, . Hubungan antara dua variabel (misal X dengan Y) Nilai Korelasi: Bila r = 0, atau mendekati 0, Berarti hubungan antara variabel independen dengan variabel dependen sangat lemah atau tidak terdapat hubungan sama sekali. Bila r = 1, atau mendekati 1, Berarti terdapat hubungan positif antara variabel independen dengan variabel dependen yang sangat kuat. Bila r = –1, atau mendekati – 1, Berarti terdapat hubungan negatif antara variabel independen dengan variabel dependen yang sangat kuat.
Pengujian Koefisien Korelasi ( r ) Hipotesis Ho : = 0 H1 : 0 Statistik Uji dimana : r = koefisien korelasi n = jumlah sampel Daerah Penolakan Mencari nilai t tabel untuk tingkat signifikansi () dan derajat bebas sebesar n-2. Sehingga | t0 | > t (/2, n-2) Kesimpulan: Ho ditolak jika t0 > t (/2, n-2) atau t0 < t (/2,n-2) Ho diterima jika t0 > t (/2,n-2) atau t0 < t (/2,n-2)
Korelasi Korelasi Plot antara X dengan Y Uji Korelasi 40 20 Uji Korelasi Figure 1: scatter(1:20,10+(1:20)+2*randn(1,20),'k','filled'); a=axis; a(3)=0; axis(a); 10 20 [start Matlab demo lecture2.m]
REGRESI LINIER SEDERHANA dimana: Yi = variabel dependent/respon/output Xi = variabel independent/prediktor/input/fixed = intercept i = slope/gradien/koefisien regresi i = unsur gangguan yang diasumsikan identik, independen dan berdistribusi normal atau i ~ IIDN(0,2)
DENGAN Ordinary Least Squares (OLS): Persamaan Regresi:
PENGUJIAN KOEFISIEN REGRESI SECARA SERENTAK HO : model tidak signifikan H1 : model signifikan Statistik Uji: Tolak Ho, jika F-Rasio > F(1,n-2;)
Pengujian Koefisien Regresi untuk
Problem: Regresi Linear Sederhana Bagaimana pengaruh harga terhadap sales suatu produk ? Dapatkah meramal sales suatu produk berdasarkan harganya ? Biaya Iklan, Jumlah Outlet, Area Pema-saran dan faktor lain yang dapat dikontrol dalam kondisi TETAP Controllable Factors F1, F2, …, Fq Process (Model Regresi) Input (X) Output (Y) Harga Produk Z1, Z2, …, Zq Sales Produk Uncontrollable Factors Harga Pesaing, Selera Konsumen, Kondisi Ekonomi Nasional (inflasi dll) dan faktor lain yang tidak dapat dikontrol dalam kondisi TETAP
Regresi Linier Given examples Predict given a new point Temperature 40 26 24 Temperature 20 22 20 30 40 20 30 10 20 10 20 10 Figure 1: scatter(1:20,10+(1:20)+2*randn(1,20),'k','filled'); a=axis; a(3)=0; axis(a); Given examples Predict given a new point [start Matlab demo lecture2.m]
Prediction Temperature 10 20 30 40 22 24 26 40 Temperature 20 20 Prediction Figure 1: scatter(1:20,10+(1:20)+2*randn(1,20),'k','filled'); a=axis; a(3)=0; axis(a);
Ordinary Least Squares (OLS) Error or “residual” Observation Prediction Figure 1: scatter(1:20,10+(1:20)+2*randn(1,20),'k','filled'); a=axis; a(3)=0; axis(a); 20 Sum squared error
Probabilistic interpretation 20 Likelihood
Minimize the sum squared error Linear equation Linear system
Problem : Data hasil pengamatan … (continued) Minggu Sales (ribu unit) Harga (ribu rupiah) 1. 10 1.3 2. 6 2.0 3. 5 1.7 4. 12 1.5 5. 1.6 6. 15 1.2 7. 8. 1.4 9. 17 1.0 10. 20 1.1 Plot antara Harga dan Sales Pengamatan dilakukan dengan mengambil secara random data 10 minggu penjualan
Problem : MINITAB output … (continued) MTB > Correlation 'Harga' 'Sales'. Pearson correlation of Harga and Sales = -0.863 P-Value = 0.001 MTB > Regress 'Sales' 1 'Harga' The regression equation is Sales = 32.1 – 14.5 Harga Predictor Coef SE Coef T P Constant 32.136 4.409 7.29 0.000 Harga -14.539 3.002 -4.84 0.001 S = 2.725 R-Sq = 74.6% R-Sq(adj) = 71.4% Analysis of Variance Source DF SS MS F P Regression 1 174.18 174.18 23.45 0.001 Residual Error 8 59.42 7.43 Total 9 233.60
Model Regresi Linier Berganda dimana: Yi = variabel dependent/respon/output Xi = variabel independent/prediktor/input/fixed i = parameter/koefisien regresi i = unsur gangguan yang diasumsikan identik, independen dan berdistribusi normal atau i ~ IIDN(0,2)
DENGAN Ordinary Least Squares (OLS):
PENGUJIAN KOEFISIEN REGRESI SECARA SERENTAK
PENGUJIAN KOEFISIEN REGRESI SECARA INDIVIDU
KOEFISIEN DETERMINASI KEGUNAAN: Mengukur ketepatan atau kecocokan suatu garis regresi yang diterapkan terhadap suatu kelompok data hasil observasi. Makin besar nilai R2 dikatakan model regresi semakin tepat atau cocok, sebaliknya makin kecil nilai R2 dikatakan model regresi tidak tepat untuk mewakili data hasil observasi. Mengukur proporsi atau prosentase dari jumlah variasi Y yang dapat diterangkan oleh model regresi.
KOEFISIEN KORELASI PARSIAL Korelasi parsial merupakan ukuran hubungan linier antara variabel Y dengan X1 dan X2 dibuat tetap atau sebaliknya. Nilai koefisien korelasi parsial ry1,2 artinya korelasi Y dengan X1 dikontrol dengan X2.
RESIDUAL IDENTIK INDEPENDEN DISTRIBUSI NORMAL
DISTRIBUSI NORMAL Penerapan metode kuadrat terkecil (Ordinary Least Squares/OLS) tidak memerlukan / membuat asumsi apapun mengenai distribusi pada residualnya. Asumsi pada residual yang diperoleh diharapkan mempunyai nilai (rata-rata) nol, tak berkorelasi dan mempunyai varians konstan. Dengan adanya asumsi ini, penaksir OLS memenuhi beberapa sifat statistik yang diinginkan, seperti ketidakbiasan (unbiased) dan varians minimum. Karena hal tersebut di atas dan tujuan penarikan kesimpulan mengenai persamaan regresi populasi, dalam konteks regresi biasanya resudal diasumsikan mengikuti distribusi normal. Pengujian ini dilakukan untuk mengetahui apakah residual dari model berdistribusi normal dengan mean nol dan varians 2.
PEMERIKSAAN DISTRIBUSI NORMAL Tentukan residual ei dari persamaan regresi Sortir ei dari urutan yang terkecil sampai yang besar Hitung Pi yang sesuai dengan ei yang telah disortir 4. Plot Pi dengan ei Jika pola tersebut membentuk sudut mendekati 450, maka asumsi normal terpenuhi.
PEMERIKSAAN IDENTIK (HOMOSKEDASTISITAS) HETEROSKEDASTISITAS
Apakah Y=Perubahan Laba Bank dipengaruhi Oleh:X1 = Gross Profit Margin X2 = Interest Margin on Loans X3 = Operating Efficiency Ratio X4 = Ratio Non Performing Loans to Total Loans
Persamaan Regresi: Y=-5,633 + 0,637X1 – 37,41X2 + 8,680 X3 + 17,531X4
Pemeriksaan ASUMSI pada Error
DAFTAR PUSTAKA Mason Robert D, 1996, Teknik Statistika untuk BISNIS & EKONOMI, Jilid I dan II, PT Gelora Aksara Pratama Spiegel, M.R., 1961, Theory and Problem of Statistics, McGraw-Hill. Company. William Mendenhall dan James E.R., 1993, Statistik untuk Manajemen dan Ekonomi, penerbit Erlangga, Jilid I dan II. Suharyadi & Purwanto, S.K.2000. Statistika Untuk Ekonomi & Keuangan Modern, Salemba Empat.
T E R I M A K A S I H