MULTIKOLINIERITAS (Multicollinearity) Oleh: Agung Priyo Utomo agung@stis.ac.id atau agungpu@gmail.com Agung Priyo Utomo - STIS
Pertanyaan yg Sering Muncul dalam Analisis Regresi Berganda Seberapa besar pengaruh variabel bebas terhadap variabel tak bebas? Dapatkah variabel bebas tertentu dihilangkan dari model karena pengaruhnya yg kecil (tidak ada) terhadap variabel tak bebas? Perlukah menambahkan variabel bebas yang belum masuk ke dalam model untuk memperoleh tambahan informasi? Agung Priyo Utomo - STIS
Hubungan Antar Variabel Bebas Tidak berkorelasi dengan dirinya sendiri Tidak berkorelasi dengan variabel bebas lain yang terkait dg variabel tak bebas namum belum/tidak masuk dalam model Berkorelasi dengan dirinya sendiri Berkorelasi dengan variabel bebas lain yang terkait dg variabel tak bebas namum belum/tidak masuk dalam model Agung Priyo Utomo - STIS
Agung Priyo Utomo - STIS CONTOH Misalkan regresi pengeluaran untuk konsumsi makanan keluarga pada pendapatan keluarga, tabungan, usia kepala keluarga. Variabel bebas akan saling berkorelasi Variabel bebas juga berkorelasi dengan variabel sosial-ekonomi lain yang berpengaruh terhadap pengeluaran untuk konsumsi, misalkan ukuran keluarga → Terjadi Multikolinieritas (kolinieritas) Agung Priyo Utomo - STIS
Agung Priyo Utomo - STIS MULTIKOLINIERITAS Ditemukan pertama kali oleh Ragnar Frisch (Institute of Economics, Oslo University) Pada awalnya, multikolinieritas berarti adanya hubungan yg linier sempurna atau pasti diantara beberapa atau semua variabel bebas dalam model regresi Misalkan pada model regresi dengan k variabel bebas X1, X2, …, Xk (dimana X1 = 1), suatu hubungan linier yg sempurna dikatakan ada jika memenuhi kondisi: 1X1+2X2+…+kXk = 0 dimana 1, 2, …, k adalah konstanta sdmk shg tidak semuanya nol (0) Agung Priyo Utomo - STIS
Agung Priyo Utomo - STIS MULTIKOLINIERITAS Perkembangannya, multikolinieritas juga berarti adanya hubungan yg linier kuat tetapi tidak sempurna diantara beberapa atau semua variabel bebas dalam model regresi Misalkan pada model regresi dengan k variabel bebas X1, X2, …, Xk (dimana X1 = 1), suatu hubungan linier yg kuat tapi tidak sempurna dikatakan ada jika memenuhi kondisi: 1X1+2X2+…+kXk + vi = 0 dimana vi adalah unsur kesalahan yg bersifat stokastik Agung Priyo Utomo - STIS
Pengaruh pada Saat Variabel Bebas Tidak Saling Berkorelasi Data produktifitas kerja (halaman 296) Lakukan analisis regresi secara parsial & overall Trial (i) Crew Size (Xi1) Bonus pay (Xi2) Crew Produktivity Score (Yi) 1 4 2 42 39 3 48 51 5 6 49 53 7 61 8 60 Agung Priyo Utomo - STIS
Pengaruh pada Saat Variabel Bebas Saling Berkorelasi secara Sempurna CONTOH (halaman 299) Case (i) Xi1 Xi2 Yi 1 2 6 23 8 9 83 3 63 4 10 103 Xi2 = 5 + 0,5 Xi1 Agung Priyo Utomo - STIS
KONSEKUENSI MULTIKOLINIERITAS Meski penaksir OLS bisa diperoleh, standard error (kesalahan baku) cenderung semakin besar dengan meningkatnya korelasi antar variabel bebas Misal pada model regresi dimana dan maka Agung Priyo Utomo - STIS
KONSEKUENSI MULTIKOLINIERITAS Jika xi2 = xi1 + vi, dimana ≠ 0 dan Σ xi2vi = 0, maka Penaksir β2 dapat dicari secara analogi dengan pencarian penaksir β1. Agung Priyo Utomo - STIS
KONSEKUENSI MULTIKOLINIERITAS Perilaku varian jika koefisien korelasi meningkat 0,5 0,7 0,8 0,9 0,95 1,0 ∞ Agung Priyo Utomo - STIS
KONSEKUENSI MULTIKOLINIERITAS Besarnya standard error berakibat, selang keyakinan (confidence interval) untuk suatu parameter menjadi lebih lebar Misalkan maka CI 95% untuk β1 dirumuskan sebagai berikut: Kesalahan tipe II meningkat Agung Priyo Utomo - STIS
KONSEKUENSI MULTIKOLINIERITAS Pada multikolinieritas yg tinggi tapi tidak sempurna, estimator koefisien regresi bisa diperoleh, tapi estimator & standard error menjadi sensitif terhadap perubahan data Contoh: Periksa signifikansi koefisien regresi, s.e., & R2 Y X1 X3 1 2 4 3 12 6 5 8 16 Y X1 X3 1 2 4 3 6 12 5 8 16 Agung Priyo Utomo - STIS
KONSEKUENSI MULTIKOLINIERITAS Pada multikolinieritas yg tinggi tapi tidak sempurna, bisa terjadi R2 (koefisien determinasi) tinggi namun tidak satupun variabel signifikan secara statistik Agung Priyo Utomo - STIS
CARA MENDETEKSI MULTIKOLINIERITAS Matriks korelasi antar variabel bebas Periksa apakah terdapat nilai korelasi yg tinggi (sempurna) antar variabel bebas Kestabilan koefisien regresi parsial Kesesuaian tanda koefisien regresi menurut suatu teori Variance Inflation Factor (VIF) Petunjuk terjadinya kolinieritas jika VIF > 5 R2 tinggi, tapi tidak ada/hanya sedikit variabel bebas yg signifikan secara statistik Agung Priyo Utomo - STIS
Alternatif Solusi Mengatasi Multikolinieritas Informasi apriori Contoh: Pada model Yi = β0+β1Xi1+β2Xi2+εi Misal Y = Konsumsi, X1 = Pendapatan, X2 = Tabungan Informasi apriori, misalkan β2 = 0,10β1 sehingga Yi = β0+β1Xi1+0,10β1Xi2+εi = β0+β1Xi+εi dimana Xi = Xi1+0,10Xi2 Informasi apriori bisa berdasarkan suatu teori atau hasil penelitian sebelumnya Agung Priyo Utomo - STIS
Alternatif Solusi Mengatasi Multikolinieritas Menghubungkan data cross-sectional dan data time series (panel data) Mengeluarkan satu atau beberapa variabel bebas Beberapa metode yg dapat digunakan: Principle Component Analysis Factor Analysis Stepwise Regression dan sebagainya. Agung Priyo Utomo - STIS
Alternatif Solusi Mengatasi Multikolinieritas Transformasi variabel (melalui first differencing) Untuk data time series, jika hubungan Yt = β0+β1Xt1+β2Xt2+εt berlaku pd saat t, maka berlaku pula untuk t-1, shg ada Yt-1 = β0+β1X(t-1)1+β2X(t-1)2+εt-1 Jika kedua persamaan di atas dikurangkan, maka diperoleh Yt – Yt-1 = β1(Xt1 – X(t-1)1) + β2(Xt2 – X(t-1)2) + vt dimana vt = εt – εt-1 Penambahan data baru Agung Priyo Utomo - STIS
Agung Priyo Utomo - STIS LATIHAN Berdasarkan data berikut, cocokkan model Yi = β0+β1Xi1+β2Xi2+εi No. Y X1 X2 1 -10 2 -8 3 -6 5 4 -4 7 -2 9 6 11 No. Y X1 X2 7 2 13 8 4 15 9 6 17 10 19 11 21 Agung Priyo Utomo - STIS