MULTICOLLINEARITY Salah satu asumsi model regresi berganda adalah tidak ada hubungan linier antar peubah bebas. Sebagai ilustrasi bagaimana jika terjadi hubungan yang sempurna antara dua peubah dalam model. Misalkan model regresi berganda sbb: di mana Y adalah konsumsi, X1 adalah pendapatan dan X2 adalah kekayaan. Di samping itu juga diketahui bahwa X2 =kX1 Jika X2 =kX1 maka Jika terjadi multikolinier sempurna maka koef b tidak dapat dihitung
Akibat Multikolinier Jika X2=kX1 maka Ini berarti bahwa pendugaan var(β) menjadi infinite. Akibat Multikolinier Jika korelasi antar peubah bebas tidak sempurna, tetepi tinggi, maka dugaan parameter koef. regresi mungkin masih dapat diperoleh, tetapi interpretasinya menjadi sulit. - Var(b) menjadi sangat besar, walaupun b1 dan b2 bersifat tak bias. Peluang menolak Ho menjadi kecil. Nilai b sensitif terhadap perubahan data. - Dalam uji F salah satu β berbeda nyata dengan nol (signifikan), tetapi pada uji t, tidak ada β yang signifikan.
Mendeteksi Adanya Multikolinier - Uji korelasi sederhana antar peubah bebas yang masuk model. Jika terjadi korelasi yang tinggi maka dapat diduga adanya multikolinier. Tetapi, jika korelasi rendah belum tentu tidak terjadi multikononier. Ini berarti korelasi yang tinggi merupakan syarat cukup, tetapi belum merupakan syarat perlu. Klein berpendapat walaupun korelasi r tinggi, tetapi selama rij2 <R2 maka walaupun terjadi multikolinier, tetapi multikolinier tersebut tidak menyebabkan efek yang serius. - Koefisien determinasi (R2) tinggi, tetapi tidak ada satupun peubah signifikan, atau sangat sedikit peubah yang signifikan. - Variance Inflation Factor (VIF). VIF= (1-Rj2)-1 yang tinggi. Terdapat buku yang menyebutkan nilai 9 atau 12.
Q= 850-5.03X2+4.74X3+0.277X4+0.011X5+1.31X6 Predictor Coef SE Coef T P VIF Rj2 Constant 850.0 134.8 6.31 0.000 X2 -5.03 0.44 -11.45 1.0 0.00 X3 4.74 0.97 4.89 1.3 0.23 X4 2.77 0.10 2.65 0.014 1.4 0.29 X5 0.01 8.10 1.1 0.09 X6 1.31 0.75 1.74 0.095 Dengan akar ciri matriks (X’X). (i)Menghitung akar ciri matriks (X’X) misalnya λj untuk j=1,2, . . ,k. (ii) Menghitung K=(λmax/λ min)0.5. Multikolinier jika K≥30 atau K≥(VIFmax)0.5
Mengatasi Multikolinier Memanfaatkan informasi sebelumnya (prior information) dari hasil penelitian terdahulu, atau secara apriori kita percaya bahwa b2=0.3 b1, maka model di atas menjadi (2) Mengeluarkan peubah dengan kolinieritas yang tinggi. Namun demikian hal ini harus hati-hati, karena menyebabkan terjadinya misspesification model(model salah spesifikasi). Misalnya kita menduga fungsi permintaan, yang peubah bebasnya salah satunya adalah harga sendiri. Jika karena multikolinier, kemudian harga sendiri dikeluarkan dari model, maka model tersebut bukan lagi fungsi permintaan.
(3) Melakukan transformasi terhadap peubah dalam model. Walaupun X1 dan X2 berkorelasi, tetapi perbedaannya (first difference form)belum tentu berkorelasi (4) Menggabungkan antara data cross section dengan data time series. Sering kali dalam data time series terdapat korelasi yang tinggi antara harga dengan pendapatan. Untuk mengatasinya digunakan data cross section untuk menduga α2. Setelah α2 diperoleh maka dilakukan transformasi sebagai berikut:
(5) Dengan principal component (komponen utama) (5) Dengan principal component (komponen utama). (6) Cek kembali asumsinya pada saat membangun model Misalkan fungsi produksi yang dibangun adalah constant return to scale Q=AKαLβ di mana α+β=1,maka model dapat dirubah menjadi (Q/L)=AK α . Dan untuk mencari koefisien β=1-α. (7) Menambah data baru.
HETEROSKEDASTISITAS Salah satu asumsi OLS adalah bahwa ragam sisaan εt untuk setiap Xi sama atau homogen (Var(εi)=E(εi2)=σ2). →Homoskedastisitas (homoscedasticity). Homoscedasticity Heteroscedasticity Masalah heteroskedastisitas sering terjadi dalam data cross section. Tetapi kemungkinan juga terjadi pada data time sries. Y Y Ŷ=α+βX Ŷ=α+βX X X
Berapa Penyebab Terjadinya Heteroskedastisitas (1) Pada umumnya makin tinggi tingkat pendapatan, pola pengeluarannya makin bervariasi. (2) Error –learning model Spesifikasi model yang kurang sesuai, baik bentuk fungsi maupun peubah yang masuk dalam model. Adanya data pencilan (outlier) Akibat Heteroskedastisitas (1) Dugaan parameter koefisien regresi dengan OLS tetap tidak bias, konsisten, tetapi standart errornya bias ke bawah. (2) Pendugaan OLS tidak efisien lagi. (3) Oleh karena standart error bias maka uji signifikansi dengan statistik t menjadi overestimated→ uji t tidak benar
Jika terjadi heteroskedastisitas, dugaan parameter koefisien : dan ragamnya adalah : Ini berarti bahwa untuk memperoleh dugaan ragam yang konsis-ten dapat dilakukan dengan menggantikan σi2 dengan kuadrat dari masing-masing sisaan (residual) model regresi .
Cara Mendeteksi Heteoskedastisitas Misalkan σi2 = σ2 ki, di mana k adalah konstanta, maka : Cara Mendeteksi Heteoskedastisitas Uji korelasi rank Spearman : a. Meregresikan Y terhadap X, diperoleh dugaan sisaan (e) b. Sisaan (tanpa memperhatikan tanda) dan nilai X diurutkan mulai dari nilai terkecil sampai ke yang terbesar, atau sebaliknya. Kemudian dihitung korelasi rank Spearman dengan rumus :
di mana di adalah perbedaan ranks antara peubah X dan error di mana di adalah perbedaan ranks antara peubah X dan error. Nilai koefisien korelasi yang tinggi menunjukkan adanya heretoskedastisitas. (2) Uji Glejser Meregresikan Y terhadap X, dan diperoeleh sisaan (e). Meregresikan niali absolut sisaan terhadap X dengan beberapa model berikut: (3)Uji Breusch-Pagan (4) Uji Golfeld-Quandt (5) White test
Cara Mengatasi Heteroskedastisitas Kadang-kadang dapat dilakukan dengan menstransfortasi data dengan logaritma. Tetapi kadang kala juga menimbulkan masalah baru, seperti multikolinier atau spurious correlation Jika ragam sisaan diketahui, untuk menduga parameter dapat menggunakan metode Kuadrat Terkecil Terboboti (WLS=weighted least square)→GLS (generalized least square). Prosedur WSL dapat diturunkan dari fungsi kemungkinan maksimum. Dugaan parameter adalah dengan meminimumkan : Dengan meminimumkan jumlah kuadrat pers di atas diperoleh:
Di mana Pada dasarnya adalah WLS dilakukan dengan memberikan bobot pada data aslinya, kemudian untuk menduga parameter digunakan OLS. Data asli ditransformasi dengan cara dibagi dengan standart error sbb: Sehingga model menjadi:
Komponen sisaan model di atas sudah sama atau homogen Komponen sisaan model di atas sudah sama atau homogen. yaitu: (2) Ragam sisaan tidak diketahui: Jika diasumsikan Var(ε)=cX22 dan persamaan regresi : maka peubah-peubahnya dilakukan transformasi dengan membagi dengan X2, yaitu: Sehingga modelnya menjadi:
AUTOKORELASI (SERIAL CORRELATION) Salah satu asumsi OLS adalah tidak ada autokorelasi antara sisaan, atau Cov(εi, εj)=E(εi, εj)= 0 untuk semua i≠j. Penyebab Terjadinya Autokorelasi : 1) Inertia (kelembaman): deret waktu GNP, indeks harga, pola siklus 2) Bias spefikasi : Variabel penting tidak masuk model, bentuk model yang tidak sesuai. 3) Fenomena Cobweb. Penawaran komoditas pertanian mencerminkan adanya fenomena Cobweb. 4) Lag. Misalnya konsumsi pada saat ini juga ditentukan oleh konsumsi periode sebelumnya 5) Manipulasi data: interpolasi data, ekstrapolasi data.
Akibat Autokorelasi: 1) Dugaan OLS tidak bias(Rata-rata,dugaan koefisien sama dengan nilai sebenarnya, E(bi)=βi) 2)Masih konsisten (dugaan makin mendekati nilai sebenarnya jika ukuran contohnya diperbesar) 3)Standart errornya bias ke bawah 2) Penduga OLS tidak efisien (Ragam tidak minimum). Cara Mendeteksi Autokorelasi: 1) Dengan grafik (scatter diagram) 2) Uji Durbin Watson (DW)
Langkah pengujian atutokorelasi dengan Durbin Watson: 1)Merumuskan hipotesis, yaitu: Ho : 𝜌=0 (Tidak ada autokorelasi) Hi : 𝜌≠0 (Terjadi autokorelasi) 2) Menghitung statistik Durbin Watson dengan rumus: 3) Nilai DW dibandingkan dengan nilai dalam Tabel: Jika DW < dL tolak Ho (terjadi autokorelasi positif) Jika DW > (4-dl) tolak Ho (terjadi autokorelasi negatif) Jika dU < DW < (4-dU) terima Ho (tidak terjadi autokorelasi) Jika dL < DW < dU atau (4-dU < DW < (4-dL) tidak dapat disimpulkan
Jika dalam model terdapat peubah lag respons, maka nilai statististik DW mendekati 2 walaupun terdapat autokorelasi. Hal ini berarti bahwa uji statistik DW tidak valid. Oleh karena itu disarankan menggunakan Statistik Durbin h. 𝜌 = dugaan koefisien autokorelasi ordo satu T = Jumlah pengamatan Var(b) = dugaan ragam dari koefisien peubah lag respons Oleh karena DW≈2(1-𝜌), maka,
Solusi Untuk Autokorelasi: 1) Struktur autokorelsi diketahui → Generalized differencing 2)Struktur autokorelsi tidak diketahui → Cochrane-Orcutt atau Hilderth_Lu 3) Durbin’s two stage method Metode Cochrane-Orcutt: (1) Menduga dengan OLS : , hitung sisaan: Kemudian menduga 𝜌 dengan rumus : (2) Menggunakan untuk menstranformasi data. Setelah data di rubah diduga lagi dengan OLS model : menduga , kemudian menduga (3) Menggunakan untuk menstranformasi data. Setelah data di rubah diduga lagi dengan OLS model :
Kemudian menduga : dan dihitung Prosedur ini terus diulangi sampai nilai dugaan 𝜌 konvergen. Misalkan prosedur ini sudah konvergen pada tahap ke dua maka ini dinamakan two-stage Cochrane-Orcutt method. Contoh : Misalkan kita ingin menduga fungsi import, di mana jumlah import dipengaruhi oleh pendapatan nasional. Makin tinggi pendapatan nasional makin tinggi jumlah yang diimport. Modelnya : Di mana Y adalah nilai import (Juta Rupiah) dan X adalah GNP (Juta Rupiah). Datanya adalah sbb:
Tahun Import (Y) GNP(X) et et-1 1 3748 21777 122,174 * 2 4010 22418 204,999 3 3711 22308 -63,253 4 4004 23319 -52,853 5 4151 24180 -146,523 6 4569 24893 72,176 7 4582 25310 -31,386 8 4697 25799 -53,073 9 4753 25886 -21,392 10 5062 26868 13,116 11 5669 28134 266,238 12 5628 29091 -42,267 13 5736 29450 -34,616 14 5946 30705 -175,419 15 6501 32372 -86,386 16 6549 33152 -256,415 17 6705 33764 -271,484 18 7104 34411 -53,337 19 7609 35429 167,108 20 8100 36200 442,594
Hasil pendugaan dengan minitab sbb: The regression equation is Y = - 2461 + 0,280 X Predictor Coef SE Coef T P Constant -2461,4 250,0 -9,85 0,000 X 0,279524 0,008729 32,02 0,000 S = 178,4 R-Sq = 98,3% R-Sq(adj) = 98,2% Analysis of Variance Source DF SS MS F P Regression 1 32645723 32645723 1025,40 0,000 Residual Error 18 573069 31837 Total 19 33218792 Durbin-Watson statistic = 0,94
Tabel dL dan dU pada taraf nyata 5% K=1 K=2 dL dU 15 1.08 1.36 0.95 1.54 16 1.10 1.37 0.98 17 1.13 1.38 1.02 18 1.16 1.39 1.05 19 1.18 1.40 20 1.20 1.41 21 1.22 1.42 22 1.24 1.43 1.15
Predictor Coef SE Coef T P Noconstant et-1 0,5278 0,2583 2,04 0,056 The regression equation is et= 0,528 et-1 Predictor Coef SE Coef T P Noconstant et-1 0,5278 0,2583 2,04 0,056 S = 158,7 Analysis of Variance Source DF SS MS F P Regression 1 105061 105061 4,17 0,056 Residual Error 18 453081 25171 Total 19 558142
Tahun Import (Y) GNP(X) et et-1 Yt-0,528Yt-1 Xt-0,528Xt-1 1 3748 21777 2 4010 22418 205 122 2031,1 10919,7 3 3711 22308 -63,3 1593,7 10471,3 4 4004 23319 -52,9 2044,6 11540,4 5 4151 24180 -147 2036,9 11867,6 6 4569 24893 72,2 2377,3 12126,0 7 4582 25310 -31,4 2169,6 12166,5 8 4697 25799 -53,1 2277,7 12435,3 9 4753 25886 -21,4 2273,0 12264,1 10 5062 26868 13,1 2552,4 13200,2 11 5669 28134 266 2996,3 13947,7 12 5628 29091 -42,3 2634,8 14236,2 13 5736 29450 -34,6 2764,4 14090,0 14 5946 30705 -175 2917,4 15155,4 15 6501 32372 -86,4 3361,5 16159,8 16 6549 33152 -256 3116,5 16059,6 17 6705 33764 -271 3247,1 16259,7 18 7104 34411 -53,3 3563,8 16583,6 19 7609 35429 167 3858,1 17260,0 20 8100 36200 443 4082,4 17493,5
The regression equation is Yt = - 1386 + 0,296 Xt Predictor Coef SE Coef T P Constant -1386,4 235,0 -5,90 0,000 Xt 0,29610 0,01669 17,74 0,000 S = 158,6 R-Sq = 94,9% R-Sq(adj) = 94,6% Analysis of Variance Source DF SS MS F P Regression 1 7914208 7914208 314,62 0,000 Residual Error 17 427626 25154 Total 18 8341834 Durbin-Watson statistic = 1,64 dU = 1.39 dan (4-dU) = 4-1.39 = 2.61→ Tidak terjadi autokorelasi
MODEL SEBARAN BEDA WAKTU Dalam anlisis regresi yang menggunakan data time series seringkali pengaruh peubah pada waktu ke t memerlukan waktu yang cukup lama untuk memberikan dampak terhadap peubah tak bebas. lag. Kelambanan pengaruh disebabkan oleh berbagai alasan, seperti teknologi, institusi dan psikologi. Misal terdapat kenaikan pendapatan Rp 2 juta pada Pebruari. Kenaikan ini tidak digunakan untuk menambah konsumsi sekaligus pada waktu yang sama, tetapi juga digunakan untuk wakatu-waktu berikutnya. Misalnya digunakan pad Pebruari Rp 800 ribu, Maret Rp 600 ribu, April Rp 400 ribu dan seterusnya. Jadi fungsi konsumsinya adalah: Dalam bentuk umum modelnya : Pengaruh jangka pendek adalah β0 dan jangka panjang adalah (β0+ β1+ β2+ . . . . + βk)
Dalam bentuk umum model dapat ditulis : Jika jumlah lag sedikit maka pendugaannya dapat dilakukan dengan OLS. Atau dilakukan secara berurutan, misalnya regresi Y tehadap Xt dan Xt-1, kemudian Y terhadap Xt, Xt-1 dan Xt-2 demikian seterusnya sampai peubah lag tidak nyata. Pendugaan cara ini akan menghabiskan derajat bebas, dan mungkin menyebabkan multikolinier. Sebagai contoh: Alt memilih regresi yang ke dua, karena dalam dua pers yang terakhir tanda Xt-2 tidak stabil dan Xt-3 nilainya negatif
Pendekatan Koyck Jika bobot dari koefisien fungsi diasumsikan positif dan menurun secara geometrik→Model Geometrik Lag : Respons Y sebagai akibat perubahab X satu unit dalam jangka panjang dapat dituliskan sbb: Sedangkan lag-weighted average adalah:
Jika w=0.5 maka mean lag=1→ setengah dampak perubahan y akan dirasakan pada periode pertama Jika w=0.9 maka mean lag=9→ setengah dampak perubahan y akan dirasakan pada periode ke sembilan Dalam pendugaan dilakukan manipulasi sebagai berikut: Dari persamaan (1) juga berlaku untuk persamaan berikut: Jika persamaan (5) dikalikan dengan w maka: Jika persamaan (1) dikurangi dengan persamaan (6) maka: maka
Model Ekspektasi Adap tif(Adaptive expectation Model) Persamaan (7) pertama kali dilakukan oleh Koyck (1954), oleh karena itu model tersebut dinamakan Transformasi Koyck. Pendugaan model dapat dilakukan dengan persamaan (8). Respons jangka pendek Y sebagai akibat perubahan X satu unit adalah β, sedangkan respons jangka panjangnya adalah : Model Ekspektasi Adap tif(Adaptive expectation Model) Model ini dikembangkan berdasarkan pemikiran bahwa perubahan Y berkaitan dengan perubahan nilai harapan X : X* mempresentasikan nilai harapan. X* dapat dipresentasikan sebagai pendapatan permanen dalam fungsi konsumsi agregat yang dijelaskan sebelumnya, atau harga harapan dalam permintaan mikroekonomi, atau tingkat bunga harapan pada model permintaan uang
Dalam model ini, nilai harapan X diasumsikan berubah tiap periode waktu, yang dinyatakan sebagai suatu penyesuaian terhadap perbedaan antara nilai pengamatan dengan nilai harapan sebelumnya: Pers(11) menunjukkan bahwa nilai harapan merupakan nilai rataan terboboti dari nilai X sekarang yang berlaku dengan nilai harapan sebelumnya. Dari pers(11) juga berlaku bahwa ; Jika pers(12) disubstitusikan ke pers(11) maka:
X merupakan nilai rataan terboboti dari nilai X sekarang yang berlaku dengan nilai harapan sebelumnya. Persa (13) disubstitusikan ke pers(9) maka diperoleh: Jika dimisalkan α=α*, β=β*ϴ, w=(1‒ϴ) dan εt=εt* maka pers (14) sama dengan pers (8). Dengan cara yang sama pada pembentukan pers (8) maka pers (14) dapat dituliskan sbb:
Model Penyesuaian Stok (Stoct Adjustment Model) Asumsi : Nilai Y (jumlah stok) yang diharapkan merupakan fungsi linier dari X sekarang : Dalam suatu periode tertentu, nilai aktual Y mungkin tidak menyesuaikan secara lengkap untuk memperoleh nilai yang diinginkan, yang disebabkan oleh kurang pengetahuan, kendala teknis dan institusi dan lain sebagainya. Proses penyesuaian : Jika pers (17) disubstitusikan ke pers (16) maka: Pers(18) menunjukkan bahwa model penyesusisn stok berkaitan erat dengan model geometric lag.
Akan tetapi model tersebut tidak benar-benar sama, karena asumsinya yang berbeda. Dalam model ini proses sisaan dalam model penyesuaian stok menggambarkan proses sisaan rataan bergerak (moving average error proces). Pendugaan Model Geometric Lag dengan Model Regresi Diri (Autoregressive) Persamaan model geometric lag dapat dinyatakan dalam model autoregressive: (1) Jika komponen sisaan menyebar normal dengan ragam konstan dan tidak ada serial korelasi. Pada umumnya model geometric lag memperlihatkan serial korelasi jika siaan awal ditetapkan tidak ada autokorelasi. Sehingga adanya peubah respons lagged dependent variable akan menyebabkan dugaan parameter dengan OLS bersifat bias meskipun konsisten
(2) Jika komponen sisaan mengikuti pola yang ditunjukkan oleh model geometric lag dan adaptive expectations maka : Dalam kasus ini dugaan OLS menjadi tidak konsisten dan juga bias. Kesulitan muncul karena ut dan Yt-1 berkorelasi dan korelasinya tidak hilang meskipun ukuran contohnya semakin besar. Untuk itu maka digunakan metode peubah instrumental atau metode kemungkinan maksimum. Metode instrumental, dengan peubah Xt-1 sebagai peubah instrumen untuk Yt-1. Metode ini menghasilkan dugaan yang konsisten tetapi tidak mungkin sangat efisien. (3) Sisaan mengikuti proses serial korelasi ordo kesatu, yaitu Dugaan OLS tidak konsisten dan bias. Dengan metode peubah instrumen atau kemungkinan maksimum dapat digunakan sebagai alternatifnya dapat menghasilkan dugaan konsisten tetapi cenderung tidak efisien
Peubah instrumen untuk menggatikan Yt-1 dapat diperoleh darai Dengan cara ini efisiensi dapat diperbaiki jika parameter intersep dan slope digunakan untuk memperoleh dugaan koefisien korelasi resial 𝜌. Caranya adalah dengan meregresikan ut terhadap ut-1 dan dihasilkan serial korelasi 𝜌. Proses generalized differencing dapat digunakan untuk menduga parameter dalam persamaan awal. Pengujian Autokorelasi Dalam model autoregresif, statistik d(Durbin-Watson) tidak dapat digunakan untuk menguji autokorelasi. Karena nilai d cenderung mendekati nilai 2.
Untuk itu pengujiannya diusulkan dengan statistik h, yaitu: N= ukuran contoh, var(α)=ragam koef dari lag Yt-1, dan 𝜌=dugaan autokorelasi derajat pertama . Dalam praktek, nilai 𝜌 dapat diduga dengan rumus : di mana d adalah nilai statistik Durbin Watson, rumus di atas menjadi :
Contoh: Model permintaan uang: Model dapat dinyatakan dalam bentuk log sbb: Karena variabel permintaan uang yang diinginkan tidak dapat diamati secara langsung maka digunakan hipotesis penyesuaian stok
Atau dapat dinayatakan : Model permintaan uang menjadi : Misalkan hasilnya dengan data empris sbb:
Koefisien penyesuaian 𝛿=1-0. 5284=0 Koefisien penyesuaian 𝛿=1-0.5284=0.4716 Elastisitas pendapatan jangka panjang adalah: 0.6869/0,4716 = 1.4565, yang lebih elastis daripada elastisitas pendapatan jangka pendek Pengujian autokorelasi Karena h=0.50 lebih kecil 1.645 maka hipotesis nol diterima, yang berarti tidak terjadi autokorelasi derajat satu