EKONOMETRIKA (Terapan) Pertemuan ke-2 Model Regresi Linear Berganda untuk Data Panel
Model dengan data cross section Yi = α + β’ Xi + εi ; i = 1,2,....,N (1) N: banyaknya data cross section Model dengan data time series Yt = α + β’ Xt + εt ; t = 1,2,....,T (2) T: banyaknya data time series Model dengan data panel Yit = α + β’ Xit + εit ; i = 1,2,....,N; t = 1,2,….., T (3) di mana : N = banyaknya observasi T = banyaknya waktu N x T = banyaknya data panel
Kelemahan Data cross section murni Perkembangan individu antar waktu tidak dapat dilihat Data time series murni Peubah-peubah diobservasi secara agregat dari satu unit individu sehingga mungkin memberikan hasil estimasi yang bias
A panel data set is obtained from the same in individuals, families, firms, cities, states, or whatever, across time For Example, a panel data set on individual wages, hours, education, and other factors is collected by randomly selecting people from a population at a given point in time. Then, these same people are reinterviewed at several subsequent point in time
Nama lain panel data Time series cross section data Longitudanal data Micropanel data Cohort analysis
1. Micro panel : Panel Study of Income Dynamic, US The Indonesia Family Life Survey http:www.rand.org/FLS/IFLS), SUSENAS BHPS: British Household Panel Survey (Institute for Social and Economic Research at the University of Essex) GSOEP: German Socio-Economic Panel (German Institute for Economic Research) Canadian Survey of Labor Income Dynamics Japanese Panel on Consumers Korea Labor and Income Panel Surveys Household Income and Labor Dynamics in Australia 2. Macro panel : Contoh: Purchasing Power Parity (PPP), GDP or GNI Sumber macro panel data antara lain: World Development Indicators (www.worldbank.org/data) Statistik perdagangan dan keuangan internasional (www.imf.org)
Why use panel data methods? BENEFITS (Baltagi p.4-7) Controlling for individual heterogeneity Give more informative data, more variability, less collinearity among the variables Dengan meningkatnya jumlah observasi Panel data are better able to study the dynamics of adjustment Artinya dapat digunakan untuk memperoleh informasi bagaimana kondisi individu-individu pada waktu tertentu dibandingkan pada kondisinya pada waktu yang lainnya (observasi cross section yang sama secara berulang) Panel data are better able to identify and measure effects that are simply not detectable in pure cross section or pure time series data Panel data models allow us to construct and test more complicated behavioral models than purely cross-section or time-series data Biases resulting from aggregation over firms or individuals may be reduced or eliminated
Why use panel data methods? To increase the sample size Dengan meningkatnya jumlah observasi, maka akan berimplikasi pada data yang lebih informatif, lebih variatif, kolinearitas antar variabel yang semakin berkurang, dan peningkatan derajat kebebasan (degree of freedom) sehingga dapat diperoleh hasil estimasi yang lebih efisien increased precision of regression estimates the ability to model temporal effects without aggregation bias To allow for the unobserved effect (ai) to be correlated with the explanatory variables
Why use panel data methods? Data panel mampu mengakomodasi tingkat heterogenitas individu-individu yang tidak diobservasi namun dapat mempengaruhi hasil dari permodelan (individual heterogeneity). Hal ini tidak dapat dilakukan oleh studi time series maupun cross section sehingga dapat menyebabkan hasil yang diperoleh melalui kedua studi ini akan menjadi bias. Data panel dapat meminimalkan bias yang dihasilkan oleh agregasi individu karena unit observasi terlalu banyak dapat mengatasi masalah yang timbul ketika ada masalah penghilangan variabel (ommited variables)
Keterbatasan Data Panel Limitation (Baltagi p.7) Masalah desain survey panel, pengumpulan data dan manajemen data. Permasalahan meliputi cakupan populasi yang menjadi obyek penelitian, kemampuan daya ingat responden dan periode yang menjadi acuan (frekuensi dan waktu wawancara) Kesalahan pengukuran, dapat terjadi karena kesalahan responden dalam mengingat, kesalahan pencatatan dan kesalahan pada saat wawancara. Dimensi waktu (time series) data sangat pendek. Jenis micro panel biasanya biasanya mencakup data tahunan yang relatif pendek untuk tiap individu. Jika demikian maka argumen asymtotic karakteristik data panel akan berkurang. Cross section dependence. Apabila jenis macro panel dengan unit analisis negara (wilayah) dengan deret waktu yang panjang mengabaikan cross section dependence maka akan mengakibatkan misleading inference
Keterbatasan Data Panel Limitation (Baltagi p.7) Selectivity problem: - self selectivity: masalah yang muncul karena data-data yang dikumpulkan untuk suatu penelitian tidak sepenuhnya dapat menangkap fenomena yang ada - non response: masalah yang muncul ketika ada ketidaklengkapan jawaban yang diberikan oleh responden (biasanya responden rumahtangga) - atrition: jumlah responden yang cenderung berkurang pada survei lanjutan (responden mungkin meninggal, pindah, atau biaya untuk menemui responden yang terlalu tinggi)) Kesalahan dalam memilih responden dapat terjadi karena kesalahan peneliti dalam menentukan waktu untuk wawancara sehingga informasi yang diperoleh sedikit.
Applications of Panel Models
The Basic Data Structure Wave 1 Individual 1 Wave T Wave 1 Individual 2 Wave T Wave 1 Individual N Wave T
Formulate an hypothesis
Setiap ahli ekonomi yang menggunakan panel data atau jenis data lainnya harus selalu menyadari bahwa setiap metode yang digunakan memiliki keterbatasan …
Model Regresi Data Panel Model Regresi Balanced Panel Jika setiap unit cross section mempunyai data time series yang sama Model Regresi Unbalanced Panel Jika jumlah unit observasi time series dari unit cross section tidak sama Short Panel N > T Long Panel T > N
Panel Data Methods Panel Data Methods Simple Panel Data Methods (Pooling Cross Section Across Time) Advanced Panel Data Methods Fixed Effects Model Random Effects Model
Estimasi Model Regresi Data Panel Common Effect Model (Pooled Least Square) Dengan hanya menggabungkan data time series dan cross section tanpa melihat perbedaan antar waktu dan individu Perilaku data antar individu sama dalam kurun waktu ttn mengestimasi model dengan mempergunakan metode OLS (ordinary least squares) Fixed Effects Model (FEM) memperhitungkan kemungkinan bahwa kita menghadapi masalah omitted variables dimana omitted variables mungkin membawa perubahan pada intercept time-series atau cross-section. (slope coefficents constant but intercept varies across individuals) Random Effects Model (REM) memperbaiki efisiensi proses least squares dengan memperhitungkan error dari cross-section dan time-series
Extension: Dynamic Panel Models Example - unemployment spell depends on Observed regressor (e.g. x - education) Unobserved effect (e.g. l – willingness to work) Lagged effect (e.g. g - “scarring” effect of previous unemployment)
Text Book (Advance) Baltagi, B (2001) Econometric Analysis of Panel Data, 2ndedition, Wiley Hsiao, C. (1986) Analysis of Panel Data, Cambridge University Press Wooldridge, J (2002), Econometric Analysis of Cross Section and Panel Data, MIT Press