EKONOMETRIKA Pertemuan 4,5 Estimasi Parameter Model Regresi Pengujian Hipotesis dan Interval Konfidensi Dosen Pengampu MK: Dr. Idah Zuhroh, M.M. Evellin D. Lusiana, S.Si, M.Si
Materi Estimasi parameter regresi linier sederhana (OLS) Asumsi-asumsi OLS GOF regresi (Koefisien Determinasi) Sifat-sifat estimator OLS (BLUE) Pengujian hipotesis dan Interval konfidensi
Estimasi Parameter Regresi Linier Sederhana [1] Menduga PRF dengan SRF Menggunakan metode Ordinary Least Square (OLS) PRF SRF Dari dua definisi tersebut:
Estimasi Parameter Regresi Linier Sederhana [2] Prinsip metode Ordinary Least Square (OLS): Memilih SRF sedemikian sehingga jumlah kuadrat dari error sekecil mungkin Penduga parameter model dipilih berdasarkan metode optimasi: Solusi dari turunan pertama dari masing-masing parameter yang disamadengankan nol
Persamaan (1) dan (2) disebut persamaan normal
Dari persamaan (1), diperoleh
Cara 1: untuk mendapat estimator β2 Subtitusi persamaan (3) ke (2) akan menghasilkan
Cara 2: untuk mendapat estimator β2 (estimasi berdasarkan variasi) Misalkan: Diketahui: sehingga
Estimasi Parameter Regresi Linier Sederhana [3] dengan demikian, estimator yang dihasilkan adalah
Keakuratan dan standar error dari estimator OLS Estimator ragam dari estimator OLS
Contoh: estimasi model regresi untuk teori Keynes (data hipotetik) Berdasarkan data ini, tentukan estimator
Tabel perhitungan data hipotetik 1 70 80 (70).(80)= 5600 (80)2=6400 80-170=-90 70-111=-41 (-90)2=8100 (-41)2=1681 (-90)(-41)=3690 2 65 100 6500 10000 -70 -46 4900 2116 3220 3 90 120 10800 14400 -50 -21 2500 441 1050 4 95 140 13300 19600 -30 -16 900 256 480 5 110 160 17600 25600 -10 -1 10 6 115 180 20700 32400 16 40 7 200 24000 40000 30 9 81 270 8 220 30800 48400 50 29 841 1450 155 240 37200 57600 44 1936 3080 150 260 39000 67600 39 8100 1521 3510 Σ 1110 1700 205500 322000 33000 8890 16800 rata2 111 170 20550 32200 3300 889 1680
Berdasarkan tabel perhitungan tsb, diketahui Interpretasi: Setiap kenaikan 1$ pendapatan (X) akan meningkatkan pengeluaran (Y) sebesar $0.5091 Model Estimasi
TUGAS Gunakan kembali data sampel yang diambil dari data pendapatan dan pengeluaran 60 RT (n=10). Dari scatterplot data sampel tersebut, tentukan garis regresi menurut pandangan kasat mata (subjektif). Kemudian, tentukan nilai dan untuk mendapatkan model estimasi Buatlah kurva regresi SRF berdasarkan model estimasi tersebut, serta tentukan posisi PRF Tentukan, mana garis/kurva yang lebih mendekati PRF. Apakah garis yang ditentukan secara subjektif atau berdasarkan model estimasi?
Asumsi-asumsi yang mendasari Metode OLS [1] Diperlukan karena tujuan kita adalah pengambilan kesimpulan mengenai nilai parameter yang sebenarnya. Linier dalam parameter Nilai variabel independen dianggap non stokastik (fixed) error mempunyai nilai harapan nol Homoskedastisitas: ragam yang sama pada error error tidak saling berkorelasi
Asumsi-asumsi yang mendasari Metode OLS [2] variabel independen dan error saling bebas Jumlah pengamatan harus lebih besar daripada jumlah parameter yang akan diduga Nilai variabel independen harus bervariasi Model regresi harus dispesifikasikan dengan tepat: no specification bias Tidak ada multikolinieritas sempurna
Linier dalam Parameter Hanya parameter yang bersifat linier variabel dependen/independen boleh tidak linier
Nilai variabel independen dianggap non stokastik (fixed) Untuk membentuk sebaran nilai-nilai variabel dependen (Y) pada setiap nilai variabel independen (X) Pada X tertentu terdapat beberapa nilai Y Analisis regresi di sini adalah analisis regresi bersyarat pada nilai X
Error mempunyai nilai harapan nol Dengan syarat nilai X tertentu, error mempunyai rata-rata atau nilai harapan sebesar nol
Homokedastisitas: ragam yang sama pada error Pada setiap nilai X, populasi Y mempunyai ragam yang sama
Ilustrasi grafis asumsi Heterokesdastisitas
Pada kasus heterokesdastisitas Ragam error meningkat seiring dengan meningkatnya nilai X Nilai-nilai Y pada X1 lebih terpusat di garis regresi populasi (PRF) daripada nilai-nilai Y di X yang lainnya Pengamatan Y berasal dari X= X1 akan lebih mungkin terletak di dekat PRF daripada Y yang berasal dari X yang lainnya. Pengamatan pada X= X1 lebih akurat daripada pengamatan pada X selainnya.
Implikasi dari asumsi Homokesdastisitas Dari asumsi homokesdastisitas, berlaku bahwa: Ragam dari Y dengan syarat nilai X juga sama untuk setiap kemungkinan nilai X Konstanta Ragam dari konstanta adalah nol, dan kedua suku saling bebas
Error Tidak Berkorelasi Pada dua nilai X yang berbeda, korelasi / kovarians antar error = 0. Asumsi ini setara dengan asumsi kebebasan error pada pada nilai-nilai X yang berbeda.
Error Tidak Berkorelasi Asumsi ini disebut dengan ‘tidak ada autokorelasi’ antar error Pada nilai X tertentu, penyimpangan nilai Y dari rata-rata tidak mempunyai pola tertentu (acak). Jika terdapat autokorelasi, maka Y tidak hanya dipengaruhi oleh X, tapi juga dipengaruhi oleh error dari X yang lainnya
variabel independen dan error saling bebas Kovarians di antara error dan variabel independen = 0 PRF dibentuk berdasarkan asumsi bahwa X dan u mempunyai efek aditif (yang terpisah) bagi Y Jika kedua efek tersebut berkorelasi Kesulitan dalam menganalisis efek individu dari X dan u Jika keduanya tidak saling bebas u semakin besar seiring peningkatan nilai X (korelasi positif) u semakin kecil seiring peningkatan nilai X (korelasi negatif)
Jumlah pengamatan harus lebih besar daripada jumlah parameter yang akan diduga Syarat diperolehnya solusi unik dari suatu sistem persamaan (n: jumlah pengamatan (ukuran sampel), m: jumlah penaksir parameter, n>m) Menurut Harrel (2001), ukuran minimum sampel untuk analisis regresi adalah 10-20 kali banyaknya parameter. Harrell, F.E. Jr. Regression modelling strategies. Springer-Verlag, New York, NY; 2001
Nilai variabel independen harus bervariasi Karena tujuan dari analisis adalah mempelajari perubahan Y seiring dengan perubahan X (jika secara teori Xi berpengaruh terhadap Yi, namun data yang ada tidak berubah/tidak bervariasi maka Xi tidak dimasukkan dalam model atau dianggap ceteris paribus). Dari rumus penduga slope model regresi, penyebut akan bernilai nol jika tidak ada variasi dari nilai X Tidak ada solusi bagi penduga slope ≠0
Model regresi harus dispesifikasikan dengan tepat: no specification bias Jika digunakan model 2, maka pada X tertentu, model akan overestimate rata-rata Y bagi titik-titik di antara A dan B Model 1 Model 2
Tidak ada multikolinieritas sempurna Tidak ada hubungan linier di antara variabel-variabel independen yang digunakan
Classical Linier Regression Model Asumsi-asumsi tersebut disebut dengan asumsi pada Classical Linier Regression Model (CLRM) Asumsi tersebut mendasari sifat-sifat penduga OLS secara statistika. Dinyatakan dalam Teorema Gauss Markov
Keakuratan dan standar error dari estimator OLS Mempelajari sebaran penarikan sampel dari penduga regresi SRF tidak pernah sama dari sampel satu ke sampel yang lain Nilai estimator juga seringkali tidak sama dari satu sampel ke sampel yang lain Suatu estimator dinyatakan akurat jika mempunyai ragam/standar deviasi yang kecil pada sebaran penarikan sampel.
Sebaran penarikan sampel estimator 1 tepat, tidak bias Cukup akurat, ragam kecil Sebaran penarikan sampel estimator 2 tepat, tidak bias Kurang akurat, ragam besar
Sifat-sifat penduga OLS: Teorema Gauss Markov Jika semua asumsi-asumsi CLRM terpenuhi maka estimator OLS akan mempunyai sifat berikut ini: Linier: fungsi linier dari variabel acak di dalam model (Y) Tidak bias: nilai harapan penduga adalah nilai dari parameter Mempunyai ragam terkecil dari semua penduga linier yang tak bias BLUE: (Best Linear Unbiased Estimators) Estimator OLS menyebar secara normal pula
Pembuktian BLUE Linier dalam Yestimator sbg fungsi linier dari Y =0
Tidak bias
Varians minimum
Goodness of Fit dari garis regresi Sebagai alat untuk: Menentukan apakah tidak ada alternatif garis lain yang dapat menjelaskan hubungan X dan Y Mengukur seberapa baik model yang diperoleh menjelaskan Y Diperlukan penguraian nilai sum square (SS) Y di sekitar nilai rata-rata. RSS Residual sum square TSS Total sum square ESS Explained sum square
Penguraian jumlah kuadrat Y di sekitar nilai rata-rata RSS TSS ESS Penguraian jumlah kuadrat Y di sekitar nilai rata-rata
Dari penguraian JK tersebut dapat diturunkan koefisien determinasi berikut: Sebagai ukuran seberapa besar (dalam proporsi/persen) keragaman total Y dapat dijelaskan oleh model regresi.
Rentang Nilai Koefisien Determinasi Dari hubungan: Jika model regresi gagal menjelaskan keragaman nilai Y maka: Jika model regresi menjelaskan keragaman nilai Y dengan sempurna maka:
Koefisien Determinasi dan Korelasi Koefisien determinasi merupakan kuadrat dari koefisien korelasi, yaitu Di mana:
Contoh: estimasi model regresi untuk teori Keynes (data hipotetik) [Lanj.]
Yi Xi XiYi X2 X-Xbar Y-Ybar (X-Xbar) * (Y-Ybar) Yhat u2 70 80 5600 u=Y-Yhat u2 70 80 5600 6400 -90 -41 8100 1681 3690 65.18 4.82 23.21 65 100 6500 10000 -70 -46 4900 2116 3220 75.36 -10.36 107.42 90 120 10800 14400 -50 -21 2500 441 1050 85.55 4.45 19.83 95 140 13300 19600 -30 -16 900 256 480 95.73 -0.73 0.53 110 160 17600 25600 -10 -1 1 10 105.91 4.09 16.72 115 180 20700 32400 4 16 40 116.09 -1.09 1.19 200 24000 40000 30 9 81 270 126.27 -6.27 39.37 220 30800 48400 50 29 841 1450 136.46 3.54 12.56 155 240 37200 57600 44 1936 3080 146.64 8.36 69.91 150 260 39000 67600 39 1521 3510 156.82 -6.82 46.52 Total 1110 1700 205500 322000 33000 8890 16800 1110.02 -0.01 337.27 rata2 111 170 20550 32200 3300 889 1680 111.00 0.00 33.73
Interpretasi: Setiap kenaikan 1$ pendapatan (X) akan meningkatkan pengeluaran (Y) sebesar $0.5091 Model Estimasi
Koefisien determinasi Interpretasi: 96.2% keragaman pengeluaran dapat dijelaskan oleh variabel pendapatan, sedangkan 3.8% sisanya oleh variabel lain diluar model
TUGAS Berdasarkan data yang telah dikumpulkan pada tugas sebelumnya, lakukan estimasi model regresi antara 1 variabel dependen (Y) dan 1 variabel independen (X). Hitung Intersep (β1) dan koefisien regresi (β2) Standar error β1 dan β2 Koefisien determinasi (R2)
Uji Hipotesis dan Interval Konfidensi Dengan asumsi Classical Linier Regression Model (CLRM) penduga OLS menyebar secara normal:
Interval konfidensi [1] Interval/selang di mana nilai β yang sebenarnya terletak, pada tingkat kepercayaan/konfidensi tertentu (1-α) Pembentukan interval konfidensi untuk nilai parameter regresi yaitu Nilai βj dispesifikasikan dalam Ho
Interval Konfidensi [2] Contoh: berdasarkan estimasi model regresi sebelumnya diketahui Maka interval konfidensi Interpretasi: 95 dari 100 kali sampling akan menghasilkan interval konfidensi yang memuat nilai parameter β2 yang sebenarnya
Interval Konfidensi dan Uji Hipotesis Jika Ho : β2 =0 vs H1: : β2 ≠ 0 Maka berdasarkan IK yang ada, diputuskan menolak Ho, karena nilai β2 =0 berada di luar interval.
Uji Signifikansi Parameter: Uji Parsial Uji satu arah jika dipunyai wawasan ‘a priori’ Statistik uji: Tolak atau terima H0 berdasarkan p-value lalu dibandingkan nilai α tertentu atau nilai t tabel (tα,db), serta sifat pengujian (satu arah atau dua arah)
Aturan pengambilan keputusan uji hipotesis Tipe hipotesis Ho H1 Tolak Ho jika Dua arah β2=β2* β2 ≠ β2* │t│> tα/2,db P-value < α Satu arah (kanan) β2 ≤= β2* β2 > β2* t > tα,db Satu arah (kiri) β2 ≥ β2* β2 < β2* t < -tα,db Nilai db untuk - Regresi linier sederhana=n-2 Regresi linier berganda=n-k-1
Misal, dengan contoh model regresi sebelumnya: Ho : β2 =0.3 vs H1: : β2 ≠ 0.3 Interval konfidensi: Gagal tolak Ho P-value=P(tdb < -t ) + P(tdb > t ) -- dua arah
P-value=P(tdb < -t ) -- satu arah Atau P-value=P(tdb > t ) -- satu arah Sehingga, pengambilan keputusan juga bisa ditentukan berdasar nilai p-value Ho ditolak jika p-value < α
Uji Signifikansi Parameter: Uji Serentak Dalam hal ini, k=1 Tabel Analisis Varians (ANOVA) Sumber Variasi Sum square (SS) Derajat bebas (db) Mean Square (MS) F Regresi RSS k ESS/p MS of ESS / MS of RSS Error ESS n-k-1 RSS/(n-p-1) Total TSS n-1 Tolak H0 jika F > F tabel (F(k,(n-k-1));α) P-value < α
Pelaporan hasil analisis regresi Berdasarkan data hipotetik pendapatan-pengeluaran sebelumnya: se = (6.4138) (0.0357) R2 = 0.9621 t = (3.8128) (14.2605) df = 8 p = (0.002571) (0.000000289) F(1,8) = 202.87 Nilai intersep populasi yang sebenarnya adalah tidak sama dengan nol (p=0.002571) intersep berpengaruh signifikan Seandainya nilai MPC sebenarnya adalah nol, maka kesempatan untuk memperoleh MPC=0.5091 adalah hampir tidak ada sama sekali. Sehingga nilai MPC yang sebenarnya adalah tidak sama dengan nol (p=0.00000289) pendapatan berpengaruh signifikan terhadap pengeluaran
Evaluasi Hasil analisis Regresi Pertama, apakah tanda estimator sesuai dengan yang diharapkan oleh teori? Kedua, jika teori menyatakan bahwa hubungan bersifat signifikan, maka p-value haruslah sangat kecil Ketiga, seberapa baik model regresi menjelaskan variasi pengeluaran konsumsi? Gunakan nilai R2 di mana semakin tinggi berarti semakin baik.
Pengenalan Eviews: Input Data Siapkan data excel (Table 3-2.xls)
Buka software Eviews 6.0. buat workfile baru, pilih FileNewWorkfile. Lalu buat workfile yang bersifat Unstructured/undated. Dan pada kolom Observations diisi 10 (jumlah data).
Impor data dari Excel. Pilih File ImportRead Text-Lotus-Excel Pilih data Excel yang sudah disiapkan yaitu Table 3-2.xls. Open.
Interpretasi Setiap peningkatan $1 pendapatan, akan meningkatkan pengeluaran sebesar $0.5091 R2 sebesar 0.9621 atau 96.21% menunjukkan bahwa 96.21% keragaman variabel pengeluaran dapat dijelaskan oleh besarnya pendapatan, sedangkan 3.79% sisanya dijelaskan variabel lain di luar model.
Uji Asumsi Normalitas Error/Residual Histogram residual bila bentuk histogram menyerupai lonceng (distribusi normal), maka asumsi normalitas terpenuhi Normal probability plot bila nilai-nilai residual berada di sekitar garis lurus (garis normal), asumsi terpenuhi Uji Jarque-Bera bila p-value tidak signifikan, maka asumsi terpenuhi n = jumlah pengamatan S = koefisien skewness K = kurtosis coefficient.
Uji Normalitas : EViews
Uji Normalitas: Contoh Data Hipotetik Pendapatan-Pengeluaran Karena p-value Jarque-Bera lebih besar dari α=0.05 (tidak signifikan), maka diputuskan bahwa asumsi normalitas terpenuhi
QQ-Plot
Contoh 2: Pengeluaran Makanan di India (Table 2-8)
P-value untuk intersep dan totalexp (pengeluaran total) bernilai sangat kecil (kurang dari α=0.05), sehingga disimpulkan bahwa keduanya berpengaruh signifikan terhadap foodexp (pengeluaran pangan)
Model estimasi CM Interpretasi Setiap peningkatan 1 rupee pengeluaran total, akan meningkatkan pengeluaran pangan sebesar 0.4368 rupee. R2 sebesar 0.3698 atau 36.98% menunjukkan bahwa 36.98% keragaman variabel pengeluaran pangan di India dapat dijelaskan oleh besarnya pengeluaran total, sedangkan 63.02% sisanya dijelaskan variabel lain di luar model.
Apakah asumsi normalitas terpenuhi? Karena p-value Jarque-Bera lebih besar dari α=0.05 (tidak signifikan), maka diputuskan bahwa asumsi normalitas terpenuhi
TUGAS KELOMPOK Untuk setiap kelompok, ambil satu sampel yang diambil pada tugas tentang SRF Dapatkan model estimasinya Interpretasikan model tersebut Lalu, hitung koefisien determinasi (R2). Interpretasikan. Lakukan pengujian hipotesis (uji parsial/uji t) dan bentuk interval konfidensinya.. BACA