Kuliah ke 2 sifat-sifat analisis regresi Oleh : Prof. Dr. Ir. Endang Siti Rahayu, MS
PENDAHULUAN Didlm EKONOMETRI akan banyak dibahas dalam arti kedua, yg menyangkut var ekonomi yg saling mempengaruhi. (kuliah ke 1) Hubungan yang saling mempengaruhi dalam statistik dikenal sebagai ANALISIS REGRESI & KORELASI Oleh karena itu diperlukan pengetahuan tentang sifat-sifat regresi & korelasi
ASAL MULA ISTILAH REGRESI 1 Dikenalkan oleh Francis Galton, berdasarkan hasil penelitian bhw terdpt cenderung orang tua yg tinggi memp anak yg tinggi dan sebaliknya, 2 Sdgkan distribusi tinggi dr populasi tdk berubah dr generasi ke generasi Penemuannya ditulis dlm artikel : Family Likeness in Stature” (1886)
Next … Hukum universal dr Galton ini dibuktikan lagi oleh temannya Karl Pearson
INTERPRETASI MODERN TTG REGRESI ANALISIS REGRESI berkaitan dng “studi ketergantungan” dr satu var tak bebas (dependent var) pd satu atau > variabel ADALAH var yg menerangkan, dng tujuan utk memperkirakan dan atau meramalkan nilai rata-rata var tak bebas jk nilai var yg menerangkan sudah diketahui PENGERTIAN VARIABEL Var yg diterangkan disbt var dependent Var yg menerangkan disbt independent var atau explanatory variables
MANFAAT PERKIRAAN REGRESI Nilai perkiraan utk waktu yad dr var sosial ekonomi nilai ramalan Sangat berguna sbg dasar perencanaan
PERBEDAAN ANTARA KETERGANTUNGAN SECARA STATISTIK & FUNGSIONAL KETERGANTUNGAN STATISTIK Hubungan antar variabel secara statistik berkenaan dng var yg random atau var yg stokastik (random or stochastic variable) yi var yg mempunyai distribusi probablitas (probability distribution) KETERGANTUNGAN FUNGSIONAL Hubungan antar variabel secara fungsional, variabelnya tidak random (non-random
CONTOH KETERGANTUNGAN STATISTIK 1 Jika produksi padi (Y) tidak hanya dipengaruhi oleh var pupuk (X1) saja, ttp dipengaruhi jg oleh var-var lain spt : bibit, TK, luas lahan dll 2 Sehingga nilai Y dng menggunakan garis regresi tdk tepat 100% 3 Ketidaktepatan ini disebabkan ada berbagai kesalahan (error).
Penyebab kesalahan (Error) tsb : 1 kesalahan dlm mengukur variabel 2 kesalahan krn tdk semua var yg dimasukkan mempengaruhi Y 3 kesalahan krn fungsi yg tdk cocok (fit) 4 kesalahan asumsi-asumsi
CONTOH HUBUNGAN FUNGSIONAL (1) Hubungan fungsional yg deterministik sifatnya tidak memperhitungkan adanya kesalahan dan (2) hubungan itu seolah-olah “pasti” (banyak dmanfaatkan ilmu2 murni)
YANG MANA YG DIGUNAKAN DLM EKONOMETRIKA? Didalam Ekonometri yg digunakan adalah hubungan statistik, Yaitu hubungan yg memperhitungkan adanya berbagai “kesalahan”, minimal kesalahan dlm pengukuran var (measurement’s error) Oleh karena itu bentuk fungsinya, bukan Y = a + b X tetapi : Y = a + b X + e, dimana e : kesalahan pengganggu (error)
(1) SIFAT REGRESI BUKAN HUBUNGAN SEBAB-AKIBAT SIFAT-SIFAT REGRESI (1) SIFAT REGRESI BUKAN HUBUNGAN SEBAB-AKIBAT Hubungan statistik tidak merupakan hubungan sebab-akibat dan bukan hubungan yg eksak (exact relationship) Artinya jk nilai x diketahui sekian, maka nilai Y tdk “harus” sekian tetapi kita katakan “rata-rata” Y akan mencapai sekian, hal ini disbbk krn yg mempengaruhi Y bukan hanya X saja, ttp ada faktor lainnya
(2) KONSEP FUNGSI REGRESI POPULASI Dalam kenyataan, sebenarnya kita tdk bisa meneliti populasi secara keseluruhan (complete enumeration), shg bentuk fungsi populasi mrpk persoalan “empiris” Dalam analisis regresi lebih ditekankan membuat perkiraan (estimate) dr koefisien berdasarkan hasil penelitian “sampel” Fungsi regresi populasi mrpk fungsi regresi sebenarnya, tetapi dlm prakteknya kita tidak pernah tahu, krn yg kita teliti biasanya adalah sampel dan bukan populasi
REGRESI SAMPEL 1 Dng dmk yg kita analisis adalah fungsi regresi sampel sbg perkiraan fungsi regresi populasi 2 Fungsi regresi inilah yg sering digunakan untuk meramalkan Y jk variabel bebas (X) diketahui 3 Dalam hal ini maka regresi sampel mrpk pendekatan (approximation) garis regresi sebenarnya (populasi), mk peran pengambilan sampel yg mewakili populasi menjadi “penting”
(3) LINEARITAS A. LINEARITAS DLM VARIABEL .Suatu fungsi Y=f(X) dikatakan linear dlm X, jk X pangkat satu Contoh : E(Y/Xi) = A + B Xi, A : intercept, yi jarak titik asal ke titik perpotongan antara regresi & sumbu tegak B : koefisien arah (slope) atau koefisien regresi A sebetulnya mrpk nilai E (Y/Xi) kalau Xi = 0 A & B disbt koefisien sebenarnya atau parameter Persamaan tsb nilai X muncul dng pangkat satu.
B. LINEARITAS DALAM PARAMETER Dlm pengertian ini, E(Y/Xi) mrpk linear dr parameter A, ttp B bisa tidak linear dalam variabel Contoh : E(Y/Xi) = A + BX2 mrpk linear dlm variabel, ttp bukan fungsi linear dlm parameter
(4) KESALAHAN PENGGANGGU ERROR Kebenaran regresi mrpk kebenaran statistik, yi kebenaran secara rata-rata, (pada umumnya) tidak berlaku per individu Jk tingkat pendapatan Xi, pengeluaran konsumsi secara individu sebesar rata-rata pengeluaran konsumsi utk seluruh keluarga pada kel pendapatan Xi, jadi berada disekitar rata-rata bersyarat E(Y/Xi) Dmn ej = suatu deviasi antara individu Yi dng rata-rata bersyarat E(Y/Xi), ei bisa bernilai positif/negatif dan random sifatnya atau disbt juga sbg kesalahan pengganggu (disturbance’s error) Oleh krn itu dpt dikatakan deviasi suatu nilai individu Yi thd rata-rata E(Y/Xi) adalah : ej = Yi – E (Y/Xi) atau Yi = E(Y/Xi) + ei
ALASAN DICANTUMKAN KESALAHAN PENGGANGGU DLM MODEL REGRESI Mengapa dlm model persamaan regresi harus dicantumkan kesalahan pengganggu (error), ada beberapa alasan : PERTAMA, suatu teori, jk menentukan tingkah laku (behavior) dr var bebas Y seringkali tdk lengkap. CONTOH : Jk teori menyatakan bhw jpupuk (X) mempengaruhi produksi (Y) ttp tdk dpt dikatakan secara eksplisit faktor-faktor apa saja selain pupuk yg mempengaruhi produksi. Oleh krn itu ei lah yg menampung kesalahan-kesalahan yg disbbk faktor-faktor lain yg mempengaruhi Y ttp tdk dimasukkan dlm model
ALASAN KEDUA 1 Walaupun secara teori, kita mengetahui semua variabel yg mempengaruhi Y, terkadang tdk dimasukkan dlm model 2 Tidak dimasukkan dlm model karena var tsb sulit diukur, 3 Oleh krn itu kesalahan pengganggu tetap diperlukan.
ALASAN KETIGA 1 Ada kemungkinan salah satu atau beberapa faktor atau variabel pengaruhnya thd Y tidak besar (not significant) 2 Atau ada kemungkinan biaya pengumpulan variabel mahal, shg tdk dimasukkan dlm model 3 Kesalahan-kesalahan inipun ditampung dlm ei
ALASAN KEEMPAT Kesalahan inipun ditampung dlm ei A Secara teoritis peneliti tahu semua var yg mempengaruhi Y & juga mampu membiayai pengumpulan data yg mahal dan dimasukkan dlm model B Dng demikian inipun masih ada kesalahan yg ditimbulkan oleh sifat ke”random”an (intrinsic randomness) dr variabel Y C Kesalahan inipun ditampung dlm ei
ALASAN KELIMA A Seringkali kita membuat regresi sangat “sederhana”, hanya dng satu atau dua variabel bebas saja B Hal itu dpt disebabklan krn berdasarkan teori, variabel-variabel lain pengaruhnya kurang berarti C Kekurangan inipun akan ditampung dalam kesalahan pengganggu (ei)
ANALISIS KORELASI ANALISIS KORELASI Bertujuan untuk mengukur eratnya hubungan linear antara dua variabel X dan Y, disimbolkan r
NILAI r Terletak antara -1 dan 1. Jk nilai r = 1, berarti hubungan X dan Y sempurna dan positif dan sebaliknya Nilai r = 0, berarti hub X dan Y lemah atau tidak ada hubungan sama sekali
INTERPRETASI NILAI r Pertama Jika tdk ada hubungan, naik turunnya X tidak mempengaruhi Y Kedua Jika hubungan positif atau negatif, pada umumnya kenaikan/penurunan X menyebabkan kenaikan/penurunan Y
Terima kasih