PENDUGA REGRESI (REGRESSION ESTIMATOR) by nofita istiana nofita@bps.go.id
Penduga regresi Tujuan: mendapatkan estimator yang presisinya lebih baik dg menggunakan variabel lain yang berkorelasi dg variabel yg diduga walaupun mempunyai hubungan linear, persamaan garisnya tidak melalui titik (0,0) Bandingkan : penduga ratio melalui (0,0) dengan penduga regresi tidak melalui (0,0) penduga perubahan untuk penambahan satu unit. Nilai dan diperoleh dari setiap unit dalam sampel ; nilai dan diketahui. Penduga total populasi :
Penduga regresi : Untuk: (penduga beda) (penduga ratio) (penduga beda)
1. Penduga regresi dg nilai ditentukan, misal = (asumsi SRS) Teorema 1.1 Varian: unbiased estimator dari varian
2. Penduga regresi dg nilai dihitung dari sampel, least squares estimate dari B, sbb. Bila merupakan least squares estimate dari B dan maka dalam pengambilan sampel SRS dg jumlah sampel n ( n besar ) untuk korelasi populasi antara dan Teorema 1.3
Estimasi dari varian Utk sampel besar, estimator dari Utk populasi yg tak terhingga (infinite) dan regresi linear digunakan penyebut (n-2), bukan (n-1), sehingga penduga varian menjadi :
3. Penduga regresi pada stratified sampling a. Separate regression estimate ( penduga regresi dihitung untuk setiap rata-rata strata) utk Rumus di atas digunakan apabila koefisien regresi berbeda antar stratum b. Combine regression estimate ( penduga regresi dihitung secara kombinasi ), yaitu apabila koefisien regresi sama utk semua strata maka
nilai yg meminimumkan varian di atas c. Penghitungan Varian Separate regression estimate Combine regression estimate nilai merupakan rata-rata tertimbang dari stratum regression koefisien nilai yg meminimumkan varian di atas
Latihan Soal Seorang petani ingin memperkirakan total berat rambutan di perkebunannya. Jumlah pohon dalam perkebunan sebanyak 70 pohon. Dia mendapatkan total berat rambutan tahun sebelumnya yaitu 11600 kwintal. Buah rambutan dipetik dan ditimbang pada sampel acak sederhana dari 10 pohon dengan hasil sbb: Hitung perkiraan total berat rambutan dengan penduga regresi dan tentukan kesalahan bakunya! 1 2 3 4 5 6 7 8 9 10 jumlah Berat sekarang (yi) 61 42 50 58 67 45 39 57 71 53 543 Berat tahun lalu (xi) 59 47 52 60 48 44 76 569
2. Tabel berikut ini menyajikan jumlah penduduk (dalam ribuan) untuk setiap sampel acak sederhana dari 49 kota diambil dari populasi 202 kota. Jika diketahui jumlah penduduk pada tahun 2005 sebanyak 20216. Tabel 1. Jumlah Penduduk 49 Kota (dalam Ribuan) Pada Tahun 2005 (xi) dan Tahun 2010 (yi) xi yi 76 80 172 183 77 89 87 105 74 93 138 143 78 106 64 63 30 111 45 53 67 66 86 71 79 36 54 29 50 60 57 56 142 256 288 58 381 464 46 65 40 43 61 48 75 23 2 25 37 507 634 38 52 94 85 120 115 179 260 136 139 69 121 113 116 130 298 317 387 459 104 44 243 291 161 232
Hitung perkiraan regresi dari jumlah penduduk tahun 2010 di 202 kota dan kesalahan bakunya! Bandingkan ketelitiannya dengan perkiraan rasio!
3. Suatu survey dilakukan untuk menentukan jumlah hasil pertanian yang dipengaruhi oleh polusi air. Sampil diambil secara acak sederhana sebanyak 20 plot dari 100 populasi plot. Jumlah hasil pertanian disimbolkan 𝑦 𝑖 (dalam satuan kwintal) dan level polusi disimbolkan 𝑥 𝑖 . Hasilnya diperoleh 𝑦 =10 𝑥 =6 𝑖=1 20 𝑥 𝑖 − 𝑥 𝑦 𝑖 − 𝑦 =−60 𝑖=1 20 𝑥 𝑖 − 𝑥 2 =30 𝑖=1 20 ( 𝑦 𝑖 −𝑎−𝑏 𝑥 𝑖 ) 2 =80 Rata-rata level polusi adalah 5 Perkirakan rata-rata hasil pertanian berdasarkan level polusi dengan penduga regresi linier! Perkirakan varians dari penduga regresi linier! Prediksikan hasil pertanian pada plot dengan level polusi 4!
4. Suatu survey dilaksanakan untuk memperkirakan rata-rata biaya berobat di suatu wilayah. Untuk memudahkan penelitian, kecamatan di wilayah tersebut dikelompokkan ke dalam tiga strata berdasarkan tingkat kesehatan daerah. Data yang diperoleh yaitu sbb: Strata Jumlah Kec. Jumlah Penduduk Sakit Jumlah Kec. Terpilih Jumlah Penduduk Sakit di Kec. Terpilih Pengeluaran untuk Berobat di masing-masing Kec. Terpilih (puluhan ribu rp) Rendah 25 910 7 35,30,25,15,5,7,13 889,813,758,711,175,212,650 Sedang 30 65o 9 15,10,5,7,9,11,13,6,4 535,343,179,175,315,375,380,165,130 Tinggi 20 270 6 5,7,9,3,11,15 253,261,272,120,435,525
Perkirakan rata-rata pengeluaran untuk berobat setiap kecamatan beserta standard errornya dengan metode separate regression estimator! (jumlah penduduk sakit sebagai variabel pembantu)
5. Suatu studi bertujuan untuk mempelajari produksi susu dilakukan dengan menarik sampel sebanyak 17 desa dari 117 desa secara SRS-WOR. Estimasi total direncanakan menggunakan metode ratio estimate dan regression estimate. Untuk keperluan tsb, auxiliary variabel yang digunakan adalah jumlah ternak penghasil susu per desa hasil sensus yang lalu. Diketahui total ternak penghasil susu (pada 117 desa) berdasarkan hasil sensus yang lalu adalah X=143968 ekor. Data jumlah ternak penghasil susu hasil survei (y) per desa berikut data jumlah ternak penghasil susu dari sensus yang lalu (x) tersaji pd tabel. Berdasarkan data, hitungah estimasi total ternak penghasil susu berikut satandard error-nya dengan menggunakan metode a). rata-rata per unit, b). ratio estimate, c). regression estimate.