Presentasi sedang didownload. Silahkan tunggu

Presentasi sedang didownload. Silahkan tunggu

ANALISIS REGRESI: DUA VARIABEL

Presentasi serupa


Presentasi berjudul: "ANALISIS REGRESI: DUA VARIABEL"— Transcript presentasi:

1 ANALISIS REGRESI: DUA VARIABEL
Analisis regresi berkaitan dengan memperkirakan atau memprediksi nilai rata-rata (populasi) dari variabel dependen berdasarkan nilai yang diketahui (nilai tetap) dari variabel penjelas (independen). MEAN

2 Tabel memiliki populasi 60 keluarga dengan pendapatan mingguan (X) dan pengeluaran konsumsi mingguan (Y). 60 keluarga dibagi menjadi 10 kelompok pendapatan (dari $ 80 hingga $ 260) dan pengeluaran konsumsi mingguan (Y). Dalam table ada 10 nilai tetap X (dari $80 sampai $260) dan nilai Y yang memiliki pasangan nilai X Jadi ada 10 subpopulasi Y.

3 Rata-rata konsumsi mingguan sesuai 10 tingkat pendapatan.
Tingkat pendapatan mingguan $ 80, pengeluaran konsumsi rata-rata adalah $ 65 Tingkat pendapatan $ 200, itu adalah $ 137. Jadi pada tabel tersebut, ada 10 nilai rata-rata untuk 10 subpopulasi Y. NiILAI RATA RATA INI DIEBUT NILAI YANG DIHARAPKAN, karena mereka bergantung pada nilai yang diberikan dari variabel (pengkondisian) X. Secara simbolis, kami menyatakannya sebagai E (Y | X) yang dibaca sebagai nilai yang diharapkan dari Y untuk nilai suatu X We call these mean values conditional expected values, as they depend on the given values of the (conditioning) variable X. Symbolically, we denote them as E(Y | X), which is read as the expected value of Y given the value of X

4 Penting untuk membedakan nilai ekspektasi bersyarat ini dari nilai ekspektasi tak terduga dari pengeluaran konsumsi mingguan, E (Y). Jika kita menjumlahkan semua nilai pengeluaran konsumsi mingguan dan membaginya dengan jumlah populasi sebanyak 60, maka diperoleh $ 121,20 ($ 7272/60). $121,20 merupakan NILAI RATA RATA TANPA SYARAT ATAU TIDAK DIHARAPKAN dari pengeluaran konsumsi mingguan, E (Y). NILAI RATA RATA TIDAK BERSYARAT ARTINYA bahwa dalam mendapatkan angka ini kita telah mengabaikan tingkat pendapatan berbagai keluarga

5 Berbagai nilai ekspektasi bersyarat dari Y yang diberikan pada Tabel 2
Berbagai nilai ekspektasi bersyarat dari Y yang diberikan pada Tabel 2.1 berbeda dari nilai ekspektasi Y tanpa syarat dari $ 121,20. Ketika kami mengajukan pertanyaan, "Berapa nilai yang diharapkan dari pengeluaran konsumsi mingguan keluarga," kami mendapatkan jawabannya $ 121,20 (rata-rata tanpa syarat). Tetapi jika kita mengajukan pertanyaan, "Berapa nilai yang diharapkan dari pengeluaran konsumsi mingguan keluarga yang pendapatan bulanan $ 140,“ Jawabnya $ 101 (artinya bersyarat). “Berapa prediksi terbaik (rata-rata) pengeluaran mingguan keluarga untuk pendapatan mingguan $ 140," jawabannya adalah $ 101”.

6 Titik-titik lingkaran hitam pada Gambar 2
Titik-titik lingkaran hitam pada Gambar 2.1 menunjukkan nilai rata-rata kondisional Y terhadap berbagai nilai X. Jika kita bergabung dengan nilai rata-rata bersyarat ini, kita memperoleh apa yang dikenal sebagai garis regresi populasi (PRL), atau lebih umum, kurva regresi populasi. Lebih sederhana, itu adalah regresi Y pada X.

7 Secara geometris, kurva regresi populasi hanyalah lokus dari sarana kondisional dari variabel dependen untuk nilai-nilai tetap dari variabel penjelas. Lebih sederhana, itu adalah kurva yang menghubungkan sarana subpopulasi Y yang sesuai dengan nilai-nilai yang diberikan dari regressor X. Ini dapat digambarkan seperti pada Gambar 2.2. TOTAL JUMLAH =7272

8 TOTAL JUMLAH =7272 Penting untuk membedakan nilai ekspektasi bersyarat ini dari nilai ekspektasi tak bersyarat dari pengeluaran konsumsi mingguan, E (Y). Jumlahkan semua pengeluaran konsumsi mingguan untuk semua 60 keluarga dalam populasi dan membagi angka ini dengan 60, kita mendapatkan angka $ 121,20 ($ 7272/60), yang merupakan nilai rata-rata tanpa syarat, atau diharapkan, dari pengeluaran konsumsi mingguan, E ( Y); Nilai rata rata tidak bersyarat dalam arti bahwa dalam mencapai angka ini kita telah mengabaikan tingkat pendapatan berbagai keluarga. Jelas, berbagai nilai ekspektasi bersyarat dari Y yang diberikan pada Tabel 2.1 berbeda dari nilai ekspektasi Y tanpa syarat dari $

9 kita mendapatkan jawabannya $ 121,20 (rata-rata tanpa syarat).
TOTAL JUMLAH =7272 Ketika kita mengajukan pertanyaan, "Berapa nilai yang diharapkan dari pengeluaran konsumsi mingguan keluarga," kita mendapatkan jawabannya $ 121,20 (rata-rata tanpa syarat). Jika ada pertanyaan, "Berapa nilai yang diharapkan dari pengeluaran konsumsi mingguan keluarga yang pendapatan bulanannya, katakanlah, $ 140," kita mendapatkan jawaban $ 101 (artinya bersyarat). Dengan kata lain, jika ada pertanyaan, "Apa prediksi terbaik (rata-rata) pengeluaran mingguan keluarga dengan pendapatan mingguan $ 140," jawabannya adalah $ 101. Dengan demikian pengetahuan tingkat pendapatan memungkinkan kita untuk memprediksi dengan lebih baik nilai rata-rata pengeluaran konsumsi daripada jika kita tidak memiliki pengetahuan itu. Ini adalah inti dari analisis regresi.

10 f (Xi) = suatu fungsi dari variabel penjelas X.
KONSEP FUNGSI REGRESI POPULASI (THE CONCEPT OF POPULATION REGRESSION FUNCTION/PRF) Setiap conditional mean E(Y|Xi) adalah fungsi dari Xi, di mana Xi adalah nilai yang diberikan X. Secara simbolis, f (Xi) = suatu fungsi dari variabel penjelas X. E(Y|Xi) adalah fungsi linear dari Xi. Persamaan E(Y | Xi) = f (Xi) disebut fungsi ekspektasi kondisional (CEF) atau fungsi regresi populasi (PRF) atau regresi populasi (PR). Hal ini menyatakan bahwa nilai yang diharapkan dari distribusi Y untuk suatu nilai Xi secara fungsional berkaitan dengan Xi. Secara sederhana, ini menjelaskan bagaimana nilai rata-rata Y bervariasi terkait dengan nilai X.

11 Bentuknya apa yang diasumsikan dalam fungsi f (Xi)?
PRF E(Y|Xi) merupakan fungsi linear dari Xi, E(Y|Xi) = β1 + β2Xi di mana β1 dan β2 dikenal sebagai koefisien intercept dan slope. Persamaan diatas dikenal sebagai fungsi regresi populasi linier atau model regresi populasi linier atau regresi populasi linier sederhana. Istilah regresi, persamaan regresi, dan model regresi akan digunakan secara sinonim. Dalam analisis regresi, memperkirakan PRFs yaitu memprediksi nilai-nilai yang β1 dan β2 yang tidak diketahui berdasarkan observasi pada Y dan X.

12 Linearitas dalam Variabel
ARTI ISTILAH LINEAR Linearitas dalam Variabel Linearitas berarti ekspektasi bersyarat dari Y adalah fungsi linear dari Xi, Fungsi regresi seperti E(Y|Xi)=β1+β2X2i bukan fungsi linear karena variabel X muncul dengan pangkat 2 B. Linearitas dalam Parameter Contoh Linearitas berarti ekspektasi bersyarat dari Y, E(Y|Xi), adalah fungsi linier dari parameter, β. Kondisi ini bisa atau tidak bisa tidak linier dalam variabel X. Dalam interpretasi ini E (Y | Xi) = β1 + β2X2i adalah model regresi linier (dalam parameter). Misalnya X bernilai 3. Oleh karena itu, E(Y|X=3)=β1+9β2, yang jelas linear dalam β1 dan β2.

13 Sekarang perhatikan model E(Y|Xi) = β1+β22Xi.
Sekarang anggaplah X = 3; maka E(Y|Xi)=β1+3β22, yang nonlinier pada parameter β2. Mulai sekarang pada istilah "regresi linear" akan selalu berarti regresi yang linier dalam parameter. Secara skematis, kita memiliki Tabel 2.3. Jadi, E(Y|Xi)=β1+β2Xi, yang linear dalam parameter dan variabel, adalah LRM E(Y|Xi)=β1+β2X2i, linear dalam parameter tetapi nonlinear dalam variabel X.

14

15 SPESIFIKASI STOKASTIK DARI PRF
Saat pendapatan meningkat, rata rata pengeluaran konsumsi keluarga juga meningkat. Bagaimana dengan pengeluaran konsumsi keluarga individu sehubungan dengan tingkat pendapatannya? Tabel 2.1 dan Gambar 2.1 bahwa pengeluaran konsumsi keluarga individu tidak selalu meningkat sebagai akibat dari tingkat pendapatan meningkat. Contoh. Tingkat pendapatan $ 100 ada satu keluarga yang pengeluaran konsumsinya $ 65 lebih rendah dari pengeluaran konsumsi dua keluarga Penghasilan mingguannya hanya $ 80.

16 Tetapi perhatikan bahwa pengeluaran konsumsi rata-rata keluarga dengan pendapatan mingguan $ 100 lebih besar daripada pengeluaran konsumsi rata-rata keluarga dengan pendapatan mingguan $ 80 ($ 77 versus $ 65). Lalu, apa yang bisa kita katakan tentang hubungan antara pengeluaran konsumsi keluarga individu dan tingkat pendapatan tertentu? Tingkat pendapatan Xi, pengeluaran konsumsi keluarga individu dikelompokkan di sekitar konsumsi rata-rata semua keluarga di Xi itu, yaitu, di sekitar ekspektasi bersyarat. Oleh karena itu, kita dapat mengekspresikan penyimpangan seorang individu Yi di sekitar nilai yang diharapkan sebagai berikut:

17 ui, yang merupakan komponen acak, atau non-sistematik.
Deviasi ui adalah variabel acak yang tidak dapat diobservasi yang bernilai positif atau negatif. Secara teknis, ui dikenal sebagai gangguan stokastik (kesalahan stokastik). Pengeluaran keluarga individual pada tingkat pendapatan tertentu dapat terdiri dari dua komponen: E(Y|Xi), pengeluaran konsumsi rata-rata semua keluarga dengan tingkat pendapatan yang sama yang dikenal sebagai komponen sistematis, atau deterministik ui, yang merupakan komponen acak, atau non-sistematik.

18 Yi = E(Y | Xi) + ui = β1 + β2Xi + ui
Jika E(Y|Xi) dianggap linier terhadap Xi dapat ditulis: Yi = E(Y | Xi) + ui = β1 + β2Xi + ui Pengeluaran konsumsi suatu keluarga secara linier terkait dengan pendapatan ditambah dengan gangguan. Jadi, pengeluaran konsumsi individu jika diberikan X = $ 80

19 Jika kita menggunakan nilai yang diharapkan untuk kedua sisi, maka kita memperoleh
Yi = E(Y|Xi) + ui E(Yi|Xi) =E[E(Y|Xi)] + E(ui|Xi) = E(Y|Xi) + E(ui|Xi) Oleh karena E(Yi|Xi) sama dengan E(Y|Xi), maka E(ui | Xi) = 0

20 Dengan demikian, asumsi bahwa garis regresi melewati persyaratan berarti Y (lihat Gambar disamping) menyiratkan bahwa nilai rata-rata bersyarat of ui (tergantung pada X yang diberikan) adalah nol. FUNGSI REGRESI SAMPEL (SRF) Sejauh ini kita berdiskusi mengenai nilai populasi Y yang sesuai dengan X tetap. Sekarang saatnya menghadapi masalah pengambilan sampel, karena dalam kebanyakan situasi praktis apa yang kita miliki hanyalah sampel nilai Y yang sesuai dengan beberapa X tetap.

21 Sekarang bagaimana memperkirakan PRF berdasarkan informasi sampel.
Tabel 2.1 adalah populasi yang tidak diketahui dan satu-satunya informasi yang kami miliki adalah sampel yang dipilih secara acak dari nilai-nilai Y untuk X tetap Dapatkah kita memprediksi rata-rata pengeluaran konsumsi mingguan Y dalam populasi secara keseluruhan yang sesuai dengan X yang dipilih? Dengan kata lain, dapatkah kita memperkirakan PRF dari data sampel? Kita mungkin tidak dapat memperkirakan PRF "secara akurat" karena fluktuasi sampel. N= 60 n= 10 n= 10

22 Memplot data Tabel 2.4 dan 2.5, kita mendapatkan Gambar 2.4.
Dalam scattergram, dua garis regresi sampel yang diambil sehingga "pas" dengan baik: SRF1 didasarkan pada sampel pertama, dan SRF2 didasarkan pada sampel kedua. Manakah dari dua garis regresi yang mewakili garis regresi populasi "benar"? Gambar 2.4 mewakili garis regresi populasi yang sebenarnya yang dikenal sebagai garis regresi sampel.

23 Secara umum, kita mendapatkan N SRF berbeda untuk N sampel berbeda, dan SRF ini kemungkinan tidak sama. Analog dengan PRF yang mendasari regresi populasi baris, kita dapat mengembangkan konsep fungsi regresi sampel (SRF) untuk mewakili garis regresi sampel. Penduga yang dikenal sebagai statistik (sampel), hanyalah aturan atau rumus atau metode yang memberi tahu cara memperkirakan parameter populasi dari informasi yang diberikan oleh sampel yang ada. Nilai numerik tertentu yang diperoleh penduga dalam suatu aplikasi dikenal sebagai taksiran.

24 Sekarang sama seperti kita mengekspresikan PRF dalam dua bentuk yang setara, (2.2.2) dan (2.4.2), kita dapat mengekspresikan SRF (2.6.1) dalam bentuk stokastik sebagai berikut: Tujuan utama analisis regresi adalah untuk memperkirakan PRF dan berdasarkan SRF. Tetapi karena fluktuasi pengambilan sampel, perkiraan kami sebesar PRF yang didasarkan pada SRF paling tidak merupakan perkiraan. Perkiraan ini ditunjukkan secara diagram pada Gambar 2.5.

25

26

27 CONTOH ILUSTRASI Tabel 2.6 memberikan data tingkat pendidikan (diukur dengan jumlah tahun bersekolah), rata-rata upah per jam per orang di setiap tingkat pendidikan, dan jumlah orang di tingkat pendidikan. Kurva regresi pada gambar menunjukkan bagaimana upah rata-rata bervariasi dengan tingkat pendidikan; mereka umumnya meningkat dengan tingkat pendidikan, sebuah temuan yang seharusnya tidak mengejutkan.

28 BAB INI SELESAI


Download ppt "ANALISIS REGRESI: DUA VARIABEL"

Presentasi serupa


Iklan oleh Google