Variabel Kategori dalam Analisis Regresi TUJUAN Menjelaskan variabel kategori dan manfaatnya dalam analisis regresi serta uji hipotesis
Definisi Suatu dummy atau indikator variabel adl variabel dlm persamaan regrsi yg mempunyai jml pasti sehingga kategori yg berbeda dr satu var. dapat diidentifikasi. Terminologi dummy secara sederhana menjelaskan bahwa nilai2 di variabel (misalnya 0 atau 1) mempu-nyai arti ukuran jelas dan bukan hanya kategori saja. Contoh dummy variabel: X1 : 1 jika kelompok perlakuan 0 lainnya X2 : 1 jika subjek adalah perempuan -1 jika subjek adalah laki-laki
Aturan membuat dummy variabel. Masing2 kategori diatas mempunyai arti dan perlu diperhatikan dalam analisis Aturan membuat dummy variabel. Bila ada k kelompok, maka jumlah dummy nya adl k-1 dan dalam regresi ada term konstant (b0) *Jika ada intersep dlm model; regresi, maka k-1 dummy variabel otomatis termasuk semua k kategori *Jika k dummy variabel digunakan dlm model regresi yg ada intersep, maka semua nilai koefisien tidak bisa di estimasi karena adanya kolineariti.
Membandingkan 2 regresi garis lurus Kita gunakan data TDS dan kita lakukan anreg TDS terhadap U menurut JK dan didapatkan: YL = 110.04 + 0.96X dan YP = 97.08 + 0.95X Gambar berikut memberikan petunjuk bhw TDS L>P.
Namun hal ini tidak efisien karena kita melakukan 2 kali uji regresi Namun hal ini tidak efisien karena kita melakukan 2 kali uji regresi. Karenanya kita rubah dari 2 model menjadi 1 model regresi sbb: Y = b0 + b1X1 + b2X2 Dimana: X1 = umur X2 = 1 jika laki-laki 0 jika perempuan Maka kita hrs membuat per(?)an Apakah kedua slope sama? Bila sama maka kedua garis pararel. Apakah kedua intersep sama? Apakah garis regresi tersebut mempunyai intersep dan slope yang sama?
Untuk menjawab pertanyaan2 tersebut, maka kita buat model regresinya menjadi: Y = b0 + b1X1 + b2X2 + b3(X1*X2) + E Ingat X2 = 1 jika laki-laki 0 jika perempuan Kita akan mendapat 2 model untuk 2 nilai X2 X2 = 1 laki-laki Y = (b0 +b2) + (b1+ b3)X1 + E X2 = 0 perempuan Y = b0 + b1X1 + E Perhatikan: b0 untuk perempuan (P) adalah b0 b0 untuk laki-laki (L) adalah (b0 + b2) b1 untuk perempuan (P) adalah b1 b1 untuk laki-laki (L) adalah (b1+ b3)
Membandingkan 2 garis lurus dengan 2 model regresi: Null hypothesis utk membandingkan 2 slope (test parallelisme) adalah: H0 = b1L = b1P Maka Ha = b1L > b1P (one-sided) Ha = b1L < b1P (one-sided) Ha = b1L # b1P (two-sided) Uji t yang digunakan adalah
= Least Square estimate of Slope b1L dgn n obs’i = Least square estimate of slope b1F dgn n obs’i = estimate SD dr estimasi perbedaan antara slope yang kita peroleh dari dan
Perbandingan slope dan intercept
Ini kita ketahui dari S2YlXL = residual MSE utk Laki-laki S2YlXP = residual MSE utk Perempuan S2XL = variance dr X utk Laki-laki S2XP = variance dr X utk Perempuan Dengan asumsi regresi uji t dgn nL+nP – 4 dk: T> tnL+nP – 4, 1-a utk Ha: b1L>b1P T< tnL+nP – 4, 1-a utk Ha: b1L<b1P T# tnL +nP – 4, 1-a/2 utk Ha: b1L # b1P Dengan menggunakan data yang ada
= 38(71.9) + 27(91.46) / (40+24-4) = 5201.62 / 65 = 80.02 = 80.02[1/39(221.15) + 1/28(242.14)] = 0.021
Thitung = 0.069 < t65,0.975 Ho diterima kedua slope paralel PERHATIKAN PERLU ANOVA TABEL YA
Andaikan kita punya 1 Kontinyu variabel (X) dan 2 dummy variabel yaitu Jenis Kelamin dan Kelas Sosial Z = 0 bila laki-laki Z = 1 bila perempuan W = 0 bila miskin W = 1 bila kaya Persamaan garis gabungan sebelum memperhati-kan jenis kelamin dan kelas sosial adalah: Y = b0 + b1X Regression model dengan 3 variabel adalah: Y = b0 + b1X + b2Z + b3W + b4X*Z + b5X*W + b6Z*W + E
Persamaan garis untuk laki-laki dan kaya adalah: Y = b0 + b1X + b3W + b5X*W Y = (b0 + b3) + (b1 + b5)X Persamaan garis untuk perempuan dan miskin adalah: Y = b0 + b1X + b2Z + b4X*Z Y = (b0 + b2) + (b1 + b4X*Z Buatlah persamaan garis untuk laki-laki dan miskin perempuan dan kaya
Andaikan kita punya 1 variabel kontinyu 1 variabel yang terdiri dari 3 kelompok yaitu miskin, menengah dan kaya, maka kita buat 3 dummy variabel yaitu: Q1 = 1 jika menengah 0 lainnya Q2 = 1 jika kaya Model persamaan garis: Y = b0 + b1X + b2Q1 + b3Q2 + b4X*Q1 + b5X*Q2 + E Persamaan garis utk kelompok miskin adalah Y = b0 + b1X + E
Persamaan garis untuk kelompok menengah adalah Y = b0 + b1X + b2Q1 + b4X*Q1 + E Y = (b0 + b2) + (b1 + b4) X + E Buatlah persamaan garis untuk kelompok kaya Y = ………………………………..
LATIHAN: Perhatikan data berikut: No TDS IMT Umur RKK 1 135 28 45 16 134 29 50 2 122 32 41 17 145 33 49 3 130 31 18 142 30 46 4 148 37 52 19 57 5 146 54 20 34 56 6 129 27 47 21 150 36 7 162 60 22 144 58 8 160 48 23 137 53 9 44 24 132 10 180 64 25 149 11 166 38 59 26 12 138 40 51 120 43 13 152 126 14 161 63 15 140 35 170
Data menunjukan RKK = 1 bila merokok dan 0 bila tidak Data menunjukan RKK = 1 bila merokok dan 0 bila tidak. Kerjakan soal berikut: Tentukan garis lurus TDS dan IMT secara terpisah untuk yang merokok dan tidak; Lakukan uji hipotesis untuk membuktikan bahwa slope utk merokok dan tidak merokok berasal dari populasi yang sama; Hitunglah TDS untuk orang yang berumur 50 tahun dan merokok; orang dengan IMT 35 dan merokok; orang berumur 50 tahun, IMT 40 dan tidak merokok.
Pelajari ANOVA tabel berikut: Variable b Sb Partial F Umur 1.02892 0.50177 IMT 10.45104 1.310 RKK -0.53744 23.23004 Umur*RKK 0.43733 0.376 IMT*RKK -3.70682 10.76763 Intercept 48.61271 Lengkapilah tabel anova diatas dan interpretasikan hasilnya serta buat model regresi yang terbaik