DUMMY VARIABEL PADA VARIABEL BEBAS MODEL REGRESI Gangga Anuraga, M.Si
Variabel Dummy Variabel artificial yang digunakan untuk mengkuantifikasikan Variabel kualitatif Variabel kualitatif: - Gender (perempuan,lakilaki) - Tingkat pendidikan(SD,SMP,SMA,PT) - dll
PENERAPAN VARIABEL DUMMY Untuk membedakan kategori –kategori dalam variabel kualitatif menggunakan nilai 0 dan 1. Dengan ketentuan jumlah variabel dummy : Model regresi dengan intersep, jumlah variabel dummy r-1 (r=jumlah kategori variabel kualitatif)
Contoh Model regresi intersep: Pola alokasi variabel dummy untuk variabel kualitatif r kategori diperoleh dengan menuliskan matrik 1 yang berukuran (r-1)(r-1) ditambah satu baris (r-1) angka 0. Contoh
Contoh : Variabel tingkat pendidikan (SD,SMP,SMA,PT) r=4 jumlah var dummy=3 Alokasi penulisan: D1 D2 D3 Kategori SD 1 0 0 Dlm var SMP 0 1 0 kualitatif SMA 0 0 1 PT ( 0 0 0) kategori dasar pembanding dengan kategori lain
Sifat-sifat variabel Dummy Untuk membedakan kategori dalam variabel kualitatif tanpa menyebabkan matrik (x’x) nya singular Interpretasi hasil dari model yang menggunakan var dummy tergantung pada penggunaan angka 1 dan 0, artinya kategori mana yang dikode 1 dan 0. Kategori yang diberi angka 0 disebut kategori dasar Koefisien dari var dummy (D) disebut sebagai differential intercept koefisien,sebab menerangkan besarnya pendapatan kategori yang diberi nilai 1 dengan kategori dasar (angka 0)
CONTOH : Data merupakan data berat ayam kalkun (Y) dalam pound dan umur (X) dalm minggu dari 13 kalkun untuk perayaan thanks giving. Empat diantara ayam kalkun itu berasal dari Georgia (G), empat dari Virginia (V), dan lima dari Wincosin (W). Postulate model menyatakan ada pengaruh umur dan asal terhadap berat ayam kalkun estimasi modelnya?
X(umur) Y (berat) D1 D2 28 13.3 1 20 8.9 32 15.1 22 10.4 29 13.1 27 12.4 13.2 26 11.8 21 11.5 14.2 15.4 23 25 13.8
The regression equation is y = 1.43 + 0.487 x - 1.92 D1 - 2.19 D2 Predictor Coef SE Coef T P Constant 1.4309 0.6574 2.18 0.058 x 0.48676 0.02574 18.91 0.000 D1 -1.9184 0.2018 -9.51 0.000 D2 -2.1919 0.2114 -10.37 0.000 S = 0.3002 R-Sq = 97.9% R-Sq(adj) = 97.3% Analysis of Variance Source DF SS MS F P Regression 3 38.606 12.869 142.78 0.000 Residual Error 9 0.811 0.090 Total 12 39.417 Source DF Seq SS x 1 26.202 D1 1 2.717 D2 1 9.687
Estimasi model yang didapat: y = 1.43 + 0.487 x - 1.92 D1 - 2.19 D2 Estimasi model untuk Georgia y = -0.49+ 0.487 x Estimasi model untuk Virginia y = -0.76 + 0.487 x Estimasi model untuk Winconsin y = 1.43 + 0.487 x