Regresi dengan Respon Biner Eni Sumarminingsih
Arti Fungsi Respon Pandang model regresi linier sederhana berikut: Dengan nilai Yi yang mungkin adalah 0 dan 1. Karena
Karena Yi adalah peubah biner maka Yi memiliki sebaran Bernouli dengan sebaran peluang Berdasar definisi nilai harapan peubah acak
Rata β rata respon adalah peluang saat nilai predictor adalah
Permasalahan yang muncul bila peubah respon adalah biner Galat tidak menyebar normal Bila peubah respon adalah biner, maka galat juga hanya mempunyai dua kemungkinan nilai, Saat , maka
2. Ragam galat tidak konstan ragam galat tergantung pada nilai
3. Batasan pada Fungsi Respon Fungsi respon yang linier tidak memenuhi batasan ini harus ditransformasi sedemikian hingga nilainya berkisar antara nilai 0 dan 1
Atau dapat ditulis juga
Model Regresi Logistik Atau Atau bentuk logit
Pendugaan Parameter Dengan nilai Y yang bersifat biner, kita dapat menggunakan Bernoulli sebagai sebaran variabel Y sehingga fungsi likelihood akan berbentuk
Nilai maksimum dari fungsi kemungkinan dapat dicari dengan melogaritmakan kedua ruas. Maksimum dari fungsi πΏ(π½π) disebut sebagai log likelihood.
Karena Ξ²j yang akan diduga bersifat nonlinier, maka penyelesaian persamaan dapat menggunakan metode iterasi Gauss Newton atau Metode Marquardt.
Pengujian Terhadap Pendugaan Parameter Pengujianpendugaan parameter ( π· π ) secaraparsial. Untukmemeriksaperanankoefisienregresidarimasing-masingvariabelprediktorsecaraindividudalammodel. Hipotesis yang digunakanadalah :
Statistik uji yang digunakan adalah statistik uji Wald yang dapat ditulis:
Untuk sampel besar statistik uji Wald mengikuti sebaran normal (Z)
b. Pengujianpendugaanparameter ( π· π ) secarasimultan Untukmemeriksapengaruhkoefisienregresidarivariabelprediktorsecarabersama-sama. Hipotesisnyaadalah:
Uji yang digunakanadalahujinisbahkemungkinan(Likelihood Ratio Test) yaitu: dengan: L0= nilai log likelihood model regresilogistiktanpavariabelprediktor Lp = nilai log likelihood model regresilogistikdenganvariabelprediktor Likelihood ratio test berdistribusi ο£ (π) 2
Interpretasi untuk variabel independen polikotomus Misalkan peubah bebas memiliki kategori lebih dari 2. Contoh: Penelitian dilakukan untuk meneliti adakah pengaruh ras (White, Black, Hispanic, Other) terhadap terjadinya CHD (Coronary Hearth Disease)
Data dari penelitian adalah sebagai berikut:
Karena Variabel bebas memiliki kategori lebih dari 2 maka kita gunakan design variabel seperti pada tabel berikut:
Hasil estimasi adalah sebagai berikut: Sehingga didapatkan
Interpretasi untuk variabel Independen Kontinu Asumsikan logit πππ π 1βπ = g(x) adalah linier. Persamaanlogitadalah ο’1merupakanperubahan log odds (logit) untuksetiappeningkatansebesar 1 satuan x ο’1 =g(x+1) β g(x) = π½ 0 + π½ 1 π₯+1 β π½ 0 + π½ 1 (π₯) π½ 0 + π½ 1 (π₯) untuk setiapnilai x.
Secaraumumjika x berubahsebesar c satuanmakalogitakanberubahsebesar cο’1, Didapatkandari π π₯+π βπ π₯ = π½ 0 + π½ 1 π₯+π β π½ 0 + π½ 1 π₯ = cο’1 Sehingga OR(c)=OR(x+c,x) = exp(cο’1)
Contoh : padapenelitianpengaruhusiaterhadapterjadinya CHD didapatkanmodel Odd Ratio dugauntukkenaikanusia 10 tahunadalah ππ 10 = exp 10Γ0.111 =3.03 Artinyasetiapkenaikanusiasebesar 10 tahunmakaresikoterjadinya CHD meningkatsebesar 3.03 kali
Multivariable Model Suatu penelitiandilakukanuntukmengetahuipengaruhusia (AGE), jeniskelamindan level cathecolamin (CAT) terhadapterjadinya CHD. Model yang digunakanadalah πππ π 1βπ =π πΏ = π½ 0 + π½ 1 π 1 + π½ 2 π 2 + π½ 3 π 3 Dimana X1 = usia X2 = jeniskelamin (0 = perempuan, 1=laki β laki) X3 = level cathecolamin ( 0= rendah, 1=tinggi)
Odd ratio untukvariabel 0-1 adalah π π½ π denganasumsivariabel yang lain tetap. Sedangkanuntukvariabelkontinu, Odd ratio didapatkandari π π½ π ( π 1π β π 0π ) Secaraumumrumusuntuk Odd Ratio adalah ππ = π π=1 π π½ π ( π 1π β π 0π )
Model Multivariabel dengan interaksi
Goodness of fit Misalkan model kitaterdiridari p peubahbebas J adalahbanyaknyanilaipengamatanx yang berbeda. Jikabeberapasubjekmemilikinilaix yang samamaka J < n Notasikanbanyaknyasubjekdengannilaix=xjdenganmj, j = 1, 2, β¦, J. Maka π π =π Yjadalahbanyaknya y=1 diantaramjsubjekdenganx=xj. Sehingga π¦ π = π π yaitubanyaknyasubjekdengan y=1
Pearson Residual didefinisikan sebagai Dan statistik ο£2 Pearson adalah
Deviance Residual didefinisikansebagai Tanda + atau β , samadengantandadari π¦ π β π π π π Statistik Deviance adalah Statistik ο£2dan Deviance menyebarο£2denganderajatbebas J β (p+1)
Diagnostic Residual Plot Jika model regresilogistikbenar, maka E(Yi) = ο°I Sehingga E(Yi - π π )= E(ei) = 0. Jadijika model benarmaka plot antara π π dan residual akanmenunjukkanpolagarishorisontaldenganintersepnol