Presentasi sedang didownload. Silahkan tunggu

Presentasi sedang didownload. Silahkan tunggu

Regresi dengan Respon Biner

Presentasi serupa


Presentasi berjudul: "Regresi dengan Respon Biner"— Transcript presentasi:

1 Regresi dengan Respon Biner
Eni Sumarminingsih

2 Arti Fungsi Respon Pandang model regresi linier sederhana berikut: Dengan nilai Yi yang mungkin adalah 0 dan 1. Karena

3 Karena Yi adalah peubah biner maka Yi memiliki sebaran Bernouli dengan sebaran peluang Berdasar definisi nilai harapan peubah acak

4 Rata – rata respon adalah peluang saat nilai predictor adalah

5 Permasalahan yang muncul bila peubah respon adalah biner
Galat tidak menyebar normal Bila peubah respon adalah biner, maka galat juga hanya mempunyai dua kemungkinan nilai, Saat , maka

6 2. Ragam galat tidak konstan ragam galat tergantung pada nilai

7 3. Batasan pada Fungsi Respon Fungsi respon yang linier tidak memenuhi batasan ini harus ditransformasi sedemikian hingga nilainya berkisar antara nilai 0 dan 1

8 Atau dapat ditulis juga

9

10 Model Regresi Logistik
Atau Atau bentuk logit

11 Pendugaan Parameter Dengan nilai Y yang bersifat biner, kita dapat menggunakan Bernoulli sebagai sebaran variabel Y sehingga fungsi likelihood akan berbentuk

12

13

14

15 Nilai maksimum dari fungsi kemungkinan dapat dicari dengan melogaritmakan kedua ruas. Maksimum dari fungsi 𝐿(𝛽𝑗) disebut sebagai log likelihood.

16

17

18

19

20 Karena βj yang akan diduga bersifat nonlinier, maka penyelesaian persamaan dapat menggunakan metode iterasi Gauss Newton atau Metode Marquardt.

21 Pengujian Terhadap Pendugaan Parameter
Pengujianpendugaan parameter ( 𝜷 𝒋 ) secaraparsial. Untukmemeriksaperanankoefisienregresidarimasing-masingvariabelprediktorsecaraindividudalammodel. Hipotesis yang digunakanadalah :

22 Statistik uji yang digunakan adalah statistik uji Wald yang dapat ditulis:

23 Untuk sampel besar statistik uji Wald mengikuti sebaran normal (Z)

24 b. Pengujianpendugaanparameter ( 𝜷 𝒋 ) secarasimultan Untukmemeriksapengaruhkoefisienregresidarivariabelprediktorsecarabersama-sama. Hipotesisnyaadalah:

25 Uji yang digunakanadalahujinisbahkemungkinan(Likelihood Ratio Test) yaitu: dengan: L0= nilai log likelihood model regresilogistiktanpavariabelprediktor Lp = nilai log likelihood model regresilogistikdenganvariabelprediktor Likelihood ratio test berdistribusi  (𝑝) 2

26

27

28 Interpretasi untuk variabel independen polikotomus
Misalkan peubah bebas memiliki kategori lebih dari 2. Contoh: Penelitian dilakukan untuk meneliti adakah pengaruh ras (White, Black, Hispanic, Other) terhadap terjadinya CHD (Coronary Hearth Disease)

29 Data dari penelitian adalah sebagai berikut:

30 Karena Variabel bebas memiliki kategori lebih dari 2 maka kita gunakan design variabel seperti pada tabel berikut:

31 Hasil estimasi adalah sebagai berikut: Sehingga didapatkan

32 Interpretasi untuk variabel Independen Kontinu
Asumsikan logit 𝑙𝑜𝑔 𝑝 1−𝑝 = g(x) adalah linier. Persamaanlogitadalah 1merupakanperubahan log odds (logit) untuksetiappeningkatansebesar 1 satuan x 1 =g(x+1) – g(x) = 𝛽 0 + 𝛽 1 𝑥+1 − 𝛽 0 + 𝛽 1 (𝑥) 𝛽 0 + 𝛽 1 (𝑥) untuk setiapnilai x.

33 Secaraumumjika x berubahsebesar c satuanmakalogitakanberubahsebesar c1,
Didapatkandari 𝑔 𝑥+𝑐 −𝑔 𝑥 = 𝛽 0 + 𝛽 1 𝑥+𝑐 − 𝛽 0 + 𝛽 1 𝑥 = c1 Sehingga OR(c)=OR(x+c,x) = exp(c1)

34 Contoh : padapenelitianpengaruhusiaterhadapterjadinya CHD didapatkanmodel Odd Ratio dugauntukkenaikanusia 10 tahunadalah 𝑂𝑅 10 = exp 10×0.111 =3.03 Artinyasetiapkenaikanusiasebesar 10 tahunmakaresikoterjadinya CHD meningkatsebesar 3.03 kali

35 Multivariable Model Suatu penelitiandilakukanuntukmengetahuipengaruhusia (AGE), jeniskelamindan level cathecolamin (CAT) terhadapterjadinya CHD. Model yang digunakanadalah 𝑙𝑜𝑔 𝑝 1−𝑝 =𝑔 𝑿 = 𝛽 0 + 𝛽 1 𝑋 1 + 𝛽 2 𝑋 2 + 𝛽 3 𝑋 3 Dimana X1 = usia X2 = jeniskelamin (0 = perempuan, 1=laki – laki) X3 = level cathecolamin ( 0= rendah, 1=tinggi)

36 Odd ratio untukvariabel 0-1 adalah 𝑒 𝛽 𝑖 denganasumsivariabel yang lain tetap. Sedangkanuntukvariabelkontinu, Odd ratio didapatkandari 𝑒 𝛽 𝑖 ( 𝑋 1𝑖 − 𝑋 0𝑖 ) Secaraumumrumusuntuk Odd Ratio adalah 𝑂𝑅= 𝑒 𝑖=1 𝑘 𝛽 𝑖 ( 𝑋 1𝑖 − 𝑋 0𝑖 )

37 Model Multivariabel dengan interaksi

38

39 Goodness of fit Misalkan model kitaterdiridari p peubahbebas J adalahbanyaknyanilaipengamatanx yang berbeda. Jikabeberapasubjekmemilikinilaix yang samamaka J < n Notasikanbanyaknyasubjekdengannilaix=xjdenganmj, j = 1, 2, …, J. Maka 𝑚 𝑗 =𝑛 Yjadalahbanyaknya y=1 diantaramjsubjekdenganx=xj. Sehingga 𝑦 𝑗 = 𝑛 𝑗 yaitubanyaknyasubjekdengan y=1

40 Pearson Residual didefinisikan sebagai Dan statistik 2 Pearson adalah

41 Deviance Residual didefinisikansebagai Tanda + atau – , samadengantandadari 𝑦 𝑗 − 𝑚 𝑗 𝜋 𝑗 Statistik Deviance adalah Statistik 2dan Deviance menyebar2denganderajatbebas J – (p+1)

42 Diagnostic Residual Plot
Jika model regresilogistikbenar, maka E(Yi) = I Sehingga E(Yi - 𝜋 𝑖 )= E(ei) = 0. Jadijika model benarmaka plot antara 𝜋 𝑖 dan residual akanmenunjukkanpolagarishorisontaldenganintersepnol


Download ppt "Regresi dengan Respon Biner"

Presentasi serupa


Iklan oleh Google