Presentasi sedang didownload. Silahkan tunggu

Presentasi sedang didownload. Silahkan tunggu

REGRESI LOGISTIK BINER

Presentasi serupa


Presentasi berjudul: "REGRESI LOGISTIK BINER"— Transcript presentasi:

1 REGRESI LOGISTIK BINER
ENI SUMARMININGSIH

2 Model regresi logistik adalah salah satu model yang digunakan untuk mencari hubungan antara peubah respon kategori dengan satu atau lebih peubah penjelas yang kontinyu ataupun kategori. Peubah respon yang terdiri atas dua kategori yaitu “ya (sukses)” dan “tidak (gagal)”, dan dinotasikan dengan 1 = “sukses” dan 0 = “gagal”, maka akan mengikuti sebaran Bernoulli.

3 Jika pi menyatakan peluang suatu individu ke-i memiliki nilai Y = 1, maka model regresi logistik dengan k buah variabel bebas dapat dituliskan sebagai

4

5

6 Interpretasi: Peluang kejadian tertentu dari peubah respons kategori (misalnya membeli) jika nilai peubah pejelas diketahui Koefisien  selanjutnya diduga menggunakan metode maximum likelihood. Secara sederhana dapat disebutkan bahwa metode ini berusaha mencari nilai koefisien yang memaksimumkan fungsi likelihood.

7 Dengan nilai Y yang bersifat biner, kita dapat menggunakan Bernoulli sebagai sebaran variabel Y sehingga fungsi likelihood akan berbentuk

8

9

10

11 Nilai maksimum dari fungsi kemungkinan dapat dicari dengan melogaritmakan kedua ruas. Maksimum dari fungsi 𝐿(𝛽𝑗) disebut sebagai log likelihood.

12

13

14

15

16 Karena βj yang akan diduga bersifat nonlinier, maka penyelesaian persamaan dapat menggunakan metode iterasi Gauss Newton atau Metode Marquardt.

17 Pengujian Terhadap Pendugaan Parameter
Pengujian pendugaan parameter ( 𝜷 𝒋 ) secara parsial. Untuk memeriksa peranan koefisien regresi dari masing-masing variabel prediktor secara individu dalam model. Hipotesis yang digunakan adalah :

18 Statistik uji yang digunakan adalah statistik uji Wald yang dapat ditulis:

19 Untuk sampel besar statistik uji Wald mengikuti sebaran normal (Z)

20 b. Pengujian pendugaan parameter ( 𝜷 𝒋 ) secara simultan Untuk memeriksa pengaruh koefisien regresi dari variabel prediktor secara bersama-sama. Hipotesisnya adalah:

21 Uji yang digunakan adalah uji nisbah kemungkinan(Likelihood Ratio Test) yaitu: dengan: L0= nilai log likelihood model regresi logistik tanpa variabel prediktor Lp = nilai log likelihood model regresi logistik dengan variabel prediktor Likelihood ratio test berdistribusi  (𝑝) 2

22

23

24 Interpretasi untuk variabel independen polikotomus
Misalkan peubah bebas memiliki kategori lebih dari 2. Contoh: Penelitian dilakukan untuk meneliti adakah pengaruh ras (White, Black, Hispanic, Other) terhadap terjadinya CHD (Coronary Hearth Disease)

25 Data dari penelitian adalah sebagai berikut:

26 Karena Variabel bebas memiliki kategori lebih dari 2 maka kita gunakan design variabel seperti pada tabel berikut:

27 Hasil estimasi adalah sebagai berikut: Sehingga didapatkan

28 Interpretasi untuk variabel Independen Kontinu
Asumsikan logit 𝑙𝑜𝑔 𝑝 1−𝑝 = g(x) adalah linier. Persamaan logit adalah 1 merupakan perubahan log odds (logit) untuk setiap peningkatan sebesar 1 satuan x 1 =g(x+1) – g(x) = 𝛽 0 + 𝛽 1 𝑥+1 − 𝛽 0 + 𝛽 1 (𝑥) untuk setiap nilai x.

29 Secara umum jika x berubah sebesar c satuan maka logit akan berubah sebesar c1,
Didapatkan dari 𝑔 𝑥+𝑐 −𝑔 𝑥 = 𝛽 0 + 𝛽 1 𝑥+𝑐 − 𝛽 0 + 𝛽 1 𝑥 = c1 Sehingga OR(c)=OR(x+c,x) = exp(c1)

30 Contoh : pada penelitian pengaruh usia terhadap terjadinya CHD didapatkan model Odd Ratio duga untuk kenaikan usia 10 tahun adalah 𝑂𝑅 10 = exp 10×0.111 =3.03 Artinya setiap kenaikan usia sebesar 10 tahun maka resiko terjadinya CHD meningkat sebesar 3.03 kali

31 Multivariable Model Suatu penelitian dilakukan untuk mengetahui pengaruh usia (AGE), jenis kelamin dan level cathecolamin (CAT) terhadap terjadinya CHD. Model yang digunakan adalah 𝑙𝑜𝑔 𝑝 1−𝑝 =𝑔 𝑿 = 𝛽 0 + 𝛽 1 𝑋 1 + 𝛽 2 𝑋 2 + 𝛽 3 𝑋 3 Dimana X1 = usia X2 = jenis kelamin (0 = perempuan, 1=laki – laki) X3 = level cathecolamin ( 0= rendah, 1=tinggi)

32 Odd ratio untuk variabel 0-1 adalah 𝑒 𝛽 𝑖 dengan asumsi variabel yang lain tetap. Sedangkan untuk variabel kontinu, Odd ratio didapatkan dari 𝑒 𝛽 𝑖 ( 𝑋 1𝑖 − 𝑋 0𝑖 ) Secara umum rumus untuk Odd Ratio adalah 𝑂𝑅= 𝑒 𝑖=1 𝑘 𝛽 𝑖 ( 𝑋 1𝑖 − 𝑋 0𝑖 )

33 Model Multivariabel dengan interaksi

34

35 Goodness of fit Misalkan model kita terdiri dari p peubah bebas J adalah banyaknya nilai pengamatan x yang berbeda. Jika beberapa subjek memiliki nilai x yang sama maka J < n Notasikan banyaknya subjek dengan nilai x=xj dengan mj, j = 1, 2, …, J. Maka 𝑚 𝑗 =𝑛 Yj adalah banyaknya y=1 diantara mj subjek dengan x=xj. Sehingga 𝑦 𝑗 = 𝑛 𝑗 yaitu banyaknya subjek dengan y=1

36 Pearson Residual didefinisikan sebagai Dan statistik 2 Pearson adalah

37 Deviance Residual didefinisikan sebagai Tanda + atau – , sama dengan tanda dari 𝑦 𝑗 − 𝑚 𝑗 𝜋 𝑗 Statistik Deviance adalah Statistik 2 dan Deviance menyebar 2 dengan derajat bebas J – (p+1)

38 Diagnostic Residual Plot
Jika model regresi logistik benar, maka E(Yi) = I Sehingga E(Yi - 𝜋 𝑖 )= E(ei) = 0. Jadi jika model benar maka plot antara 𝜋 𝑖 dan residual akan menunjukkan pola garis horisontal dengan intersep nol

39 Title TERIMA KASIH


Download ppt "REGRESI LOGISTIK BINER"

Presentasi serupa


Iklan oleh Google