ANALISIS DATA KATEGORIK ANNA ISLAMIYATI
Minggu VI
Inti Kuliah 1. Regresi Logistik Biner 2. Model Logit
GLM (Model Linear Umum) Pengantar 1. Komponen Acak GLM (Model Linear Umum) 2. Komponen Sistematik 3. Fungsi Link Regresi Logistik Model Log Linear
GLM (Generalized Linear Model) Model Linear Umum Komponen Acak : Fungsi Distribusi Variabel Respon (Y) Komponen Sistematik : Variat yang terbentuk dari kombinasi atau beberapa variabel prediktor X Fungsi Penghubung : Fungsi yang menghubungkan antara Komponen Acak dengan Komponen Sistematik Model Linear Umum/GLM diantaranya: Analisis Regresi Linear Analisis Varians (ANOVA) Analisis Covarians (ANACOVA) Analisis Regresi Logistik
Regresi Logistik Regresi Logistik Regresi Logistik Biner Regresi Logistik Multinomial Regresi Logistik Regresi Logistik Ordinal Regresi Probit
Kapan menggunakan regresi logistik? Variabel Respon (Y) Biner/Dikotomus Prediktor/ Kovariat (X) 2 kategori, ‘0’ dan ‘1’ Variabel dikotomus : 2 kategori Variabel politokomus : lebih dari 2 kategori Variabel kontinu : datanya kontinu, tidak dalam bentuk kategori Tujuan : untuk menemukan model dugaan yang paling baik dan relatif paling sederhana sehingga dapat menggambarkan hubungan antara respon dengan sekumpulan variabel-variabel bebasnya/kovariat.
Perbedaan dengan model regresi linear 1 1. Hubungan antara variabel respon dengan variabel-variabel penjelasnya. Pada setiap masalah regresi suatu besaran yang penting adalah nilai rata-rata dari variabel respon untuk nilai variabel penjelas tertentu. Dalam regresi linier diasumsikan bahwa rata-rata itu dapat dinyatakan sebagai persamaan linier dalam variabel x E(Y|x) = 0 + 1x Dalam regresi logistik, besaran E(Y|x) =(x) menggambarkan rata-rata Y bersyarat x jika distribusi logistik digunakan
Perbedaan dengan model regresi linear 2 2. Asumsi dalam regresi linear bahwa mengikuti distribusi normal dengan rata-rata nol dan varians konstant menurut tingkat dari variabel bebas. Asumsi untuk regresi logistik, mengikuti distribusi binomial yaitu dengan rata-rata nol dan varians sama dengan (x)[1 - (x)]. Dalam hal ini, besaran dapat diasumsikan akan mempunyai dua nilai yang mungkin. Jika y = 1 maka = 1 - (x) dengan peluang (x), sedangkan jika y = 0, maka = -(x) dengan peluang 1 - (x)
Regresi Logistik Biner Regresi logistik biner adalah regresi dengan peubah respon Y Berbentuk 2 kategorik, yang berdistribusi bernoulli.
Struktur Data Regresi Logistik Biner ungrouped binary data grouped binary data A. SUBJEK B. KELAS KOVARIAT Nomor Subjek Kovariat Respon s Y (X1, X2) Ukuran Kelas ni X1 X2 1 2 3 4 5 6 7 8 9 10 (1, 1) (1, 2) (2, 1) (2, 2)
Model Regresi Logistik Biner Misalkan terdapat 1 variabel X dengan Y dua kategori (0 dan 1) : (x) adalah proporsi atau peluang untuk terjadinya Y=1 Adalah nilai koefisien regresi yang ditaksir melalui MLE (Maksimum Likelihood Estimation) x adalah kovariat (prediktor)
Transformasi Logit Transformasi (x) pada regresi logistik adalah transformasi logit. Transformasi ini didefinisikan sebagai berikut: Tujuan transformasi logit adalah membawa hubungan menjadi linear dalam parameternya dan bisa berbentuk kontinu dan range bisa berada antara - dan +, bergantung pada range dari variabel x.
Model Regresi Logistik Linear Model logistik linear untuk i yang bergantung pada nilai-nilai dari k buah variabel penjelas, x1i, x2i, …, xki, didefinisikan oleh:
Sampai Ketemu Minggu VII