REGRESI LOGISTIK BINER

Slides:



Advertisements
Presentasi serupa
Outlier Pada Analisis Regresi
Advertisements

UJI HIPOTESIS.
ANALISIS DATA KATEGORI
Latihan Regresi Logistik
REGRESI LOGISTIK BINER
REGRESI LINIER SEDERHANA
ANALISIS REGRESI.
BAB XI REGRESI LINEAR Regresi Linear.
STATISTIK vs STATISTIKA
Heteroskedastisitas Penyimpangan asumsi ketika ragam galat tidak konstan Ragam galat populasi di setiap Xi tidak sama Terkadang naik seiring dengan nilai.
Analisis Data: Memeriksa Perbedaan
Regresi dengan Pencilan
REGRESI LOGISTIK Erni Tri Astuti.
Regresi dengan Respon Biner
Regresi Linier Berganda
Korelasi Fungsi : Mempelajari Hubungan 2 (dua) variabel Var. X Var. Y.
Regresi Linier Fungsi : Jenis :
ANALISIS REGRESI Pertemuan ke 12.
KORELASI DAN REGRESI LINEAR SEDERHANA
Pengujian asumsi dalam ANOVA dan Transformasi Data
Threshold Generalized Autoregressive Conditional Heteroscedasticity (TGARCH) Eni Sumarminingsih, SSi, MM.
BAB VI REGRESI SEDERHANA.
RANK FULL MODEL (VARIANCE ESTIMATION)
Abdul Rohman Fakultas Farmasi UGM
Regresi Linier Berganda
LOGISTIC REGRESSION Logistic regression adalah regressi dengan binary untuk variabel dependen. Variabel dependen bersifat dikotomi dengan mengambil nilai.
ANALISIS KORELASI.
Uji Hipotesis.
REGRESI LINIER SEDERHANA
contingency tables (tabel kontingensi)
BAB VII ANALISIS KORELASI DAN REGRESI LINIER SEDERHANA
ANALISIS REGRESI LINIER BERGANDA
ANALISIS DATA KATEGORIK
MODEL PROBABILITAS LINIER
ANALISIS DATA KATEGORIK
Analisis Korelasi dan Regresi linier
REGRESI NON LINIER Gangga Anuraga, M.Si.
STATISTIK TERAPAN Oleh : Dr. dr. Buraerah. H. Abd. Hakim, MSc
ANALISIS DATA KATEGORIK
STATISTIK II Pertemuan 14: Analisis Regresi dan Korelasi
Program Studi Statistika Semester Ganjil 2012
Pertemuan Ke-7 REGRESI LINIER BERGANDA
STATISTIK II Pertemuan 14: Analisis Regresi dan Korelasi
ESTIMASI dan HIPOTESIS
EKONOMETRIKA Pertemuan 10: Pengujian Asumsi-asumsi Klasik (Bagian 1)
Program Studi Statistika Semester Ganjil 2012
Operations Management
REGRESI LOGISTIK BINER
Regresi Sederhana : Estimasi
EKONOMETRIKA Pertemuan 9: Pengujian Asumsi-asumsi Klasik (Bagian 1)
Model Peluang Linier.
REGRESI LOGIT ATAU REGRESI LOGISTIK.
REGRESI LOGISTIK BINER (DICHOTOMOUS INDEPENDENT VARIABLE)
REGRESI LOGISTIK ORDINAL
Analisis Jalur (Path Analysis).
MODEL REGRESI DENGAN VARIABEL BEBAS KATEGORI
Rancangan Acak Lengkap
Korelasi Korelasi Product Moment digunakan untuk melukiskan hubungan antara 2 buah variabel yg sama-sama berjenis interval atau rasio. Rumus.
Generalized Linear Model pada Data Berdistribusi Poisson (Studi kasus : Banyaknya Jumlah kecelakaan lalu lintas berdasarkan faktor jumlah pelanggaran.
STATISTIK II Pertemuan 12: Analisis Regresi dan Korelasi
REGRESI POISSON Gangga Anuraga, M.Si.
ANALISIS REGRESI & KORELASI
DASAR-DASAR UJI HIPOTESIS
Model Logit Untuk Respons Biner
Pendugaan Parameter Regresi Logistik
Model Linier untuk data kontinyu (lanjut)
Simulasi untuk Model-model Statistika
Pendugaan Parameter Statistika Matematika II
Model Linier untuk Data Kontinyu
Model untuk Respons Biner
Transcript presentasi:

REGRESI LOGISTIK BINER ENI SUMARMININGSIH

Model regresi logistik adalah salah satu model yang digunakan untuk mencari hubungan antara peubah respon kategori dengan satu atau lebih peubah penjelas yang kontinyu ataupun kategori. Peubah respon yang terdiri atas dua kategori yaitu “ya (sukses)” dan “tidak (gagal)”, dan dinotasikan dengan 1 = “sukses” dan 0 = “gagal”, maka akan mengikuti sebaran Bernoulli.

Jika pi menyatakan peluang suatu individu ke-i memiliki nilai Y = 1, maka model regresi logistik dengan k buah variabel bebas dapat dituliskan sebagai

Interpretasi: Peluang kejadian tertentu dari peubah respons kategori (misalnya membeli) jika nilai peubah pejelas diketahui Koefisien  selanjutnya diduga menggunakan metode maximum likelihood. Secara sederhana dapat disebutkan bahwa metode ini berusaha mencari nilai koefisien yang memaksimumkan fungsi likelihood.

Dengan nilai Y yang bersifat biner, kita dapat menggunakan Bernoulli sebagai sebaran variabel Y sehingga fungsi likelihood akan berbentuk

Nilai maksimum dari fungsi kemungkinan dapat dicari dengan melogaritmakan kedua ruas. Maksimum dari fungsi 𝐿(𝛽𝑗) disebut sebagai log likelihood.

Karena βj yang akan diduga bersifat nonlinier, maka penyelesaian persamaan dapat menggunakan metode iterasi Gauss Newton atau Metode Marquardt.

Pengujian Terhadap Pendugaan Parameter Pengujian pendugaan parameter ( 𝜷 𝒋 ) secara parsial. Untuk memeriksa peranan koefisien regresi dari masing-masing variabel prediktor secara individu dalam model. Hipotesis yang digunakan adalah :

Statistik uji yang digunakan adalah statistik uji Wald yang dapat ditulis:

Untuk sampel besar statistik uji Wald mengikuti sebaran normal (Z)

b. Pengujian pendugaan parameter ( 𝜷 𝒋 ) secara simultan Untuk memeriksa pengaruh koefisien regresi dari variabel prediktor secara bersama-sama. Hipotesisnya adalah:

Uji yang digunakan adalah uji nisbah kemungkinan(Likelihood Ratio Test) yaitu: dengan: L0= nilai log likelihood model regresi logistik tanpa variabel prediktor Lp = nilai log likelihood model regresi logistik dengan variabel prediktor Likelihood ratio test berdistribusi  (𝑝) 2

Interpretasi untuk variabel independen polikotomus Misalkan peubah bebas memiliki kategori lebih dari 2. Contoh: Penelitian dilakukan untuk meneliti adakah pengaruh ras (White, Black, Hispanic, Other) terhadap terjadinya CHD (Coronary Hearth Disease)

Data dari penelitian adalah sebagai berikut:

Karena Variabel bebas memiliki kategori lebih dari 2 maka kita gunakan design variabel seperti pada tabel berikut:

Hasil estimasi adalah sebagai berikut: Sehingga didapatkan

Interpretasi untuk variabel Independen Kontinu Asumsikan logit 𝑙𝑜𝑔 𝑝 1−𝑝 = g(x) adalah linier. Persamaan logit adalah 1 merupakan perubahan log odds (logit) untuk setiap peningkatan sebesar 1 satuan x 1 =g(x+1) – g(x) = 𝛽 0 + 𝛽 1 𝑥+1 − 𝛽 0 + 𝛽 1 (𝑥) untuk setiap nilai x.

Secara umum jika x berubah sebesar c satuan maka logit akan berubah sebesar c1, Didapatkan dari 𝑔 𝑥+𝑐 −𝑔 𝑥 = 𝛽 0 + 𝛽 1 𝑥+𝑐 − 𝛽 0 + 𝛽 1 𝑥 = c1 Sehingga OR(c)=OR(x+c,x) = exp(c1)

Contoh : pada penelitian pengaruh usia terhadap terjadinya CHD didapatkan model Odd Ratio duga untuk kenaikan usia 10 tahun adalah 𝑂𝑅 10 = exp 10×0.111 =3.03 Artinya setiap kenaikan usia sebesar 10 tahun maka resiko terjadinya CHD meningkat sebesar 3.03 kali

Multivariable Model Suatu penelitian dilakukan untuk mengetahui pengaruh usia (AGE), jenis kelamin dan level cathecolamin (CAT) terhadap terjadinya CHD. Model yang digunakan adalah 𝑙𝑜𝑔 𝑝 1−𝑝 =𝑔 𝑿 = 𝛽 0 + 𝛽 1 𝑋 1 + 𝛽 2 𝑋 2 + 𝛽 3 𝑋 3 Dimana X1 = usia X2 = jenis kelamin (0 = perempuan, 1=laki – laki) X3 = level cathecolamin ( 0= rendah, 1=tinggi)

Odd ratio untuk variabel 0-1 adalah 𝑒 𝛽 𝑖 dengan asumsi variabel yang lain tetap. Sedangkan untuk variabel kontinu, Odd ratio didapatkan dari 𝑒 𝛽 𝑖 ( 𝑋 1𝑖 − 𝑋 0𝑖 ) Secara umum rumus untuk Odd Ratio adalah 𝑂𝑅= 𝑒 𝑖=1 𝑘 𝛽 𝑖 ( 𝑋 1𝑖 − 𝑋 0𝑖 )

Model Multivariabel dengan interaksi

Goodness of fit Misalkan model kita terdiri dari p peubah bebas J adalah banyaknya nilai pengamatan x yang berbeda. Jika beberapa subjek memiliki nilai x yang sama maka J < n Notasikan banyaknya subjek dengan nilai x=xj dengan mj, j = 1, 2, …, J. Maka 𝑚 𝑗 =𝑛 Yj adalah banyaknya y=1 diantara mj subjek dengan x=xj. Sehingga 𝑦 𝑗 = 𝑛 𝑗 yaitu banyaknya subjek dengan y=1

Pearson Residual didefinisikan sebagai Dan statistik 2 Pearson adalah

Deviance Residual didefinisikan sebagai Tanda + atau – , sama dengan tanda dari 𝑦 𝑗 − 𝑚 𝑗 𝜋 𝑗 Statistik Deviance adalah Statistik 2 dan Deviance menyebar 2 dengan derajat bebas J – (p+1)

Diagnostic Residual Plot Jika model regresi logistik benar, maka E(Yi) = I Sehingga E(Yi - 𝜋 𝑖 )= E(ei) = 0. Jadi jika model benar maka plot antara 𝜋 𝑖 dan residual akan menunjukkan pola garis horisontal dengan intersep nol

Title TERIMA KASIH