Regresi dengan Respon Biner

Slides:



Advertisements
Presentasi serupa
Outlier Pada Analisis Regresi
Advertisements

Peubah acak khusus.
ANALISIS KORELASI.
ANALISIS DATA KATEGORI
Latihan Regresi Logistik
Analisis Data Hujan HIDROLOGI TL-2204.
REGRESI LOGISTIK BINER
VI. ESTIMASI PARAMETER Estimasi Parameter : Metode statistika yang berfungsi untuk mengestimasi/menduga/memperkirakan nilai karakteristik dari populasi.
BAB XI REGRESI LINEAR Regresi Linear.
ANAILSIS REGRESI BERGANDA
Heteroskedastisitas Penyimpangan asumsi ketika ragam galat tidak konstan Ragam galat populasi di setiap Xi tidak sama Terkadang naik seiring dengan nilai.
Analisis Data: Memeriksa Perbedaan
Regresi dengan Pencilan
REGRESI LOGISTIK Erni Tri Astuti.
Regresi Eni Sumarminingsih, SSi, MM. Analisis regresi linier merupakan analisis yang digunakan untuk mengetahui dan mempelajari suatu model hubungan fungsional.
Pengujian asumsi dalam ANOVA dan Transformasi Data
DIAGNOSTICS AND REMEDIAL MEASURES
Threshold Generalized Autoregressive Conditional Heteroscedasticity (TGARCH) Eni Sumarminingsih, SSi, MM.
RANK FULL MODEL (VARIANCE ESTIMATION)
Sifat-Sifat Kebaikan Penduga
Mixture Autoregressive (MAR)
LOGISTIC REGRESSION Logistic regression adalah regressi dengan binary untuk variabel dependen. Variabel dependen bersifat dikotomi dengan mengambil nilai.
METODE STATISTIKA (STK211)
Uji Hipotesis.
Rancangan Acak Lengkap (RAL) (Completely Randomized Design)
Kuliah ke 9 ESTIMASI PARAMETER SATU POPULASI
SEBARAN PELUANG BERSAMA 2
TAKSIRAN NILAI PARAMETER
ANALISIS DATA KATEGORIK
ANALISIS DATA KATEGORIK
METODE STATISTIKA (STK211)
Pengujian Korelasi Diri Pertemuan 16
REGRESI LOGISTIK BINER
REGRESI NON LINIER Gangga Anuraga, M.Si.
STATISTIK TERAPAN Oleh : Dr. dr. Buraerah. H. Abd. Hakim, MSc
ANALISIS DATA KATEGORIK
Program Studi Statistika Semester Ganjil 2012
ANALISIS REGRESI.
Program Studi Statistika, semester Ganjil 2012/2013
Pertemuan Ke-7 REGRESI LINIER BERGANDA
Program Studi Statistika, semester Ganjil 2012/2013
Regresi Linier Sederhana
Program Studi Statistika Semester Ganjil 2012
REGRESI LOGISTIK BINER
PENDAHULUAN Dalam kehidupan sering ditemukan adanya sekelompok peubah yang diantaranya terdapat hubungan alamiah, misalnya panjang dan berat bayi yang.
Model Peluang Linier.
Pertemuan 21 Pemeriksaan penyimpangan regresi
Analisis Regresi Pengujian Asumsi Residual
Analisis data kualitatif (introduction to Categorical data analysis)
REGRESI LOGIT ATAU REGRESI LOGISTIK.
REGRESI LOGISTIK MULTINOMIAL
REGRESI LOGISTIK BINER (DICHOTOMOUS INDEPENDENT VARIABLE)
REGRESI LOGISTIK ORDINAL
Analisis Jalur (Path Analysis).
D0124 Statistika Industri Pertemuan 12 dan 13
Agribusiness Study of Programme Wiraraja University
Uji Asumsi Analisis Regresi Berganda Manajemen Informasi Kesehatan
Pengujian asumsi dalam ANOVA dan Transformasi Data
Generalized Linear Model pada Data Berdistribusi Poisson (Studi kasus : Banyaknya Jumlah kecelakaan lalu lintas berdasarkan faktor jumlah pelanggaran.
REGRESI POISSON Gangga Anuraga, M.Si.
REGRESI LINIER BERGANDA
Pokok Bahasan : Review Regresi Linier Sederhana dan Berganda
Sebaran Penarikan Contoh
Model Logit Untuk Respons Biner
Pendugaan Parameter Regresi Logistik
Model Linier untuk data kontinyu (lanjut)
Simulasi untuk Model-model Statistika
Pendugaan Parameter Statistika Matematika II
Model Linier untuk Data Kontinyu
Model untuk Respons Biner
Transcript presentasi:

Regresi dengan Respon Biner Eni Sumarminingsih

Arti Fungsi Respon Pandang model regresi linier sederhana berikut: Dengan nilai Yi yang mungkin adalah 0 dan 1. Karena

Karena Yi adalah peubah biner maka Yi memiliki sebaran Bernouli dengan sebaran peluang Berdasar definisi nilai harapan peubah acak

Rata – rata respon adalah peluang saat nilai predictor adalah

Permasalahan yang muncul bila peubah respon adalah biner Galat tidak menyebar normal Bila peubah respon adalah biner, maka galat juga hanya mempunyai dua kemungkinan nilai, Saat , maka

2. Ragam galat tidak konstan ragam galat tergantung pada nilai

3. Batasan pada Fungsi Respon Fungsi respon yang linier tidak memenuhi batasan ini harus ditransformasi sedemikian hingga nilainya berkisar antara nilai 0 dan 1

Atau dapat ditulis juga

Model Regresi Logistik Atau Atau bentuk logit

Pendugaan Parameter Dengan nilai Y yang bersifat biner, kita dapat menggunakan Bernoulli sebagai sebaran variabel Y sehingga fungsi likelihood akan berbentuk

Nilai maksimum dari fungsi kemungkinan dapat dicari dengan melogaritmakan kedua ruas. Maksimum dari fungsi 𝐿(𝛽𝑗) disebut sebagai log likelihood.

Karena Ξ²j yang akan diduga bersifat nonlinier, maka penyelesaian persamaan dapat menggunakan metode iterasi Gauss Newton atau Metode Marquardt.

Pengujian Terhadap Pendugaan Parameter Pengujianpendugaan parameter ( 𝜷 𝒋 ) secaraparsial. Untukmemeriksaperanankoefisienregresidarimasing-masingvariabelprediktorsecaraindividudalammodel. Hipotesis yang digunakanadalah :

Statistik uji yang digunakan adalah statistik uji Wald yang dapat ditulis:

Untuk sampel besar statistik uji Wald mengikuti sebaran normal (Z)

b. Pengujianpendugaanparameter ( 𝜷 𝒋 ) secarasimultan Untukmemeriksapengaruhkoefisienregresidarivariabelprediktorsecarabersama-sama. Hipotesisnyaadalah:

Uji yang digunakanadalahujinisbahkemungkinan(Likelihood Ratio Test) yaitu: dengan: L0= nilai log likelihood model regresilogistiktanpavariabelprediktor Lp = nilai log likelihood model regresilogistikdenganvariabelprediktor Likelihood ratio test berdistribusi  (𝑝) 2

Interpretasi untuk variabel independen polikotomus Misalkan peubah bebas memiliki kategori lebih dari 2. Contoh: Penelitian dilakukan untuk meneliti adakah pengaruh ras (White, Black, Hispanic, Other) terhadap terjadinya CHD (Coronary Hearth Disease)

Data dari penelitian adalah sebagai berikut:

Karena Variabel bebas memiliki kategori lebih dari 2 maka kita gunakan design variabel seperti pada tabel berikut:

Hasil estimasi adalah sebagai berikut: Sehingga didapatkan

Interpretasi untuk variabel Independen Kontinu Asumsikan logit π‘™π‘œπ‘” 𝑝 1βˆ’π‘ = g(x) adalah linier. Persamaanlogitadalah 1merupakanperubahan log odds (logit) untuksetiappeningkatansebesar 1 satuan x 1 =g(x+1) – g(x) = 𝛽 0 + 𝛽 1 π‘₯+1 βˆ’ 𝛽 0 + 𝛽 1 (π‘₯) 𝛽 0 + 𝛽 1 (π‘₯) untuk setiapnilai x.

Secaraumumjika x berubahsebesar c satuanmakalogitakanberubahsebesar c1, Didapatkandari 𝑔 π‘₯+𝑐 βˆ’π‘” π‘₯ = 𝛽 0 + 𝛽 1 π‘₯+𝑐 βˆ’ 𝛽 0 + 𝛽 1 π‘₯ = c1 Sehingga OR(c)=OR(x+c,x) = exp(c1)

Contoh : padapenelitianpengaruhusiaterhadapterjadinya CHD didapatkanmodel Odd Ratio dugauntukkenaikanusia 10 tahunadalah 𝑂𝑅 10 = exp 10Γ—0.111 =3.03 Artinyasetiapkenaikanusiasebesar 10 tahunmakaresikoterjadinya CHD meningkatsebesar 3.03 kali

Multivariable Model Suatu penelitiandilakukanuntukmengetahuipengaruhusia (AGE), jeniskelamindan level cathecolamin (CAT) terhadapterjadinya CHD. Model yang digunakanadalah π‘™π‘œπ‘” 𝑝 1βˆ’π‘ =𝑔 𝑿 = 𝛽 0 + 𝛽 1 𝑋 1 + 𝛽 2 𝑋 2 + 𝛽 3 𝑋 3 Dimana X1 = usia X2 = jeniskelamin (0 = perempuan, 1=laki – laki) X3 = level cathecolamin ( 0= rendah, 1=tinggi)

Odd ratio untukvariabel 0-1 adalah 𝑒 𝛽 𝑖 denganasumsivariabel yang lain tetap. Sedangkanuntukvariabelkontinu, Odd ratio didapatkandari 𝑒 𝛽 𝑖 ( 𝑋 1𝑖 βˆ’ 𝑋 0𝑖 ) Secaraumumrumusuntuk Odd Ratio adalah 𝑂𝑅= 𝑒 𝑖=1 π‘˜ 𝛽 𝑖 ( 𝑋 1𝑖 βˆ’ 𝑋 0𝑖 )

Model Multivariabel dengan interaksi

Goodness of fit Misalkan model kitaterdiridari p peubahbebas J adalahbanyaknyanilaipengamatanx yang berbeda. Jikabeberapasubjekmemilikinilaix yang samamaka J < n Notasikanbanyaknyasubjekdengannilaix=xjdenganmj, j = 1, 2, …, J. Maka π‘š 𝑗 =𝑛 Yjadalahbanyaknya y=1 diantaramjsubjekdenganx=xj. Sehingga 𝑦 𝑗 = 𝑛 𝑗 yaitubanyaknyasubjekdengan y=1

Pearson Residual didefinisikan sebagai Dan statistik 2 Pearson adalah

Deviance Residual didefinisikansebagai Tanda + atau – , samadengantandadari 𝑦 𝑗 βˆ’ π‘š 𝑗 πœ‹ 𝑗 Statistik Deviance adalah Statistik 2dan Deviance menyebar2denganderajatbebas J – (p+1)

Diagnostic Residual Plot Jika model regresilogistikbenar, maka E(Yi) = I Sehingga E(Yi - πœ‹ 𝑖 )= E(ei) = 0. Jadijika model benarmaka plot antara πœ‹ 𝑖 dan residual akanmenunjukkanpolagarishorisontaldenganintersepnol