ANALISIS DATA KATEGORI

Slides:



Advertisements
Presentasi serupa
Outlier Pada Analisis Regresi
Advertisements

MODEL PROBABILITAS LINIER
ANALISIS KORELASI.
REGRESI LINIER BERGANDA
Regresi Diskriminan dan Regresi Logistik
Latihan Regresi Logistik
REGRESI LOGISTIK BINER
ANALISIS REGRESI.
Learning Vector Quantization (LVQ)
MULTIVARIATE ANALYSIS
DR. Robiana Modjo, SKM, M.Kes
PENGUJIAN HIPOTESIS ASOSIATIF
BAB III ANALISIS REGRESI.
Korelasi dan Regresi Linear Berganda
Analisis Data: Memeriksa Perbedaan
Regresi dengan Pencilan
DISTRIBUSI DARI FUNGSI VARIABEL RANDOM
REGRESI LOGISTIK Erni Tri Astuti.
Regresi dengan Respon Biner
Regresi Linier Berganda
REGRESI LOGISTIK DEWI GAYATRI, M.Kes..
REGRESI LOGISTIK Mugi Wahidin, SKM, M.Epid Prodi Kesehatan Masyarakat
BAB XIII REGRESI BERGANDA.
Threshold Generalized Autoregressive Conditional Heteroscedasticity (TGARCH) Eni Sumarminingsih, SSi, MM.
Ordinal Logistic Regression
BAB VI REGRESI SEDERHANA.
Regresi Linier Berganda
Pemodelan Volatilitas
LOGISTIC REGRESSION Logistic regression adalah regressi dengan binary untuk variabel dependen. Variabel dependen bersifat dikotomi dengan mengambil nilai.
ANALISIS MULTIVARIAT.
VARIABEL.
Struktur Penelitian Eni Mahawati, M.Kes.
ANALISIS DATA KATEGORIK
MODEL PROBABILITAS LINIER
Regresi Berganda Statistika Ekonomi II Pertemuan Ke 10
Uji Hipotesis Dep Biostatik FKM UI.
UJI HIPOTESIS Perbandingan Dua Mean.
ANALISIS DATA KATEGORIK
REGRESI LOGISTIK BINER
STATISTIK TERAPAN Oleh : Dr. dr. Buraerah. H. Abd. Hakim, MSc
Regresi Linier Berganda
Mencaritahu Faktor-faktor Yang Mempengaruhi Kolesterol Darah
ESTIMASI dan HIPOTESIS
Regresi Linier Berganda
ANALISIS REGRESI LINIER DUA PREDIKTOR
REGRESI LOGISTIK BINER
Model Peluang Linier.
Bagian Ilmu Kesehatan Masyarakat Faculty of Medicine & Health Sciences
REGRESI LOGIT ATAU REGRESI LOGISTIK.
REGRESI LOGISTIK MULTINOMIAL
REGRESI LOGISTIK BINER (DICHOTOMOUS INDEPENDENT VARIABLE)
TEMU 11 COMPARE MEANS: MEANS.
REGRESI LOGISTIK ORDINAL
STATISTIKA Materi : Pengantar Statistika deskriptif
Analisis Jalur (Path Analysis).
HIPOTESIS.
HUBUNGAN ANTARA KEPATUHAN PENGGUNAAN
Regresi Linier Berganda
Regresi Linier Berganda
Generalized Linear Model pada Data Berdistribusi Poisson (Studi kasus : Banyaknya Jumlah kecelakaan lalu lintas berdasarkan faktor jumlah pelanggaran.
TEMU 11 COMPARE MEANS: MEANS.
Dalam Analisis Statistik
BAB 6 MULTIKOLINIERITAS
Agribusiness Study of Programme Wiraraja University
Uji Asosiasi Korelasi Spearman.
Model Logit Untuk Respons Biner
Pendugaan Parameter Regresi Logistik
Model Linier untuk data kontinyu (lanjut)
BAB VIII REGRESI &KORELASI BERGANDA
Model untuk Respons Biner
Transcript presentasi:

ANALISIS DATA KATEGORI Eni Sumarminingsih

Distribusi Multinomial Misalnya terdapat c kategori pada variabel respon. Peluangnya dinotasikan {1 ,2 ,…,c} di mana 𝑗  𝑗 = 1. Untuk n sampel, peluang Multinomial bahwa n1 jatuh pada kategori1, n2 jatuh pada kategori 2,…, nc jatuh pada kategori c di mana 𝑗 𝑛 𝑗 =𝑛

Distribusi Multinomial

Regresi Logistik Multinomial Regresi Logistik yang melibatkan variabel respon dengan kategori lebih dari dua dengan skala nominal yaitu tidak memiliki tingkatan serta variabel prediktor yang bersifat kategori dan atau kontinyu disebut sebagai regresi logistik multinomial

Suatu variabel respon dengan M kategori akan membentuk persamaan logit sebanyak M-1 di mana masing-masing persamaan ini membentuk regresi logistik biner yang membandingkan suatu kelompok kategori terhadap kategori pembanding

Secara umum model multinomial logit adalah

Jika yang digunakan sebagai pembanding adalah kategori M, maka ΞΎM = 0 untuk di mana p adalah banyaknya variabel prediktor, sehingga transformasi logitnya menjadi,

Multinomial Logit dengan 3 Kategori Respon Dalam model regresi logistik dengan 3 kategori Y (Y=0,1,2),dibutuhkan 2 fungsi logit dan harus diputuskan kategori respon mana yang menjadi kategori pembanding Misal Y=0 sebagai kategori pembanding untuk membentuk 2 logit (yaitu sebagai pembanding untuk Y=1 dan Y=2) maka

Menurut Hosmer dan Lemeshow (2000) untuk mendapatkan model, asumsikan terdapat p variabel prediktor dan n sampel yang dinotasikan sebagai vektor X dengan matrik berukuran n x (p+1)di mana X0=1. Dua fungsi logit dinotasikan sebagai:

Bentuk Umum fungsi peluang dengan 3 kategori respon

Secara teori, model dengan 3 kategori peubah respon akan menghasilkan dua fungsi logit. Sebenarnya dapat digunakan pasangan kategori pembanding yang mana saja tergantung dari tujuan yang ingin dicapai dalam penelitian, tetapi menurut Hosmer dan Lemeshow (2000) lebih baik menggunakan kategori 0 sebagai pembanding karena merupakan perluasan dari model dengan dua kategori variabel respon (biner).

Pendugaan Parameter Pendugaan parameter dari model logit menggunakan metode maksimum likelihood Untuk membuat fungsi likelihood pada model dengan kategori respon lebih dari 2 (misalnya 3 kategori) hal pertama yang dilakukan adalah membuat 3 variabel biner yang dikode 0 atau 1 untuk menandai group membership (anggota kelompok) pada suatu observasi

Dalam kasus ini 3 variabel biner tersebut hanya untuk menjelaskan fungsi likelihood dan bukan digunakan untuk analisis regresi logistik multinomial yang sebenarnya

Pengujian Terhadap Pendugaan Parameter Pengujian pendugaan parameter () secara parsial Uji koefisien regresi secara parsial digunakan untuk memeriksa peranan koefisien regresi dari masing-masing variabel prediktor secara individu dalam model. Hipotesis yang digunakan adalah:

Pengujian Terhadap Pendugaan Parameter Statistik uji yang digunakan adalah statistik uji Wald yang dapat ditulis:

Pengujian Terhadap Pendugaan Parameter

Pengujian Terhadap Pendugaan Parameter

Pengujian Terhadap Pendugaan Parameter

Pengujian Terhadap Pendugaan Parameter

Pengujian Terhadap Pendugaan Parameter

Interpretasi Koefisien regresi logistik Interpretasi dalam regresi logistik menggunakan nilai odds ratio yang menunjukkan perbandingan tingkat kecenderungan dari kategori yang ada dalam satu variabel prediktor. Nilai odds ratio pada respon multinomial menggunakan notasi umum yang digunakan dalam respon biner.

Misalnya Y=0 digunakan sebagai kategori pembanding, odd ratio untuk Y=j terhadap Y=0 yang dihitung pada dua nilai adalah

pada regresi logistik politomus dengan tiga kategori respon akan terbentuk dua odds ratio. Yang pertama perbandingan peluang antara respon kategori 1 (Y=1) dengan respon kategori pembanding (Y=0) Yang kedua adalah perbandingan peluang antara respon kategori 2 (Y=2) dengan respon kategori pembanding (Y=0).

Koefisien Determinasi

Contoh Suatu penelitian ingin mengetahui berapa peluang seseorang terkena PJK (Penyakit Jantung Koroner), PJK disertai hipertensi dan PJK disertai hipertensi serta diabetes mellitus. Adapun faktor – faktor yang diduga mempengaruhi terjadinya PJK dan komplikasinya adalah usia, tekanan darah sistole, tekanan darah diastole, kolesterol, HDl, LDL dan Trigliserid. Variabel Respon:

Y= 0 (PJK), Y= 1 (PJK disertai hipertensi), Y= 2 (PJK disertai hipertensi dan diabetes mellitus). Variabel Prediktor: X1 = Usia (tahun) X2 = Tekanan darah sistole (mmHg) X3 = Tekanan darah diastole (mmHg) X4 = Kolesterol (mg/dl) X5 = HDL (mg/dl)

X6 = LDL (mg/dl) X7 = Trigliserid (mg/dl)

Model regresi logistik multinomial setelah dilakukan transformasi adalah sebagai berikut: Model regresi logistik yang pertama

Model regresi logistik yang kedua adalah

Nilai odds ratio model regresi logistik pertama

Interpretasi untuk model logistik pertama, Untuk variabel X1 diperoleh nilai odds ratio sebesar 1.109, berarti setiap bertambahnya 1 tahun usia seseorang yang telah memiliki faktor-faktor resiko PJK akan meningkatkan peluang orang tersebut terkena penyakit jantung koroner sekaligus hipertensi sebesar 1.109 kali. Untuk variabel X2 dengan nilai odds ratio sebesar 9.318 berarti dengan bertambahnya 1 57 mmHg tekanan darah sistole akan meningkatkan peluang orang tersebut terkena penyakit jantung koroner sekaligus hipertensi sebesar 9.318 kali, sedangkan untuk bertambahnya 1 mmHg tekanan darah diastole (X3) akan meningkatkan resiko terkena penyakit jantung serta hipertensi sebesar 9.309 kali. Untuk variabel kolesterol (X4), mengindikasikan bahwa dengan menurunnya 1 mg/dl kadar kolesterol akan menurunkan resiko terkena penyakit jantung koroner sekaligus hipertensi sebesar 0.749 kali. Untuk kenaikan 1 mg/dl kadar HDL (X5) akan meningkatkan resiko terkena PJK serta hipertensi sebesar 1.704 kali. Sedangkan untuk penurunan 1 mg/dl kadar LDL dan kadar trigliserid dapat mengurangi resiko terkena PJK disertai hipertensi berturut turut sebesar 0.488 kali dan 0.895 kali.

Untuk variabel X2 dengan nilai odds ratio sebesar 9 Untuk variabel X2 dengan nilai odds ratio sebesar 9.318 berarti dengan bertambahnya 1 mmHg tekanan darah sistole akan meningkatkan peluang orang tersebut terkena penyakit jantung koroner sekaligus hipertensi sebesar 9.318 kali, sedangkan untuk bertambahnya 1 mmHg tekanan darah diastole (X3) akan meningkatkan resiko terkena penyakit jantung serta hipertensi sebesar 9.309 kali.

Untuk variabel kolesterol (X4), mengindikasikan bahwa dengan menurunnya 1 mg/dl kadar kolesterol akan menurunkan resiko terkena penyakit jantung koroner sekaligus hipertensi sebesar 0.749 kali. Untuk kenaikan 1 mg/dl kadar HDL (X5) akan meningkatkan resiko terkena PJK serta hipertensi sebesar 1.704 kali.

Sedangkan untuk penurunan 1 mg/dl kadar LDL dan kadar trigliserid dapat mengurangi resiko terkena PJK disertai hipertensi berturut turut sebesar 0.488 kali dan 0.895 kali.

Nilai odds ratio model regresi logistik kedua

Interpretasi untuk model logistik kedua, untuk variabel X1 diperoleh nilai odds ratio sebesar 2.659, berarti setiap bertambahnya 1 tahun usia seseorang yang telah memiliki faktor-faktor resiko PJK akan meningkatkan peluang orang tersebut terkena penyakit jantung koroner disertai hipertensi dan diabetes mellitus (DM) sebesar 2.659 kali.

Untuk variabel X2 dengan nilai odds ratio sebesar 6 Untuk variabel X2 dengan nilai odds ratio sebesar 6.938 berarti dengan bertambahnya 1 mmHg tekanan darah sistole akan meningkatkan peluang orang tersebut terkena penyakit jantung koroner sekaligus hipertensi dan DM sebesar 6.938 kali,

bertambahnya 1 mmHg tekanan darah diastole (X3) akan meningkatkan resiko terkena penyakit jantung disertai hipertensi dan DM sebesar 5.667 kali variabel kolesterol (X4), mengindikasikan bahwa dengan menurunnya 1 mg/dl kadar kolesterol akan menurunkan resiko terkena penyakit jantung koroner disertai hipertensi dan DM sebesar 0.977 kali

Untuk kenaikan 1 mg/dl kadar HDL (X5) akan meningkatkan resiko terkena PJK disertai hipertensi dan DM sebesar 1.166 kali. Sedangkan untuk penurunan 1 mg/dl kadar LDL dan kadar trigliserid dapat mengurangi resiko terkena PJK disertai hipertensi dan DM berturut turut sebesar 0.891 kali dan 0.866 kali.

TERIMA KASIH