Presentasi sedang didownload. Silahkan tunggu

Presentasi sedang didownload. Silahkan tunggu

ANALISIS DATA KATEGORI

Presentasi serupa


Presentasi berjudul: "ANALISIS DATA KATEGORI"β€” Transcript presentasi:

1 ANALISIS DATA KATEGORI
Eni Sumarminingsih

2 Distribusi Multinomial
Misalnya terdapat c kategori pada variabel respon. Peluangnya dinotasikan {1 ,2 ,…,c} di mana 𝑗  𝑗 = 1. Untuk n sampel, peluang Multinomial bahwa n1 jatuh pada kategori1, n2 jatuh pada kategori 2,…, nc jatuh pada kategori c di mana 𝑗 𝑛 𝑗 =𝑛

3 Distribusi Multinomial

4 Regresi Logistik Multinomial
Regresi Logistik yang melibatkan variabel respon dengan kategori lebih dari dua dengan skala nominal yaitu tidak memiliki tingkatan serta variabel prediktor yang bersifat kategori dan atau kontinyu disebut sebagai regresi logistik multinomial

5 Suatu variabel respon dengan M kategori akan membentuk persamaan logit sebanyak M-1 di mana masing-masing persamaan ini membentuk regresi logistik biner yang membandingkan suatu kelompok kategori terhadap kategori pembanding

6 Secara umum model multinomial logit adalah

7 Jika yang digunakan sebagai pembanding adalah kategori M, maka ΞΎM = 0 untuk di mana p adalah banyaknya variabel prediktor, sehingga transformasi logitnya menjadi,

8

9 Multinomial Logit dengan 3 Kategori Respon
Dalam model regresi logistik dengan 3 kategori Y (Y=0,1,2),dibutuhkan 2 fungsi logit dan harus diputuskan kategori respon mana yang menjadi kategori pembanding Misal Y=0 sebagai kategori pembanding untuk membentuk 2 logit (yaitu sebagai pembanding untuk Y=1 dan Y=2) maka

10 Menurut Hosmer dan Lemeshow (2000) untuk mendapatkan model, asumsikan terdapat p variabel prediktor dan n sampel yang dinotasikan sebagai vektor X dengan matrik berukuran n x (p+1)di mana X0=1. Dua fungsi logit dinotasikan sebagai:

11

12

13

14 Bentuk Umum fungsi peluang dengan 3 kategori respon

15 Secara teori, model dengan 3 kategori peubah respon akan menghasilkan dua fungsi logit.
Sebenarnya dapat digunakan pasangan kategori pembanding yang mana saja tergantung dari tujuan yang ingin dicapai dalam penelitian, tetapi menurut Hosmer dan Lemeshow (2000) lebih baik menggunakan kategori 0 sebagai pembanding karena merupakan perluasan dari model dengan dua kategori variabel respon (biner).

16 Pendugaan Parameter Pendugaan parameter dari model logit menggunakan metode maksimum likelihood Untuk membuat fungsi likelihood pada model dengan kategori respon lebih dari 2 (misalnya 3 kategori) hal pertama yang dilakukan adalah membuat 3 variabel biner yang dikode 0 atau 1 untuk menandai group membership (anggota kelompok) pada suatu observasi

17 Dalam kasus ini 3 variabel biner tersebut hanya untuk menjelaskan fungsi likelihood dan bukan digunakan untuk analisis regresi logistik multinomial yang sebenarnya

18

19

20

21

22

23

24

25

26

27

28 Pengujian Terhadap Pendugaan Parameter
Pengujian pendugaan parameter () secara parsial Uji koefisien regresi secara parsial digunakan untuk memeriksa peranan koefisien regresi dari masing-masing variabel prediktor secara individu dalam model. Hipotesis yang digunakan adalah:

29 Pengujian Terhadap Pendugaan Parameter
Statistik uji yang digunakan adalah statistik uji Wald yang dapat ditulis:

30 Pengujian Terhadap Pendugaan Parameter

31 Pengujian Terhadap Pendugaan Parameter

32 Pengujian Terhadap Pendugaan Parameter

33 Pengujian Terhadap Pendugaan Parameter

34 Pengujian Terhadap Pendugaan Parameter

35 Interpretasi Koefisien regresi logistik
Interpretasi dalam regresi logistik menggunakan nilai odds ratio yang menunjukkan perbandingan tingkat kecenderungan dari kategori yang ada dalam satu variabel prediktor. Nilai odds ratio pada respon multinomial menggunakan notasi umum yang digunakan dalam respon biner.

36 Misalnya Y=0 digunakan sebagai kategori pembanding, odd ratio untuk Y=j terhadap Y=0 yang dihitung pada dua nilai adalah

37 pada regresi logistik politomus dengan tiga kategori respon akan terbentuk dua odds ratio.
Yang pertama perbandingan peluang antara respon kategori 1 (Y=1) dengan respon kategori pembanding (Y=0) Yang kedua adalah perbandingan peluang antara respon kategori 2 (Y=2) dengan respon kategori pembanding (Y=0).

38

39 Koefisien Determinasi

40 Contoh Suatu penelitian ingin mengetahui berapa peluang seseorang terkena PJK (Penyakit Jantung Koroner), PJK disertai hipertensi dan PJK disertai hipertensi serta diabetes mellitus. Adapun faktor – faktor yang diduga mempengaruhi terjadinya PJK dan komplikasinya adalah usia, tekanan darah sistole, tekanan darah diastole, kolesterol, HDl, LDL dan Trigliserid. Variabel Respon:

41 Y= 0 (PJK), Y= 1 (PJK disertai hipertensi), Y= 2 (PJK disertai hipertensi dan diabetes mellitus).
Variabel Prediktor: X1 = Usia (tahun) X2 = Tekanan darah sistole (mmHg) X3 = Tekanan darah diastole (mmHg) X4 = Kolesterol (mg/dl) X5 = HDL (mg/dl)

42 X6 = LDL (mg/dl) X7 = Trigliserid (mg/dl)

43 Model regresi logistik multinomial setelah dilakukan transformasi adalah sebagai berikut:
Model regresi logistik yang pertama

44 Model regresi logistik yang kedua adalah

45 Nilai odds ratio model regresi logistik pertama

46 Interpretasi untuk model logistik pertama,
Untuk variabel X1 diperoleh nilai odds ratio sebesar 1.109, berarti setiap bertambahnya 1 tahun usia seseorang yang telah memiliki faktor-faktor resiko PJK akan meningkatkan peluang orang tersebut terkena penyakit jantung koroner sekaligus hipertensi sebesar kali. Untuk variabel X2 dengan nilai odds ratio sebesar berarti dengan bertambahnya 1 57 mmHg tekanan darah sistole akan meningkatkan peluang orang tersebut terkena penyakit jantung koroner sekaligus hipertensi sebesar kali, sedangkan untuk bertambahnya 1 mmHg tekanan darah diastole (X3) akan meningkatkan resiko terkena penyakit jantung serta hipertensi sebesar kali. Untuk variabel kolesterol (X4), mengindikasikan bahwa dengan menurunnya 1 mg/dl kadar kolesterol akan menurunkan resiko terkena penyakit jantung koroner sekaligus hipertensi sebesar kali. Untuk kenaikan 1 mg/dl kadar HDL (X5) akan meningkatkan resiko terkena PJK serta hipertensi sebesar kali. Sedangkan untuk penurunan 1 mg/dl kadar LDL dan kadar trigliserid dapat mengurangi resiko terkena PJK disertai hipertensi berturut turut sebesar kali dan 0.895 kali.

47 Untuk variabel X2 dengan nilai odds ratio sebesar 9
Untuk variabel X2 dengan nilai odds ratio sebesar berarti dengan bertambahnya 1 mmHg tekanan darah sistole akan meningkatkan peluang orang tersebut terkena penyakit jantung koroner sekaligus hipertensi sebesar kali, sedangkan untuk bertambahnya 1 mmHg tekanan darah diastole (X3) akan meningkatkan resiko terkena penyakit jantung serta hipertensi sebesar kali.

48 Untuk variabel kolesterol (X4), mengindikasikan bahwa dengan menurunnya 1 mg/dl kadar kolesterol akan menurunkan resiko terkena penyakit jantung koroner sekaligus hipertensi sebesar kali. Untuk kenaikan 1 mg/dl kadar HDL (X5) akan meningkatkan resiko terkena PJK serta hipertensi sebesar kali.

49 Sedangkan untuk penurunan 1 mg/dl kadar LDL dan kadar trigliserid dapat mengurangi resiko terkena PJK disertai hipertensi berturut turut sebesar kali dan kali.

50 Nilai odds ratio model regresi logistik kedua

51 Interpretasi untuk model logistik kedua, untuk variabel X1 diperoleh nilai odds ratio sebesar 2.659, berarti setiap bertambahnya 1 tahun usia seseorang yang telah memiliki faktor-faktor resiko PJK akan meningkatkan peluang orang tersebut terkena penyakit jantung koroner disertai hipertensi dan diabetes mellitus (DM) sebesar kali.

52 Untuk variabel X2 dengan nilai odds ratio sebesar 6
Untuk variabel X2 dengan nilai odds ratio sebesar berarti dengan bertambahnya 1 mmHg tekanan darah sistole akan meningkatkan peluang orang tersebut terkena penyakit jantung koroner sekaligus hipertensi dan DM sebesar kali,

53 bertambahnya 1 mmHg tekanan darah diastole (X3) akan meningkatkan resiko terkena penyakit jantung disertai hipertensi dan DM sebesar kali variabel kolesterol (X4), mengindikasikan bahwa dengan menurunnya 1 mg/dl kadar kolesterol akan menurunkan resiko terkena penyakit jantung koroner disertai hipertensi dan DM sebesar kali

54 Untuk kenaikan 1 mg/dl kadar HDL (X5) akan meningkatkan resiko terkena PJK disertai hipertensi dan DM sebesar kali. Sedangkan untuk penurunan 1 mg/dl kadar LDL dan kadar trigliserid dapat mengurangi resiko terkena PJK disertai hipertensi dan DM berturut turut sebesar kali dan kali.

55 TERIMA KASIH


Download ppt "ANALISIS DATA KATEGORI"

Presentasi serupa


Iklan oleh Google