Presentasi sedang didownload. Silahkan tunggu

Presentasi sedang didownload. Silahkan tunggu

ORDINAL REGRESSION KELOMPOK 4 / 3SE1 AKBAR DARMAWAN BAKRI MALIK AHMAD ISMAEL IDHO NAJIBULAH Y. S. KARINA ASTUTI SUNDARI TIARA SETYATI.

Presentasi serupa


Presentasi berjudul: "ORDINAL REGRESSION KELOMPOK 4 / 3SE1 AKBAR DARMAWAN BAKRI MALIK AHMAD ISMAEL IDHO NAJIBULAH Y. S. KARINA ASTUTI SUNDARI TIARA SETYATI."— Transcript presentasi:

1 ORDINAL REGRESSION KELOMPOK 4 / 3SE1 AKBAR DARMAWAN BAKRI MALIK AHMAD ISMAEL IDHO NAJIBULAH Y. S. KARINA ASTUTI SUNDARI TIARA SETYATI

2 Menggunakan Regresi Ordinal dalam Credit scoring model  Seorang kreditor ingin mengetahui apakah peminjam memiliki risiko kredit yang baik  Telah diketahui beragam informasi keuangan dan pribadi peminjam  Dari database nasabah, kreditor menetapkan variabel respon “status account ” dalam lima kategori yaitu :  Tidak ada catatan hutang  Tidak sedang berhutang  Sedang dalam proses pembayaran hutang  Melewati jatuh tempo pembayaran hutang  Kritis / Memiliki catatan buruk di Bank  Variabel Prediktor terdiri dari :  Usia  Banyak kredit di bank  Tipe Rumah  Jangka waktu berhutang (dalam bulan)  Hutang lain yang menjadi tanggungan

3 Data yang Digunakan sampel SPSS : german_credit.sav

4 Running Data Klik Analyze >> Regression >> Ordinal

5 Running Data Isikan Variabel Dependen “Account Status” Masukkan Variabel kategorik dalam Kotak Factor(s) Banyak kredit di bank Tipe Rumah Hutang lain yang menjadi tanggungan Masukkan Variabel non Kategorik sebagai kovariat Usia Jangka Waktu Pinjaman

6 Running Data Pada menu output, centang “Test of parallel lines” untuk mengetahui apakah semua parameter data kategorik memiliki slope/parameter sama

7 Hasil Dari hasil, muncul peringatan bahwa terdapat 78,3% cell yang berfrekuensi nol. Sedangkan tabel di bawah menunjukkan ringkasan data yang diolah. Semua data valid untuk digunakan.

8 Hasil Melalui tabel Model Fitting Information, kita dapat mengetahui apakah model dengan prediktor (model final) memberikan pengaruh yang signifikan terhadap model yang hanya menggunakan intercept saja. Dari tabel di samping, terlihat bahwa p-value kurang dari 0,05; sehingga dapat disimpulkan bahwa model dengan prediktor memberikan hasil yang lebih baik daripada model dengan intercept saja. Pengujian ini bertujuan untuk menguji apakah data yng diobservasi tidak konsisten dengan model yang di-fitkan. Jika nilai p-value besar, maka dapat disimpulkan bahwa data dan prediksi dari model mirip => model yang dibuat baik. Tetapi karena terdapat banyak sel-sel yang kosong, sehingga tidak dapat dipastikan apakah statistik mengikuti dist. Chi square, memungkinkan nilai p- value yang didapatkan tidak akurat.

9 Hasil Pendekatan nilai R2 dengan menggunakan berbagai metode menghasilkan nilai yang tidak terlalu besar. Yang dapat diartikan bahwa variabel respon yang dijelaskan variabel-variabel prediktor tidak terlalu besar. Terlihat bahwa variabel prediktor yang signifikan mempengaruhi variabel respon adalah: Jangka waktu berhutang Usia Banyak hutang =1 Hutang lain yang menjadi tanggungan

10 Hasil Dari pengujian Parallel Lines di atas, telihat bahwa p-value signifikan, dapat disimpulkan bahwa parameter lokasi (koef. slope) tidak sama untuk semua kategori respon. Sehingga asumsi bahwa parameter sama untuk semua kategori tidak berlaku.

11 Persamaan dan Interptretasi (≤0/(>0)= -4,631-0,011duration+0,0163age-2,007numcred-1,0384othstal-0,188housng Interpretasi: Tanda (-) pada variabel duration berarti peminjam yang memiliki jangka waktu berhutang lebih lama memiliki kecenderungan lebih kecil untuk memiliki status account “tidak ada catatan hutang” (dibandingkan minimal status account “kritis”). Tanda (-) pada variabel numcred berarti peminjam yang memiliki hutang sebanyak 1, cenderung lebih kecil untuk memiliki status account “tidak ada catatan hutang” (dibandingkan minimal status account “kritis”). Tanda (-) pada variabel othstal berarti peminjam yang memiliki hutang lain di bank (kategori 1) memiliki kecenderungan lebih kecil untuk memiliki status account “tidak ada catatan hutang” (dibandingkan minimal status account “kritis”). Tanda (-) pada variabel housng berarti peminjam yang status perumahannya sewa (kategori 1) memiliki kecenderungan lebih kecil untuk memiliki status account “tidak ada catatan hutang” (dibandingkan minimal status account “kritis”).

12 Persamaan dan Interptretasi (2) Koef. Variabel duration = -0,011, berarti peminjam yang memiliki jangka waktu berhutang lebih lama memiliki kecenderungan sebesar 0,989 untuk memiliki status account “tidak ada catatan hutang” (dibandingkan minimal status account “kritis”). Koef. Variabel age = 0,016, peminjam yang memiliki usia lebih tua memiliki kecenderungan 1,016 untuk memiliki status account “tidak ada catatan hutang” (dibandingkan minimal status account “kritis”). Koef. Variabel numcred = -0,2007, berarti peminjam yang memiliki hutang sebanyak 1 (kategori 1) memiliki kecenderungan 0,134 untuk memiliki status account “tidak ada catatan hutang” (dibandingkan minimal status account “kritis”). Koef. Variabel othstal = -1,038, berarti peminjam yang memiliki pinjaman lain di bank (kategori 1) memiliki kecenderungan 0,354 untuk memiliki status account “tidak ada catatan hutang” (dibandingkan minimal status account “kritis”). Koef. Variabel housng = -0,188, berarti peminjam yang memiliki status perumahan sewa (kategori 1) memiliki kecenderungan 0,828 untuk memiliki status account “tidak ada catatan hutang” (dibandingkan minimal status account “kritis”).

13  Alzira Doutel  Ayu Paramudita  Fanisa Dwita Hanggarani  Hari Akhiardy Tofri  Rezky Mayda Putri  Rizki Tri Anggara

14 Sebuah studi bertujuan untuk melihat faktor- faktor yang mempengaruhi Confidence in Education. Variabel yang di teliti meliputi : Get news from newspapers, Get news from news magazines, Get news from televisions, Get news from radios, dan Get news from internets.

15 Marginal Percentage bernilai 100% menunjukkan semua data valid digunakan.

16 Nilai significant sebesar 0,000 < α (α=5 %), menunjukkan bahwa model dengan variabel bebas lebih baik dari model tnpa variabel bebas.

17 Ho : Model yang digunakan cocok. H 1 : Model yang digunakan tidak cocok. Hasil menunjukkan bahwa nilai significant atau p-value > α, yg berarti model regresi telah cocok.

18

19 Get news from newspapers dan Get news from internet significant mempengaruhi Confidence Education.

20 Tujuan dari Test of Parallel Lines adalah untuk menguji apakah koefisien slope sama untuk semua kategori variabel respon. H o : Koefisien slope sama untuk semua variabel respon. H 1 : Koefisien slope tidak sama untuk semua variabel respon.

21 KELOMPOK 2 ALIFIA NIDYA HAPSARI ( ) FARIDATUN NIHAYAH ( ) EMILIA ANISA ( ) M. FIKRI ANWAR ( ) RAISSA SAMANTHA H ( ) RISMA KARLIA ( )

22 Regresi Logistik Ordinal Data : α = 0,05 Sumber : 1991,General Social Survey Jenis Kelamin Pendapatan Kepuasan Pekerjaan (dollars)Sangat Tidak Puas Agak Tidak Puas Agak PuasSangat Puas Perempuan < > Laki-laki < >

23 Variabel Dependent (Respon) : Kepuasan pekerjaan (Job) 1 = Sangat tidak puas (very dissatisfied) 2 = Agak tidak puas ( A little satisfied) 3 = Agak puas (moderately satisfied) 4 = Sangat puas (very satisfied) Variabel Independent (Predictors) : Jenis Kelamin(Gender) 0 = laki-laki (male) 1 = perempuan (female) Pendapatan (Income) 1 = < = – = – = >

24 Output Semua data valid Case Processing Summary N Marginal Percentage Jobvery dissatified 43.8% a little satisfied % moderately satisfied % very satisfied % Gendermale % female % Income< % % % > % Valid % Missing 0 Total 104

25 Output (2) H0 : Model dengan variabel bebas dan tanpa variabel bebas(hanya intersep) sama baiknya H1 : Model dengan variabel bebas lebih baik daripada tanpa variabel bebas(hanya intersep) Nilai sig. sebesar < α (0,05) menunjukkan bahwa model dg variabel bebas lebih baik dari model tanpa variabel bebas (hanya intersep). Model Fitting Information Model-2 Log LikelihoodChi-SquaredfSig. Intercept Only Final Link function: Logit.

26 Output (3) H0 : Model yang digunakan dapat menjelaskan variabel bebas H1 : Model yang digunakan belum dapat menjelaskan variabel bebas Karena kedua nilai sig. > α (0,05) maka model yang digunakan dapat menjelaskan variabel bebas Goodness-of-Fit Chi-SquaredfSig. Pearson Deviance Link function: Logit.

27 Output (4) Merupakan perkiraan/pendekatan untuk R2 seperti pada regresi OLS pada model non linier. (pada model non linier tidak bisa dihitung R2 scr langsung spt pada model regresi OLS). Untuk nilai cox and snell : variabel predictors dapat menjelaskan variasi dari variabel respon sebesar 9,3% Pseudo R-Square Cox and Snell.093 Nagelkerke.107 McFadden.047 Link function: Logit.

28 Output (5) Parameter Estimates EstimateStd. ErrorWalddfSig. 95% Confidence Interval Lower BoundUpper Bound Threshold[Job = 1] [Job = 2] [Job = 3] Location[Gender=0] [Gender=1] 0a0a [Income=1] [Income=2] [Income=3] [Income=4] 0a0a Link function: Logit. a. This parameter is set to zero because it is redundant.

29 Output (6) H0 : koefisien slope paralel H1 : koefisien slope tidak paralel Karena nilai sig. 0,892 > α (0,05) maka koefisien adalah paralel atau sama untuk setiap kategori variabel respon sehingga modelnya benar Test of Parallel Lines a Model-2 Log LikelihoodChi-SquaredfSig. Null Hypothesis General The null hypothesis states that the location parameters (slope coefficients) are the same across response categories. a. Link function: Logit.

30 MODEL REGRESI LOGISTIK ORDINAL KELOMPOK 3

31 Seorang mahasiswa STIS melakukan suatu penelitian yang bertujuan untuk mengetahui faktor- faktor yang dapat mempengaruhi minat belajar mahasiswa pada semester 2. Studi ini dilakukan pada 20 orang mahasiswa. Penilaian terhadap minat tersebut dikualifikasikan menjadi tidak minat,minat dan minat sekali. Beberapa variabel yang awalnya yang dinilai dapat mempengaruhi minat belajar mahasiswa tersebut adalah jenis kelamin,IPK semester 1 dan ikut tidaknya mahasiswa pada kegiatan non akademik. Contoh : Seorang mahasiswa STIS melakukan suatu penelitian yang bertujuan untuk mengetahui faktor- faktor yang dapat mempengaruhi minat belajar mahasiswa pada semester 2. Studi ini dilakukan pada 20 orang mahasiswa. Penilaian terhadap minat tersebut dikualifikasikan menjadi tidak minat,minat dan minat sekali. Beberapa variabel yang awalnya yang dinilai dapat mempengaruhi minat belajar mahasiswa tersebut adalah jenis kelamin,IPK semester 1 dan ikut tidaknya mahasiswa pada kegiatan non akademik.

32   Variabel-variabel 1. Dependent : Minat belajar mahasiswa tidak minat (0) minat (1) minat sekali (2) 2. Independent : - Jenis kelamin perempuan (0) laki-laki (1) - IP semester 1 (kuantitatif) - kegiatan non akademik tidak ikut (0) ikut (1)

33 Hasil dan Pembahasan (SPSS) 1 Hasil dan Pembahasan (SPSS) 1 Berdasarkan output SPSS di atas,nilai valid 100% menyatakan bahwa data-data yang ada valid dan dapat dapat diteliti lebih lanjut.

34 Pemilihan model Hipotesis H0: Model tanpa variabel bebas H1: Model dengan varibel bebas α = 5 % Berdasarkan output SPSS di atas,nilai signifikan 0,007 dimana lebih kecil dari nilai α (0,05) berarti keputusannya menolak H0, yang menunjukkan bahwa model dengan variabel bebas lebih baik daripada model tanpa variabel bebas.

35 Hipotesis H0 : Model cocok H1 : Model tidak cocok α =5% Berdasarkan output SPSS diatas,nilai signifikannya lebih besar dari nilai α,yang berarti model yang digunakan cocok. KECOCOKAN MODEL Hipotesis H0 : Model cocok H1 : Model tidak cocok α =5% Berdasarkan output SPSS diatas,nilai signifikannya lebih besar dari nilai α,yang berarti model yang digunakan cocok.

36 Hasil output SPSS di atas merupakan beberapa nilai perkiraan/pendekatan untuk seperti pada regresi OLS pada model non linier. (pada model non linier tidak bisa dihitung R2 scr langsung spt pada model regresi OLS). Dari output tersebut terlihat bahwa besarnya pengaruh variabel2 independent terhadap variasi dari variabel dependent adalah 45,1% dan sisanya di pengaruhi oleh faktor lain.

37 Jenis kelamin,IP semester 1 dan keikutsertaan dalam kegiatan non akademik signifikan (pd α = 5%) mempengaruhi minat belajar mahasiswa pada semester 2.

38 Test of Parallel Lines Test of Parallel Lines Hipotesis Ho : koefisien slopenya sama H 1 : koefisien slopenya tidak sama Berdasarkan output SPSS di atas,nilai signifikan lebih besar dari nilai α (0,05),yaitu menerima Ho dimana slope yang digunakan adalah berdasarkan kategori yang cocok atau koefisien yang digunakan sama.

39 PENULISAN PERSAMAAN DAN INTERPRETASI Persamaan regresi logistik ordinal: (≤0/(>0)=14,062−1,135 jeniskelamin-0,439kegnonakdmik +4,675IPKs1 (≤1/(>1)=17,931−1,135jeniskelamin-0,439kegnonakdmik+4,675IPKs1 interpretasi: - mahasiswa pada semester 2 yang memiliki minat belajar tersebut lebih besar exp(3,869) kali dibandingkan mahasiswa yang yang tidak memiliki minat belajar,dengan tanpa dipengaruhi oleh faktor lain. - tanda (-) pada variabel jenis kelamin berarti mahasiswa yang bejenis kelamin perempuan cenderung lebih besar exp(-1,135)kali minatnya untuk belajar dibandingkan dengan mahasiswa yang berjenis kelamin laki-laki. - tanda (-) pada variabel aktif dalam kegiatan non akademik berarti mahasiswa yang tidak mengikuti kegiatan non akademik minatnya untuk belajar cenderung lebih besar exp(-0,439)kali dibandingkan dengan mahasiswa yang mengikuti kegiatan non akademik. -Tanda (+) pada variabel IP semester 1 berarti semakin besar nilai IP mahasiswa pada semester 1 maka semakin besar pula minat mahasiswa untuk belajar pada semester 2.

40 TERIMA KASIH

41 ANALISIS DATA KATEGORIK MODEL REGRESI LOGISTIK ORDINAL Kelompok 5 1.Adelina Namira 2.Amelia Tangdilambi 3.Friska S 4.Resti Deni Mira 5.Teguh Haryono 6.Ulfa

42 CONTOH SOAL Sebuah studi bertujuan untuk melihat faktor-faktor yang mempengaruhi 30 mahasiswa mudah terkena penyakit selama sebulan terakhir (masing-masing berkode 0=sangat sering, 1=sering, 2=jarang, dan 3=tidak pernah). Variabel yang diteliti ialah banyaknya konsumsi vitC (gram), jumlah jam istirahat, bnyaknya makan nasi per hari (kali), dan jam istirahat malam (masing-masing berkode 0 untuk ≤ pukul 20.00, 1 untuk , 2 untuk , 3 untuk , dan 4 untuk > 02.00)

43 DATA

44 OUTPUT -Valid 100% menyatakan semua data valid -Pada final terdapat signifikansi sebesar 0.031, yang menyatakan kurang dari alpha 0.05, sehingga menunjukkan bahwa model dengan variabel bebas lebih baik daripada model tanpa variabel bebas -Untuk menguji hipotesis: Ho: Model cocok vs H1: model tidak cocok Hasil menunjukkan terima Ho karena nilai sig p-value > alpha (0.05) yang berarti model regresi cocok

45 OUTPUT (LANJUTAN) -Nilai Pseudo R-square merupakan perkiraan/pendekatan untuk Rsquare seperti pada regresi OLS pada model non linear. -Terdapat banyak jenis pseudo Rsquare, dan masing-masing akan memberikan nilai perkiraan yang berbeda -Pada nilai parameter estimasi, hanya variabel vitC yang signifikan mempengaruhi seorang mahasiswa terkena penyakit -Untuk test of parallel lines: Ho: koefisien slope sama untuk setiap kategori variabel respon H1: koefisien slope tidak sama untuk setiap kategori variabel respon Keputusan: sig > maka terima Ho atau koefisen slope sama untuk setiap kategori variabel respon

46 PENULISAN PERSAMAAN

47 INTERPRETASI  Koefiesien variabel vitC = -0,274, berarti konsumsi vitC (per gram) mengakibatkan kecendrungan pengaruh sebesar 0.76 kali lebih besar daripada variabel lainnya terhadap menyebabkan penyakit  Koefiesien variabel rata2 jumlah jam tidur = -0,656, berarti rata2 jmlh jam tidur mengakibatkan kecendrungan sebesar kali lebih besar dari pada variabel lainnya untuk menyebabkan penyakit  Koefiesien variabel rata2 bnyak makan nasi= -0,351, berarti rata2 bnyak makan nasi mengakibatkan kecendrungan sebesar kali lebih besar dari pada variabel lainnya untuk menyebabkan penyakit

48 INTERPRETASI (LANJUTAN)  Koefisien variabel rata2 jam tidur malam pada ≤ pukul = 2,046, berarti seseorang yg memiliki rata2 jam tidur ≤ memiliki kecendrungan 7,7368 kali lebih besar dibandingkan yang memiliki jam tidur lainnya.  Koefisien variabel rata2 jam tidur malam pada antara pukul – = 0,633, berarti seseorang yg memiliki rata2 jam tidur antara pukul – memiliki kecendrungan 1,883 kali lebih besar dibandingkan yang memiliki jam tidur lainnya.  Koefisien variabel rata2 jam tidur malam pada antara pukul – = -1,254, berarti seseorang yg memiliki rata2 jam tidur antara pukul – memiliki kecendrungan 0,285 kali lebih besar dibandingkan yang memiliki jam tidur lainnya.

49 DEWI MAULIZAR ESTERIA SIAGIAN JULMIATI MUH. SYAIFUL YESDI CALVIN KELOMPOK 6

50 Data

51 Hasil output Warnings There are 357 (54,1%) cells (i.e., dependent variable levels by combinations of predictor variable values) with zero frequencies. Menunjukan data kuantitatif/kontinu

52 Hasil output Case Processing Summary N Marginal Percentage applytidak ingin22055,0% keinginan kuat 14035,0% sangat kuat4010,0% Valid400100,0% Missing0 Total400 Menunjukan semua data valid

53 Model Fitting Information ModelModel -2 Log LikelihoodChi-SquaredfSig. InterceptOnlyInterceptOnly 557,272 FinalFinal 533,09124,1803,000 Sig 0,000 menunjukkan model dengan variabel variabel bebas lebih baik daripada tanpavariabel bebas

54 Nilai sig lebih besar dari 5%, berarti model regresi cocok Goodness-of-Fit Chi-SquaredfSig. Pearson400,843435,878 Deviance400,749435,879

55 Pseudo R-Square Cox and Snell,059 Nagelkerke,070 McFadden,033

56 Pared dan gpa signifikanmempengaruhi keinginan melanjutkan studi Parameter Estimates EstimateStd. ErrorWalddfSig. 95% Confidence Interval Lower Bound Upper Bound Threshold[apply =,00] 2,203,7847,8901,005,6663,741 [apply = 1,00] 4,299,80928,2241,0002,7135,885 Locationpared1,048,26815,2311,000,5221,574 public-,059,289,0411,839-,624,507 gpa,616,2635,4991,019,1011,130

57 Test of Parallel Lines a Model -2 Log LikelihoodChi-SquaredfSig. Null Hypothesis 533,091 General529,0774,0143,260


Download ppt "ORDINAL REGRESSION KELOMPOK 4 / 3SE1 AKBAR DARMAWAN BAKRI MALIK AHMAD ISMAEL IDHO NAJIBULAH Y. S. KARINA ASTUTI SUNDARI TIARA SETYATI."

Presentasi serupa


Iklan oleh Google