Presentasi sedang didownload. Silahkan tunggu

Presentasi sedang didownload. Silahkan tunggu

Generalized Linear Model pada Data Berdistribusi Poisson (Studi kasus : Banyaknya Jumlah kecelakaan lalu lintas berdasarkan faktor jumlah pelanggaran.

Presentasi serupa


Presentasi berjudul: "Generalized Linear Model pada Data Berdistribusi Poisson (Studi kasus : Banyaknya Jumlah kecelakaan lalu lintas berdasarkan faktor jumlah pelanggaran."โ€” Transcript presentasi:

1 Generalized Linear Model pada Data Berdistribusi Poisson (Studi kasus : Banyaknya Jumlah kecelakaan lalu lintas berdasarkan faktor jumlah pelanggaran lalu lintas dan jumlah hari hujan menurut bulan dikota Makassar) TISA H

2 Data Jumlah Kecelakaan lalulintas
PENDAHULUAN Analisis Regresi digunakan untuk mengetahui bentuk hubungan antara Var. Respon dan var. prediktor Analisis Regresi Dist. Normal Data kontinu Data Jumlah Kecelakaan lalulintas Tidak Dist. Normal tetapi berdist. poisson Data Diskrit Uji asumsi yang digunakan GLM tidak mengharuskan asumsi kenormalan dari variabel respon dan kehomogenan dari variansinya GLM Suatu Metode penaksira n parameter yang dapat digunakan untuk menaksir parameter suatu model yang diketahui distribusinya MLE

3 TINJAUAN PUSTAKA 1. Regresi Poisson
komponen utama dalam analisis GLM yaitu dimana variabel dependen memiliki sebaran yang termasuk dalam keluarga eksponensial dan terdapat hubungan antara mean populasi dan prediktor yang dinyatakan oleh fungsi link. Model untuk regresi Poisson pada dasarnya menyatakan rata โ€“ rata dari distribusi yang diskrit (dalam hal ini adalah proses Poisson) sebagai fungsi dari variabel independennya, berikut merupakan fungsi dari distribusi Poisson. ๐‘“ ๐‘ฆ,๐œ‡ = ๐‘’ โˆ’๐œ‡ ๐œ‡ ๐‘ฆ ๐‘ฆ! , ๐‘‘๐‘–๐‘š๐‘Ž๐‘›๐‘Ž ๐‘ฆ=0,1,2,โ€ฆ dengan rata-rata dan varians, ๐ธ ๐‘Œ ๐‘– =๐‘‰๐‘Ž๐‘Ÿ ๐‘Œ ๐‘– = ๐œ‡ ๐‘–

4 TINJAUAN PUSTAKA ๐‘” ๐œ‡ ๐‘– = ๐œ‚ ๐‘– = ๐›ฝ 0 + ๐›ฝ 1 ๐‘ฅ ๐‘–1 + ๐›ฝ 2 ๐‘ฅ ๐‘–2 +โ€ฆ+ ๐›ฝ ๐‘˜ ๐‘ฅ ๐‘–๐‘˜
Poisson pilihan yang tepat, ketika variabel respon ๐‘Œ merupakan bilangan bulat kecil. Model regresi Poisson ditulis sebagai berikut ๐‘ฆ ๐‘– = ๐œ‡ ๐‘– + ๐œ€ ๐‘– , ๐‘–=1,2,โ€ฆ,๐‘› Dalam generalize linear model (GLM), terdapat sebuah fungsi ๐‘” yang linear dan menghubungkan mean dari variabel respon dengan sebuah predictor, yaitu: ๐‘” ๐œ‡ ๐‘– = ๐œ‚ ๐‘– = ๐›ฝ 0 + ๐›ฝ 1 ๐‘ฅ ๐‘–1 + ๐›ฝ 2 ๐‘ฅ ๐‘–2 +โ€ฆ+ ๐›ฝ ๐‘˜ ๐‘ฅ ๐‘–๐‘˜ dimana fungsi penghubung yang digunakan adalah fungsi log yang berbentuk: ๐‘” ๐œ‡ ๐‘– =๐‘™๐‘› ๐œ‡ ๐‘– = ๐‘ฅ ๐‘– ๐‘‡ ๐›ฝ

5 TINJAUAN PUSTAKA Untuk fungsi penghubung log, hubungan antara mean variable respon dengan prediktor linear adalah: ๐‘™๐‘› ๐œ‡ ๐‘– = ๐‘ฅ ๐‘– ๐‘‡ ๐›ฝ ๐‘’ ๐‘™๐‘› ๐œ‡ ๐‘– = ๐‘’ ๐‘ฅ ๐‘– ๐‘‡ ๐›ฝ ๐œ‡ ๐‘– = ๐‘’ ๐‘ฅ ๐‘– ๐‘‡ ๐›ฝ Fungsi penghubung log adalah fungsi yang lebih cocok digunakan, karena fungsi log menjamin bahwa nilai variable yang diharapkan dari variabel responnya akan benilai non negatif. Fungsi penghubung log yaitu ๐‘™๐‘› ๐œ‡ ๐‘– = ๐œ‚ ๐‘– , sehingga fungsi hubungan untuk model regresi Poisson mempunyai logaritma seperti ditunjukkan pada persamaan berikut ini: ln ๐ธ ๐‘ฆ ๐‘ฅ ๐‘– = ln ๐œ‡ ๐‘– = ๐œ‚ ๐‘– = ๐›ฝ 0 + ๐›ฝ 1 ๐‘ฅ ๐‘–1 + ๐›ฝ 2 ๐‘ฅ ๐‘–2 +โ€ฆ+ ๐›ฝ ๐‘— ๐‘ฅ ๐‘–๐‘˜ ๐œ‡ ๐‘– = exp ๐‘ฅ ๐‘– ๐‘‡ ๐›ฝ = exp ๐›ฝ 0 + ๐›ฝ 1 ๐‘ฅ ๐‘–1 + ๐›ฝ 2 ๐‘ฅ ๐‘–2 +โ€ฆ+ ๐›ฝ ๐‘˜ ๐‘ฅ ๐‘–๐‘˜ + ๐œ€ ๐‘–

6 TINJAUAN PUSTAKA 2. Penaksir Parameter dengan
Fungsi peluang ๐‘“ ๐‘ฆ ๐‘– ; ๐œ‡ ๐‘– = ๐‘’ โˆ’ ๐œ‡ ๐‘– ๐œ‡ ๐‘– ๐‘ฆ ๐‘– ๐‘ฆ ๐‘– ! ,๐‘‘๐‘–๐‘š๐‘Ž๐‘›๐‘Ž ๐‘ฆ ๐‘– =0,1,2,โ€ฆ,๐‘› Fungsi likelihood ๐ฟ=๐‘’๐‘ฅ๐‘ ๐‘–=1 ๐‘› โˆ’ ๐œ‡ ๐‘– ๐‘–=1 ๐‘› ( ๐œ‡ ๐‘– ) ๐‘ฆ ๐‘– ๐‘–=1 ๐‘› ( ๐‘ฆ ๐‘– !) โˆ’1 Fungsi ln- likelihood dengan ๐‘™=lnL diperoleh ; ๐‘™=๐‘™๐‘› exp ๐‘–=1 ๐‘› โˆ’ ๐œ‡ ๐‘– ๐‘–=1 ๐‘› ( ๐œ‡ ๐‘– ) ๐‘ฆ ๐‘– ๐‘–=1 ๐‘› ( ๐‘ฆ ๐‘– !) โˆ’1 = ๐‘–=1 ๐‘› โˆ’ ๐œ‡ ๐‘– + ๐‘–=1 ๐‘› ๐‘ฆ ๐‘– ๐‘™๐‘› ๐œ‡ ๐‘– โˆ’ ๐‘–=1 ๐‘› ๐‘™๐‘› ๐‘ฆ ๐‘– ! dengan ๐œ‡ ๐‘– =exp( ๐‘‹ ๐‘– ๐‘‡ ๐›ฝ)=exp ๐›ฝ 0 + ๐›ฝ 1 ๐‘ฅ ๐‘–1 +โ€ฆ+ ๐›ฝ ๐‘˜ ๐‘ฅ ๐‘–๐‘˜ dengan mengikuti persamaan diatas dapat dinyatakan ๐‘™=โˆ’ ๐‘–=1 ๐‘› exp( ๐‘‹ ๐‘– ๐‘‡ ๐›ฝ) + ๐‘–=1 ๐‘› ๐‘ฆ ๐‘– ๐‘‹ ๐‘– ๐‘‡ ๐›ฝ โˆ’ ๐‘–=1 ๐‘› ln ๐‘ฆ ๐‘– !

7 TINJAUAN PUSTAKA Syarat cukup agar fungsi ln-likelihood (4.4) mencapai nilai maksimum adalah ๐๐’ ๐๐œท =0 Selanjutnya dihitung ๐œ•๐‘™ ๐œ• ๐›ฝ 0 = ๐‘–=1 ๐‘› ๐‘ฆ ๐‘– ๐‘ฅ ๐‘–0 โˆ’ ๐‘–=1 ๐‘› exp( ๐‘‹ ๐‘– ๐‘‡ ๐›ฝ) . ๐‘ฅ ๐‘–0 =0 ๐œ•๐‘™ ๐œ• ๐›ฝ 1 = ๐‘–=1 ๐‘› ๐‘ฆ ๐‘– ๐‘ฅ ๐‘–1 โˆ’ ๐‘–=1 ๐‘› exp( ๐‘‹ ๐‘– ๐‘‡ ๐›ฝ) . ๐‘ฅ ๐‘–1 =0 โ‹ฎ ๐œ•๐‘™ ๐œ• ๐›ฝ ๐‘˜ = ๐‘–=1 ๐‘› ๐‘ฆ ๐‘– ๐‘ฅ ๐‘–๐‘˜ โˆ’ ๐‘–=1 ๐‘› exp( ๐‘‹ ๐‘– ๐‘‡ ๐›ฝ) . ๐‘ฅ ๐‘–๐‘˜ =0 Dari persamaan diatas diperoleh persamaan umum sebagai berikut ; ๐œ•๐‘™ ๐œ• ๐›ฝ ๐‘— = ๐‘–=1 ๐‘› ๐‘ฆ ๐‘– ๐‘ฅ ๐‘–๐‘— โˆ’ ๐‘–=1 ๐‘› exp( ๐‘‹ ๐‘– ๐‘‡ ๐›ฝ) . ๐‘ฅ ๐‘–๐‘— =0 Persamaan diatas masih berbentuk implisit sehingga tidak dapat diselesaikan secara analitik. Untuk mengestimasi vektor parameter ๐›ฝ dari persamaan diatas digunakan langkah-langkah numerik dengan iterasi.

8 Uji Kesesuaian Model (Uji Deviance)
TINJAUAN PUSTAKA Uji Kesesuaian Model (Uji Deviance) Uji kelayakan model untuk fungsi regresi poisson tergeneralisasi didasarkan pada statistik D ( uji deviance), dengan rumus; Statistik uji deviance dilakukan dengan langkah-langkah sebagai berikut : Menulis hipotesis ๐ป 0 dan ๐ป 1 yang digunakan dalam menguji kesesuaian model regresi poisson, yaitu : ๐ป 0 : ๐œ‡ ๐‘– =0 (Model regresi poisson tidak sesuai atau tidak layak digunakan pada data kecelakaan) ๐ป 1 : ๐œ‡ ๐‘– โ‰ 0 (Model regresi poisson sesuai atau layak digunakan pada data kecelakaan) . 2. Menghitung nilai deviance, yaitu : ๐ท(๐‘ฆ,๐œ‡ฬ‚)=2[๐‘™(๐‘ฆ)โˆ’๐‘™(๐œ‡ฬ‚)] 3. Menghitung statistik uji deviance, yaitu tolak ๐ป 0 jika diperoleh : ๐ท(๐‘ฆ,๐œ‡ฬ‚)> ๐‘‹ 2 (๐‘›โˆ’๐‘)(๐‘Ž)

9 METODE ANALISIS 1. Sumber data
Data yang digunakan dalam penelitian ini merupakan data sekunder yang diperoleh dari Jurnal yaitu Makassar dalam Angka Tahun , tentang โ€œJumlah Kecelakaan Lalu Lintas Menurut Bulan di kota Makassarโ€, โ€œJumlah pelanggaran Lalu Lintas Menurut Kelompok Sosial Dikota Makassarโ€, dan โ€œJumlah Hari Hujan Menurut Bulan Di kota Makassarโ€ 2. Identifikasi variabel Adapun variabel yang digunakan dalam penelitian ini yaitu; Variabel Respon Yang menjadi variabel respon dalam penelitian ini adalah ; Jumlah kecelakaan lalu lintas pada tahun dikota Makassar. (Y) Variabel Prediktor Yang menjadi variabel prediktor dalam penelitian ini ada 2 yaitu : Jumlah pelanggaran lalu lintas. (X1) Kondisi lingkungan (jumlah hari hujan). (X2)

10 METODE ANALISIS 3. Tahapan Analisis
a. Mengasumsikan berdistribusi Poisson. b. Menentukan fungsi likelihood dari langkah (a). c. Menentukan fungsi ln-likelihood dari langkah (b). d. Mengestimasi parameter ๐›ฝ dengan langkah-langkah sebagai berikut: # Mendiferensialkan hasil ln-likelihood dari langkah (d) terhadap parameter ๐›ฝ # Hasil dari diferensial pada langkah (i) disamakan dengan nol sebagai syarat perlu untuk memaksimumkan fungsi ln-likelihood dan diselesaikan. # Melakukan pendekatan iterasi, karena pada langkah (ii) masih diperoleh persamaan yang berbentuk implisit. e. Menggunakan uji signifikan paramater dengan menggunakan uji p-value dengan a= 0,05 . f. Menggunakan uji kesesuaian model regresi poisson dengan menggunakan statistik uji deviance. g. Kesimpulan

11 GAMBAR PROSEDUR KERJA DATA Uji variabel respon (Y) dengan
Uji Kolmogrov-Smirnov Metode MLE Menaksir Parameter (ฮฒj) Uji Signifikan Parameter Uji P-Value Uji goodness of fit (Deviance) Uji Kesesuaian Model Model terbaik

12 HASIL ANALISIS DATA 1. Uji variabel respon dengan menggunakan uji kolmogrov- smirnov Hipotesis H0: Jumlah kecelakaan lalu lintas berdistribusi Poisson. H1: Jumlah kecelakaan lalu lintas tidak berdistribusi Poisson. Untuk mengambil kesimpulan apakah respon berdistribusi poisson atau tidak itu dapat diuji dengan melihat nilai Asymp. Sig.(2-tailed) yang dibandingkan dengan a = 5% = 0,05. Terlihat pada output diatas dengan taraf signifikansi diperoleh nilai asymp.sig.(2-tailed) atau p-value = 0,283 > a = 0,05 , maka H0 diterima. Sehingga dapat disimpulkan bahwa jumlah kecelakaan pada tahun berdistribusi Poisson.

13 HASIL ANALISIS DATA 2. Bentuk Model dengan 2 variabel prediktor
๐‘ฆ ๐‘– = ๐œ‡ ๐‘– = exp ๐›ฝ 0 + ๐›ฝ 1 ๐‘‹ ๐‘–1 + ๐›ฝ 2 ๐‘‹ ๐‘–2 + ๐œ€ ๐‘– 3. Menaksir parameter ๐›ฝ 0 , ๐›ฝ 1 , ๐›ฝ 2 dengan menggunakan teknik iterative

14 HASIL ANALISIS DATA 4. Uji signifikan parameter ๐ป 0 = ๐›ฝ ๐‘— =0 , ๐‘—=1,2
Hipotesis : ๐ป = ๐›ฝ ๐‘— = , ๐‘—=1,2 ๐ป = ๐›ฝ ๐‘— โ‰  ,๐‘—=1,2 Uji signifikansi parameter ( dilakukan secara parsial dengan membandingkan p-value( nilai sig) dengan ๐›ผ=0,05

15 HASIL ANALISIS DATA ๐’š ๐’Š = ๐ ๐’Š =๐ž๐ฑ๐ฉ(๐Ÿ’,๐Ÿ“๐Ÿ“๐Ÿ+๐ŸŽ,๐ŸŽ๐ŸŽ๐ŸŽ๐ŸŽ๐Ÿ–๐Ÿ’ ๐‘ฟ ๐’Š๐Ÿ โˆ’๐ŸŽ,๐ŸŽ๐ŸŽ๐Ÿ– ๐‘ฟ ๐’Š๐Ÿ )
Masing parameter (๐›ฝ 0 , ๐›ฝ 1 ,๐‘‘๐‘Ž๐‘› ๐›ฝ 2 ) memiliki nilai p-value (sig.) masing-masing adalah (0,000)(0,011)(0,000) yang berarti p-value (sig.) < a = 0,05 sehingga H0 ditolak yang berarti semua parameter signifikan berpengaruh terhadap variabel respon. Sehingga bentuk model regresi poissonnya adalah sebagai berikut ; Model ๐’š ๐’Š = ๐ ๐’Š =๐ž๐ฑ๐ฉ(๐Ÿ’,๐Ÿ“๐Ÿ“๐Ÿ+๐ŸŽ,๐ŸŽ๐ŸŽ๐ŸŽ๐ŸŽ๐Ÿ–๐Ÿ’ ๐‘ฟ ๐’Š๐Ÿ โˆ’๐ŸŽ,๐ŸŽ๐ŸŽ๐Ÿ– ๐‘ฟ ๐’Š๐Ÿ ) Model diatas menjelaskan bahwa jumlah kecelakaan lalu lintas akan bertambah sebesar exp(0,000084) jika variabel ๐‘‹ ๐‘–1 bertambah sebesar satu satuan dengan syarat variabel prediktor yang lain konstan. Kemudian jumlah kecelakaan lalu lintas akan berkurang sebesar exp(-0,008) jika variabel ๐‘‹ ๐‘–2 berkurang sebesar satu satuan dengan syarat variabel prediktor yang lain adalah konstan.

16 HASIL ANALISIS DATA 5. Uji Kelayakan Model dengan statistik uji Deviance Hipotesis H0 : Model regresi poisson tergeneralisasi tidak layak digunakan pada data kecelakaan. H1 : Model regresi poisson tergeneralisasi layak digunakan pada data kecelakaan Terlihat pada output disamping bahwa nilai Deviance pada analisis ini adalah 114,948 sedangkan ๐‘ฅ (0,05;21) 2 =32,7. Karena nilai ๐ท=114,948> ๐‘ฅ (0,05;21) 2 =32,7 maka ๐ป 0 ditolak artinya pada taraf signifikan ๐›ผ=0,05 paling tidak ada satu peubah yang berpengaruh terhadap jumlah kecelakaan lalu lintas.

17 KESIMPULAN Hasil penerapan program estimasi model regresi Poisson pada data Jumlah Kecelakaan Lalu Lintas, Korban Jiwa dan Kerugian yang ditimbulkan Menurut Bulan di kota Makassar diperoleh model dugaan sebagai berikut : ๐‘ฆ ๐‘– = ๐œ‡ ๐‘– =expโก(4,552+0, ๐‘‹ ๐‘–1 โˆ’0,008 ๐‘‹ ๐‘–2 ) Dengan uji kesesuaian model diperoleh nilai ๐ท(๐‘ฆ,๐œ‡ฬ‚)= 114,948 dan ๐‘ฅ (0,05;21) 2 =11,59. Karena ๐ท ๐‘ฆ, ๐œ‡ > ๐‘ฅ (0,05;21) 2 diperoleh keputusan tolak ๐ป 0 pada tingkat kepercayaan 95% . Jadi model dugaan sesuai dan layk digunakan pada data.

18 TERIMA KASIH


Download ppt "Generalized Linear Model pada Data Berdistribusi Poisson (Studi kasus : Banyaknya Jumlah kecelakaan lalu lintas berdasarkan faktor jumlah pelanggaran."

Presentasi serupa


Iklan oleh Google