Upload presentasi
Presentasi sedang didownload. Silahkan tunggu
Diterbitkan olehSuryadi Hadiman Telah diubah "6 tahun yang lalu
1
Peramalan Data Wisatawan Candi Ratu Boko, Yogyakarta
Oleh : Mila Isti Riani ( ) Dinda Kartika ( ) Dian Sukma Pratiwi ( ) Arum Hana Zafirah ( )
2
Tahapan Peramalan ARIMA
1 Statistika Deskriptif 2 Identifikasi : Time Series Plot 3 Ke-stasioneran Data : Variansi (Box Cox Transformation) Mean (Time Series Plot) 4 Pemilihan Model ARIMA yang Memungkinkan 5 Estimasi Parameter Model ARIMA Menggunakan Metode Least Square 6 Pengujian Diagnostik : Ljung Box (Uncorrelated) Anderson Darling (Normality) 7 Perbandingan Nilai Akurasi Model ARIMA untuk Pemilihan Model Terbaik 8 Peramalan Wisatawan Candi Ratu Boko (12 periode kedepan) 9 Kesimpulan
3
Statistika Deskriptif
Berikut ini adalah statistika deskriptif untuk data wisatawan Candi Ratu Boko : Rentang waktu mulai Januari 2009 – Mei 2015 𝑿 𝒕 : Peubah Acak yang menyatakan Jumlah Wisatawan di Candi Ratu Boko, Yogyakarta dalam bulan. Pada Graphical Summary, dapat disimpulkan : HISTOGRAM : Data Wisatawan banyak menumpuk di nilai yang kecil sehingga mengindikasikan data mengalami skewness kanan, yaitu nilai mean > median. Selain itu, data juga berbentuk mesokurtik. BOXPLOT : Terdapat 2 observasi yang merupakan outlier salah satunya adalah klaim yang terjadi pada bulan Agustus dan Desember 2014. 95% CONFIDENCE INTERVAL : Sedangkan untuk 95% CI menggambarkan selang kepercayaan sebesar 95% memuat nilai mean yang sebenarnya berada pada selang : < 𝜇 < 12705, begitu juga untuk median dan standard deviasi dapat dilihat pada Grafik. ANDERSON-DARLING TEST : Menggambarkan bahwa dengan taraf keyakinan > 95% (p-value : <0,05) data mengikuti suatu distribusi tertentu.
4
Time Series Plot Berdasarkan Time Series plot menunjukkan data belum stasioner dalam mean dan variansi. Akan dilakukan pengujian kestasioneran dalam variansi dan mean.
5
Stasioner dalam Variansi
Akan digunakan pengujian stasioner dalam variansi menggunakan Box Cox Transformation. (Menggunakan ln) Apabila tidak stasioner dalam varian maka dilakukan transformasi pada data dengan Box-Cox Transformation dengan persamaan umum sebagai berikut : 𝑇 𝑍 𝑡 = 𝑍 𝑡 𝜆 −1 𝜆 Nilai Estimasi (𝝀) Transformasi -1 1 𝑍 𝑡 -0,5 1 𝑍 𝑡 Ln ( 𝑍 𝑡 ) 0,5 𝑍 𝑡 1
6
Time Series Plot Setelah dilakukan Transformasi dengan ln, didapatkan hasil yang telah stasioner dalam variansi. Berdasarkan time series plot, didapatkan hasil yang belum stasioner dalam mean.
7
Stasioner dalam Mean Apabila tidak stasioner dalam mean maka dilakukan differencing pada data dengan persamaan umum sebagai berikut :
8
Identifikasi Model Berdasarkan hasil yang telah stasioner, akan ditentukan model yang sesuai dengan data secara visual menggunakan ACF dan PACF.
9
Model SARIMA Berdasarkan identifikasi model menggunakan ACF dan PACF didapatkan model SARIMA yang mungkin untuk data wisatawan adalah sebagai berikut. SARIMA (1,1,1)(0,0,1)12 SARIMA (2,1,1)(0,0,1)12 SARIMA (4,1,1)(0,0,1)12 Secara umum model SARIMA dapat dituliskan sebagai berikut. Φ 𝑃 𝐵 𝑠 𝜙 𝑝 𝐵 (1−𝐵 ) 𝑑 (1− 𝐵 𝑠 ) 𝐷 𝑥 𝑡 = θ 𝑞 (𝐵) Θ 𝑄 ( 𝐵 𝑠 ) 𝑒 𝑡
10
Estimasi Parameter SARIMA (1,1,1)(0,0,1)12
Berikut ini adalah hasil estimasi dan pengujian signifikansi parameter dari model SARIMA (1,1,1)(0,0,1)12 . Statistik uji yang digunakan untuk estimasi parameter model adalah dengan melihat nilai 𝑡 ℎ𝑖𝑡𝑢𝑛𝑔 dan nilai p-value dengan menggunakan =0,05. Parameter Estimasi 𝒕 𝒉𝒊𝒕𝒖𝒏𝒈 p-value Signifikansi 𝜙 1 𝐵 0.2309 1.79 0.077 Tidak 𝜃 1 (𝐵) 0.9713 17.56 0.000 Signifikan Θ 1 ( 𝐵 12 ) -4.87 Konstanta 140.7 4.70
11
Estimasi Parameter SARIMA (2,1,1)(0,0,1)12
Berikut ini adalah hasil estimasi dan pengujian signifikansi parameter dari model SARIMA (2,1,1)(0,0,1)12 . Statistik uji yang digunakan untuk estimasi parameter model adalah dengan melihat nilai 𝑡 ℎ𝑖𝑡𝑢𝑛𝑔 dan nilai p-value dengan menggunakan =0,05. Parameter Estimasi 𝒕 𝒉𝒊𝒕𝒖𝒏𝒈 p-value Signifikansi 𝜙 1 𝐵 0.0254 0.14 0.887 Tidak 𝜙 2 𝐵 -0.39 0.699 𝜃 1 (𝐵) 0.7399 5.40 0.000 Signifikan Θ 1 ( 𝐵 12 ) -4.96 Konstanta 157.6 0.96 0.340
12
Estimasi Parameter SARIMA (4,1,1)(0,0,1)12
Berikut ini adalah hasil estimasi dan pengujian signifikansi parameter dari model SARIMA (4,1,1)(0,0,1)12 . Statistik uji yang digunakan untuk estimasi parameter model adalah dengan melihat nilai 𝑡 ℎ𝑖𝑡𝑢𝑛𝑔 dan nilai p-value dengan menggunakan =0,05. Parameter Estimasi 𝒕 𝒉𝒊𝒕𝒖𝒏𝒈 p-value Signifikansi 𝜙 1 𝐵 -4.04 0.000 Signifikan 𝜙 2 𝐵 -3.78 𝜙 3 𝐵 -3.39 0.001 𝜙 4 𝐵 -3.07 0.003 𝜃 1 (𝐵) -1.92 0.059 Tidak Θ 1 ( 𝐵 12 ) -4.66 Konstanta 531 0.50 0.621
13
Pengujian Diagnostik Pengujian diagnostik untuk mengetahui apakah residual model telah memenuhi asumsi white noise dan distribusi normal. Pengujian asumsi white noise dilakukan menggunakan uji Ljung-Box dengan hipotesis sebagai berikut. Hipotesis : H0 : 𝜌 1 = 𝜌 2 =…= 𝜌 𝑘 =0 H1 : Minimal ada satu 𝜌 𝑖 ≠0, 𝑖=1,2,…𝑘 Statistik Uji : Statistik uji yang digunakan dalam pengujian kali ini adalah nilai statistik Q yang akan dibandingkan dengan nilai 𝜒 𝑡𝑎𝑏𝑒𝑙 2 atau p-value yang dibandingkan dengan nilai α sebesar 0,01. Pengujian normalitas dari residual model menggunakan uji Anderson Darling dengan hipotesis sebagai berikut. H0 : Residual model berdistribusi Normal H1 : Residual model tidak berdistribusi Normal Statistik uji yang digunakan dalam pengujian ini adalah nilai p-value yang dibandingkan dengan nilai α sebesar 0,01.
14
Pengujian Diagnostik (Asumsi Independen : Ljung Box)
Berikut ini adalah hasil pengujian asumsi residual independen dari model SARIMA (1,1,1)(0,0,1)12 . Berikut ini adalah hasil pengujian asumsi residual independen dari model SARIMA (2,1,1)(0,0,1)12 . Berikut ini adalah hasil pengujian asumsi residual independen dari model SARIMA (4,1,1)(0,0,1)12 . Lag 𝜒 (𝛼, 𝐾−𝑝−𝑞) 2 p-value Keputusan 12 16.2 0.039 Gagal Tolak H0 24 34.3 0.024 36 41.9 0.113 48 50.6 0.230 Lag 𝜒 (𝛼, 𝐾−𝑝−𝑞) 2 p-value Keputusan 12 16.2 0.023 Gagal Tolak H0 24 33.3 0.022 36 44.7 0.052 48 55.9 0.090 Lag 𝜒 (𝛼, 𝐾−𝑝−𝑞) 2 p-value Keputusan 12 15.4 0.009 Tolak H0 24 32.6 0.013 Gagal Tolak H0 36 49.7 0.010 48 60.3 0.026
15
Pengujian Diagnostik (Asumsi Normalitas : Anderson Darling)
Berikut ini adalah hasil pengujian asumsi residual berdistribusi normal dari model SARIMA (1,1,1)(0,0,1)12 . P-value = maka, residual berdistribusi normal. Berikut ini adalah hasil pengujian asumsi residual berdistribusi normal dari model SARIMA (2,1,1)(0,0,1)12 . P-value = maka, residual berdistribusi normal. Berikut ini adalah hasil pengujian asumsi residual berdistribusi normal dari model SARIMA (4,1,1)(0,0,1)12 . P-value = maka, residual berdistribusi normal.
16
Pemilihan Model SARIMA Terbaik
Berdasarkan ketiga model yang teridentifikasi, dimana semua model yang telah diidentifikasi memiliki pola musiman. Selanjutnya dilakukan pemilihan model terbaik dengan menggunakan kriteria nilai MSE. Berikut ini adalah nilai MSE dari ketiga model tersebut. Didapatkan bahwa model SARIMA (1,1,1)(1,0,1)12 merupakan model terbaik karena memiliki nilai MSE terkecil dibandingkan dengan model SARIMA lainnya. Model SARIMA (1,1,1)(1,0,1)12 dapat ditulis persamaannya sebagai berikut. Model Nilai MSE SARIMA (1,1,1)(0,0,1)12 SARIMA (2,1,1)(0,0,1)12 SARIMA (4,1,1)(0,0,1)12 (1-0,2309B)(1-B)xt = (1+0,6302B12)( B)et
17
Peramalan dengan Model Terbaik
Setelah diperoleh model terbaik yaitu SARIMA (1,1,1)(0,0,1)12. Selanjutnya akan dilakukan peramalan (forecasting) terhadap jumlah pengunjung Candi Ratu Boko untuk 12 bulan berikutnya. Periode Nilai Peramalan Juni 2015 16536 Juli 2015 19683 Agustus 2015 20953 Sep-15 17024 Oktober 2015 18696 Nopember 2015 18939 Periode Nilai Peramalan Desember 2015 26300 Januari 2016 22842 Februari 2016 21763 Maret 2016 19816 April 2016 18623 Mei 2016 21740
18
Kesimpulan
19
(1-0,2309B)(1-B)xt = (1+0,6302B12)(1-0.9713B)et
Kesimpulan Berdasarkan uji diagnostik (menggunakan Ljung-Box pada lag , dan Anderson Darling) diperoleh: - residual ketiga model telah memenuhi asumsi white noise, kecuali model (3) pada lag 12 - residual ketiga model berdistribusi normal Dari analisis yang telah dilakukan berdasarkan data jumlah wisatawan Candi Ratu Boko, Yogyakarta pada Januari Mei Berdasarkan kriteria MSE, diperoleh model yang terbaik adalah SARIMA (1,1,1)(0,0,1)12 (karena memiliki nilai MSE terkecil) dengan model (1-0,2309B)(1-B)xt = (1+0,6302B12)( B)et
20
Kesimpulan 5. Dari model terbaik didapatkan jumlah wisatawan paling banyak diperkirakan pada bulan Desember 2015 dan paling sedikit diperkirakan pada bulan Juni 2015.
21
Daftar Pustaka Wei, W. W. S Time Series Analysis Univariate and Multivariate Methods. (Second Edition), New York: Pearson.
Presentasi serupa
© 2024 SlidePlayer.info Inc.
All rights reserved.