Presentasi sedang didownload. Silahkan tunggu

Presentasi sedang didownload. Silahkan tunggu

Uji Asumsi Model Part 1 – Deteksi Pelanggaran Asumsi*

Presentasi serupa


Presentasi berjudul: "Uji Asumsi Model Part 1 – Deteksi Pelanggaran Asumsi*"— Transcript presentasi:

1 Uji Asumsi Model Part 1 – Deteksi Pelanggaran Asumsi*
Wahyu Dwi Lesmono *Akan dibahas sedikit mengenai cara penanggulangannya

2 Diagram Pengujian Model
Uji Kelayakan Model Uji Signifikansi Model Uji F Uji t Koefisien Determinasi Root Mean Square Error Uji Asumsi Model Normalitas Autokorelasi Heterokedastisitas Multikolinearitas Endogenitas

3 Kapan Pengujian Asumsi Model dilakukan?
Pengujian asumsi model dilakukan apabila metode penduga parameter yang digunakan adalah metode OLS (Ordinary Least Square). Namun tidak menutup kemungkinan jika metode penduga parameter yang lain harus dilakukan pengujian asumsi.

4 Kenapa Perlu dilakukan Uji Asumsi?
Suatu model dapat dikatakan memiliki nilai penduga terbaik apabila memenuhi kriteria BLUE (Best Linear Unbiased Estimator) berdasarkan minimisasi iteratif dengan teorema Gauss-Markov, yaitu: Penduga parameter bersifat efisien (Nilai ragam yang minimum) Penduga parameter bersifat linear terhadap variabel bergantung. Penduga parameter bersifat tidak bias (Nilai rata-rata dari penduga parameter sama dengan nilai parameter itu sendiri)

5 Aturan dalam asumsi Hubungan antara variabel bergantung dengan variabel bebas bersifat linear. Variabel bebas bersifat tetap pada setiap observasi (tidak berubah-ubah/tidak stokastik). Nilai variabel bebas harus bervariasi. Nilai rata-rata residual/galat dengan syarat dari masing-masing variabel bebasnya adalah 0. Ragam residual/galat adalah konstan atau bersifat homokedastisitas. Tidak ada hubungan antar perbedaan observasi residual (serial correlation). Tidak ada hubungan antara variabel bebas dengan residual. Variabel residual/galat berdistribusi normal. Tidak ada korelasi-korelasi yang sempurna antar variabel bebas. Jumlah observasi harus lebih besar daripada jumlah parameter yang diestimasi dan jumlah persamaan yang ada dalam sistem.

6 Definisi Autokorelasi
Autokorelasi (Korelasi Silang atau Korelasi Seri) merupakan suatu kondisi adanya korelasi antar galat pada observasi yang berbeda. Suatu model dikatakan baik apabila bebas dari masalah autokorelasi. Autokorelasi sering terjadi pada data time series (data dengan variabel waktu), namun tidak menutup kemungkinan terjadi pada data cross-sectional (data antar objek/tanpa variabel waktu).

7 Faktor Penyebab Autokorelasi
Data mengandung pergerakan naik-turun secara musiman. Kekeliruan memanipulasi data. Data yang dianalisis tidak bersifat stasioner. Data yang digunakan bersifat runtut. Adanya bias spesifikasi (Mengeluarkan variabel yang benar dari persamaan model karena alasan-asalan tertentu). Adanya keterlambatan (Lag) Adanya hubungan variabel pada observasi yang diperoleh dengan variabel pada observasi sebelumnya.

8 Indikasi dan Konsekuensi Akibat Autokorelasi
Metode penduga masih bersifat linear dan tidak bias namun tidak efisien sehingga tidak mempunyai ragam yang minimum. Akibatnya kriteri metode penduga berubah menjadi LUE (Linear Unbiased Estimation). Nilai standard error pada parameter menjadi underestimated dan nilai statistik t, F, dan koefisien determinasi menjadi overestimated sehingga memberikan kesimpulan yang menyesatkan tentang arti statistik dan hasil dari koefisien penduga parameter.

9 Cara Mendeteksi Adanya Autokorelasi
Menggambarkan korelogram autokorelasi dan autokorelasi parsial. Menggambarkan scatter plot antara residual dengan residual pada observasi sebelumnya. Menggunakan uji Durbin-Watson atau uji Godfrey.

10 Cara Penanggulangan Adanya Autokorelasi
Biarkan data apa adanya (Jika datanya Cross-Sectional) Menambahkan data observasi Melakukan transformasi data dengan melakukan lag, differencing pada variabel bebas, atau transformasi dengan fungsi tertentu. Menggunakan metode penduga Maximum Likelihood, Yule-Walker, Full Information Maximum Likelihood, atau Unconstrained Least Square (ULS). Menggunakan metode koreksi Cochrane-Orchutt. Menggunakan pendekatan autoregressive (AR)

11 Definisi Heterokesdastisitas
Heterokesdastisitas (Kebalikan dari Homokesdastisitas) merupakan suatu kondisi terjadinya keragaman residual/galat dengan observasi dari satu observasi ke observasi yang lainnya. Suatu model dikatakan baik apabila rata-rata nilai residualnya adalah nol, residualnya memiliki ragam yang konstan, dan tidak saling berhubungan dengan residual observasi yang lainnya. Permasalahan heterokesdastisitas sering terjadi pada data cross-sectional dibandingkan data time series.

12 Faktor Penyebab Heterokesdastisitas
Adanya penggolongan antarobjek, baik secara numerik maupun kategorik, yang menyebabkan nilai penduganya terlalu jauh. Metode penduga dan pengumpulan sampel yang menghasilkan nilai simpangan baku parameter yang semakin besar. Adanya pencilan pada data sehingga menyebabkan terjadinya keragaman yang tinggi. Kemiringan (skewness) yang tidak merata. Spesifikasi model yang tidak tepat. Transformasi data yang salah. Model fungsi yang salah.

13 Indikasi dan Konsekuensi Akibat Heterokesdastisitas
Uji F pada persamaan model yang signifikan namun banyak uji t dari masing-masing parameter yang tidak signifikan atau sebaliknya sehingga mengakibatkan nilai simpangan baku dari setiap variabel bebasnya tidak dapat dipercaya kebenarannya serta mengakibatkan ragamnya tidak minimum. Nilai penduga parameter model tidak efisien sehingga mengakibatkan nilai penduganya menjadi LUE (Linear Unbiased Estimation). Nilai residual pada beberapa observasi cukup besar sehingga mengakibatkan model tidak cocok untuk dilakukan prediksi (cross-sectional) atau peramalan (time series). Kesimpulan statistik inferensi akan menyesatkan dan tidak dapat dipercaya kebenarannya.

14 Cara Mendeteksi Adanya Heterokesdastisitas
Melihat scatter plot/scatter gram antara kuadrat residual dengan penduga variabel bergantung atau variabel bebas. Menghitung korelasi antara variabel bebas dengan variabel residual dengan metode korelasi Spearman-Rank. Menggunakan uji White, Bresuch-Pagan, Park, Glejser, atau Goldfeld-Quandt.

15 Cara Penanggulangan Adanya Heterokesdastisitas
Menggunakan metode penduga Regresi Instrumen Variabel (IV), Generalized Least Square (GLS), Generalized Method of Moment (GMM), Feasible GLS (FGLS), dan Weighted Least Square (WLS) (Jika ragam kelompok observasinya diketahui). Transformasikan data dengan fungsi yang sesuai. Menggunakan metode koreksi Heteroskedasticity Consistent Coefficient Covariance (Jika ragam kelompok observasinya tidak diketahui). Menghitung penduga dengan metode tertentu dengan simulasi Monte Carlo, Bootstrapping, dan Robust.

16 Definisi Multikolinearitas
Multikolinearitas merupakan suatu kondisi adanya korelasi antarvariabel. Suatu model yang baik “seharusnya” tidak terjadi korelasi di antara variabel bebasnya. Secara aljabar, multikolinearitas disebabkan oleh adanya kombinasi linear dari salah satu atau masing-masing nilai variabel bebas.

17 Faktor Penyebab Multikolinearitas
Metode pengumpulan data yang digunakan terbatas pada populasi yang diambil sampelnya. Retriksi yang ada pada model Spesifikasi model yang minim atau berlebihan Model yang overdetermined (Lebih banyak jumlah parameternya dibandingkan jumlah observasi) Pergerakan nilai antar variabel yang sama dengan laju perubahan waktu (untuk data time series)

18 Indikasi dan Konsekuensi Akibat Multikolinearitas
Nilai koefisien determinasi tinggi namun banyak variabel bebas yang tidak signifikan atau sebaliknya. Sehingga menyebabkan selang kepercayaan nilai penduga parameternya lebih lebar. Nilai standard error yang sangat rendah dibandingkan nilai penduga parameter atau sebaliknya. Sehingga menyebabkan terjadi kesesatan prediksi yang tidak ak Nilai ragam dan koragam antar variabel yang cukup besar, sehingga variabel-variabel tersebut sulit digunakan untuk estimasi. Walaupun sulit digunakan untuk estimasi, masalah multikolinearitas masih bersifat BLUE.

19 Cara Mendeteksi Adanya Multikolinearitas
Melihat bentuk scatterplot antar variabel Melihat adanya koefisien korelasi antar variabel bebas yang tinggi. Melihat adanya koefisien korelasi parsial antar variabel bebas dengan antar variabel kontrol yang tinggi. Menghitung nilai eigen dan indeks kondisi. Menghitung nilai toleransi dan Variance Inflating Factor (VIF) Menggunakan regresi Ridge atau regresi Bayesian.

20 Cara Penanggulangan Adanya Multikolinearitas
Biarkan apa adanya. Mengetahui adanya retriksi secara teoritis terdahulu pada model dari hasil penduga parameter dan menambahkan retriksi pada model. Mengkombinasikan data cross-sectional dan data time series. Tambahkan jumlah observasi jika memungkinkan. Hilangkan salah satu variabel bebas yang mengandung korelasi yang kuat terhadap variabel yang lain. Transformasi variabel dengan fungsi resiprokal pada variabel yang memiliki korelasi kuat. Transformasi variabel dengan melakukan differencing pertama. (Untuk data time series) Menggunakan analisis faktor. Menggunakan pendekatan regresi Ridge, regresi Bayesian, dan regresi polinomial ortogonal.

21 Contoh Kasus 1 Y X1 X2 23.3 5 13 24.5 6 14 27.2 8 17 27.1 9 24.1 7 23.4 24.3 27.3 27.4 27.0 23.5 23.7 Diketahui model regresi berganda yang didefinisikan sebagai berikut: Dengan menetapkan tingkat kepercayaan sebesar 95%: Buatlah persamaan Regresinya dengan metode penduga OLS dan lakukan pengujian signifikansi modelnya! Apakah metode penduga OLS dari model tersebut terdapat asumsi yang dilanggar? Periksalah dengan uji autokorelasi, heterokedastisitas, multikolinearitas! Lakukan pengujian normalitas untuk mengetahui apakah residual dari model regresi berdistribusi normal!

22 -Analyze > Regression > Linear -Masukkan variabel Y di kotak Dependent dan variabel X1 dan X2 di kotak Independent -Statistics > Ceklis Estimates, Model Fit, R Squared Change, Collinearity Diagnostics, Durbin-Watson, Casewise Diagnostics pilih All cases > Continue -Plot > Masukkan X sebagai ZPRED dan Y sebagai SRESID > Standardized Residual Plots pilih Normal Probability Plots > Continue

23 -Plot > di kotak Residuals ceklis Unstandardized > Continue -Klik OK
-Uji normalitas (nilai statistik): Analyze > Nonparametric Test > 1-Sample KS Masukkan Unstandardized Residual ke Test Variable List > Ceklis Test Distribution Normal > OK -Uji normalitas (visual): Analyze > descriptive Statistics > PP Plot atau QQ Plot

24 Jawaban A Berdasarkan nilai Adjusted R-Square menunjukkan nilai yang berarti 99.4% variasi dari Y dapat dijelaskan oleh variasi dari variabel x1 dan x2, sisanya dijelaskan oleh variabel bebas lainnya. Berdasarkan uji F dapat disimpulkan bahwa seluruh variabel bebas secara bersama-sama memberikan pengaruh terhadap variabel y. N.B: Variabel bebas berpengaruh jika nilai Sig < Taraf Nyata . Baik uji F maupun uji t Berdasarkan uji t dapat disimpulkan bahwa seluruh variabel bebas secara terpisah memberikan pengaruh terhadap variabel y. Model Persamaan Regresinya adalah:

25 Jawaban A Berdasarkan nilai Standard Error of the Estimate adalah menunjukkan bahwa variasi Y yang tidak dijelaskan oleh variabel bebas sebesar satuan. Berdasarkan uji F dapat disimpulkan bahwa nilai akar dari mean square residual yaitu yang menunjukkan bahwa nilai error yang mungkin terjadi pada model sebesar 12.87% N.B: Standard Error of the Estimate (SEE) sama dengan Root Mean Square Error (RMSE) Berdasarkan uji t dapat disimpulkan bahwa nilai simpangan baku untuk setiap penduga parameternya cukup kecil sehingga tidak berakibat banyak penyimpangan dalam menduga variabel bergantung.

26 Prosedur Pengujian Autokorelasi dengan Durbin-Watson
Tentukan banyaknya observasi (n) dan banyaknya variabel bebas pada model (k) Hitung Durbin-Watson Statistik Tentukan nilai Durbin-Watson Tabel (dL dan dU) dan selisih nilai 4 dengan Durbin-Watson batas atas (4-dU) dan batas bawah (4-dL) Membuat kriteria keputusan dan keputusan Kesimpulan. Tidak dapat disimpulkan Tidak dapat disimpulkan dL dU 4-dU 4-dL 2 4 Terjadi autokorelasi positif Tidak terjadi autokorelasi Terjadi autokorelasi negatif

27 Jawaban B (Uji Autokorelasi)
Pengujian dengan Durbin-Watson: -Banyaknya observasi n = 20 -Banyaknya variabel bebas k = 2 -Nilai Durbin-Watson statistik: DW= Berdasarkan tabel Durbin Watson, diperoleh: 1. Batas bawah Durbin-Watson tabel: dL = Batas atas Durbin-Watson tabel: dU = Nilai 4-dU = = Nilai 4-dL = =

28 Jawaban B (Uji Autokorelasi)
Tidak dapat disimpulkan Tidak dapat disimpulkan 1.804 1.1004 1.5367 2.4633 2.8996 2 4 Terjadi autokorelasi positif Tidak terjadi autokorelasi Terjadi autokorelasi negatif Berdasarkan hasil uji Durbin-Watson didapat bahwa nilai Durbin-Watson statistik berada diantara dL dan 4-dU sehingga metode OLS pada model regresi tidak mengalami masalah autokorelasi.

29 Deteksi Heterokesdastisitas Secara Visual dengan Scatter Plot
Untuk axis merupakan hasil estimasi dan ordinat merupakan kuadrat residual, gambar a tidak mengalami masalah heterokedastisitas, Gambar b, c, d, e mengalami masalah heterokedastisitas. Tidak adanya masalah heterokedastisitas apabila scatter plot membentuk pola yang tidak jelas (acak).

30 Deteksi Heterokesdastisitas Secara Visual dengan Scatter Plot
Untuk axis merupakan variabel bebas X merupakan kuadrat residual, gambar a tidak mengalami masalah heterokedastisitas, Gambar b, c, d, e mengalami masalah heterokedastisitas. Tidak adanya masalah heterokedastisitas apabila scatter plot membentuk pola yang tidak jelas (acak).

31 Jawaban B (Uji Heterokesdastisitas)
Dari scatter plot standardized predicted value dengan studentized residual diperoleh pola yang tidak jelas sehingga dapat dikatakan bahwa metode OLS pada model regresi tidak mengalami masalah heterokesdastisitas.

32 Deteksi Multikolinearitas
Untuk mendeteksi adanya multikolinearitas dapat menggunakan nilai Indeks Kondisi, Toleransi, atau nilai Variance Inflation Factor (VIF). Conditional Index (CI) Toleransi (TOL) Variance Inflation Factor (VIF) Keterangan Multikolinearitas 1 ≤ CI ≤ 15  0.25 ≤ TOL ≤ 1 1 ≤ VIF ≤ 4 Tidak Ada Masalah/Aman 15 < CI ≤ 50   ≤ TOL < 0.25  4 < VIF ≤ 7 Sedikit Masalah/Hati-Hati 50 < CI ≤ 100  0.1 ≤ TOL ≤  7 < VIF ≤ 10 Cukup Masalah/Bermasalah CI > 100  TOL < 0.1 VIF > 10 Masalah Serius/Bencana

33 Jawaban B (Uji Multikolinearitas)
Hasil nilai Tolerance dan VIF menunjukkan bahwa variabel X1 dan X2 mengalami cukup masalah pada multikolinearitas. Parameter β2 pada indeks kondisi memiliki nilai diatas 50 dan proporsi variasi antar parameter penduganya diatas 0.7 sehingga metode OLS pada model Regresi mengalami cukup masalah multikolinearitas khususnya pada variabel bebas X2 atau parameter β2.

34 Jawaban C (Uji Normalitas)
Dengan nilai P-Value = > Taraf Nyata = 0.05 maka residual berdistribusi normal sehingga tidak mengalami masalah pada normalitas.

35 Jawaban C (Uji Normalitas)
Berdasarkan P-P plot menunjukkan bahwa residual berdistribusi normal. Pada normal P-P Plot titik observasinya mendekati garis linear Z dan pada detrended normal P-P plot titik observasinya menjauhi garis deviasi. Sehingga residual berdistribusi normal.

36 Jawaban C (Uji Normalitas)
Berdasarkan Q-Q plot menunjukkan bahwa residual berdistribusi normal. Pada normal Q-Q Plot titik observasinya mendekati garis linear Z dan pada detrended normal Q-Q plot titik observasinya menjauhi garis deviasi. Sehingga residual berdistribusi normal. Karena hanya 1 pencilan observasi residual, maka residual masih berdistribusi normal.

37 Contoh Kasus 1 Versi SAS (Input Program)
Keterangan: fit untuk menduga parameter dari variabel bergantung ols untuk metode penduga parameter dw, dwprob, godfrey untuk uji autokorelasi collin untuk uji multikolinearitas white, breusch untuk uji heterokesdatisitas normal untuk uji normalitas

38 Yang ada didalam lingkaran memiliki intepretasi yang sama dengan intepretasi pada SPSS

39 Model Regresi dengan OLS seluruhnya tidak mengalami masalah heterokesdastisitas, baik dengan metode White maupun Breusch-Pagan Model Regresi dengan OLS seluruhnya tidak mengalami masalah autokorelasi, baik dengan metode Durbin-Watson maupun Godfrey Positif Negatif Model Regresi dengan OLS seluruhnya normal, baik satu persamaan maupun sistem

40 Yang ada didalam lingkaran memiliki intepretasi yang sama dengan intepretasi pada SPSS

41 Contoh Kasus 2 Penelitian yang dilakukan oleh Winda bertujuan untuk mengetahui dampak volume maksimal kebugaran tubuh berdasarkan faktor indeks massa gizi tubuh (IMT) dan tingkat aktivitas fisik dari Atlet Bulu Tangkis Himatika Berikut ini merupakan data yang diperoleh dan diolah oleh Winda dari 18 berdasarkan formulasi yang dia ambil dari literatur statistik kesehatan tertentu.

42 Bentuklah model yang menggambarkan tujuan kasus tersebut dan dugalah parameter model dengan menggunakan metode OLS! Lakukan pengujian asumsi model untuk mengetahui adanya pelanggaran asumsi autokorelasi, multikolinearitas, dan heterokedastisitas pada model yang telah anda bentuk! Kebugaran Gizi Aktiv fisik 49.9 17.84 2.09 51.4 18.07 2.08 38.85 18.96 2.14 54.1 19.14 2.26 52.8 20.57 35.7 20.77 2.19 56.25 21.05 46.2 21.09 2.18 43.9 21.3 2.27 40.2 21.55 2.3 21.86 2.52 41.8 22.31 2.31 49.3 22.46 2.42 46.5 23.05 2.44 51.9 23.41 2.58 45.9 24.2 37.45 25 2.38 51.1 25.76 2.65

43 Input Data di SAS

44 Jawaban A Dengan menggunakan metode OLS diperoleh:
Karena tujuannya ingin mengetahui pengaruh faktor indeks massa gizi tubuh dan tingkat aktivitas fisik terhadap volume maksimal kebugaran tubuh berdasarkan. Maka model dapat diformulasikan dengan model regresi berganda: Dengan menggunakan metode OLS diperoleh:

45 Jawaban B Berdasarkan uji asumsi masalah heterokedastisitas dengan metode White dan Bresuch-Pagan menunjukkan model tidak mengalami masalah heterokedastisitas. Uji asumsi masalah autokorelasi dengan metode Durbin-Warson dan Godfrey menunjukkan bahwa model tidak mengalami masalah autokorelasi

46 Jawaban B Berdasarkan nilai kondisi indeks menunjukkan bahwa variabel AF mengalami masalah multikolinearitas. Selain itu variasi proporsi parameter β3 terhadap parameter β2 dan β3 cukup tinggi sehingga metode OLS pada model regresi mengalami masalah multikolinearitas. Namun nilai Adjusted R-Squared yang negatif, persentase RMSE yang cukup besar, dan hasil uji t yang tidak wajar mengindikasikan adanya masalah Heterokesdatisitas.

47 Contoh Kasus 3 Diketahui suatu sistem persamaan model yang didefinisikan sebagai berikut: Y1 Y2 X1 X2 X3 10 21 3 5 6 12 29 2 4 7 13 28 15 23 11 24 8 1 17 22 19 20 Dengan: Dugalah parameter sistem model dengan metode OLS! Lakukan pengujian asumsi untuk mengetahui adanya masalah autokorelasi, heterokedastisitas, dan multikolinearitas!

48 Input SAS

49 Jawaban A Nilai penduga parameter sistem model dengan metode OLS didapat sebagai berikut:

50 Dari pengujian asumsi menunjukkan bahwa seluruh persamaan dengan penduga OLS tidak mengalami masalah heterokedastisitas namun y1 mengalami masalah autokorelasi positif. Berdasarkan kondisi indeks menunjukkan bahwa masing-masing parameternya tidak mengalami masalah multikolinearitas. Namun walaupun tidak mengalami masalah multikolinearitas, proporsi variasi yang bernilai besar akan memberikan hubungan kuat antar variabel bebas untuk menduga variabel bergantungnya.

51 Check Point Lakukan pengujian asumsi pada Modul ANEDA halaman 52!
Lakukan penanggulangan/koreksi masalah pada Contoh Kasus 1 dan Contoh Kasus 2!

52 Pertanyaan Tugas Besar Individu
Apakah yang dimaksud dengan masalah asumsi endogenitas dan normalitas? Sebutkan faktor penyebab, indikasi dan konsekuensi, cara mendeteksi, dan cara penanggulangan masalah endogenitas dan normalitas! Apa perbedaan penggunaan grafik P-P Plot dan Q-Q Plot?


Download ppt "Uji Asumsi Model Part 1 – Deteksi Pelanggaran Asumsi*"

Presentasi serupa


Iklan oleh Google