PENGUJIAN DATA
Uji Data Uji missing data Untuk melihat apakah data yang tidak lengkap/hilang akan memengaruhi pengolahan data secara keseluruhan Uji data outlier Untuk mengetahui sejauh mana data outlier akan mengganggu keseluruhan data, yang dapat mengakibatkan kesalahan dalam menarik kesimpulan Uji asumsi klasik Untuk mengetahui apakah data memenuhi beberapa asumsi pokok seperti: normalitas data, linearitas data, homoskedastisitas data, dsb.
Analisis Missing Data Missing data: Sel-sel kosong pada variabel Disebabkan karena informasi/data tidak diberikan, sulit diperoleh, atau lupa ditanyakan Contoh: Data umur Data gaji/penghasilan Dampaknya? Jika sedikit (sekitar 1%) dihapus tidak masalah Jika banyak perlu pengujian apakah layak diproses lebih lanjut atau tidak
Analisis Missing Data Uji Keacakan : Untuk mengetahui apakah data yang hilang bersifat random atau tidak Random tidak ada pola tertentu Contoh: Kasus 1 lihat buku Singgih Santoso hal.16.
Analisis Missing Data Kasus 1: Uji Keacakan Data Langkah-langkah: Buka file : missing value.sav Analyze Missing value analysis Masukkan variabel: usia, berat, tinggi dll. ke bagian QUANTITATIVE VARIABLE. Masukkan variabel minum ke bagian CATEGORICAL VARIABLE. Masukkan variabel nama ke bagian CASE LABELS. Pada bagian ESTIMATION (kanan tengah), klik kotak listwise, pairwise, dan EM Klik ikon PATTERN . Pada bagian DISPLAY klik Tabulated cases.... dan Cases with missing values..... Klik CONTINUE. Klik DESCRIPTIVES Pada bagian INDICATOR VARIABLE STATISTICS, klik Percent missmatch dan klik juga Crosstabulation of .... Klik OK.
Analisis Missing Data Bagaimana mengatasi missing data? Membuang data (kasus) Mengisi sel (data) yang hilang dengan data tertentu rata-rata keseluruhan Lihat contoh Kasus 2.
Analisis Missing Data Kasus 2: Perlakuan terhadap Missing Data Langkah-langkah: Buka file : missing value.sav Pilih menu: Transform Replace Missing Value Masukkan variabel: usia, berat, tinggi, income, jam kerja dan olah raga ke bagian NEW VARIABLE. Bagian NAME AND METHOD Bagian NAME otomatis menampilkan variabel baru USIA_1, dll. Bagian METHOD pilih Series Mean Abaikan bagian yang lain. 5. Klik OK.
Uji Data Outlier Outlier : Mengapa terjadi outlier? Data yang secara nyata berbeda dengan data-data yang lain Mengapa terjadi outlier? Kesalahan dalam pemasukan data Kesalahan pengambilan sampel Memang ada data ekstrim
Deteksi Data Outlier Membuat nilai z (standardisasi data) Deteksi dapat dilakukan dengan 3 cara: Membuat nilai z (standardisasi data) Membuat grafik/diagram Scatter Plot Penyajian Box Plot
Deteksi Data Outlier 1. Standardisasi Data Langkah-langkah: 1. Buka file outlier. 2. Menu Analyse Descriptive Statistics Descriptive 3. Masukkan variabel usia, berat, tinggi, income, jam kerja dan olah raga ke bagian VARIABLE(S). 4. Aktifkan (klik) Save standardized values at variables. Abaikan yang lain lalu klik OK. Output dapat dilihat pada outlier uji z.sav
Deteksi Data Outlier Rumus standardisasi: _ z = x - X Std. Deviasi Jika nilai z < - 2,5 atau z > + 2,5 maka data tersebut dikategorikan sebagai data outlier. Lihat tabel output berikut. x = nilai data X = nilai rata-rata Z = Nilai standar
Deteksi Data Outlier
Deteksi Data Outlier
Deteksi Data Outlier 2. Scatter Plot Langkah-langkah: Buka file outlier. Menu Graph Legacy Dialogs Scatter/Dot Pada kotak SCATTER/DOT, pilih SIMPLE SCATTER dan tekan tombol DEFINE. Masukkan variabel income pada sumbu X dan variabel usia pada sumbu Y. Abaikan bagian yang lain, lalu klik OK Output dapat dilihat pada outlier scatter plot.sav
Deteksi Data Outlier Scatter Plot Outlier Outlier
Deteksi Data Outlier 3. Box Plot Langkah-langkah: Buka file outlier. Menu Analyse Descriptive Statistics Explore ... Masukkan variabel usia dan berat pada kotak DEPENDENT LIST. Pada bagian DISPLAY (kiri bawah), klik Plots Buka kotak PLOTS, lalu nonaktifkan steam and leaf pada bagian DESCRIPTIVES. Klik Continue. Abaikan yang lain lalu klik OK. Output disimpan pada file outlier box plot
Deteksi Data Outlier Output: Ekstrim Max Outlier Median Min
Deteksi Data Outlier Ketentuan Box Plot: Outlier Jika data terletak 1,5 kali panjang box plot, yang dimulai dari batas atas atau batas bawah Ekstrim Jika data terletak melebihi 3 kali panjang box plot, yang dimulai dari batas atas atau batas bawah
Penanganan Outlier Ada dua cara penanganan outlier: Dihilangkan/dibuang, jika dianggap mencerminkan data yang sesungguhnya atau karena kesalahan pengambilan data, kesalahan inputing dsb. Dipertahankan, jika data tersebut memang ada atau tidak ada indikasi kesalahan. Pilihan no.1 atau no.2 tergantung pengguna.
Uji Normalitas Data Tujuan: Untuk mengetahui apakah data terdistribusi secara normal bentuk lonceng (bell shape) Data yang baik distribusi normal
Uji Normalitas Data Contoh : Buka file outlier Menu Analyze Descriptive Statistics Explore... Masukkan variabel usia dan berat pada kotak DEPENDENT LIST Pada bagian DISPLAY, klik kotak Plots Buka kotak PLOTS Aktifkan kotak Normality Plots with tests NON AKTIFKAN pilihan steam and leaf pada bagian DESCRIPTIVES Pilih None pada bagian BOXPLOT Tekan CONTINUE Abaikan yang lain lalu klik OK.
Uji Normalitas Data OutputNormalitas Data Kriteria uji lihat Kolmogorov-Smirnov dan Shapiro-Wilk Jika Sig. > 0.05 data terdistribusi normal Jika Sig. < 0.05 data tidak terdistribusi normal
Uji Normalitas Data Diagram Plot : Contoh Data yang terdistribusi normal Data bergerombol disekitar garis uji Data menyebar secara acak, tidak membentuk pola tertentu
Uji Normalitas Data Diagram Plot : Contoh Data yang terdistribusi tidak normal Data bergerombol disekitar garis uji, namun ada data yg terletak jauh dari sebaran data Data membentuk pola tertentu, ke kanan bawah kemudian naik ke atas
Penanganan Data Tidak Normal Ada 4 perlakuan: Menambah jumlah data Menghilangkan data penyebab tidak normal Dilakukan transformasi data, misal mengubah data ke bentuk logaritma atau natural atau bentuk lainnya, lalu diuji ulang Terima apa adanya. Pilih alat analisis yang tepat, misalnya gunakan uji nonparametrik
Uji Homoskedastisitas Data Tujuan: Untuk mengetahui apakah sebuah kelompok data mempunyai varians yang sama (seperti yang seharusnya terjadi). Jika varians-nya sama homoskedastisitas Jika varians-nya tdk sama heteroskedastisitas Alat uji: Levene Test Analisis Residual grafik
Uji Homoskedastisitas Data Contoh : Buka file homoskedastisitas Menu Analyze Descriptive Statistics Explore... Masukkan variabel tinggi dan jam kerja pada kotak DEPENDENT LIST Masukkan variabel minum pada kotak FACTOR LIST Pada bagian DISPLAY, tetap pada pilihan both Buka kotak PLOTS Pilih none pada bagian BOXPLOTS NON AKTIFKAN pilihan steam and leaf pada bagian DESCRIPTIVES Pada bagian SPRED VS LEVEL WITH LEVENE TEST, pilih power estimation. Tekan CONTINUE, abaikan yang lain lalu klik OK.
Uji Homoskedastisitas Data Test of Homogeneity of Variance Levene Statistic df1 df2 Sig. tinggi Based on Mean 4,244 1 73 ,043 Based on Median 3,789 ,055 Based on Median and with adjusted df 71,641 ,056 Based on trimmed mean 4,143 ,045 jamkerja 2,822 ,097 2,062 ,155 68,546 ,156 2,775 ,100 Output Hipotesis: H0 : kedua varians populasi sama H1 : Kedua varians populasi berbeda/tidak identik Jika: Sig. > 0.05 H0 diterima , artinya varians-nya sama Sig. < 0.05 H0 ditolak, artinya varians-nya berbeda
Uji Homoskedastisitas Data Kesimpulan: Varians data tinggi konsumen yg minum sedikit air mineral berbeda secara nyata dengan varians data tinggi konsumen dengan banyak minum air mineral. Heteroskedastisitas Varians data jam kerja konsumen yang minum sedikit air sama dengan varians data konsumen dengan banyak minum air mineral homoskedastisitas
Penanganan Terhadap Adanya Heteroskedastisitas Dilakukan transformasi data, misal mengubah data ke bentuk logaritma atau natural atau bentuk lainnya, lalu diuji ulang dengan Levene Test.
Uji Linearitas Data Linearitas adalah keadaan di mana hubungan antara variabel dependen dengan variabel independen bersifat linear (garis lurus) dalam range variabel tertentu. Pengujian dilakukan dengan scatter plot (diagram pencar)
Uji Linearitas Data Contoh : Uji asumsi linearitas variabel usia – income Buka file homoskedastisitas Menu Graph Legacy Dialogs Scatter/dot Pada kotak SCATTER/DOT, pilih SIMPLE SCATTER, kemudian tekan tombol DEFINE. Masukkan variabel usia pada sumbu X dan variabel olahraga pada sumbu Y. Abaikan yang lain lalu klik OK. Cara membuat garis lurus pada grafik yang ada: Letakkan pointer pada grafik dan klik ganda untuk masuk ke CHART EDITOR Klik ikon ADD FIT LINE AT TOTAL, sesaat akan muncul garis regresi Tutup chart editor utk kembali ke output grafik.
Uji Linearitas Data Output: Variabel Usia - Olahraga
Uji Linearitas Data Contoh : Uji asumsi linearitas variabel Olahraga - Berat Buka file homoskedastisitas Menu Graph Legacy Dialogs Scatter/dot Pada kotak SCATTER/DOT, pilih SIMPLE SCATTER, kemudian tekan tombol DEFINE. Masukkan variabel berat pada sumbu X dan variabel olahraga pada sumbu Y. Abaikan yang lain lalu klik OK. Cara membuat garis lurus pada grafik yang ada: Letakkan pointer pada grafik dan klik ganda untuk masuk ke CHART EDITOR Klik ikon ADD FIT LINE AT TOTAL, sesaat akan muncul garis regresi Tutup chart editor utk kembali ke output grafik.
Uji Linearitas Data Output: Variabel Berat - Olahraga
Uji Linearitas Data Kesimpulan: 1. Untuk variabel usia – olah raga ada hubungan linear (ada linearitas) 2. Untuk variabel berat – olahraga tidak ada hubungan linear (tidak ada linearitas)