Presentasi sedang didownload. Silahkan tunggu

Presentasi sedang didownload. Silahkan tunggu

PENGUJIAN DATA.

Presentasi serupa


Presentasi berjudul: "PENGUJIAN DATA."— Transcript presentasi:

1 PENGUJIAN DATA

2 Uji Data Uji missing data
Untuk melihat apakah data yang tidak lengkap/hilang akan memengaruhi pengolahan data secara keseluruhan Uji data outlier Untuk mengetahui sejauh mana data outlier akan mengganggu keseluruhan data, yang dapat mengakibatkan kesalahan dalam menarik kesimpulan Uji asumsi klasik Untuk mengetahui apakah data memenuhi beberapa asumsi pokok seperti: normalitas data, linearitas data, homoskedastisitas data, dsb.

3 Analisis Missing Data Missing data: Sel-sel kosong pada variabel
Disebabkan karena informasi/data tidak diberikan, sulit diperoleh, atau lupa ditanyakan Contoh: Data umur Data gaji/penghasilan Dampaknya? Jika sedikit (sekitar 1%)  dihapus tidak masalah Jika banyak  perlu pengujian apakah layak diproses lebih lanjut atau tidak

4 Analisis Missing Data Uji Keacakan :
Untuk mengetahui apakah data yang hilang bersifat random atau tidak Random  tidak ada pola tertentu Contoh: Kasus 1  lihat buku Singgih Santoso hal.16.

5 Analisis Missing Data Kasus 1: Uji Keacakan Data Langkah-langkah:
Buka file : missing value.sav Analyze Missing value analysis Masukkan variabel: usia, berat, tinggi dll. ke bagian QUANTITATIVE VARIABLE. Masukkan variabel minum ke bagian CATEGORICAL VARIABLE. Masukkan variabel nama ke bagian CASE LABELS. Pada bagian ESTIMATION (kanan tengah), klik kotak listwise, pairwise, dan EM Klik ikon PATTERN . Pada bagian DISPLAY klik Tabulated cases.... dan Cases with missing values..... Klik CONTINUE. Klik DESCRIPTIVES Pada bagian INDICATOR VARIABLE STATISTICS, klik Percent missmatch dan klik juga Crosstabulation of .... Klik OK.

6 Analisis Missing Data Bagaimana mengatasi missing data? Membuang data (kasus) Mengisi sel (data) yang hilang dengan data tertentu  rata-rata keseluruhan  Lihat contoh Kasus 2.

7 Analisis Missing Data Kasus 2: Perlakuan terhadap Missing Data
Langkah-langkah: Buka file : missing value.sav Pilih menu: Transform  Replace Missing Value Masukkan variabel: usia, berat, tinggi, income, jam kerja dan olah raga ke bagian NEW VARIABLE. Bagian NAME AND METHOD Bagian NAME  otomatis menampilkan variabel baru USIA_1, dll. Bagian METHOD  pilih Series Mean Abaikan bagian yang lain. 5. Klik OK.

8 Uji Data Outlier Outlier : Mengapa terjadi outlier?
Data yang secara nyata berbeda dengan data-data yang lain Mengapa terjadi outlier? Kesalahan dalam pemasukan data Kesalahan pengambilan sampel Memang ada data ekstrim

9 Deteksi Data Outlier Membuat nilai z (standardisasi data)
Deteksi dapat dilakukan dengan 3 cara: Membuat nilai z (standardisasi data) Membuat grafik/diagram Scatter Plot Penyajian Box Plot

10 Deteksi Data Outlier 1. Standardisasi Data Langkah-langkah:
1. Buka file outlier. 2. Menu Analyse  Descriptive Statistics  Descriptive 3. Masukkan variabel usia, berat, tinggi, income, jam kerja dan olah raga ke bagian VARIABLE(S). 4. Aktifkan (klik) Save standardized values at variables. Abaikan yang lain lalu klik OK.  Output dapat dilihat pada outlier uji z.sav

11 Deteksi Data Outlier Rumus standardisasi: _ z = x - X Std. Deviasi
Jika nilai z < - 2,5 atau z > + 2,5 maka data tersebut dikategorikan sebagai data outlier.  Lihat tabel output berikut. x = nilai data X = nilai rata-rata Z = Nilai standar

12 Deteksi Data Outlier

13 Deteksi Data Outlier

14 Deteksi Data Outlier 2. Scatter Plot Langkah-langkah:
Buka file outlier. Menu Graph  Legacy Dialogs  Scatter/Dot Pada kotak SCATTER/DOT, pilih SIMPLE SCATTER dan tekan tombol DEFINE. Masukkan variabel income pada sumbu X dan variabel usia pada sumbu Y. Abaikan bagian yang lain, lalu klik OK  Output dapat dilihat pada outlier scatter plot.sav

15 Deteksi Data Outlier Scatter Plot Outlier Outlier

16 Deteksi Data Outlier 3. Box Plot Langkah-langkah: Buka file outlier.
Menu Analyse  Descriptive Statistics  Explore ... Masukkan variabel usia dan berat pada kotak DEPENDENT LIST. Pada bagian DISPLAY (kiri bawah), klik Plots Buka kotak PLOTS, lalu nonaktifkan steam and leaf pada bagian DESCRIPTIVES. Klik Continue. Abaikan yang lain lalu klik OK.  Output disimpan pada file outlier box plot

17 Deteksi Data Outlier Output: Ekstrim Max Outlier Median Min

18 Deteksi Data Outlier Ketentuan Box Plot:
Outlier  Jika data terletak 1,5 kali panjang box plot, yang dimulai dari batas atas atau batas bawah Ekstrim  Jika data terletak melebihi 3 kali panjang box plot, yang dimulai dari batas atas atau batas bawah

19 Penanganan Outlier Ada dua cara penanganan outlier:
Dihilangkan/dibuang, jika dianggap mencerminkan data yang sesungguhnya atau karena kesalahan pengambilan data, kesalahan inputing dsb. Dipertahankan, jika data tersebut memang ada atau tidak ada indikasi kesalahan. Pilihan no.1 atau no.2  tergantung pengguna.

20 Uji Normalitas Data Tujuan:
Untuk mengetahui apakah data terdistribusi secara normal  bentuk lonceng (bell shape) Data yang baik  distribusi normal

21 Uji Normalitas Data Contoh : Buka file outlier
Menu Analyze  Descriptive Statistics  Explore... Masukkan variabel usia dan berat pada kotak DEPENDENT LIST Pada bagian DISPLAY, klik kotak Plots Buka kotak PLOTS Aktifkan kotak Normality Plots with tests NON AKTIFKAN pilihan steam and leaf pada bagian DESCRIPTIVES Pilih None pada bagian BOXPLOT Tekan CONTINUE Abaikan yang lain lalu klik OK.

22 Uji Normalitas Data OutputNormalitas Data
Kriteria uji  lihat Kolmogorov-Smirnov dan Shapiro-Wilk Jika Sig. > 0.05  data terdistribusi normal Jika Sig. < 0.05  data tidak terdistribusi normal

23 Uji Normalitas Data Diagram Plot : Contoh Data yang terdistribusi normal Data bergerombol disekitar garis uji Data menyebar secara acak, tidak membentuk pola tertentu

24 Uji Normalitas Data Diagram Plot : Contoh Data yang terdistribusi tidak normal Data bergerombol disekitar garis uji, namun ada data yg terletak jauh dari sebaran data Data membentuk pola tertentu, ke kanan bawah kemudian naik ke atas

25 Penanganan Data Tidak Normal
Ada 4 perlakuan: Menambah jumlah data Menghilangkan data penyebab tidak normal Dilakukan transformasi data, misal mengubah data ke bentuk logaritma atau natural atau bentuk lainnya, lalu diuji ulang Terima apa adanya. Pilih alat analisis yang tepat, misalnya gunakan uji nonparametrik

26 Uji Homoskedastisitas Data
Tujuan: Untuk mengetahui apakah sebuah kelompok data mempunyai varians yang sama (seperti yang seharusnya terjadi). Jika varians-nya sama  homoskedastisitas Jika varians-nya tdk sama  heteroskedastisitas Alat uji: Levene Test Analisis Residual  grafik

27 Uji Homoskedastisitas Data
Contoh : Buka file homoskedastisitas Menu Analyze  Descriptive Statistics  Explore... Masukkan variabel tinggi dan jam kerja pada kotak DEPENDENT LIST Masukkan variabel minum pada kotak FACTOR LIST Pada bagian DISPLAY, tetap pada pilihan both Buka kotak PLOTS Pilih none pada bagian BOXPLOTS NON AKTIFKAN pilihan steam and leaf pada bagian DESCRIPTIVES Pada bagian SPRED VS LEVEL WITH LEVENE TEST, pilih power estimation. Tekan CONTINUE, abaikan yang lain lalu klik OK.

28 Uji Homoskedastisitas Data
Test of Homogeneity of Variance Levene Statistic df1 df2 Sig. tinggi Based on Mean 4,244 1 73 ,043 Based on Median 3,789 ,055 Based on Median and with adjusted df 71,641 ,056 Based on trimmed mean 4,143 ,045 jamkerja 2,822 ,097 2,062 ,155 68,546 ,156 2,775 ,100 Output Hipotesis: H0 : kedua varians populasi sama H1 : Kedua varians populasi berbeda/tidak identik Jika: Sig. > 0.05  H0 diterima , artinya varians-nya sama Sig. < 0.05  H0 ditolak, artinya varians-nya berbeda

29 Uji Homoskedastisitas Data
Kesimpulan: Varians data tinggi konsumen yg minum sedikit air mineral berbeda secara nyata dengan varians data tinggi konsumen dengan banyak minum air mineral. Heteroskedastisitas Varians data jam kerja konsumen yang minum sedikit air sama dengan varians data konsumen dengan banyak minum air mineral  homoskedastisitas

30 Penanganan Terhadap Adanya Heteroskedastisitas
Dilakukan transformasi data, misal mengubah data ke bentuk logaritma atau natural atau bentuk lainnya, lalu diuji ulang dengan Levene Test.

31 Uji Linearitas Data Linearitas adalah keadaan di mana hubungan antara variabel dependen dengan variabel independen bersifat linear (garis lurus) dalam range variabel tertentu. Pengujian dilakukan dengan scatter plot (diagram pencar)

32 Uji Linearitas Data Contoh : Uji asumsi linearitas variabel usia – income Buka file homoskedastisitas Menu Graph  Legacy Dialogs  Scatter/dot Pada kotak SCATTER/DOT, pilih SIMPLE SCATTER, kemudian tekan tombol DEFINE. Masukkan variabel usia pada sumbu X dan variabel olahraga pada sumbu Y. Abaikan yang lain lalu klik OK. Cara membuat garis lurus pada grafik yang ada: Letakkan pointer pada grafik dan klik ganda untuk masuk ke CHART EDITOR Klik ikon ADD FIT LINE AT TOTAL, sesaat akan muncul garis regresi Tutup chart editor utk kembali ke output grafik.

33 Uji Linearitas Data Output: Variabel Usia - Olahraga

34 Uji Linearitas Data Contoh : Uji asumsi linearitas variabel Olahraga - Berat Buka file homoskedastisitas Menu Graph  Legacy Dialogs  Scatter/dot Pada kotak SCATTER/DOT, pilih SIMPLE SCATTER, kemudian tekan tombol DEFINE. Masukkan variabel berat pada sumbu X dan variabel olahraga pada sumbu Y. Abaikan yang lain lalu klik OK. Cara membuat garis lurus pada grafik yang ada: Letakkan pointer pada grafik dan klik ganda untuk masuk ke CHART EDITOR Klik ikon ADD FIT LINE AT TOTAL, sesaat akan muncul garis regresi Tutup chart editor utk kembali ke output grafik.

35 Uji Linearitas Data Output: Variabel Berat - Olahraga

36 Uji Linearitas Data Kesimpulan: 1. Untuk variabel usia – olah raga  ada hubungan linear (ada linearitas) 2. Untuk variabel berat – olahraga  tidak ada hubungan linear (tidak ada linearitas)


Download ppt "PENGUJIAN DATA."

Presentasi serupa


Iklan oleh Google