PENGUJIAN DATA.

Slides:



Advertisements
Presentasi serupa
(DESCRIPTIVE ANALYZE)
Advertisements

PERTEMUAN 4 GRAFIK DAN TABEL.
PENGUKURAN STATISTIK DESKRIPTIF
UJI ASUMSI KLASIK.
MATERI-5 STATISTIKA DESKRIPTIF OLEH IR. INDRAWANI SINOEM, MS.
UJI ASUMSI KLASIK.
OLAP CUBES Digunakan utk meringkas data secara praktis, termasuk banyak variabel.Hasilnya berupa gambaran sederhana data, tidak inferensi(analisa buat.
STATISTIKA DESKRIPTIF
Statistik Deskriptif.
PEMBAHASAN Hasil SPSS 21.
UJI ASUMSI KLASIK.
2. Independent-Sample T Test
Anas Tamsuri UJI STATISTIK UJI STATISTIK.
Contoh Perhitungan Regresi Oleh Jonathan Sarwono.
oleh: Hutomo Atman Maulana, S.Pd. M.Si
MODUL 11 METODE PENELITIAN ANALISIS DATA (ANALISIS REGRESI)
DESCRIPTIVE STATISTICS
APLIKASI KOMPUTER LANJUTAN TEORI DAN PRAKTEK
FEB Univ. 17 Agustus 1945 Jakarta
PERTEMUAN Ke-13 Dosen pengasuh: Moraida Hasanah, S.Si., M.Si
STATISTIK DESKRIPTIF.
STATISTIK DESKRIPTIF Adhi Gurmilang.
created by Vilda Ana Veria Setyawati
MAGISTER MANAGEMENT PROGRAM UNIVERSITAS KOMPUTER INDONESIA
UJI CHI SQUARE.
FEB Univ. 17 Agustus 1945 Jakarta
Chi Square.
Analisis Regresi Linier Berganda dan Uji t
UJI NORMALITAS.
KORELASI & REGRESI.
JURUSAN PENDIDIKAN EKONOMI FAKULTAS EKONOMI UNNES
Chi Square.
UJI ASUMSI KLASIK & GOODNESS OF FIT MODEL REGRESI LINEAR
Uji Chi Square.
ANALISIS MODERATING.
Uji t Dua Sampel Independent dengan SPSS
Pertemuan Ke-7 REGRESI LINIER BERGANDA
Uji Asumsi Klasik MULTIKOLINIERITAS 2. AUTOKORELASI
JURUSAN PENDIDIKAN EKONOMI
Uji Persyaratan Analisis Data
Uji Kolmogorov-Smirnov
STATISTIK II Pertemuan 12: Asumsi Analisis Regresi Dosen Pengampu MK:
Uji Asumsi Klasik Multikolinearitas Normalitas
MODUL 10 ANALISIS REGRESI
ANOVA ANALYSIS OF VARIANCE.
Regresi linier satu variable Independent
ANALISIS DASAR DALAM STATISTIKA
STATISTIK II Pertemuan 12-13: Asumsi Analisis Regresi
Adhi Gurmilang STATISTIK DESKRIPTIF.
VALIDITAS DAN REABILITAS REGRESI BERGANDA Nori Sahrun, S.Kom., M.Kom
REGRESI BERGANDA dan PENGEMBANGAN Nori Sahrun., S.Kom., M.Kom
TUGAS AKHIR PRAKTIKUM METODE STATISTIKA II
Binomial.
ANALISA STATISTIKA UMI SOLIKHAH.
Makta Kuliah Bimbingan Penulisan Skripsi 2
Regresi Linier Beberapa Variable Independent
STATISTIK II Pertemuan 13: Asumsi Analisis Regresi Dosen Pengampu MK:
05 Praktikum Total Quality Management
UJI NORMALITAS MENGGUNAKAN Q-Q PLOT STATISTIKA
UJI NORMALITAS MENGGUNAKAN P-P PLOT STATISTIKA
ANALISIS HUBUNGAN NUMERIK DENGAN NUMERIK (UJI KORELASI)
Distribusi Univariat, Multivariat, Penerapan, dan Jarak
UJI ASUMSI KLASIK Oleh: Dr. Suliyanto, SE,MM
Analisis dan Eksplorasi Data serta Statistika Deskriptif
UJI ASUMSI KLASIK.
Analisis lainnya Resista Vikaliana 25/03/2016.
Regresi Linier dan Korelasi
UJI VALIDITAS DAN RELIABILITAS
STATISTIK DESKRIPTIF.
Ukuran Distribusi.
Transcript presentasi:

PENGUJIAN DATA

Uji Data Uji missing data Untuk melihat apakah data yang tidak lengkap/hilang akan memengaruhi pengolahan data secara keseluruhan Uji data outlier Untuk mengetahui sejauh mana data outlier akan mengganggu keseluruhan data, yang dapat mengakibatkan kesalahan dalam menarik kesimpulan Uji asumsi klasik Untuk mengetahui apakah data memenuhi beberapa asumsi pokok seperti: normalitas data, linearitas data, homoskedastisitas data, dsb.

Analisis Missing Data Missing data: Sel-sel kosong pada variabel Disebabkan karena informasi/data tidak diberikan, sulit diperoleh, atau lupa ditanyakan Contoh: Data umur Data gaji/penghasilan Dampaknya? Jika sedikit (sekitar 1%)  dihapus tidak masalah Jika banyak  perlu pengujian apakah layak diproses lebih lanjut atau tidak

Analisis Missing Data Uji Keacakan : Untuk mengetahui apakah data yang hilang bersifat random atau tidak Random  tidak ada pola tertentu Contoh: Kasus 1  lihat buku Singgih Santoso hal.16.

Analisis Missing Data Kasus 1: Uji Keacakan Data Langkah-langkah: Buka file : missing value.sav Analyze Missing value analysis Masukkan variabel: usia, berat, tinggi dll. ke bagian QUANTITATIVE VARIABLE. Masukkan variabel minum ke bagian CATEGORICAL VARIABLE. Masukkan variabel nama ke bagian CASE LABELS. Pada bagian ESTIMATION (kanan tengah), klik kotak listwise, pairwise, dan EM Klik ikon PATTERN . Pada bagian DISPLAY klik Tabulated cases.... dan Cases with missing values..... Klik CONTINUE. Klik DESCRIPTIVES Pada bagian INDICATOR VARIABLE STATISTICS, klik Percent missmatch dan klik juga Crosstabulation of .... Klik OK.

Analisis Missing Data Bagaimana mengatasi missing data? Membuang data (kasus) Mengisi sel (data) yang hilang dengan data tertentu  rata-rata keseluruhan  Lihat contoh Kasus 2.

Analisis Missing Data Kasus 2: Perlakuan terhadap Missing Data Langkah-langkah: Buka file : missing value.sav Pilih menu: Transform  Replace Missing Value Masukkan variabel: usia, berat, tinggi, income, jam kerja dan olah raga ke bagian NEW VARIABLE. Bagian NAME AND METHOD Bagian NAME  otomatis menampilkan variabel baru USIA_1, dll. Bagian METHOD  pilih Series Mean Abaikan bagian yang lain. 5. Klik OK.

Uji Data Outlier Outlier : Mengapa terjadi outlier? Data yang secara nyata berbeda dengan data-data yang lain Mengapa terjadi outlier? Kesalahan dalam pemasukan data Kesalahan pengambilan sampel Memang ada data ekstrim

Deteksi Data Outlier Membuat nilai z (standardisasi data) Deteksi dapat dilakukan dengan 3 cara: Membuat nilai z (standardisasi data) Membuat grafik/diagram Scatter Plot Penyajian Box Plot

Deteksi Data Outlier 1. Standardisasi Data Langkah-langkah: 1. Buka file outlier. 2. Menu Analyse  Descriptive Statistics  Descriptive 3. Masukkan variabel usia, berat, tinggi, income, jam kerja dan olah raga ke bagian VARIABLE(S). 4. Aktifkan (klik) Save standardized values at variables. Abaikan yang lain lalu klik OK.  Output dapat dilihat pada outlier uji z.sav

Deteksi Data Outlier Rumus standardisasi: _ z = x - X Std. Deviasi Jika nilai z < - 2,5 atau z > + 2,5 maka data tersebut dikategorikan sebagai data outlier.  Lihat tabel output berikut. x = nilai data X = nilai rata-rata Z = Nilai standar

Deteksi Data Outlier

Deteksi Data Outlier

Deteksi Data Outlier 2. Scatter Plot Langkah-langkah: Buka file outlier. Menu Graph  Legacy Dialogs  Scatter/Dot Pada kotak SCATTER/DOT, pilih SIMPLE SCATTER dan tekan tombol DEFINE. Masukkan variabel income pada sumbu X dan variabel usia pada sumbu Y. Abaikan bagian yang lain, lalu klik OK  Output dapat dilihat pada outlier scatter plot.sav

Deteksi Data Outlier Scatter Plot Outlier Outlier

Deteksi Data Outlier 3. Box Plot Langkah-langkah: Buka file outlier. Menu Analyse  Descriptive Statistics  Explore ... Masukkan variabel usia dan berat pada kotak DEPENDENT LIST. Pada bagian DISPLAY (kiri bawah), klik Plots Buka kotak PLOTS, lalu nonaktifkan steam and leaf pada bagian DESCRIPTIVES. Klik Continue. Abaikan yang lain lalu klik OK.  Output disimpan pada file outlier box plot

Deteksi Data Outlier Output: Ekstrim Max Outlier Median Min

Deteksi Data Outlier Ketentuan Box Plot: Outlier  Jika data terletak 1,5 kali panjang box plot, yang dimulai dari batas atas atau batas bawah Ekstrim  Jika data terletak melebihi 3 kali panjang box plot, yang dimulai dari batas atas atau batas bawah

Penanganan Outlier Ada dua cara penanganan outlier: Dihilangkan/dibuang, jika dianggap mencerminkan data yang sesungguhnya atau karena kesalahan pengambilan data, kesalahan inputing dsb. Dipertahankan, jika data tersebut memang ada atau tidak ada indikasi kesalahan. Pilihan no.1 atau no.2  tergantung pengguna.

Uji Normalitas Data Tujuan: Untuk mengetahui apakah data terdistribusi secara normal  bentuk lonceng (bell shape) Data yang baik  distribusi normal

Uji Normalitas Data Contoh : Buka file outlier Menu Analyze  Descriptive Statistics  Explore... Masukkan variabel usia dan berat pada kotak DEPENDENT LIST Pada bagian DISPLAY, klik kotak Plots Buka kotak PLOTS Aktifkan kotak Normality Plots with tests NON AKTIFKAN pilihan steam and leaf pada bagian DESCRIPTIVES Pilih None pada bagian BOXPLOT Tekan CONTINUE Abaikan yang lain lalu klik OK.

Uji Normalitas Data OutputNormalitas Data Kriteria uji  lihat Kolmogorov-Smirnov dan Shapiro-Wilk Jika Sig. > 0.05  data terdistribusi normal Jika Sig. < 0.05  data tidak terdistribusi normal

Uji Normalitas Data Diagram Plot : Contoh Data yang terdistribusi normal Data bergerombol disekitar garis uji Data menyebar secara acak, tidak membentuk pola tertentu

Uji Normalitas Data Diagram Plot : Contoh Data yang terdistribusi tidak normal Data bergerombol disekitar garis uji, namun ada data yg terletak jauh dari sebaran data Data membentuk pola tertentu, ke kanan bawah kemudian naik ke atas

Penanganan Data Tidak Normal Ada 4 perlakuan: Menambah jumlah data Menghilangkan data penyebab tidak normal Dilakukan transformasi data, misal mengubah data ke bentuk logaritma atau natural atau bentuk lainnya, lalu diuji ulang Terima apa adanya. Pilih alat analisis yang tepat, misalnya gunakan uji nonparametrik

Uji Homoskedastisitas Data Tujuan: Untuk mengetahui apakah sebuah kelompok data mempunyai varians yang sama (seperti yang seharusnya terjadi). Jika varians-nya sama  homoskedastisitas Jika varians-nya tdk sama  heteroskedastisitas Alat uji: Levene Test Analisis Residual  grafik

Uji Homoskedastisitas Data Contoh : Buka file homoskedastisitas Menu Analyze  Descriptive Statistics  Explore... Masukkan variabel tinggi dan jam kerja pada kotak DEPENDENT LIST Masukkan variabel minum pada kotak FACTOR LIST Pada bagian DISPLAY, tetap pada pilihan both Buka kotak PLOTS Pilih none pada bagian BOXPLOTS NON AKTIFKAN pilihan steam and leaf pada bagian DESCRIPTIVES Pada bagian SPRED VS LEVEL WITH LEVENE TEST, pilih power estimation. Tekan CONTINUE, abaikan yang lain lalu klik OK.

Uji Homoskedastisitas Data Test of Homogeneity of Variance Levene Statistic df1 df2 Sig. tinggi Based on Mean 4,244 1 73 ,043 Based on Median 3,789 ,055 Based on Median and with adjusted df 71,641 ,056 Based on trimmed mean 4,143 ,045 jamkerja 2,822 ,097 2,062 ,155 68,546 ,156 2,775 ,100 Output Hipotesis: H0 : kedua varians populasi sama H1 : Kedua varians populasi berbeda/tidak identik Jika: Sig. > 0.05  H0 diterima , artinya varians-nya sama Sig. < 0.05  H0 ditolak, artinya varians-nya berbeda

Uji Homoskedastisitas Data Kesimpulan: Varians data tinggi konsumen yg minum sedikit air mineral berbeda secara nyata dengan varians data tinggi konsumen dengan banyak minum air mineral. Heteroskedastisitas Varians data jam kerja konsumen yang minum sedikit air sama dengan varians data konsumen dengan banyak minum air mineral  homoskedastisitas

Penanganan Terhadap Adanya Heteroskedastisitas Dilakukan transformasi data, misal mengubah data ke bentuk logaritma atau natural atau bentuk lainnya, lalu diuji ulang dengan Levene Test.

Uji Linearitas Data Linearitas adalah keadaan di mana hubungan antara variabel dependen dengan variabel independen bersifat linear (garis lurus) dalam range variabel tertentu. Pengujian dilakukan dengan scatter plot (diagram pencar)

Uji Linearitas Data Contoh : Uji asumsi linearitas variabel usia – income Buka file homoskedastisitas Menu Graph  Legacy Dialogs  Scatter/dot Pada kotak SCATTER/DOT, pilih SIMPLE SCATTER, kemudian tekan tombol DEFINE. Masukkan variabel usia pada sumbu X dan variabel olahraga pada sumbu Y. Abaikan yang lain lalu klik OK. Cara membuat garis lurus pada grafik yang ada: Letakkan pointer pada grafik dan klik ganda untuk masuk ke CHART EDITOR Klik ikon ADD FIT LINE AT TOTAL, sesaat akan muncul garis regresi Tutup chart editor utk kembali ke output grafik.

Uji Linearitas Data Output: Variabel Usia - Olahraga

Uji Linearitas Data Contoh : Uji asumsi linearitas variabel Olahraga - Berat Buka file homoskedastisitas Menu Graph  Legacy Dialogs  Scatter/dot Pada kotak SCATTER/DOT, pilih SIMPLE SCATTER, kemudian tekan tombol DEFINE. Masukkan variabel berat pada sumbu X dan variabel olahraga pada sumbu Y. Abaikan yang lain lalu klik OK. Cara membuat garis lurus pada grafik yang ada: Letakkan pointer pada grafik dan klik ganda untuk masuk ke CHART EDITOR Klik ikon ADD FIT LINE AT TOTAL, sesaat akan muncul garis regresi Tutup chart editor utk kembali ke output grafik.

Uji Linearitas Data Output: Variabel Berat - Olahraga

Uji Linearitas Data Kesimpulan: 1. Untuk variabel usia – olah raga  ada hubungan linear (ada linearitas) 2. Untuk variabel berat – olahraga  tidak ada hubungan linear (tidak ada linearitas)