Langkah awal sebelum menganalisis data Oleh : Rahmad Wijaya
Pokok Bahasan Missing Value dan perlakuannya Kesalahan Entry Data Sebaran dan Smooting Data Efisiensi Sebaran Data Deteksi Normalitas Data
Missing Value & perlakuannya Definisi Missing Value Perlakuan terhadap missing value Pairwise Deletion of Missing Data vs. Mean Substitution. Casewise vs. Pairwise Deletion of Missing Data Pengaturan missing value
Perlakuan terhadap Missing Value Mean Substitution of missing data (SPSS : Replace with mean) Pairwise deletion of missing data Casewise (Listwise) deletion of missing data
Pairwise Deletion of Missing Data vs. Mean Substitution Keunggulan : mean subtitution hasilnya konsisten secara internal. Kelemahan : Mean substitution menurunkan nilai varian. Semakin banyak data yang hilang menjadikan skor rata-rata menjadi sempurna. Sebab penggantian data yang hilang tersebut dengan data buatan, akan menciptakan nilai data menjadi “rata-rata”, sehingga mean substitution perlu dipertimbangkan terhadap perubahan nilai korelasi.
Casewise vs. Pairwise Deletion of Missing Data. Casewise digunakan pada waktu penghitungan matrik korelasi, maka akan diperoleh matrik korelasi yang “benar” Gunakan Pairwise jika data yang hilang kecil (< 10 %) dan missing data tersebar merata). Jangan digunakan pada permasalahan yang serius.
Pengaturan missing value No missing values Discrete missing values Range of missing values Range plus one discrete missing values SPSS Display
Kesalahan Entry Data Pada data dengan range tertentu, kesalahan entry dapat diketahui dengan distribusi frekuensi. Contoh :
Sebaran dan Smooting Data SEBARAN DATA Tujuan umum Fit of the Observed Distribution Distribusi apa yang dipergunakan ?
Smoothing (Outlier) Gunakan scatterplot. Outlier mempengaruhi nilai korelasi dan garis regresi Pendekatan kuantitatif untuk Outliers
Efisiensi Sebaran Data Ukuran Pemusatan : Rata-rata Hitung, Median, Modus Dispersi : Range, Deviasi Rata-rata,Varian, Deviasi Standar Skewness Memilih rata-rata dalam distribusi frekuensi
Ukuran Pemusatan : Rata-rata Hitung Sifat Rata-rata Hitung : Skala interval dan skala rasio saja Semua nilai dimasukkan Satu kelompok data hanya mempunyai satu rata-rata hitung Jumlah deviasi setiap nilai terhadap rata-rata hitungnya selalu sama dengan nol. Kelemahan rata-rata hitung : Dipengaruhi Nilai Ekstrem
Ukuran Pemusatan : Median dan Modus Modus untuk menjelaskan data yang diukur dalam skala nominal dan ordinal. Berarti modus dapat dipergunakan untuk semua jenis skala data. Keuntungan : Tidak dipengaruhi nilai Kelemahan : Seringkali data tidak memiliki modus. Ada pula kelompok data yang memiliki lebih dari satu modus.
Dispersi Rata-rata hitung atau median, hanya menunjukkan titik tengah data dan tidak menunjukkan penyebaran data. Ukuran Dispersi antara lain : Jarak (range) Deviasi Rata-rata (average deviation) Varian (Variance) Deviasi Standar (Standard Deviation)
Skewness Diukur dengan koefisien kecondongan Pearson (Pearson coefficient skewness). Bila Sk >0, maka distribusi terkonsentrai ke kanan (skewness positif) Bila Sk <0, maka distribusi terkonsentrai ke kiri (skewness negatif)
Memilih rata-rata dalam distribusi frekuensi Tingkat kemenjuluran yang sangat tinggi, jangan gunakan rata-rata hitung Dispersi yang besar (datanya menyebar), jangan memakai rata-rata hitung. Distribusi normal, pakailah rata-rata hitung. DASAR PEMILIHAN NILAI SATISTIK : Tidak Bias Efisien Konsisten
Deteksi Normalitas Data Level Significant Pentingnya Distribusi Normal Apakah seluruh uji statistik menggunakan distribusi normal ?
Terima Kasih