Upload presentasi
Presentasi sedang didownload. Silahkan tunggu
1
Langkah awal sebelum menganalisis data
Oleh : Rahmad Wijaya
2
Pokok Bahasan Missing Value dan perlakuannya Kesalahan Entry Data
Sebaran dan Smooting Data Efisiensi Sebaran Data Deteksi Normalitas Data
3
Missing Value & perlakuannya
Definisi Missing Value Perlakuan terhadap missing value Pairwise Deletion of Missing Data vs. Mean Substitution. Casewise vs. Pairwise Deletion of Missing Data Pengaturan missing value
4
Perlakuan terhadap Missing Value
Mean Substitution of missing data (SPSS : Replace with mean) Pairwise deletion of missing data Casewise (Listwise) deletion of missing data
5
Pairwise Deletion of Missing Data vs. Mean Substitution
Keunggulan : mean subtitution hasilnya konsisten secara internal. Kelemahan : Mean substitution menurunkan nilai varian. Semakin banyak data yang hilang menjadikan skor rata-rata menjadi sempurna. Sebab penggantian data yang hilang tersebut dengan data buatan, akan menciptakan nilai data menjadi “rata-rata”, sehingga mean substitution perlu dipertimbangkan terhadap perubahan nilai korelasi.
6
Casewise vs. Pairwise Deletion of Missing Data.
Casewise digunakan pada waktu penghitungan matrik korelasi, maka akan diperoleh matrik korelasi yang “benar” Gunakan Pairwise jika data yang hilang kecil (< 10 %) dan missing data tersebar merata). Jangan digunakan pada permasalahan yang serius.
7
Pengaturan missing value
No missing values Discrete missing values Range of missing values Range plus one discrete missing values SPSS Display
8
Kesalahan Entry Data Pada data dengan range tertentu, kesalahan entry dapat diketahui dengan distribusi frekuensi. Contoh :
9
Sebaran dan Smooting Data
SEBARAN DATA Tujuan umum Fit of the Observed Distribution Distribusi apa yang dipergunakan ?
10
Smoothing (Outlier) Gunakan scatterplot.
Outlier mempengaruhi nilai korelasi dan garis regresi Pendekatan kuantitatif untuk Outliers
11
Efisiensi Sebaran Data
Ukuran Pemusatan : Rata-rata Hitung, Median, Modus Dispersi : Range, Deviasi Rata-rata,Varian, Deviasi Standar Skewness Memilih rata-rata dalam distribusi frekuensi
12
Ukuran Pemusatan : Rata-rata Hitung
Sifat Rata-rata Hitung : Skala interval dan skala rasio saja Semua nilai dimasukkan Satu kelompok data hanya mempunyai satu rata-rata hitung Jumlah deviasi setiap nilai terhadap rata-rata hitungnya selalu sama dengan nol. Kelemahan rata-rata hitung : Dipengaruhi Nilai Ekstrem
13
Ukuran Pemusatan : Median dan Modus
Modus untuk menjelaskan data yang diukur dalam skala nominal dan ordinal. Berarti modus dapat dipergunakan untuk semua jenis skala data. Keuntungan : Tidak dipengaruhi nilai Kelemahan : Seringkali data tidak memiliki modus. Ada pula kelompok data yang memiliki lebih dari satu modus.
14
Dispersi Rata-rata hitung atau median, hanya menunjukkan titik tengah data dan tidak menunjukkan penyebaran data. Ukuran Dispersi antara lain : Jarak (range) Deviasi Rata-rata (average deviation) Varian (Variance) Deviasi Standar (Standard Deviation)
15
Skewness Diukur dengan koefisien kecondongan Pearson (Pearson coefficient skewness). Bila Sk >0, maka distribusi terkonsentrai ke kanan (skewness positif) Bila Sk <0, maka distribusi terkonsentrai ke kiri (skewness negatif)
16
Memilih rata-rata dalam distribusi frekuensi
Tingkat kemenjuluran yang sangat tinggi, jangan gunakan rata-rata hitung Dispersi yang besar (datanya menyebar), jangan memakai rata-rata hitung. Distribusi normal, pakailah rata-rata hitung. DASAR PEMILIHAN NILAI SATISTIK : Tidak Bias Efisien Konsisten
17
Deteksi Normalitas Data
Level Significant Pentingnya Distribusi Normal Apakah seluruh uji statistik menggunakan distribusi normal ?
18
Terima Kasih
Presentasi serupa
© 2024 SlidePlayer.info Inc.
All rights reserved.