Presentasi sedang didownload. Silahkan tunggu

Presentasi sedang didownload. Silahkan tunggu

Langkah awal sebelum menganalisis data

Presentasi serupa


Presentasi berjudul: "Langkah awal sebelum menganalisis data"— Transcript presentasi:

1 Langkah awal sebelum menganalisis data
Oleh : Rahmad Wijaya

2 Pokok Bahasan Missing Value dan perlakuannya Kesalahan Entry Data
Sebaran dan Smooting Data Efisiensi Sebaran Data Deteksi Normalitas Data

3 Missing Value & perlakuannya
Definisi Missing Value Perlakuan terhadap missing value Pairwise Deletion of Missing Data vs. Mean Substitution. Casewise vs. Pairwise Deletion of Missing Data Pengaturan missing value

4 Perlakuan terhadap Missing Value
Mean Substitution of missing data (SPSS : Replace with mean) Pairwise deletion of missing data Casewise (Listwise) deletion of missing data

5 Pairwise Deletion of Missing Data vs. Mean Substitution
Keunggulan : mean subtitution hasilnya konsisten secara internal. Kelemahan : Mean substitution menurunkan nilai varian. Semakin banyak data yang hilang menjadikan skor rata-rata menjadi sempurna. Sebab penggantian data yang hilang tersebut dengan data buatan, akan menciptakan nilai data menjadi “rata-rata”, sehingga mean substitution perlu dipertimbangkan terhadap perubahan nilai korelasi.

6 Casewise vs. Pairwise Deletion of Missing Data.
Casewise digunakan pada waktu penghitungan matrik korelasi, maka akan diperoleh matrik korelasi yang “benar” Gunakan Pairwise jika data yang hilang kecil (< 10 %) dan missing data tersebar merata). Jangan digunakan pada permasalahan yang serius.

7 Pengaturan missing value
No missing values Discrete missing values Range of missing values Range plus one discrete missing values SPSS Display

8 Kesalahan Entry Data Pada data dengan range tertentu, kesalahan entry dapat diketahui dengan distribusi frekuensi. Contoh :

9 Sebaran dan Smooting Data
SEBARAN DATA Tujuan umum Fit of the Observed Distribution Distribusi apa yang dipergunakan ?

10 Smoothing (Outlier) Gunakan scatterplot.
Outlier mempengaruhi nilai korelasi dan garis regresi Pendekatan kuantitatif untuk Outliers

11 Efisiensi Sebaran Data
Ukuran Pemusatan : Rata-rata Hitung, Median, Modus Dispersi : Range, Deviasi Rata-rata,Varian, Deviasi Standar Skewness Memilih rata-rata dalam distribusi frekuensi

12 Ukuran Pemusatan : Rata-rata Hitung
Sifat Rata-rata Hitung : Skala interval dan skala rasio saja Semua nilai dimasukkan Satu kelompok data hanya mempunyai satu rata-rata hitung Jumlah deviasi setiap nilai terhadap rata-rata hitungnya selalu sama dengan nol. Kelemahan rata-rata hitung : Dipengaruhi Nilai Ekstrem

13 Ukuran Pemusatan : Median dan Modus
Modus untuk menjelaskan data yang diukur dalam skala nominal dan ordinal. Berarti modus dapat dipergunakan untuk semua jenis skala data. Keuntungan : Tidak dipengaruhi nilai Kelemahan : Seringkali data tidak memiliki modus. Ada pula kelompok data yang memiliki lebih dari satu modus.

14 Dispersi Rata-rata hitung atau median, hanya menunjukkan titik tengah data dan tidak menunjukkan penyebaran data. Ukuran Dispersi antara lain : Jarak (range) Deviasi Rata-rata (average deviation) Varian (Variance) Deviasi Standar (Standard Deviation)

15 Skewness Diukur dengan koefisien kecondongan Pearson (Pearson coefficient skewness). Bila Sk >0, maka distribusi terkonsentrai ke kanan (skewness positif) Bila Sk <0, maka distribusi terkonsentrai ke kiri (skewness negatif)

16 Memilih rata-rata dalam distribusi frekuensi
Tingkat kemenjuluran yang sangat tinggi, jangan gunakan rata-rata hitung Dispersi yang besar (datanya menyebar), jangan memakai rata-rata hitung. Distribusi normal, pakailah rata-rata hitung. DASAR PEMILIHAN NILAI SATISTIK : Tidak Bias Efisien Konsisten

17 Deteksi Normalitas Data
Level Significant Pentingnya Distribusi Normal Apakah seluruh uji statistik menggunakan distribusi normal ?

18 Terima Kasih


Download ppt "Langkah awal sebelum menganalisis data"

Presentasi serupa


Iklan oleh Google