Langkah awal sebelum menganalisis data

Langkah awal sebelum menganalisis data
Oleh : Rahmad Wijaya

Pokok Bahasan Missing Value dan perlakuannya Kesalahan Entry Data
Sebaran dan Smooting Data Efisiensi Sebaran Data Deteksi Normalitas Data

Missing Value & perlakuannya
Definisi Missing Value Perlakuan terhadap missing value Pairwise Deletion of Missing Data vs. Mean Substitution. Casewise vs. Pairwise Deletion of Missing Data Pengaturan missing value

Perlakuan terhadap Missing Value
Mean Substitution of missing data (SPSS : Replace with mean) Pairwise deletion of missing data Casewise (Listwise) deletion of missing data

Pairwise Deletion of Missing Data vs. Mean Substitution
Keunggulan : mean subtitution hasilnya konsisten secara internal. Kelemahan : Mean substitution menurunkan nilai varian. Semakin banyak data yang hilang menjadikan skor rata-rata menjadi sempurna. Sebab penggantian data yang hilang tersebut dengan data buatan, akan menciptakan nilai data menjadi “rata-rata”, sehingga mean substitution perlu dipertimbangkan terhadap perubahan nilai korelasi.

Casewise vs. Pairwise Deletion of Missing Data.
Casewise digunakan pada waktu penghitungan matrik korelasi, maka akan diperoleh matrik korelasi yang “benar” Gunakan Pairwise jika data yang hilang kecil (< 10 %) dan missing data tersebar merata). Jangan digunakan pada permasalahan yang serius.

Pengaturan missing value
No missing values Discrete missing values Range of missing values Range plus one discrete missing values SPSS Display

Kesalahan Entry Data Pada data dengan range tertentu, kesalahan entry dapat diketahui dengan distribusi frekuensi. Contoh :

Sebaran dan Smooting Data
SEBARAN DATA Tujuan umum Fit of the Observed Distribution Distribusi apa yang dipergunakan ?

Smoothing (Outlier) Gunakan scatterplot.
Outlier mempengaruhi nilai korelasi dan garis regresi Pendekatan kuantitatif untuk Outliers

Efisiensi Sebaran Data
Ukuran Pemusatan : Rata-rata Hitung, Median, Modus Dispersi : Range, Deviasi Rata-rata,Varian, Deviasi Standar Skewness Memilih rata-rata dalam distribusi frekuensi

Ukuran Pemusatan : Rata-rata Hitung
Sifat Rata-rata Hitung : Skala interval dan skala rasio saja Semua nilai dimasukkan Satu kelompok data hanya mempunyai satu rata-rata hitung Jumlah deviasi setiap nilai terhadap rata-rata hitungnya selalu sama dengan nol. Kelemahan rata-rata hitung : Dipengaruhi Nilai Ekstrem

Ukuran Pemusatan : Median dan Modus
Modus untuk menjelaskan data yang diukur dalam skala nominal dan ordinal. Berarti modus dapat dipergunakan untuk semua jenis skala data. Keuntungan : Tidak dipengaruhi nilai Kelemahan : Seringkali data tidak memiliki modus. Ada pula kelompok data yang memiliki lebih dari satu modus.

Dispersi Rata-rata hitung atau median, hanya menunjukkan titik tengah data dan tidak menunjukkan penyebaran data. Ukuran Dispersi antara lain : Jarak (range) Deviasi Rata-rata (average deviation) Varian (Variance) Deviasi Standar (Standard Deviation)

Skewness Diukur dengan koefisien kecondongan Pearson (Pearson coefficient skewness). Bila Sk >0, maka distribusi terkonsentrai ke kanan (skewness positif) Bila Sk <0, maka distribusi terkonsentrai ke kiri (skewness negatif)

Memilih rata-rata dalam distribusi frekuensi
Tingkat kemenjuluran yang sangat tinggi, jangan gunakan rata-rata hitung Dispersi yang besar (datanya menyebar), jangan memakai rata-rata hitung. Distribusi normal, pakailah rata-rata hitung. DASAR PEMILIHAN NILAI SATISTIK : Tidak Bias Efisien Konsisten

Deteksi Normalitas Data
Level Significant Pentingnya Distribusi Normal Apakah seluruh uji statistik menggunakan distribusi normal ?

Terima Kasih

Langkah awal sebelum menganalisis data

Presentasi serupa

Presentasi berjudul: "Langkah awal sebelum menganalisis data"— Transcript presentasi:

Presentasi serupa

Tentang proyek

Tanggapan

Masuk

Otorisasi melalui jaringan sosial:

Langkah awal sebelum menganalisis data

Presentasi serupa

Presentasi berjudul: "Langkah awal sebelum menganalisis data"— Transcript presentasi:

Presentasi serupa

Tentang proyek

Tanggapan