Presentasi sedang didownload. Silahkan tunggu

Presentasi sedang didownload. Silahkan tunggu

Langkah awal sebelum menganalisis data Oleh : Rahmad Wijaya.

Presentasi serupa


Presentasi berjudul: "Langkah awal sebelum menganalisis data Oleh : Rahmad Wijaya."— Transcript presentasi:

1

2 Langkah awal sebelum menganalisis data Oleh : Rahmad Wijaya

3 Pokok Bahasan Missing Value dan perlakuannyaMissing Value dan perlakuannyaMissing Value dan perlakuannyaMissing Value dan perlakuannya Kesalahan Entry DataKesalahan Entry DataKesalahan Entry DataKesalahan Entry Data Sebaran dan Smooting DataSebaran dan Smooting DataSebaran dan Smooting DataSebaran dan Smooting Data Efisiensi Sebaran DataEfisiensi Sebaran DataEfisiensi Sebaran DataEfisiensi Sebaran Data Deteksi Normalitas DataDeteksi Normalitas DataDeteksi Normalitas DataDeteksi Normalitas Data

4 Missing Value & perlakuannya Definisi Missing Value Perlakuan terhadap missing valuePerlakuan terhadap missing value Pairwise Deletion of Missing Data vs. Mean Substitution.Pairwise Deletion of Missing Data vs. Mean Substitution. Casewise vs. Pairwise Deletion of Missing DataCasewise vs. Pairwise Deletion of Missing Data Pengaturan missing value

5 Perlakuan terhadap Missing Value Mean Substitution of missing data (SPSS : Replace with mean) Pairwise deletion of missing data Casewise (Listwise) deletion of missing data

6 Pairwise Deletion of Missing Data vs. Mean Substitution  Keunggulan : mean subtitution hasilnya konsisten secara internal.  Kelemahan :  Mean substitution menurunkan nilai varian. Semakin banyak data yang hilang menjadikan skor rata-rata menjadi sempurna.  Sebab penggantian data yang hilang tersebut dengan data buatan, akan menciptakan nilai data menjadi “rata-rata”, sehingga mean substitution perlu dipertimbangkan terhadap perubahan nilai korelasi.

7 Casewise vs. Pairwise Deletion of Missing Data.  Casewise digunakan pada waktu penghitungan matrik korelasi, maka akan diperoleh matrik korelasi yang “benar”  Gunakan Pairwise jika data yang hilang kecil (< 10 %) dan missing data tersebar merata). Jangan digunakan pada permasalahan yang serius.

8 Pengaturan missing value No missing values Discrete missing values Range of missing values Range plus one discrete missing values SPSS Display

9 Kesalahan Entry Data Pada data dengan range tertentu, kesalahan entry dapat diketahui dengan distribusi frekuensi. Contoh :

10 Sebaran dan Smooting Data SEBARAN DATA Tujuan umumTujuan umum Fit of the Observed DistributionFit of the Observed Distribution Distribusi apa yang dipergunakan ?Distribusi apa yang dipergunakan ?

11 Smoothing (Outlier) Gunakan scatterplot. Outlier mempengaruhi nilai korelasi dan garis regresi Pendekatan kuantitatif untuk Outliers

12 Efisiensi Sebaran Data Ukuran Pemusatan : Rata-rata Hitung, Median, Modus Dispersi : Range, Deviasi Rata-rata,Varian, Deviasi Standar Skewness Memilih rata-rata dalam distribusi frekuensi

13 Ukuran Pemusatan : Rata-rata Hitung Sifat Rata-rata Hitung : Skala interval dan skala rasio saja Semua nilai dimasukkan Satu kelompok data hanya mempunyai satu rata-rata hitung Jumlah deviasi setiap nilai terhadap rata-rata hitungnya selalu sama dengan nol. Kelemahan rata-rata hitung : Dipengaruhi Nilai Ekstrem

14 Ukuran Pemusatan : Median dan Modus Modus untuk menjelaskan data yang diukur dalam skala nominal dan ordinal. Berarti modus dapat dipergunakan untuk semua jenis skala data. Keuntungan : Tidak dipengaruhi nilai Kelemahan : Seringkali data tidak memiliki modus. Ada pula kelompok data yang memiliki lebih dari satu modus.

15 Dispersi Rata-rata hitung atau median, hanya menunjukkan titik tengah data dan tidak menunjukkan penyebaran data. Ukuran Dispersi antara lain : Jarak (range) Deviasi Rata-rata (average deviation) Varian (Variance) Deviasi Standar (Standard Deviation)

16 Skewness Diukur dengan koefisien kecondongan Pearson (Pearson coefficient skewness). Bila Sk >0, maka distribusi terkonsentrai ke kanan (skewness positif) Bila Sk <0, maka distribusi terkonsentrai ke kiri (skewness negatif)

17 Memilih rata-rata dalam distribusi frekuensi Tingkat kemenjuluran yang sangat tinggi, jangan gunakan rata-rata hitung Dispersi yang besar (datanya menyebar), jangan memakai rata-rata hitung. Distribusi normal, pakailah rata-rata hitung. DASAR PEMILIHAN NILAI SATISTIK : Tidak Bias Efisien Konsisten

18 Deteksi Normalitas Data Level Significant Pentingnya Distribusi Normal Apakah seluruh uji statistik menggunakan distribusi normal ?

19


Download ppt "Langkah awal sebelum menganalisis data Oleh : Rahmad Wijaya."

Presentasi serupa


Iklan oleh Google