Statistika dan Aplikasi Komputer Sesi 2: Ukuran Sentral dan Persebaran Program Pasca Sarjana Universitas Indonesia Magister Kajian Kependudukan & Ketenagakerjaan Semester Gasal 2012/2013
Garis Besar Meninjau tugas pertemuan ke-1 Ukuran sentral/pemusatan: Rerata/rata-rata, median, modus Ukuran persebaran: range (jangkauan), deviasi/simpangan rata-rata, varians, standar deviasi (simpangan baku); Ukuran kecondongan (skewness); dan Distribusi frekuensi dan latihan 12/09/2012 E. L. Pardede
Tugas 1: Populasi & Sampel di mana: = proporsi populasi P = proporsi sampel n = besarnya sampel Untuk tingkat keyakinan 95% 12/09/2012 E. L. Pardede
Hasil Pilkada Gubernur DKI Jakarta Sumber: (3) Diolah dari http://www.republika.co.id/berita/menuju-jakarta-1/news/12/07/19/m7ev7i-ini-hasil-resmi-jumlah-suara-pilkada-dki-putaran-satu 12/09/2012
Ukuran Pemusatan/Sentral Ukuran pemusatan: nilai tunggal yang mewakili suatu kumpulan data yang menunjukkan (lokasi) pusat dari nilai data Rata-rata hitung (arithmetic mean): rata-rata hitung populasi dan sampel, rata-rata hitung tertimbang (weighted mean) Median (nilai tengah) Modus: nilai yang paling sering muncul 12/09/2012 E. L. Pardede
Rata-rata Hitung Populasi Untuk data tidak berkelompok, rata-rata hitung populasi adalah jumlah seluruh nilai dalam populasi dibagi dengan jumlah observasi dalam populasi: di mana (myu) rata-rata hitung populasi N = jumlah observasi dalam populasi X = nilai tertentu dalam populasi = penjumlahan dari.... Gunakan contoh tinggi badan rata-rata dari populasi kelas statistika S2KK tahun 2012 E. L. Pardede
Rata-rata Hitung Sampel Untuk data tidak berkelompok, rata-rata hitung sampel adalah jumlah seluruh nilai dalam sampel dibagi dengan jumlah observasi dalam sampel: di mana X bar, rata-rata sampel n = jumlah observasi dalam sampel Gunakan contoh usia rata-rata perempuan dan laki-laki dari data lansia IFLS 2007 E. L. Pardede
Rata-rata Hitung Tertimbang Rata-rata hitung tertimbang dari sekelompok angka X1, X2, ..., Xn, dengan bobot w1, w2, ...,wn, dapat dihitung dengan rumus berikut: Contoh: menghitung nilai akhir dari mata kuliah tertentu E. L. Pardede
Latihan 1 E. L. Pardede
Ciri-ciri/Sifat dari Rata-rata Hitung Rata-rata hitung paling sering digunakan; membutuhkan data dengan skala pengukuran interval dan rasio. Sifat/ciri utamanya: Semua nilai observasi digunakan dalam penghitungan Setiap data memiliki nilai rata-rata hitung yang unik Dihitung dengan menjumlahkan semua nilai dibagi dengan jumlah observasi Jumlah simpangan (deviasi) dari nilai rata-rata adalah nol. Nilainya dipengaruhi oleh nilai data yang ekstrim (besar atau kecil) 12/09/2012 E. L. Pardede
Median Median atau nilai tengah adalah titik tengah dari nilai-nilai observasi setelah observasi diurutkan dari nilai terkecil ke nilai terbesar (membagi observasi menjadi dua atau masing-masing 50%). Nilai di atas dan di bawah median jumlahnya sama dalam data yang terurut. Untuk observasi yang jumlahnya genap, median adalah rata-rata hitung dari dua nilai di tengah data terurut. Contoh: excel yang sudah ada 12/09/2012 E. L. Pardede
Ciri-ciri/Sifat Median Nilai median unik untuk setiap data. Tidak terpengaruh oleh nilai yang ekstrim (sangat besar atau sangat kecil) tepat untuk menggambarkan kecenderungan sentral ketika ada nilai-nilai ekstrim Bisa dicari/dihitung untuk data yang berskala ukuran rasio, interval, dan ordinal. Dapat dihitung untuk distribusi frekuensi dengan kelas interval yang terbuka jika mediannya tidak di kelas yang terbuka tersebut. 12/09/2012 E. L. Pardede
Modus Modus adalah nilai obervasi yang paling sering muncul. E. L. Pardede
Latihan 2 E. L. Pardede
Kapan menggunakan ukuran sentral tertentu? Modus: paling mudah, tetapi paling tidak cukup untuk menggambarkan ukuran sentral Median: lebih berguna dan lebih mudah dipakai, terutama jika ada nilai ekstrim Tetapi Rata-rata hitunglah yang memperhitungkan semua nilai dalam observasi dan yang paling sering digunakan 12/09/2012 E. L. Pardede
Posisi Relatif dari Rata-rata, Median dan Modus E. L. Pardede
Ukuran persebaran Untuk apa mempelajari ukuran persebaran? Pengukuran seperti rata-rata atau median penting untuk menggambarkan pusat/sentral dari data, tetapi ukuran ini tidak menggambarkan apa pun tentang persebaran data. Contoh: kedalaman sungai yang akan diseberangi; Persebaran data dapat dibandingkan dengan melihatnya dalam distribusi tertentu. 12/09/2012 E. L. Pardede
Ukuran-ukuran persebaran Range (jangkauan) Simpangan/Deviasi Rata-rata Varians Populasi Standar Deviasi Populasi Range = Nilai Terbesar – Nilai Terkecil Standar deviasi adalah pengembangan dari simpangan/deviasi rata-rata
Varians & Standar Deviasi Sampel Faktor Koreksi Varians sampel Standar Deviasi Sampel E. L. Pardede
Latihan 3 E. L. Pardede
Rata-rata Hitung untuk Data Berkelompok di mana: rata-rata sampel M = nilai tengah dari setiap kelas/kelompok f = frekuensi dari tiap kelas n = jumlah observasi dalam sampel 12/09/2012 E. L. Pardede
Standar Deviasi/Simpangan Baku dari Data Berkelompok di mana: s standar deviasi sampel M = nilai tengah dari setiap kelas/kelompok f = frekuensi dari tiap kelas n = jumlah observasi dalam sampel = rata-rata sampel 12/09/2012 E. L. Pardede
Median dari Data Berkelompok di mana: Md median sampel L = batas bawah/tepi kelas lokasi median n = jumlah observasi dalam sampel Cf = frekuensi kumulatif sebelum kelas lokasi median f = frekuensi dari tiap kelas i = besarnya interval kelas 12/09/2012 E. L. Pardede
Modus dari Data Berkelompok di mana: Mo modus sampel L = batas bawah/tepi kelas lokasi modus d1 = selisih frekuensi kelas lokasi modus dengan frekuensi kelas sebelumnya d2 = selisih frekuensi kelas lokasi modus dengan frekuensi kelas sesudahnya i = besarnya interval kelas 12/09/2012 E. L. Pardede
Teorema Chebyshev Teorema Chebyshev: Untuk suatu kelompok data (sampel/populasi), proporsi nilai-nilai yang berada dalam standar deviasi dari rata-rata hitung k sekurang-kurangnya 1-1/k2, di mana k merupakan konstanta bernilai > 1. Implikasinya: 75% atau ¾ data berada pada kisaran ± 2s, 89,9% data berada pada kisaran ± 3s, dan 96% data berada pada kisaran ± 5s. 12/09/2012 E. L. Pardede
Teorema Chebyshev: Contoh Nilai rata-rata hitung harga saham ( ) Rp. 490,7 dengan standar deviasi (s) Rp. 144,7. Berapa jumlah perusahaan dengan harga saham berkisar Rp. 201,3 –Rp. 780,1? (210,3; 780,1) = 490,7 ± 2 x 144,7 (210,3; 780,1) = ± 2s, berarti k = 2 Dengan rumus 1-1/k2 = 1-1/22 = 1-1/4=3/4 (75%) 12/09/2012 E. L. Pardede
Hukum Empirik Distribusi Simetrik 12/09/2012 E. L. Pardede
Ukuran Kecondongan (Skewness) Selain ukuran sentral (rata-rata, median, dan modus) dan ukuran persebaran (range, varians, standar deviasi), karakteristik lain dari data adalah bentuknya. Berdasarkan pengamatan, ditemukan ada empat bentuk kecondongan data yang umum: Simetris (symmetric) Condong positif (positively skewed) Condong negatif (negatively skewed) Bimodal. 12/09/2012 E. L. Pardede
Bentuk-bentuk Kecondongan Data 12/09/2012 E. L. Pardede
Rumus Ukuran Kecondongan Nilai koefisien kecondongan (skewness atau sk): -3 sk 3. Nilai sk yang mendekati -3, misalnya -2,57: kecondongan negatif yang besar Nilai sk 1,63: kecondongan positif yang sedang Nilai sk 0, yang muncul jika rata-rata dan median sama: distribusi simetris dan tidak terdapat kecondongan. Pearson’s coefficient of skewness 12/09/2012 E. L. Pardede
Tugas: Ukuran Sentral & Persebaran Berdasarkan data 50 Lansia dari IFLS 2007: Hitung rata-rata, median, dan modus usia untuk seluruh sampel dan masing-masing untuk lansia laki-laki dan lansia perempuan! Hitung jangkauan, varians, dan standar deviasi usia lansia laki-laki dan lansia perempuan! Apa yang dapat Anda simpulkand dari hasilnya? Sampel mana yang persebaran usianya paling mendekati simetris? (Hitung kecondongannya!) 12/09/2012 E. L. Pardede
Tugas: Ukuran Sentral & Persebaran Pilih sampel acak 3 kali (=3 sampel) dari populasi tinggi badan mahasiswa S2KK BKKBN/Reguler (5 orang dari 16 orang). Hitung standar deviasi ketiga sampel tersebut! Apakah terbukti perlunya faktor koreksi (n-1) untuk standar deviasi sampel (s) agar lebih mendekati standar deviasi populasi ()? 12/09/2012 E. L. Pardede
Tugas: Ukuran Sentral & Persebaran Kelompokkanlah data Lansia dalam 5 tahunan (60-64, 65-69, dst.). Hitung rata-rata, median, modus, varians, dan standar deviasi data tersebut dengan metode untuk data berkelompok! Bandingkan hasilnya dengan hasil dalam tugas no. 1. Apakah rumus data terkelompok tersebut merupakan aproksimasi yang baik untuk ukuran sentral dan persebaran? 12/09/2012 E. L. Pardede