STATISTIKA Pertemuan 3: Ukuran Pemusatan dan Penyebaran Dosen Pengampu MK: Evellin Lusiana, S.Si, M.Si
Materi Ukuran pemusatan Ukuran penyebaran Box-plot Mean Median Modus Range Varians Standar deviasi Koefisien variasi Kuartil Box-plot
Deskripsi Data dengan Ukuran Numerik Metode grafis seringkali tidak cukup untuk menggambarkan data Ukuran numerik, dapat digunakan untuk populasi dan sample. Parameter ukuran numerik untuk populasi Statistik ukuran numerik untuk sampel
Ukuran Pemusatan Mean Median Modus Rata-rata aritmatika Overview Ukuran pemusatan Mean Median Modus Rata-rata aritmatika Nilai tengah dari data terurut Nilai yang paling sering muncul
Mean Data Tunggal [1] Rata-rata aritmatika (mean) merupakan ukuran pemusatan yang paling sering digunakan Untuk populasi berukuran N: Untuk sampel berukuran n: Nilai populasi Ukuran populasi Nilai pengamatan Ukuran sampel
Mean Data Tunggal [2] Mean = jumlah nilai pengamatan dibagi dengan banyaknya pengamatan Sangat dipengaruhi oleh nilai ekstrim(outliers) 0 1 2 3 4 5 6 7 8 9 10 0 1 2 3 4 5 6 ... 100 Mean = 3 Mean = 22
Median Data Tunggal [1] Dalam data yang terurut, median merupakan data yang berada di “tengah Tidak dipengaruhi oleh outlier 0 1 2 3 4 5 6 7 8 9 10 0 1 2 3 4 5 6 7 ... 100 Median = 3 Median = 3
Median Data Tunggal [2] Lokasi median: Jika banyaknya pengamatan bernilai ganjilmedian adalah nilai tengah Jika banyaknya pengamatan bernilai genapmedian adalah rata-rata dari dua nilai tengah
Modus Data Tunggal [1] Nilai yang paling sering muncul Tidak dipengaruhi oleh outlier Dapat digunakan untuk data kualitatif dan kuantitatif Ada kemungkinan tidak ada modus Ada juga kemungkinan terdapat beberapan modus 0 1 2 3 4 5 6 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 No Mode Mode = 9
Contoh: Ukuran Pemusatan Data Tunggal [1] Contoh: Berikut ini adalah temperatur (0C) selama 20 hari di perairan laut K. 24, 35, 17, 21, 24 , 37, 26, 46, 58, 30, 32, 13, 12, 38, 41, 43, 44, 27, 53, 27
Contoh: Ukuran Pemusatan Data Tunggal [2] 24 35 17 21 37 26 46 58 30 32 13 12 38 41 43 44 27 53 Jml : 648 Data terurut 12 13 17 21 24 26 27 30 32 35 37 38 41 43 44 46 53 58 Mean: (648/5) = 32.4 Median: nilai tengah data terurut = (30+32)/2 = 21 Mode: nilai paling sering muncul = 24 dan 27
Ukuran Pemusatan Mana Yang Terbaik? Mean adalah yang paling umum digunakan, selama tidak ada outlier Jika ada outlier, maka gunakan median Modus dapat digunakan baik untuk data kuantitatif maupun kualitatif. Namun, kadang bersifat tidak unik/tunggal
Bentuk Distribusi Menunjukkan bagaimana distribusi dari data Left-Skewed Symmetric Right-Skewed Mean < Median Mean = Median Median < Mean
Mean Data Berkelompok Jika nilai n buah data adalah x1, x2, x3, … xn, dan masing-masing frekuensi adalah f1, f2, f3, … fn, maka mean data tersebut didefinisikan sebagai berikut. = jumlah hasil perkalian setiap data dan frekuensinya fi = frekuensi data ke-I x i = data ke-i (atau xi= ½.(batas bawah + batas atas) fi = N = jumlah data
Median Data Berkelompok Med = median Lo = tepi bawah kelas median c = panjang kelas interval kelas median n = banyaknya data pengamatan F = jumlah frekuensi sebelum kelas median f = frekuensi kelas median Kelas median = ½ n
Modus Data Berkelompok Mod = modus Lo = tepi bawah kelas modus c = panjang kelas interval kelas modus n = banyaknya data pengamatan b1 = selisih antara frekuensi kelas modus dengan frekuensi kelas sebelum kelas modus b2 = selisih antara frekuensi kelas modus dengan frekuensi kelas setelah kelas modus Kelas modus = kelas dengan frekuensi tertinggi
Contoh: Ukuran Pemusatan Data Berkelompok [1] Contoh: Berikut ini adalah temperatur (0C) selama 20 hari di perairan laut K. 24, 35, 17, 21, 24 , 37, 26, 46, 58, 30, 32, 13, 12, 38, 41, 43, 44, 27, 53, 27 Ketika dibuat tabel distribusi frekuensi akan menjadi sbb KELAS Frekuensi 10 – 20 3 20 – 30 6 30 - 40 5 40 – 50 4 50 - 60 2 Jumlah 20
Contoh: Mean Data Berkelompok Data Terurut 12, 13, 17, 21, 24, 24, 26, 27, 27, 30, 32, 35, 37, 38, 41, 43, 44, 46, 53, 58 KELAS Niai tengah (Xi) Fi 10 – 20 15 3 20 – 30 25 6 30 - 40 35 5 40 – 50 45 4 50 - 60 55 2 Total 20
Contoh: Median Data Berkelompok Letak median = ½ n = ½ 20 = 10 Kelas median = 30-40 c = 40 – 30 = 10 n = 20 F = 3+6 =9 f = 5 Lo = 30 – 0,5 = 29,5 KELAS Niai tengah (Xi) Fi 10 – 20 15 3 20 – 30 25 6 30 - 40 35 5 40 – 50 45 4 50 - 60 55 2 Total 20
Contoh: Modus Data Berkelompok Kelas modus = 20-30 Lo = 20-0.5=19.5 c = 30-20 =10 n = 20 b1 = 6-3 = 3 b2 = 6-5 = 1 KELAS Niai tengah (Xi) Fi 10 – 20 15 3 20 – 30 25 6 30 - 40 35 5 40 – 50 45 4 50 - 60 55 2 Total 20
Ukuran Penyebaran Range Range Interkuartil Varians Standar Deviasi Variasi Range Range Interkuartil Varians Standar Deviasi Koefisien variasi Ukuran penyebaran memberikan informasi mengenai penyebaran atau variabilitas dari nilai-nilai data yang ada pusat sama, Variasi berbeda
Range Ukuran penyebaran yang paling sederhana Selisih antara nilai terbesar dan terkecil Range = Xmax – Xmin misal: 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 Range = 14 - 1 = 13
Kekurangan Range Tidak mempedulikan distribusi data Sensitif terhadap outlier 7 8 9 10 11 12 7 8 9 10 11 12 Range = 12 - 7 = 5 Range = 12 - 7 = 5 1,1,1,1,1,1,1,1,1,1,1,2,2,2,2,2,2,2,2,3,3,3,3,4,5 Range = 5 - 1 = 4 1,1,1,1,1,1,1,1,1,1,1,2,2,2,2,2,2,2,2,3,3,3,3,4,120 Range = 120 - 1 = 119
Kuartil Membagi data terurut menjadi 4 bagian, dengan banyaknya elemen di setiap bagian adalah sama 25% 25% 25% 25% Q1 Q2 Q3 Kuartil pertama, Q1, menunjukkan terdapat 25% pengamatan yang bernilai lebih kecil dan 75% lainnya lebih besar Q2 sama dengan median (50% lebih kecil, 50% lebih besar) Hanya 25% dari pengamatan yang lebih besar dari Q3
Rumus Kuartil Penentuan nilai kuartil dilakukan dengan menentukan posisi yang sesuai dari data terurut posisi kuartil pertama: Q1 = 0.25(n+1) posisi kuartil kedua: Q2 = 0.50(n+1) (posisi median) posisi kuartil ketiga: Q3 = 0.75(n+1)
Kuartil Contoh: tentukan kuartil pertama Sample Ranked Data: 11 12 13 16 16 17 18 21 22 (n = 9) Q1 = ada di 0.25(9+1) = 2.5 position dari data terurut sehingga ambil nilai tengah antara pengamatan ke 2 dan 3 jadi, Q1 = 12.5
Varians Populasi Rata-rata kuadrat deviasi dari nilai mean Where = mean populasi N = ukuran populasi xi = nilai variabel X ke-i
Varians Sampel Varians sampel: Where = rata-rata aritmatika n = ukuran sampel Xi = nilai variabel X ke-i
Standar Deviasi Populasi Menunjukkan variasi di sekitar mean Memiliki satuan yang sama dengan data asli Population standard deviation:
Standar Deviasi Sampel Sample standard deviation:
Pengukuran Variasi Standar deviasi kecil Standar deviasi besar
Perbandingan standar deviasi Data A Mean = 15.5 s = 3.338 11 12 13 14 15 16 17 18 19 20 21 Data B Mean = 15.5 s = 0.926 11 12 13 14 15 16 17 18 19 20 21 Data C Mean = 15.5 s = 4.570 11 12 13 14 15 16 17 18 19 20 21
Kelebihan varians dan standar deviasi Setiap nilai dalam dataset digunakan dalam perhitungan Nilai yang jauh dari mean memiliki bobot yang lebih besar
Koefisien Variasi [1] Mengukur variasi relatif Dalam bentuk persentase (%) Menunjukkan variasi relatif terhadap mean Dapat digunakan untuk membandingkan dua atau lebih data yang berbeda satuan
Koefisien Variasi [2] Stock A: Rata-rata harga akhir tahun lalu = $50 Standar deviasi= $5 Stock B: Rata-rata harga akhir tahun lalu= $100 Kedua saham memiliki standar deviasi sama, namun saham A lebih variatif terhadap nilai rata-rata nya dibanding saham B
Penggunaan ukuran pemusatan dan penyebaran: Box Plot Ringkasan lima angka: Min Q1 Median Q3 Max membagi data menjadi 4 bagian ringkasan sederhana terhadap distribusi data Digunakan untuk membentuk box-plot, untuk menentukan bentuk distribusi data dan mendeteksi outlier
Membuat Box-Plot [1] Hitung Q1, median, Q3 dan IQR = Q3-Q1 gambarkan garis horizontal untuk menyatakan skala satuan pengukuran gambarkan kotak (box) untuk Q1, median, Q3. Q1 m Q3
Membuat Box-Plot [2] * Outlier ditentukan dengan pagar Pagar bawah: Q1-1.5 IQR Pagar atas: Q3+1.5 IQR data yang berada di luar pagar, dikatakan outlier (*). Q1 m Q3 *
Membuat Box-Plot [3] gambarkan “whiskers” yang menghubungan nilai max dan min yang bukan outlier Q1 m Q3 *
Interpretasi Box-Plot garis median tepat di tengah box – simetris garis median di kiri pusat box dan dan whisker panjang di kanan— miring kanan (skewed right) garis median di kanan pusat box dan dan whisker panjang di kiri—miring kiri (skewed left)
Contoh: Ukuran Penyebaran Data Tunggal [1] Contoh: Berikut ini adalah temperatur (0C) selama 20 hari di perairan laut K. 24, 35, 17, 21, 24 , 37, 26, 46, 58, 30, 32, 13, 12, 38, 41, 43, 44, 27, 53, 27 Data Terurut 12, 13, 17, 21, 24, 24, 26, 27, 27, 30, 32, 35, 37, 38, 41, 43, 44, 46, 53, 58 - Range: max – min= 67 - 23 = 44
Contoh: Ukuran Penyebaran Data Tunggal [2] Xi Xi-Xbar 12 -20.4 416.2 13 -19.4 376.4 17 -15.4 237.2 21 -11.4 130 24 -8.4 70.56 26 -6.4 40.96 27 -5.4 29.16 30 -2.4 5.76 32 -0.4 0.16 35 2.6 6.76 37 4.6 21.16 38 5.6 31.36 41 8.6 73.96 43 10.6 112.4 44 11.6 134.6 46 13.6 185 53 20.6 424.4 58 25.6 655.4 Jumlah 3051 Rumus definisi:
Contoh: perhitungan varians [2] Rumus kerja: Xi 12 144 13 169 17 289 21 441 24 576 26 676 27 729 30 900 32 1024 35 1225 37 1369 38 1444 41 1681 43 1849 44 1936 46 2116 53 2809 58 3364 648 24046
Box-Plot 12 13 17 21 24 26 27 30 32 35 37 38 41 43 44 46 53 58 Q1=24 Q2=31 Q3=42.5 posisi kuartil pertama = 0.25(n+1)=0.25(21)=5.25 (antara obs 5 dan 6) Q1=0.75(24) + 0.25 (24) =24 posisi kuartil kedua/median = 0.50(n+1)=0.50(21)=10.5 (antara obs 10 dan 11) Q2= 0.50 (30+32) = 31 posisi kuartil ketiga = 0.75(n+1) = 0.75 (21) = 15.75 (antara obs 15 dan 16) Q3=0.25(41) + 0.75(43 )=42.5 IQR = Q3 - Q1 = 42.5– 24 = 18.5 Pagar Bawah = Q1 – 1.5(IQR) = 24 – 1.5(18.5) = -3.75 Pagar Atas = Q3 + 1.5(IQR) =42.5 + 1.5(18.5) = 70.25
Box-Plot
VARIANS DAN STANDAR DEVIASI DATA BERKELOMPOK Varians s2 = varians sampel s = standar deviasi Xi = nilai tengah kelas ke-i fi = frekuensi kelas ke-i = rata-rata sampel Standar deviasi
Kuartil Data Berkelompok Qi = kuartil ke-i (i = 1, 2, 3) L0 = tepi bawah kelas kuartil c = panjang kelas interval kelas kuartil n = banyaknya data pengamatan F = jumlah frekuensi sebelum kelas kuartil f = frekuensi kelas kuartil
Contoh: Ukuran Pemusatan Data Berkelompok [1] Contoh: Berikut ini adalah temperatur (0C) selama 20 hari di perairan laut K. 24, 35, 17, 21, 24 , 37, 26, 46, 58, 30, 32, 13, 12, 38, 41, 43, 44, 27, 53, 27 Ketika dibuat tabel distribusi frekuensi akan menjadi sbb KELAS Frekuensi 10 – 20 3 20 – 30 6 30 - 40 5 40 – 50 4 50 - 60 2 Jumlah 20
Contoh: Varians Data Berkelompok KELAS Niai tengah (Xi) Fi 10 – 20 15 15-33=-18 (-18)2=324 3 3(324)= 972 20 – 30 25 25-33=-8 (-8)2=64 6 6(64)=384 30 - 40 35 35-33=2 22=4 5 5(4)=20 40 – 50 45 45-33=12 122=144 4 4(144)=576 50 - 60 55 55-33=22 222=484 2 2(484)=968 Total 20 2920
Kuartil 1 Data Berkelompok c = 30 – 20 = 10 n = 20 F = 3 f = 6
Kuartil 2 Data Berkelompok c = 40 – 30 = 10 n = 20 F = 3+6= 9 f = 5
Kuartil 3 Data Berkelompok c = 50– 40 = 10 n = 20 F = 3+6+5=14 f = 4