STATISTIK 1 Pertemuan 5,6: Ukuran Pemusatan dan Penyebaran Dosen Pengampu MK: Evellin Lusiana, S.Si, M.Si
Materi Ukuran pemusatan Ukuran penyebaran Box-plot Mean Median Modus Range Range interkuartil Varians Standar deviasi Koefisien variasi Box-plot
Deskripsi Data dengan Ukuran Numerik Metode grafis seringkali tidak cukup untuk menggambarkan data Ukuran numerik, dapat digunakan untuk populasi dan sample. Parameter ukuran numerik untuk populasi Statistik ukuran numerik untuk sampel
Ukuran Pemusatan Mean Median Modus Rata-rata aritmatika Overview Ukuran pemusatan Mean Median Modus Rata-rata aritmatika Nilai tengah dari data terurut Nilai yang paling sering muncul
Rata-rata Aritmatika (Mean) [1] Rata-rata aritmatika (mean) merupakan ukuran pemusatan yang paling sering digunakan Untuk populasi berukuran N: Untuk sampel berukuran n: Nilai populasi Ukuran populasi Nilai pengamatan Ukuran sampel
Rata-rata Aritmatika (Mean) [2] Mean = jumlah nilai pengamatan dibagi dengan banyaknya pengamatan Sangat dipengaruhi oleh nilai ekstrim(outliers) 0 1 2 3 4 5 6 7 8 9 10 0 1 2 3 4 5 6 7 8 9 10 Mean = 3 Mean = 4
Median [1] Dalam data yang terurut, median merupakan data yang berada di “tengah Tidak dipengaruhi oleh outlier 0 1 2 3 4 5 6 7 8 9 10 0 1 2 3 4 5 6 7 8 9 10 Median = 3 Median = 3
Median [2] Lokasi median: Jika banyaknya pengamatan bernilai ganjilmedian adalah nilai tengah Jika banyaknya pengamatan bernilai genapmedian adalah rata-rata dari dua nilai tengah
Modus Nilai yang paling sering muncul Tidak dipengaruhi oleh outlier Dapat digunakan untuk data kualitatif dan kuantitatif Ada kemungkinan tidak ada modus Ada juga kemungkinan terdapat beberapan modus 0 1 2 3 4 5 6 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 No Mode Mode = 9
Contoh: Ukuran Pemusatan [1] Harga 5 rumah di sebuah bukit dekat pantai Harga: $2,000,000 500,000 300,000 100,000 100,000
Contoh: Ukuran Pemusatan [2] House Prices: $2,000,000 500,000 300,000 100,000 100,000 Sum 3,000,000 Mean: ($3,000,000/5) = $600,000 Median: nilai tengah data terurut = $300,000 Mode: nilai paling sering muncul = $100,000
Ukuran Pemusatan Mana Yang Terbaik? Mean adalah yang paling umum digunakan, selama tidak ada outlier Jika ada outlier, maka gunakan median
Bentuk Distribusi Menunjukkan bagaimana distribusi dari data Left-Skewed Symmetric Right-Skewed Mean < Median Mean = Median Median < Mean
Latihan [1] Tentukan mean, median, dan modus dari data-data berikut
Latihan [2] Sebuah firma audit akuntansi Rowatti dan Kopell khusus menangani pajak penghasilan dari para profesional seperti dokter, arsitek, pengacara, dsb. Firma tersebut mempkerjakan 11 akuntan. Tahun lalu, jumlah pajak yang ditangani setiap akuntan adalah sebagai berikut Tentukan mean, median, dan modus. Interpretasi! Jika diminta memilih satu statistik untuk dilaporkan, statistik apa yang sebaiknya digunakan?
Ukuran Penyebaran Range Range Interkuartil Varians Standar Deviasi Variasi Range Range Interkuartil Varians Standar Deviasi Koefisien variasi Ukuran penyebaran memberikan informasi mengenai penyebaran atau variabilitas dari nilai-nilai data yang ada pusat sama, Variasi berbeda
Range Ukuran penyebaran yang paling sederhana Selisih antara nilai terbesar dan terkecil Range = Xmax – Xmin misal: 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 Range = 14 - 1 = 13
Kekurangan Range Tidak mempedulikan distribusi data Sensitif terhadap outlier 7 8 9 10 11 12 7 8 9 10 11 12 Range = 12 - 7 = 5 Range = 12 - 7 = 5 1,1,1,1,1,1,1,1,1,1,1,2,2,2,2,2,2,2,2,3,3,3,3,4,5 Range = 5 - 1 = 4 1,1,1,1,1,1,1,1,1,1,1,2,2,2,2,2,2,2,2,3,3,3,3,4,120 Range = 120 - 1 = 119
Range Interkuartil [1] Masalah outlier bisa sedikit teratasi dengan menggunakan range interkuartil Mengeliminasi observasi terbesar dan terkecil, serta yang dihitung adalah range dari 50% data yang berada di tengahthe data Range interkuartil = kuartil 3– kuartil 1 IQR = Q3 – Q1
Range Interkuartil [1] maximum minimum 12 30 45 57 70 Misal Median (Q2) X X Q1 Q3 maximum minimum 25% 25% 25% 25% 12 30 45 57 70 Range interkaurtil = 57 – 30 = 27
Kuartil Membagi data terurut menjadi 4 bagian, dengan banyaknya elemen di setiap bagian adalah sama 25% 25% 25% 25% Q1 Q2 Q3 Kuartil pertama, Q1, menunjukkan terdapat 25% pengamatan yang bernilai lebih kecil dan 75% lainnya lebih besar Q2 sama dengan median (50% lebih kecil, 50% lebih besar) Hanya 25% dari pengamatan yang lebih besar dari Q3
Rumus Kuartil Penentuan nilai kuartil dilakukan dengan menentukan posisi yang sesuai dari data terurut posisi kuartil pertama: Q1 = 0.25(n+1) posisi kuartil kedua: Q2 = 0.50(n+1) (posisi median) posisi kuartil ketiga: Q3 = 0.75(n+1)
Kuartil Contoh: tentukan kuartil pertama Sample Ranked Data: 11 12 13 16 16 17 18 21 22 (n = 9) Q1 = ada di 0.25(9+1) = 2.5 position dari data terurut sehingga ambil nilai tengah antara pengamatan ke 2 dan 3 jadi, Q1 = 12.5
Varians Populasi Rata-rata kuadrat deviasi dari nilai mean Where = mean populasi N = ukuran populasi xi = nilai variabel X ke-i
Varians Sampel Varians sampel: Where = rata-rata aritmatika n = ukuran sampel Xi = nilai variabel X ke-i
Standar Deviasi Populasi Menunjukkan variasi di sekitar mean Memiliki satuan yang sama dengan data asli Population standard deviation:
Standar Deviasi Sampel Sample standard deviation:
Contoh: perhitungan varians [1] Rumus definisi: 5 -4 16 12 3 9 6 -3 8 -1 1 14 25 Jml 45 60
Contoh: perhitungan varians [2] Rumus kerja: 5 25 12 144 6 36 8 64 14 196 Jml 45 465
Pengukuran Variasi Standar deviasi kecil Standar deviasi besar
Perbandungan standar deviasi Data A Mean = 15.5 s = 3.338 11 12 13 14 15 16 17 18 19 20 21 Data B Mean = 15.5 s = 0.926 11 12 13 14 15 16 17 18 19 20 21 Data C Mean = 15.5 s = 4.570 11 12 13 14 15 16 17 18 19 20 21
Kelebihan varians dan standar deviasi Setiap nilai dalam dataset digunakan dalam perhitungan Nilai yang jauh dari mean memiliki bobot yang lebih besar
Koefisien Variasi [1] Measures relative variation Always in percentage (%) Shows variation relative to mean Can be used to compare two or more sets of data measured in different units
Koefisien Variasi [2] Stock A: Average price last year = $50 Standard deviation = $5 Stock B: Average price last year = $100 Both stocks have the same standard deviation, but stock B is less variable relative to its price
Penggunaan ukuran pemusatan dan penyebaran: Box Plot Ringkasan lima angka: Min Q1 Median Q3 Max membagi data menjadi 4 bagian ringkasan sederhana terhadap distribusi data Digunakan untuk membentuk box-plot, untuk menentukan bentuk distribusi data dan mendeteksi outlier
Membuat Box-Plot [1] Hitung Q1, median, Q3 and IQR. gambarkan garis horizontal untuk menyatakan skala satuan pengukuran gambarkan kotak (box) untuk Q1, median, Q3. Q1 m Q3
Membuat Box-Plot [2] * Outlier ditentukan dengan pagar Pagar bawah: Q1-1.5 IQR Pagar atas: Q3+1.5 IQR data uyang berada di luar pagar, dikatakan outlier (*). Q1 m Q3 *
Membuat Box-Plot [3] gambarkan “whiskers” yang menghubungan nilai max dan min yang bukan outlier Q1 m Q3 *
Contoh: Box-Plot Amount of sodium in 8 brands of cheese: 260 290 300 320 330 340 340 520 Q1 = 292.5 m = 325 Q3 = 340 Q1 m Q3
Interpretasi Box-Plot garis median tepat di tengah box – simetris garis median di kiri pusat box dan dan whisker panjang di kanan— miring kanan (skewed right) garis median di kanan pusat box dan dan whisker panjang di kiri—miring kiri (skewed left)
TUGAS KELOMPOK