STATISTIK1 Pertemuan 3: Ukuran Pemusatan dan Penyebaran Dosen Pengampu MK: Evellin Lusiana, S.Si, M.Si
Materi Blog: vellinlusiana.wordpress.com Ukuran pemusatan Mean Median Modus Ukuran penyebaran Range Range interkuartil Varians Standar deviasi Koefisien variasi
Deskripsi Data dengan Ukuran Numerik Metode grafis seringkali tidak cukup untuk menggambarkan data Ukuran numerik, dapat digunakan untuk populasi dan sample. Parameter ukuran numerik untuk populasi Statistik ukuran numerik untuk sampel
Ukuran Pemusatan Mean Median Modus Rata-rata aritmatika Overview Ukuran pemusatan Mean Median Modus Rata-rata aritmatika Nilai tengah dari data terurut Nilai yang paling sering muncul
Rata-rata Aritmatika (Mean) [1] Rata-rata aritmatika (mean) merupakan ukuran pemusatan yang paling sering digunakan Untuk populasi berukuran N: Untuk sampel berukuran n: Nilai populasi Ukuran populasi Nilai pengamatan Ukuran sampel
Rata-rata Aritmatika (Mean) [2] Mean = jumlah nilai pengamatan dibagi dengan banyaknya pengamatan Sangat dipengaruhi oleh nilai ekstrim(outliers) 0 1 2 3 4 5 6 7 8 9 10 0 1 2 3 4 5 6 7 8 .. 100 Mean = 3 Mean = 22
Median [1] Dalam data yang terurut, median merupakan data yang berada di “tengah Tidak dipengaruhi oleh outlier 0 1 2 3 4 5 6 7 8 9 10 0 1 2 3 4 5 6 7 8 .. 100 Median = 3 Median = 3
Median [2] Lokasi median: Jika banyaknya pengamatan bernilai ganjilmedian adalah nilai tengah Jika banyaknya pengamatan bernilai genapmedian adalah rata-rata dari dua nilai tengah
Modus Nilai yang paling sering muncul Tidak dipengaruhi oleh outlier Dapat digunakan untuk data kualitatif dan kuantitatif Ada kemungkinan tidak ada modus Ada juga kemungkinan terdapat beberapa modus 0 1 2 3 4 5 6 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 No Mode Mode = 9
Contoh: Ukuran Pemusatan [1] Harga 5 rumah di sebuah bukit dekat pantai Harga: $2,000,000 500,000 300,000 100,000 100,000
Contoh: Ukuran Pemusatan [2] House Prices: $2,000,000 500,000 300,000 100,000 100,000 Sum 3,000,000 Mean: ($3,000,000/5) = $600,000 Median: nilai tengah data terurut = $300,000 Mode: nilai paling sering muncul = $100,000
Ukuran Pemusatan Mana Yang Terbaik? Mean adalah yang paling umum digunakan, selama tidak ada outlier Jika ada outlier, maka gunakan median
Bentuk Distribusi Menunjukkan bagaimana distribusi dari data Left-Skewed Symmetric Right-Skewed Mean < Median Mean = Median Median < Mean
Ukuran Penyebaran Range Range Interkuartil Varians Standar Deviasi Variasi Range Range Interkuartil Varians Standar Deviasi Koefisien variasi Ukuran penyebaran memberikan informasi mengenai penyebaran atau variabilitas dari nilai-nilai data yang ada pusat sama, Variasi berbeda
Range Ukuran penyebaran yang paling sederhana Selisih antara nilai terbesar dan terkecil Range = Xmax – Xmin misal: 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 Range = 14 - 1 = 13
Kekurangan Range Tidak mempedulikan distribusi data Sensitif terhadap outlier 7 8 9 10 11 12 7 8 9 10 11 12 Range = 12 - 7 = 5 Range = 12 - 7 = 5 1,1,1,1,1,1,1,1,1,1,1,2,2,2,2,2,2,2,2,3,3,3,3,4,5 Range = 5 - 1 = 4 1,1,1,1,1,1,1,1,1,1,1,2,2,2,2,2,2,2,2,3,3,3,3,4,120 Range = 120 - 1 = 119
Range Interkuartil [1] Masalah outlier bisa sedikit teratasi dengan menggunakan range interkuartil Mengeliminasi observasi terbesar dan terkecil, serta yang dihitung adalah range dari 50% data yang berada di tengahthe data Range interkuartil = kuartil 3– kuartil 1 IQR = Q3 – Q1
Range Interkuartil [1] maximum minimum 12 30 45 57 70 Misal Median (Q2) X X Q1 Q3 maximum minimum 25% 25% 25% 25% 12 30 45 57 70 Range interkaurtil = 57 – 30 = 27
Kuartil Membagi data terurut menjadi 4 bagian, dengan banyaknya elemen di setiap bagian adalah sama 25% 25% 25% 25% Q1 Q2 Q3 Kuartil pertama, Q1, menunjukkan terdapat 25% pengamatan yang bernilai lebih kecil dan 75% lainnya lebih besar Q2 sama dengan median (50% lebih kecil, 50% lebih besar) Hanya 25% dari pengamatan yang lebih besar dari Q3
Rumus Kuartil Penentuan nilai kuartil dilakukan dengan menentukan posisi yang sesuai dari data terurut posisi kuartil pertama: Q1 = 0.25(n+1) posisi kuartil kedua: Q2 = 0.50(n+1) (posisi median) posisi kuartil ketiga: Q3 = 0.75(n+1)
Kuartil Contoh: tentukan kuartil pertama Sample Ranked Data: 11 12 13 16 16 17 18 21 22 (n = 9) Q1 = ada di 0.25(9+1) = 2.5 position dari data terurut sehingga ambil nilai tengah antara pengamatan ke 2 dan 3 jadi, Q1 = 12.5
Varians Populasi Rata-rata kuadrat deviasi dari nilai mean Where = mean populasi N = ukuran populasi xi = nilai variabel X ke-i
Varians Sampel Varians sampel: Where = rata-rata aritmatika n = ukuran sampel Xi = nilai variabel X ke-i
Standar Deviasi Populasi Menunjukkan variasi di sekitar mean Memiliki satuan yang sama dengan data asli Population standard deviation:
Standar Deviasi Sampel Sample standard deviation:
Contoh: perhitungan varians [1] Rumus definisi: 5 -4 16 12 3 9 6 -3 8 -1 1 14 25 Jml 45 60
Contoh: perhitungan varians [2] Rumus kerja: 5 25 12 144 6 36 8 64 14 196 Jml 45 465
Pengukuran Variasi Standar deviasi kecil Standar deviasi besar
Perbandingan standar deviasi Data A Mean = 15.5 s = 3.338 11 12 13 14 15 16 17 18 19 20 21 Data B Mean = 15.5 s = 0.926 11 12 13 14 15 16 17 18 19 20 21 Data C Mean = 15.5 s = 4.570 11 12 13 14 15 16 17 18 19 20 21
Kelebihan varians dan standar deviasi Setiap nilai dalam dataset digunakan dalam perhitungan Nilai yang jauh dari mean memiliki bobot yang lebih besar
Koefisien Variasi [1] Mengukur variasi relatif Dalam bentuk persentase (%) Menunjukkan variasi relatif terhadap mean Dapat digunakan untuk membandingkan dua atau lebih data yang berbeda satuan
Koefisien Variasi [2] Stock A: Rata-rata harga akhir tahun lalu = $50 Standar deviasi= $5 Stock B: Rata-rata harga akhir tahun lalu= $100 Kedua saham memiliki standar deviasi sama, namun saham A lebih variatif terhadap nilai rata-rata nya dibanding saham B