Ukuran penyebaran (Measures of Dispersion)
Kita mempunyai distribusi hasil panen dua varietas padi (kg per plot), masing-masing terdiri dari 5 plot. Distribusi datanya sebagai berikut: Varietas 1 45 42 41 40 Varietas 2 54 48 36 30
Kita dapat melihat bahwa nilai mean varietas I dan II bernilai sama, 42 kg, namun apabila kita perhatikan, keragaman kedua varietas tersebut berbeda. Pada Varietas I, hasilnya tidak terlalu jauh dari nilai pusatnya, 42 kg, sedangkan pada Varietas II, sebaran datanya sangat beragam.
Ukuran penyebaran (Measures of Dispersion) atau ukuran keragaman pengamatan dari nilai rata-ratanya disebut simpangan (deviation/dispersi). Terdapat beberapa ukuran untuk menentukan dispersi data pengamatan, seperti: jangkauan/rentang (range), simpangan kuartil (quartile deviation), simpangan rata-rata (mean deviation), dan simpangan baku(standard deviation).
Jangkauan (Range) Ukuran penyebaran yang paling sederhana adalah Range (Jangkauan/Rentang, terkadang di beberapa literatur diterjemahkan dengan istilah wilayah). Range dari suatu kelompok data pengamatan adalah selisih antara nilai minimum dan maksimum.
Range hanya memperhitungkan dua nilai, yaitu nilai maksimum dan nilai minimum dan tidak memperhitungkan semua nilai, Range tidak stabil atau tidak dapat diandalkan sebagai indikator dari ukuran penyebaran. Range sangat dipengaruhi oleh nilai-nilai ekstrim.
Temukan mean, nilai terendah, nilai tertinggi dan jangkauan dari data di bawah ini
Jangkauan pada data menghasilkan nilai yg sama, tetapi perhatikan histogram dr kedua data. Kalau dicermati lagi ternyata data tersebar secara berbeda. Pada histogram data kedua, ternyata terjadi ‘loncatan’ dari skor 8 ke 10 dan dari skor 10 ke 12 karena skor 9 dan 11 mempunyai frekuensi 0. Jangkauan hanya mendeskripsikan lebar dari data, namun tidak bisa menunjukkan apakah terdapat jarak dari skor data satu ke data berikutnya. Untuk menghindari kelemahan range, ukuran dispersi lain seperti simpangan kuartil lebih disukai.
Quartiles Come to Resque Salah satu cara untuk membuat mini range adalah mengurutkan data kemudian membagi menjadi 4 bagian yang sama. Contoh Kita dapat mengonstruksikan jangkauan dengan cara terlebih dahulu mencari nilai diantara dua bagian data
Kuartil Kuartil adalah nilai yg memisahkan antar bagian data. Kuartil terendah dinamakan kuartil pertama ( 𝑄 1 ) dan kuartil tertinggi dinamakan kuartil ketiga ( 𝑄 3 ). Sedangkan kuartil tengah ( 𝑄 2 ) merupakan median karena membagi data menjadi dua bagian yg sama. Jangkauan dari nilai dalam kuartil terendah dan kuartil tertinggi dinamakan jangkauan interkuartil Jangkauan interkuartil = 𝑄 3 - 𝑄 1
Menentukan Kuartil dari Data Tunggal Jika banyak data n, maka Mencari letak kuartil terendah : Pertama hitung n : 4. Selanjutnya, Jika hasilnya bilangan bulat, nyatakan dgn k, maka mencari kuartil terendah adalah dgn mencari rata-rata dari data ke-k dan data ke-(k+1). Jika hasilnya bukan bilangan bulat, maka bulatkan ke atas. Posisi kuartil terendah adalah pada hasil pembulatan tersebut. Contoh misal n = 9, maka 9 : 4 = 2.25 dibulatkan ke atas menjadi 3. Jadi kuartil terendah adalah data ke-3
Mencari letak kuartil tertinggi : Pertama hitung 3n : 4. Selanjutnya, Bila hasil 3n : 4 adlh bilangan bulat, nyatakan dgn m, maka nilai kuartil tertinggi adalah dengan mencari rata-rata data ke-m dan data ke-(m+1). Jika hasil 3n : 4 bukan bilangan bulat, maka bulatkan hasilnya ke atas. Posisi kuartil tertinggi adalah pada hasil pembulatan tersebut.
Mencari Kuartil dari Data pada Tabel Distribusi Frekuensi data Berkelompok Jika data disajikan dalam tabel distribusi frekuensi data berkelompok, maka kuartil ke-i dicari dgn rumus 𝐾𝑢𝑎𝑟𝑡𝑖𝑙 𝑘𝑒−𝑖=𝑏+𝑙 𝑖 4 𝑁−𝐹 𝑓 ,𝑖=1,2,3 dimana b adalah tepi bawah kelas kuartil ke-i, l adalah luas kelas, F adalah jumlah frekuensi sebelum kelas kuartil ke-i, f adalah frekuensi kelas kuartil dan N adalah banyaknya data.
Hitung 𝑄 1 , 𝑄 2 , 𝑄 3 dan jangkauan interkuartil dari data di bawah ini
Boxplot Box Plot pertama kali dikenalkan oleh American Statistician, John Tukey, pada tahun 1977 yg berguna untuk menampilkan lima summary dalam data yaitu median, kuartil , data maksimum dan minimum. Boxplot merupakan diagram yg terdiri dari box dan whiskers, sehingga biasa disebut juga dgn box and whisker plot.
Boxplot Box Plot dapat digambarkan dalam posisi vertical maupun horizontal.
Boxplot Interpretasi Boxplot: Box mengandung 50% dari data. Tepi atas dari box disebut Q3 (75% dari data) dan tepi bawah dari box disebut Q1(25 % dari data). Garis yang terdapat pada box disebut dengan median data (Q2). Titik terakhir dari garis vertical merupakan nilai maksimum dan minimum. Titik yang berada di luar garis tersebut disebut dengan outlier. Outlier yaitu data yang terletak diluar jarak 1.5 * jangkauan interkuartil dari kuartil pertama dan ketiga. Untuk boxplot horizontal, titik ujung garis whisker kiri adlh nilai terendah dari data yg lebih dari Q1-(1.5xjangkauan interkuartil), dan titik ujung garis whisker kanan adalah nilai tertinggi dari data yg kurang dari Q3+(1.5xjangkauan interkuartil)
Boxplot Apabila jarak antara tepi bawah dan tepi atas ke median data tidak sama, berarti distribusi data tersebut tidak simetris (skewed).
Contoh Boxplot Misal berikut ini terdapat data tinggi badan siswa dalam cm: 148.7 149.8 147.9 152.1 152.1 147.9 150.4 160.0 150.5 150.4 147.3 142.6 153.4 149.3 153.8 144.7 154.9 152.7 150.5 151.0 149.2 154.0 152.7 147.2 145.8 149.9 151.2 148.0 148.0 153.0 146.3 149.2 149.3 153.0 150.7 152.2 148.7 148.7 146.8 148.9 155.1 151.5 148.9 152.3 156.2 153.3 151.6 154.1 150.3 142.4 Dari data tersebut diperoleh beberapa statistik: Mean : 150.37 cm Median : 150.38 cm SE Mean: 0.46 St. Dev: 3.31 Nilai minimum: 142.4 cm Nilai maximum: 160 cm Q1: 148.49 cm Q3: 152.69 cm
Contoh Boxplot Boxplot untuk data diatas adalah Terdapat 1 outlier yaitu 160, karena 160 > 𝑄 3 +1.5 x 4.2 (Data maks < Q3+1.5xIQR) – Q3 (Data min > Q1-1.5XIQR)-Q1
Persentil Ketiga kuartil adalah nilai-nilai yg membagi sekumpulan data menjadi 4 bagian. Persentil merupakan nilai yg membagi data dalam persentase dalam cara yg sama dgn kuartil. Persentil ke-k disimbolkan dgn 𝑃 𝑘 adalah nilai pada k% dari data. Jadi 𝑄 1 adalah persentil ke-25, 𝑄 2 adalah persentil ke-50 dan 𝑄 3 adalah persentil ke-75
Mencari Posisi Persentil Jika ingin mencari nilai persentil ke-k dgn banyak data n, pertama hitung 𝑘 𝑛 100 , selanjutnya Jika hasilnya bilangan bulat, nyatakan dgn i, maka persentil ke-k adalah rata-rata dari data ke-i dan ke-(i+1). Jika hasilnya bukan bilangan bulat, maka posisi persentil adalah pada hasil pembulatan bilangan tersebut. Contoh kita punya 125 data. Untuk mencari persentil ke-10 hitung 10 125 100 = 12.5. Maka persentil ke-10 adalah data ke-13
Variansi Salah satu cara untuk mengetahui variabilitas data adalah melalui variansi. Variansi juga adalah salah satu cara untuk mengukur sebaran data. Variansi pada populasi disimbolkan dengan 𝜎 2 , dihitung dengan menggunakan rumus. 𝑓 𝑥−𝜇 2 𝑁 untuk data pada tabel distribusi frekuensi data tunggal 𝑓 𝑥 𝑖 −𝜇 2 𝑁 untuk data pada tabel distribusi frekuensi data berkelompok, dgn 𝑥 𝑖 merupakan titik tengah tiap kelas f adalah frekuensi tiap nilai atau frekuensi tiap kelas dan N adalah banyak data.
Variansi pada sampel disimbolkan dgn 𝑠 2 , dihitung dengan rumus. 𝑓 𝑥− 𝑥 2 𝑛−1 untuk data pada tabel distribusi frekuensi data tunggal 𝑓 𝑥 𝑖 − 𝑥 2 𝑛−1 untuk data pada tabel distribusi frekuensi data berkelompok, dgn 𝑥 𝑖 merupakan titik tengah tiap kelas. dan f adalah frekuensi tiap nilai atau frekuensi tiap kelas dan n adalah ukuran sampel.
Standar Deviasi Perhatikan bahwa variansi adalah rataan kuadrat jarak tiap nilai dari mean. Ukuran yg benar-benar menyatakan jarak nilai dari mean adalah standar deviasi. Standar deviasi merupakan akar dari variansi. Standar deviasi pada populasi disimbolkan dengan 𝜎 dan pada sampel disimbolkan dengan s. 𝜎= 𝑉𝑎𝑟𝑖𝑎𝑛𝑠𝑖
Latihan Soal: 1. Banyaknya produk cacat dari PT. Mancur selama 6 minggu adalah sbb: Cari variansi dan deviasi standar data tersebut. 2. Di bawah ini adalah distribusi frekuensi berat mesin gilingan padi (dalam kg) yang diproduksi PT. Tani Maju ! Cari variansi dan deviasi standar data tersebut ! 78 84 68 87 91 72 (dalam buah) Berat mesin gilingan padi (kg) Jumlah 14 – 21 22 – 29 30 – 37 38 – 45 46 – 53 54 – 61 62 - 69 2 10 29 9 14 13 3
For Your Kind Attention Thank You For Your Kind Attention