DESKRIPSI DATA (STATISTIKA DESKRIPTIF)
Outline Penyajian Data : - Teknik Grafis (Graphical Technique) - Teknik Numeris (Numerical Technique)
Teknik Grafis (Graphical Techniques) Peringkasan data secara visual atau grafis yang menggunakan gambar-gambar berdasarkan tabel data yang telah ada sebelumnya Teknik Grafis : - Pie Chart - Bar Chart - Histogram Frekuensi - Ogive - Stem and Leaf Plot - Box Plot
Pie Chart (Diagram Pia) Data digambarkan dengan suatu lingkaran yang sektor- sektornya menggambarkan proporsi variabel yang berbeda
Bar Chart (Diagram Batang) Data digambarkan menggunakan sumbu X dan Y dimana sumbu X menunjukkan variabel yang digunakan sedangkan sumbu Y menunjukkan banyaknya kejadian
Histogram & Poligon Frekuensi Data diringkas dalam bentuk grafik yang mencerminkan distribusi frekuensi. Diperlukan sumbu X untuk menyatakan interval kelas dan sumbu Y untuk menyatakan frekuensi kelas
Ogive (Poligon Frekuensi Kumulatif) Data diringkas dalam bentuk grafik yang merupakan grafik dari distribusi frekuensi kumulatif lebih dari atau kurang dari.
Stem and Leaf Plot (Diagram Batang dan Daun) Diperkenalkan oleh John Tuckey (1977) Data dirangkum dalam bentuk batang dan daun (stem and leaf). Jika ukuran data besar maka stem dapat dibuat menjadi dua baris
Box Plot (Diagram Kotak – Box and Whisker plot) Peringkasan data menggunakan diagram kotak untuk menggambarkan apakah data mempunyai outlier (data ekstrim) atau tidak
Untuk membuat Box Plot, ada beberapa hal yang harus diketahui : - Nilai minimum - Nilai maksimum - Median (Q2 = kuartil ke-2) - Lower Quartile (Q1 = kuartil ke-1) - Upper Quartile (Q3 = kuartil ke-3) - IQR (Inter Quartile Range ) = Q3-Q1 - LIF (Lower Inner Fence) = Q1 – 1,5 IQR - UIF (Upper Inner Fence) = Q3 + 1,5 IQR - LOF (Lower Outer Fence) = Q1 – 3 IQR - UOF (Upper Outer Fence) = Q3 + 3 IQR
Contoh Misalkan dimiliki data berikut : 5,3 4,0 12,5 3,0 3,9 6,4 5,2 2,6 15,8, 6,2 4,0 7,1 3,4 4,4 3,5 3,4 3,2 5,6 3,2 3,4 8,6 3,1 n = 22, nilai minimum = 2,6, nilai maksimum = 15,8 Data terurut : 2,6 3,0 3,1 3,2 3,2 3,4 3,4 3,5 3,7 3,9 4,0 4,0 4,4 5,2 5,3 5,6 6,2 6,4 7,1 8,6 12,5 15,8
Lokasi Median : (n+1)/2 = 23/2 = 11,5 Mean = 5,4 Lokasi Q1 : (lokasi median dibulatkan ke bawah + 1)/2 yaitu lokasi ke 6 dari nilai minimum Q1 = 3,4 Lokasi Q3 : yaitu lokasi ke 6 dari nilai maksimum Q3 = 6,2
IQR = Q3-Q1 = 6,2 – 3,4 = 2,8 LIF = Q1 - 1,5 IQR = 3,4 – 1,5 (2,8) = - 0,8 UIF = Q3 + 1,5 IQR = 6,2 + 1,5 (2,8) = 10,4 LOF = Q1 - 3 IQR = 3,4 – 3 (2,8) = - 5 UOF = Q3 + 3 IQR = 6,2 + 3 (2,8) = 14,6 Data yang terletak antara LIF dan UIF bukan outlier Data yang terletak di luar LIF dan UIF adalah outlier yang dibedakan menjadi 2 yaitu mild outlier dan extrem outlier
Boxplot - Contoh Bila semua data terletak terletak antara LIF dan UIF maka data tidak memiliki outlier Data terletak antara IF dan OF disebut mild outlier (tanda bulat) Data terletak di luar OF disebut extreme outlier (tanda bintang)
Penyusunan distribusi frekuensi 1. Interval kelas harus dipilih dengan ketentuan : - seluruh data harus disertakan - data harus dimasukkan sekali, hanya di satu kelas. 2. Umumnya banyaknya kelas interval antara 5 sampai 20. 3. Lebar interval kelas dianjurkan sama (biasanya kelipatan angka 5). Sebagai perkiraan awal lebar interval kelas digunakan rumus : c = R/k dengan c = lebar interval kelas, R = kisaran data (range) k = banyaknya kelas
Interval kelas dapat dihitung dengan rumus Sturge : k = 1 + 3,3 log(n) dengan k = banyaknya kelas dan n = ukuran sampel data (sample size) Range : Nilai maks – nilai min Dihindari interval kelas terbuka karena untuk keperluan analisis tidak bisa digunakan Jika mungkin, interval kelas dipilih sedemikian rupa sehingga nilai tengah kelasnya bersesuaian dengan nilai dimana data aktual terkonsentrasi
Contoh Distribusi Frekuensi Diketahui data nilai ujian statistika untuk 80 orang mahasiswa sebagai berikut: 79 79 48 74 81 98 87 80 80 84 90 70 91 93 82 78 70 71 92 38 56 81 74 73 68 72 85 51 65 93 83 86 90 35 83 73 74 43 86 88 92 93 76 71 90 72 67 75 80 91 61 72 97 91 88 81 70 74 99 95 80 59 71 77 63 60 83 82 60 67 89 63 76 63 88 70 66 67 79 75
Data terbesar = 99; Data terkecil = 35 Rentang = 99-35 = 64 Banyak kelas = 1 + 3,3 log(n) = 1 + 3,3 log(80) = 1 + 3,3 (1,9031) = 7,2 (7 atau 8) P=rentang/banyak kelas = 64/7 = 9,14 (Gunakan 9 atau 10)
Pilih batas bawah kelas interval pertama Pilih batas bawah kelas interval pertama. Bisa diambil sama dengan data terkecil atau nilai data yang lebih kecil dari data terkecil tetapi selisihnya harus kurang dari panjang/lebar kelas yang telah ditentukan. Dengan p=9 dan mulai dengan data yang lebih kecil dari data terkecil, dipilih 31 maka kelas interval pertama 31-40, 41-50 dst. Buatlah tabel untuk memasukkan kelas- kelas interval yang sudah dibentuk.
Nilai Ujian Mahasiswa
Interval kelas (Class interval) : interval yang mendefinisikan sebuah kelas, sebagai contoh pada tabel adalah 31-40, 41-50, . . . , dst . Batas kelas (class limit) : angka-angka pada ujung interval kelas , sebagai contoh 31, 40, 41, 50 , dst. Batas kelas bawah (lower class limit) : batas kelas untuk angka yang lebih kecil dibandingkan batas kelas lain pada interval kelas yang sama, sebagai contoh 31, 41, 51, dst.
Batas kelas atas (upper class limit) : batas kelas untuk angka yang lebih besar dibandingkan batas kelas lain pada interval kelas yang sama, sebagai contoh 40, 50, 60, dst. Batas Nyata kelas (class boundary) : batas kelas atas suatu interval ditambah batas kelas bawah interval kelas berikutnya dibagi dua, sebagai contoh 30,5 dan 40,5, dst. Lebar Interval Kelas (width of interval class) : selisih antara batas atas nyata kelas dengan batas bawah nyata kelas, sebagai contoh c = 40,5-30,5 = 10.
Nilai Tengah Kelas (Class Midpoint/Class Mark) : nilai yang diperoleh dengan membagi dua jumlah dari batas kelas bawah dan batas kelas atas suatu interval kelas, sebagai contoh untuk interval kelas 31-40 nilai tengah kelasnya adalah (31+40)/2=35,5.
Dari tabel distribusi frekuensi tersebut dapat juga dibuat : - Histogram frekuensi - Poligon frekuensi - Distribusi frekuensi kumulatif : * Kurang dari disusun dengan menjumlahkan seluruh frekuensi dari semua nilai yang lebih kecil dari pada batas nyata interval kelas. * Lebih dari disusun dengan menjumlahkan seluruh frekuensi dari semua nilai yang lebih besar dari pada atau sama dengan batas bawah nyata interval kelas.