SESI 2 TABEL DISTRIBUSI FREKUENSI TENDENSI SENTRAL UKURAN PENYEBARAN UKURAN LETAK
Levels of Measurement Scales of Measurement: Nominal Ordinal labeling/classifying objects i.e. your last name, names on jerseys, social security number, etc. not technically a scale of measurement since nothing is measured Ordinal labels that imply rank i.e. place in a race, military rank – 1st > 2nd > 3rd and General > Lieutenant > Private doesn’t say how much more one is than the other
Basic Concepts Interval Ratio provides labels that imply exactly how much different one label is than another i.e. temperature - 15° F is 5 ° F more than 10 ° F lacks true zero point - 0 ° F does not represent the complete absence of heat because we have negative values of °F Ratio has all of the above, plus a true zero point i.e. height, weight, ° Kelvin – 0 lbs represents a true lack of weight can talk about 16 ° being four times 4 °, which is a proportion /ratio, hence the name of the scale - x = 4y often very difficult to identify in practice if a true zero point exists
Measurement Levels Ratio Data Interval Data Ordinal Data Nominal Data Differences between measurements, true zero exists Ratio Data Quantitative Data Differences between measurements but no true zero Interval Data Ordered Categories (rankings, order, or scaling) Ordinal Data Qualitative Data Categories (no ordering or direction) Nominal Data
DEFINISI Distribusi Frekuensi? Pengelompokkan data menjadi tabulasi data dengan memakai kelas-kelas data dan dikaitkan dengan masing-masing frekuensinya
KELEBIHAN DAN KEKURANGAN Dapat mengetahui gambaran secara lebih mudah Memudahkan mengienterpretasi data Mempermudah penarikan kesimpulan Kekurangan Rincian atau informasi awal menjadi hilang
CARA MEMBUAT TABEL DISTRIBUSI FREKUENSI Tentukan Range atau jangkauan data (r) r = nilai tertinggi – nilai terendah (data mentah) Tentukan banyak kelas (k) Rumus Sturgess : k=1+3,3 log n Tentukan lebar kelas (c) c=r/k
CARA MEMBUAT TABEL DISTRIBUSI FREKUENSI (lanjutan) Tentukan limit bawah kelas pertama dan kemudian batas bawah kelasnya Tambah batas bawah kelas pertama dengan lebar kelas untuk memperoleh batas atas kelas Tentukan limit atas kelas Tentukan nilai tengah kelas Tentukan frekuensi
LIMIT, BATAS, NILAI TENGAH, DAN LEBAR KELAS Limit Kelas/Tepi Kelas (class limit) Nilai terkecil/terbesar pada setiap kelas Batas Kelas (class boundry) Nilai yang besarnya sama dengan setengah dari nilai limit atas kelas sebelum dan nilai limit bawah kelas atasnya. Nilai ini digunakan untuk membuat histogram (bar chart) Nilai Tengah Kelas (mid point) Nilai tengah antara batas bawah kelas dengan batas atas kelas pada suatu kelas. Nilai ini digunakan untuk membuat poligon (lne chart) Lebar Kelas (class interval) Selisih antara batas bawah kelas dengan batas atas kelas
Soal kuis Data hasil ujian akhir Mata Kuliah Statistika dari 60 orang mahasiswa 23 60 79 32 57 74 52 70 82 36 80 77 81 95 41 65 92 85 55 76 10 64 75 78 25 98 67 71 83 54 72 88 62 43 89 84 48 90 15 34 17 69 63 61
JAWAB Data terkecil = 10 dan Data terbesar = 98 r = 98 – 10 = 88 Jadi jangkauannya adalah sebesar 88 Banyak kelas (k) = 1 + 3,3 log 60 = 6,8 Jadi banyak kelas adalah sebanyak 7 kelas Lebar kelas (c) = 88 / 7 = 12,5 mendekati 13 Limit bawah kelas pertama adalah 10, kita dapat membuat beberapa alternatif limit bawah kelas yaitu 10, 9, dan 8 Maka nilai tepi kelas pertama masing – masing alternatif menjadi sebagai berikut 10 – 22 (10 s/d 10 + lebar kelas -1) 9 – 21 (9 s/d 9 + lebar kelas -1) 8 – 20 (8 s/d 8 + lebar kelas -1) Maka batas bawah dan atas kelas pertamanya adalah 9,5 – 22,5 8,5 – 21,5 7,5 – 20,5
JAWAB (lanjutan) Batas atas kelas pertama adalah batas bawah kelas ditambah lebar kelas, yaitu sebesar - 9,5 + 13 = 22,5 - 8,5 + 13 = 21,5 - 7,5 + 13 = 20,5 Limit atas kelas pertama adalah sebesar - 22,5 - 0,5 = 22 - 21,5 - 0,5 = 21 - 20,5 – 0,5 = 20
JAWAB (lanjutan) Misal dipilih Alternatif 2 Alternatif 1 Alternatif 2 8-20 21-33 34-46 47-59 60-72 73-85 86-98 9-21 22-34 35-47 48-60 61-73 74-86 87-99 10-22 23-35 36-48 49-61 62-74 75-87 88-100 Misal dipilih Alternatif 2
JAWAB (lanjutan) Nilai tengah kelas adalah Frekuensi kelas pertama adalah 3
JAWAB (lanjutan) Interval Kelas Batas Kelas Nilai Tengah Frekuensi Distribusi Frekuensi Nilai Ujian Akhir Mata Kuliah Statistika Interval Kelas Batas Kelas Nilai Tengah Frekuensi 9-21 22-34 35-47 48-60 61-73 74-86 87-99 8,5-21,5 21,5-34,5 34,5-47,5 47,5-60,5 60,5-73,5 73,5-86,5 86,5-99,5 15 28 41 54 67 80 93 3 4 8 12 23 6 Jumlah 60
HISTOGRAM DAN POLIGON FREKUENSI Histogram dan Poligon Frekuensi Nilai Ujian Akhir Mata Kuliah Statistika 23 25 Histogram 20 Poligon Frekuensi Frekuensi 12 15 8 10 6 4 4 3 5 8,5 34,5 60,5 86,5 21,5 47,5 73,5 99,5 Nilai
DISTRIBUSI FREKUENSI RELATIF DAN KUMULATIF Membandingkan frekuensi masing-masing kelas dengan jumlah frekuensi total dikalikan 100 % Distribusi frekuensi kumulatif ada 2, yaitu distribusi frekuensi kumulatif kurang dari dan lebih dari
DISTRIBUSI FREKUENSI RELATIF Distribusi Frekuensi Relatif Nilai Ujian Akhir Mata Kuliah Statistika Interval Kelas Batas Kelas Nilai Tengah Frekuensi Frekuensi Relatif (%) 9-21 22-34 35-47 48-60 61-73 74-86 87-99 8,5-21,5 21,5-34,5 34,5-47,5 47,5-60,5 60,5-73,5 73,5-86,5 86,5-99,5 15 28 41 54 67 80 93 3 4 8 12 23 6 5 6,67 13,33 20 38,33 10 Jumlah 60 100
DISTRIBUSI FREKUENSI KUMULATIF KURANG DARI Distribusi Frekuensi Kumulatif Kurang Dari Untuk Nilai Ujian Akhir Mata Kuliah Statistika Interval Kelas Batas Kelas Frekuensi Kumulatif Kurang Dari Persen Kumulatif 9-21 22-34 35-47 48-60 61-73 74-86 87-99 kurang dari 8,5 kurang dari 21,5 kurang dari 34,5 kurang dari 47,5 kurang dari 60,5 kurang dari 73,5 kurang dari 86,5 kurang dari 99,5 3 7 11 19 31 54 60 5 11,67 18,34 31,67 51,67 90 100
OGIF Ogif Frekuensi Kumulatif Kurang Dari Untuk Nilai Ujian Akhir Mata Kuliah Statistika 60 60 54 50 40 31 Frekuensi Kumulatif 30 19 20 6 11 10 7 3 8,5 34,5 60,5 86,5 21,5 47,5 73,5 99,5 Nilai
DISTRIBUSI FREKUENSI KUMULATIF LEBIH DARI Distribusi Frekuensi Kumulatif Lebih Dari Untuk Nilai Ujian Akhir Mata Kuliah Statistika Interval Kelas Batas Kelas Frekuensi Kumulatif Lebih Dari Persen Kumulatif 9-21 22-34 35-47 48-60 61-73 74-86 87-99 lebih dari 8,5 lebih dari 21,5 lebih dari 34,5 lebih dari 47,5 lebih dari 60,5 lebih dari 73,5 lebih dari 86,5 lebih dari 99,5 60 57 53 49 41 29 6 100 95 88,33 81,66 68,33 48,33 10
OGIF (lanjutan) Ogif Frekuensi Kumulatif Lebih Dari Untuk Nilai Ujian Akhir Mata Kuliah Statistika 60 60 57 53 49 50 41 40 29 Frekuensi Kumulatif 30 20 10 6 8,5 34,5 60,5 86,5 21,5 47,5 73,5 99,5 Nilai
OGIF (lanjutan) Ogif Frekuensi Kumulatif kurang dan lebih dari Untuk Nilai Ujian Akhir Mata Kuliah Statistika kurva ogif lebih dari 60 kurva ogif kurang dari 50 40 Frekuensi Kumulatif 30 20 10 8,5 34,5 60,5 86,5 21,5 47,5 73,5 99,5 Nilai
Cross Tables Cross Tables (or contingency tables) list the number of observations for every combination of values for two categorical or ordinal variables If there are r categories for the first variable (rows) and c categories for the second variable (columns), the table is called an r x c cross table
Cross Table Example
SINGLE Table Example
Side-by-Side Chart Example Sales by quarter for three sales territories:
Graphing Multivariate Categorical Data (continued) Side by side bar charts
TENDENSI SENTRAL
Pengertian Merupakan ukuran yang dapat mewakili data secara keseluruhan. Artinya, jika keseluruhan nilai yang ada dalam data tersebut diurutkan besarnya dan selanjutnya dimasukkan nilai rata-rata ke dalamnya, nilai rata-rata tersebut memiliki kecenderungan terletak di urutan paling tengah.
Jenis-jenis Ukuran Nilai Pusat Rata-rata Hitung (Mean) adalah nilai rata-rata dari data-data yang ada. - Mean untuk data tunggal - Mean untuk data berkelompok * Metode Biasa Contoh : Berat badan 100 orang mahasiswa universitas Borobudur tahun 1997.
Jenis-jenis Ukuran Nilai Pusat Berat Badan (kg) Banyaknya Mahasiswa (f) 60 - 62 10 63 - 65 25 66 - 68 32 69 - 71 15 72 - 74 18 Berat Badan (kg) Titik Tengah (X) Frekuensi (f) fX 60 - 62 61 10 610 63 - 65 64 25 1,600 66 - 68 67 32 2,144 69 - 71 70 15 1,050 72 - 74 73 18 1,341 Jumlah - 100 6.718
Jenis-jenis Ukuran Nilai Pusat * Metode simpangan rata-rata Apabila M adalah rata-rata hitung sementara Dari soal sebelumnya M = 67 Berat Badan (kg) f X d = X-M fd 60 - 62 10 61 -6 -60 63 - 65 25 64 -3 -75 66 - 68 32 67 69 - 71 15 70 3 45 72 - 74 18 73 6 108 Jumlah 100 -
Jenis-jenis Ukuran Nilai Pusat * Metode Coding Sering digunakan apabila jumlah nilai-nilai dalam data yang berupa bilangan-bilangan besar. Berat Badan (kg) f X d u fu 60 - 62 10 61 -6 -2 -20 63 - 65 25 64 -3 -1 -25 66 - 68 32 67 69 - 71 15 70 3 1 72 - 74 18 73 6 2 36 Jumlah 100 -
RATA-RATA HITUNG (lanjutan) 1. Dalam Tabel Distribusi Frekuensi Interval Kelas Nilai Tengah (X) Frekuensi fX 9-21 22-34 35-47 48-60 61-73 74-86 87-99 15 28 41 54 67 80 93 3 4 8 12 23 6 45 112 164 432 804 1840 558 Σf = 60 ΣfX = 3955
RATA-RATA HITUNG (lanjutan) 2. Dengan Memakai Kode (U) Interval Kelas Nilai Tengah (X) U Frekuensi fU 9-21 22-34 35-47 48-60 61-73 74-86 87-99 15 28 41 54 67 80 93 -3 -2 -1 1 2 3 4 8 12 23 6 -9 -8 -4 46 18 Σf = 60 ΣfU = 55
HUBUNGAN EMPIRIS ANTARA NILAI RATA-RATA HITUNG, MEDIAN, DAN MODUS Ada 3 kemungkinan kesimetrian kurva distribusi data : Jika nilai ketiganya hampir sama maka kurva mendekati simetri. Jika Mod<Med<rata-rata hitung, maka kurva miring ke kanan. Jika rata-rata hitung<Med<Mod, maka kurva miring ke kiri.
Jika distribusi data tidak simetri, maka terdapat hubungan : HUBUNGAN EMPIRIS ANTARA NILAI RATA-RATA HITUNG, MEDIAN, DAN MODUS (lanjutan) Jika distribusi data tidak simetri, maka terdapat hubungan : Rata-rata hitung-Modus = 3 (Rata-rata hitung-Median)
Median data berkelompok Diameter dari 40 buah pipa adalah sebagai berikut : Diameter Pipa (mm) Frekuensi (f) 65 - 67 2 68 - 70 5 71 - 73 13 74 - 76 14 77 - 79 4 80 - 82
Penyelesaian : Jumlah Frekuensi (n) = 40 dan ½ n = 20 Kelas median Jadi, kelas median adalah kelas ke-3
Jenis-jenis Ukuran Nilai Pusat Modus (Mode) adalah nilai yang paling sering muncul dalam data. Modus data tunggal : Data dengan frekuensi terbanyak. Modus data berkelompok
Ukuran Letak
KUARTIL, DESIL, PERSENTIL Kelompok data yang sudah diurutkan (membesar atau mengecil) dibagi empat bagian yang sama besar. Ada 3 jenis yaitu kuartil pertama (Q1) atau kuartil bawah, kuartil kedua (Q2) atau kuartil tengah, dan kuartil ketiga (Q3) atau kuartil atas.
KUARTIL (lanjutan) Untuk data tidak berkelompok Untuk data berkelompok L0 = batas bawah kelas kuartil F = jumlah frekuensi semua kelas sebelum kelas kuartil Qi f = frekuensi kelas kuartil Qi
KUARTIL (lanjutan) Contoh : Q1 membagi data menjadi 25 % Sehingga : Q1 terletak pada 48-60 Q2 terletak pada 61-73 Q3 terletak pada 74-86 Interval Kelas Nilai Tengah (X) Frekuensi 9-21 22-34 35-47 48-60 61-73 74-86 87-99 15 28 41 54 67 80 93 3 4 8 12 23 6 Σf = 60
KUARTIL (lanjutan) Untuk Q1, maka : Untuk Q2, maka : Untuk Q3, maka :
KUARTIL, DESIL, PERSENTIL (lanjutan) Kelompok data yang sudah diurutkan (membesar atau mengecil) dibagi sepuluh bagian yang sama besar.
DESIL (lanjutan) Untuk data tidak berkelompok Untuk data berkelompok L0 = batas bawah kelas desil Di F = jumlah frekuensi semua kelas sebelum kelas desil Di f = frekuensi kelas desil Di
DESIL (lanjutan) Contoh : D3 membagi data 30% D7 membagi data 70% Sehingga : D3 berada pada 48-60 D7 berada pada 74-86 Interval Kelas Nilai Tengah (X) Frekuensi 9-21 22-34 35-47 48-60 61-73 74-86 87-99 15 28 41 54 67 80 93 3 4 8 12 23 6 Σf = 60
DESIL (lanjutan)
KUARTIL, DESIL, PERSENTIL (lanjutan) Untuk data tidak berkelompok Untuk data berkelompok
PENGUKURAN DISPERSI, KEMIRINGAN, DAN KERUNCINGAN DATA DISPERSI DATA Dispersi/ variasi/ keragaman data: ukuran penyebaran suatu kelompok data terhadap pusat data. Ukuran Dispersi yang akan dipelajari: Jangkauan (Range) Simpangan rata – rata (mean deviation) Variansi (variance) Standar Deviasi (Standard Deviation) Simpangan Kuartil (quartile deviation) Koefisien variasi (coeficient of variation) Dispersi multak Dispersi relatif
RANGE/ JANGKAUAN DATA (r) Range: Selisih nilai maksimum dan nilai minimum Rumus: Range untuk kelompok data dalam bentuk distribusi frekuensi diambil dari selisih antara nilai tengah kelas maksimun – nilai tengah kelas minimum Range (r) = Nilai max – nilai min
Simpangan Rata2/ Mean Deviation (SR) Simpangan rata – rata: jumlah nilai mutlak dari selisih semua nilai dengan nilai rata – rata, dibagi banyaknya data. Rumus Untuk data tidak berkelompok Dimana: X = nilai data = rata – rata hitung n = banyaknya data
VARIANSI/ VARIANCE Untuk data berkelompok Dimana: X = nilai data = rata – rata hitung n = Σf = jumlah frekuensi VARIANSI/ VARIANCE Variansi adalah rata – rata kuadrat selisih atau kuadrat simpangan dari semua nilai data terhadap rata – rata hitung. = simbol untuk sample = simbol untuk populasi
Untuk data berkelompok Rumus untuk data tidak berkelompok Untuk data berkelompok
STANDAR DEVIASI/ STANDARD DEVIATION (S) Standar deviasi: akar pangkat dua dari variansi Rumus: Untuk data tidak berkelompok Untuk data berkelompok
Contoh Soal Data tidak berkelompok Diketahui sebuah data berikut: 20, 50, 30, 70, 80 Tentukanlah: Range (r) Simpangan Rata – rata (SR) Variansi Standar Deviasai
Jawab: Range (r) = nilai terbesar – nilai terkecil = 80 – 20 = 60 Simpangan Rata – rata (SR): n = 5
Variansi Standar Deviasi (S)
Contoh Soal Data Berkelompok Diketahui data pada tabel dibawah ini: Modal Frekuensi 112 - 120 4 121 - 129 5 130 - 138 8 139 - 147 12 148 -156 157 -165 166 - 174 2 40 Tentukan: Range (r) Simpangan rata – rata (SR) Variansi Standar Deviasi
JAWAB Range (r)= (nilai tengah tertinggi – nilai tengah terendah)/2 Simpangan rata – rata Variansi Standar Deviasi n = jml frekuensi
Untuk memudahkan mencari jawaban, maka dibuat tabel sesuai dengan keperluan jawaban Modal f Nilai Tengah (X) 112 - 120 4 116 24,525 98,100 601,476 2405,902 121 - 129 5 125 15,525 77,625 241,026 1205,128 130 - 138 8 134 6,525 52,200 42,576 340,605 139 - 147 12 143 2,475 29,700 6,126 73,507 148 -156 152 11,475 57,375 131,676 658,378 157 -165 161 20,475 81,900 419,226 1676,902 166 - 174 2 170 29,475 58,950 868,776 1737,551 Jumlah 40 455,850 8097,974
Maka dapat dijawab: Range (r) = 170 – 116 = 54 Simpangan rata – rata Variansi Standar Deviasi
JANGKAUAN QUARTIL DAN JANGKAUAN PERSENTIL 10-90 Jangkauan kuartil disebut juga simpangan kuartil, rentang semi antar kuartil, deviasi kuartil. Jangkauan persentil 10-90 disebut juga rentang persentil 10-90 Jangkauan kuartil dan jangkauan persentil lebih baik daripada jangkauan (range) yang memakai selisih antara nilai maksimum dan nilai minimun suatu kelompok data Rumus: Jangkauan Kuartil: Ket: JK: jangkauan kuartil Q1: kuartil bawah/ pertama Q3: kuartil atas/ ketiga
KOEFISIEN VARIASI/ DISPERSI RELATIF Rumus Jangkauan Persentil KOEFISIEN VARIASI/ DISPERSI RELATIF Untuk mengatasi dispersi data yang sifatnya mutlak, seperti simpangan baku, variansi, standar deviasi, jangkauan kuartil,dll Untuk membandingkan variasi antara nilai – nilai bersar dengan nilai – nilai kecil. Untuk mengatasi jangkauan data yang lebih dari 2 kelompok data. Rumus: Ket: KV: Koefisien variasi S : Standar deviasi X : Rata – rata hitung
KOEFISIEN VARIASI KUARTIL Alternatif lain untuk dispersi relatif yang bisa digunakan jika suatu kelompok data tidak diketahui nilai rata – rata hitungnya dan nilai standar deviasinya. Rumus: atau
NILAI BAKU Nilai baku atau skor baku adalah hasil transformasi antara nilai rata – rata hitung dengan standar deviasi Rumus: Nilai i = 1, 2, 3, …, n
Contoh Soal untuk Koefisien Variasi dan Simpangan Baku Ada dua jenis bola lampu. Lampu jenis A secara rata – rata mampu menyala selama 1500 jam dengan simpangan baku (standar deviasi) S1 = 275 jam, sedangkan lampu jenis B secara rata – rata dapat menyala selama 1.750 jam dengan simpangan baku S2 = 300 jam. Lampu mana yang kualitasnya paling baik? Jawab: Lampu jenis A: Lampu jenis B:
Nilai rata – rata ujian akhir semester mata kuliah Statistika dengan 45 mahasiswa adalah 78 dan simpangan baku/standar deviasi (S) = 10. Sedangkan untuk mata kuliah Bahasa Inggris di Kelas itu mempunyai nilai rata – rata 84 dan simpangan bakunya (S) = 18. Bila dikelas itu, Desi mendapat nilai UAS untuk kalkulus adalah 86 dan untuk bahasa Inggris adalah 92, bagaimana posisi/ prestasi Desi di kelas itu? Jawab Untuk mengetahui posisi/ prestasi Desi, maka harus dicari nilai baku (Z) dari kedua mata kuliah tersebut. dengan nilai X adalah nilai UAS yang diperoleh Desi
Untuk Mata Kuliah Statistika X = 86 S = 10 Maka: Untuk Mata Kuliah Bahasa Inggris X = 92 S = 18 Karena nilai baku (Z) untuk mata kuliah Statistika lebih besar dari B. Inggris, maka posisi Desi lebih baik pada mata kuliah Statistika dari pada B. Inggris
KEMIRINGAN DATA Kemiringan: derajat/ ukuran dari ketidaksimetrian (asimetri) suatu distribusi data 3 pola kemiringan distribusi data, sbb: Distribusi simetri (kemiringan 0) Distribusi miring ke kiri (kemiringan negatif) Distribusi miring ke kanan (kemiringan positif)
Beberapa metoda yang bisa dipakai untuk menghitung kemiringan data, yaitu: Rumus Pearson Rumus Momen Rumus Bowley Rumus Pearson (α) atau
Rumus tersebut dipakai untuk data tidak berkelompok maupun data berkelompok. Bila α = 0 atau mendekati nol, maka dikatakan distribusi data simetri. Bila α bertanda negatif, maka dikatakan distribusi data miring ke kiri. Bila α bertanda positif, maka dikatakan distribusi data miring ke kanan. Semakin besar α, maka distribusi data akan semakin miring atau tidak simetri
Standard or z score A z score indicates distance from the mean in standard deviation units. Formula: Converting to standard or z scores does not change the shape of the distribution. Z-scores are not normalized.
KASUS DATA TIDAK BERKELOMPOK Berikut adalah data sampel tentang nilai sewa bulanan untuk satu kamar apartemen ($). Berikut adalah data yang berasal dari 70 apartemen di suatu kota tertentu: