Chapter 2 Representasi Data: Grafik Statistika Chapter 2 Representasi Data: Grafik
Tujuan Bab Setelah Mempelajari Bab ini, anda mampu : Mengidentifikasi tipe-tipe data dan level pengukuran Membuat dan menginterpretasikan grafik untuk analisis variabel kategorik : Distribusi frequensi, bar chart, pie chart, dll Membuat grafik untuk data time-series Membuat dan menginterpretasikan grafik untuk analisis variabel numerik : Distribusi frekuensi, histogram, diagram batang dan daun Mengkonstruksi dan interpretasi grafik untuk menggambarkan hubungan antar variabel : Scatter plot, tabulasi silang
Tipe-tipe Data Contoh: Status perkawinan Jenis Kelamin Tingkat Pendidikan Status Merokok Contoh: Banyaknya anak Banyaknya cacat per jam Contoh: Berat Badan Hasil panen Konsumsi BBM perliter
Measurement Levels Ratio Data Interval Data Ordinal Data Nominal Data Differences between measurements, true zero exists Ratio Data Quantitative Data Differences between measurements but no true zero Interval Data Kategorik terurut (ranking, urutan, or skaling) Ordinal Data Qualitative Data Kategorik (Tidak ada urutan ) Nominal Data
Skala nominal Adalah skala yang semata-mata hanya untuk memberikan indeks, atau nama saja dan tidak mempunyai makna yang lain Misal anda memberi angka untuk Jenis Pekerjaan 1 = Petani 2 = Pedagang 3 = PNS Tidak berarti bahwa Petani lebih rendah dari Pedagang dan PNS, begitu juga sebaliknya. Anda dapat mengganti angka ketiganya sesuka hati anda tanpa mempengaruhi arti statistikanya.
Skala ordinal Adalah skala ranking, di mana kode yang diberikan memberikan urutan tertentu pada data, tetapi tidak menunjukkan selisih yang sama dan tidak ada nol mutlak Misal tingkat kecantikan ranking 1,2,3,4. Jelas bahwa ranking 1 lebih cantik dari ranking 2,3, dan 4. Akan tetapi, tidak berarti bahwa ranking 1 mempunyai kecantikan 4 kali dibanding ranking 4, dst…
Skala interval Skala pengukuran yang mempunyai selisih sama antara satu pengukuran dengan pengukuran yang lain, tetapi tidak memiliki nilai nol mutlak Nilai A setara dengan 4, B dengan 3, C dengan 2 dan D dengan 1. Selisih A dan B sama dengan selisih B dan C dan juga sama persis dengan selisih nilai C dan D. Akan tetapi, tidak boleh dikatakan bahwa A empat kali lebih pintar dibandingkan D, atau A dua kali lebih pintas dari pada B. Meskipun selisihnya sama, tetapi tidak mempunyai nilai nol mutlak.
Sebagai contoh, suhu, dalam derajat Fahrenheit atau Celcius, merupakan skala interval. Kita dapat mengatakan bahwa suhu 50 > 40 derajat, demikian juga suhu 30 > 20 derajat. Perbedaan selisih suhu antara 40 dan 50 derajat = perbedaan suhu antara 20 dan 30 derajat, yaitu 10 derajat. Perbedaan antara kedua nilai pada skala interval sudah punya makna yang berarti, berbeda dengan perbedaan pada skala ordinal yang maknanya tidak berarti. Misalnya, perbedaan antara suhu 40 dan 50 derajat dua kali lebih besar dibandingkan dengan perbedaan antara suhu 30 dan 35.
Skala rasio Adalah skala pengukuran yang paling tinggi di mana selisih tiap pengukuran adalah sama dan mempunyai nilai nol mutlak BB 100 benar-benar 2x BB 50. BB Ayah anda 60 kg, berat badan anda 40 kg. Berarti BB ayah anda adalah 1,5 x BB anda.
Memang agak sedikit susah membedakan skala interval dengan rasio Memang agak sedikit susah membedakan skala interval dengan rasio. Kuncinya adalah di angka 0, apakah nilai nol tersebut mutlak atau tidak? Suhu bisa berupa skala interval tapi bisa juga skala rasio, tergantung pada skala pengukuran yang digunakan. Apabila kita menggunakan skala Celcius atau Fahrenheit, termasuk skala interval, Apabila Kelvin yang digunakan, suhu termasuk skala rasio. Mengapa? Karena suhu 0 derajat Kelvin adalah mutlak! Kita tidak saja dapat mengatakan bahwa suhu 200 derajat lebih tinggi daripada suhu 100 derajat, tetapi benar dua kali lebih tinggi.
Presentasi Grafik Techniques reviewed in this chapter: Variabel Kategorik Variabel Numerik Distribusi Frequensi Bar chart Pie chart Diagram Pareto Line chart Histogram Diagram Batang dan Daun Scatter plot
Tabel Distribusi Frekuensi Ringkasan data per kategori Contoh: Banyaknya Pasien Per Unit Unit RS # Pasien Cardiac Care 1,052 Emergency 2,245 Intensive Care 340 Maternity 552 Surgery 4,630 (Variabel : Kategorik)
Contoh Bar Chart
Pie Chart Example Hospital Number % of Unit of Patients Total Cardiac Care 1,052 11.93 Emergency 2,245 25.46 Intensive Care 340 3.86 Maternity 552 6.26 Surgery 4,630 52.50 (Percentase dibulaskan ke angka terdekat
Diagram Pareto Contoh: 400 barang cacat berdasar faktornya: Source of Manufacturing Error Number of defects Bad Weld 34 Poor Alignment 223 Missing Part 25 Paint Flaw 78 Electrical Short 19 Cracked case 21 Total 400
Diagram Pareto Step 1: Urutkan berdasar sebab kerusakan Step 2: Hitunglan prosentasenya Source of Manufacturing Error Number of defects % of Total Defects Poor Alignment 223 55.75 Paint Flaw 78 19.50 Bad Weld 34 8.50 Missing Part 25 6.25 Cracked case 21 5.25 Electrical Short 19 4.75 Total 400 100%
% of defects in each category (bar graph) cumulative % (line graph) Diagram Pareto Step 3: Presentasi grafik % of defects in each category (bar graph) cumulative % (line graph)
Grafik data Time-Series Plot data time series dalam dibuat dalam grafik garis digunakan untuk menyajikan nilai-nilai dari suatu variabel sepanjang waktu tertentu Waktu diukur pada sumbu mendatar Variabel data diukur pada sumbu vertikal
Contoh Plot Data TS
Distribusi Frequensi Apa Distribusi Frequensi itu ? Distribusi frequensi adalah sebuah daftar atau table … Berisi kelas-kelas atau kategori-kategori … Dan frekuensi data yang bersesuaian…
Interval Kelas dan Batasnya Masing-masing kelas mempunyai lebar yang sama dengan formula Gunakan mininal 5 kelas, tapi tidak lebih 15-20 interval Interval kelas tidak overlap Bulatkan ke atas lebar interval
Contoh Distribusi Frequensi Suatu perusahaan insulasi secara random memilih 20 hari di musim winter dan Mengukur temperaturnya 24, 35, 17, 21, 24, 37, 26, 46, 58, 30, 32, 13, 12, 38, 41, 43, 44, 27, 53, 27 Urutkan datanya : 12, 13, 17, 21, 24, 24, 26, 27, 27, 30, 32, 35, 37, 38, 41, 43, 44, 46, 53, 58
Frequency Distribution Example Hitung range: 58 - 12 = 46 Pilih banyaknya kelas: 5 Hitung lebar interval : 10 (46/5 dibulat ke atas ) Tentukan batas interval: 10 but less than 20, 20 but less than 30, . . . , 60 but less than 70 Hitung observasi dan masukkan ke kelas yang sesuai
Distribusi Frequensi Percentage Interval Frequency Relative Frequency Percentage Interval Frequency 10 but less than 20 3 .15 15 20 but less than 30 6 .30 30 30 but less than 40 5 .25 25 40 but less than 50 4 .20 20 50 but less than 60 2 .10 10 Total 20 1.00 100
Histogram Grafik dari data dalam suatu distribusi frequensi disebut dengan histogram Nilai-nilai Interval ditunjukkan pada sumbu horisontal Sumbu vertikal berisi frequensi, atau frequensi relatif, atau persentase Batang tegak menunjukkan banyaknya observasi atau frekuensi masing-masing kelas
Contoh Histogram Temperature in Degrees
Bentuk Distribusi Bentuk distribusi dikatakan symmetric jika observasi seimbang, atau terdistribusi di tengah.
Bentuk Distribusi Bentuk distribusi dikatakan skewed (menceng) jika observasi tidak symmetric. Suatu distribusi dikatakan menceng ke kanan jika ekornya melebar ke kanan. Suatu distribusi dikatakan menceng ke kiri jika ekornya melebar ke kiri
Diagram Batang dan Daun Cara yang mudah untuk melihat distribusi data set METHOD: Pisahkan data terurut ke angka utama (batang) dan angka tambahan (daun)
Contoh Data terurut : 21 ditunjukkan 38 ditunjukkan 21, 24, 24, 26, 27, 27, 30, 32, 38, 41 Di sini, gunakan puluhan sebagai batangnya: batang daun 2 1 3 8 21 ditunjukkan 38 ditunjukkan
Contoh Data terurut: 21, 24, 24, 26, 27, 27, 30, 32, 38, 41 Diagram batang dan daun lengkap : Stem Leaves 2 1 4 4 6 7 7 3 0 2 8 4 1
Contoh lain Gunakan ratusan sebagai batang : Diagram batang dan daun lengkap : Data: 613, 632, 658, 717, 722, 750, 776, 827, 841, 859, 863, 891, 894, 906, 928, 933, 955, 982, 1034, 1047,1056, 1140, 1169, 1224 bat daun 6 1 3 6 7 2 2 5 8 8 3 4 6 6 9 9 9 1 3 3 6 8 10 3 5 6 11 4 7 12 2
Diagram Scatter Plot Diagram Scatter Plot digunakan untuk observasi berpasangan dari dua variabel numerik Diagram Scatter : Satu variabel diukur untuk sumbu vertikal dan lainnya digunakan untuk sumbu horisontal
Contoh Diagram Scatter Umur B. Pressure 23 125 26 140 29 146 33 160 38 167 42 170 50 188 55 195 60 200
Tabulasi Silang Tabulasi Silang digunakan untuk menampilkan data observasi dua atau lebih variabel kategorik. Kombinasi kategori dari Var I dan II, dinamakan dengan sel. Jika ada r kategiri untuk variabel I (baris), dan c kategori untuk variabel II (kolom), tabelnya disebut dengan tabel silang r x c. Ada r x c sel data.
Contoh Tabel Silang Tabulasi silang 4 x 3 untuk Biaya RS untuk 4 kategori dari 3 RS berbeda (Dalam 100 ribuan ) Category Hospital A Hospital B Hospital C A 46.5 55 57.5 B 32.0 34 39.0 C 15.5 20 13.5 D 16.0 15 7.0