Metode Statistika (STK211) Pertemuan II Statistika Dasar (Basic Statistic)
Konsep Peubah Definisi Skala pengukuran peubah Peubah (variable) merupakan karakteristik dari objek yang sedang diamati, seperti tinggi tanaman, produksi, dll Skala pengukuran peubah Nominal : mengklasifikasikan Ordinal : mengklasifikasikan dan mengurutkan Interval : mengklasifikasikan, mengurutkan dan membedakan Rasio : mengklasifikasikan, mengurutkan, membedakan dan membandingkan
Statistika Deskripsi dan Eksplorasi Merupakan teknik penyajian dan peringkasan data sehingga menjadi informasi yang mudah dipahami. Penyajian data dapat dilakukan melalui: Tabel Gambar (histogram, plot, stem-leaf, box-plot) Peringkasan data dinyatakan dalam dua ukuran yaitu: Pemusatan (Median, Modus, Kuartil, Mean, dll) Penyebaran (Range, Interquartile Range, Ragam)
Tabular and Graphical Procedures Data Qualitative Data Quantitative Data Tabular Methods Graphical Methods Tabular Methods Graphical Methods Bar Graph Pie Chart Frequency Distribution Rel. Freq. Dist. Percent Freq. Crosstabulation Dot Plot Histogram Scatter Diagram Frequency Distribution Rel. Freq. Dist. Cum. Freq. Dist. Cum. Rel. Freq. Stem-and-Leaf Display Crosstabulation
Ilustrasi I No Sex Tinggi Berat Agama 1 167 63 Islam 2 172 74 3 161 53 161 53 Kristen 4 157 47 Hindu 5 165 58 6 60 7 162 52 Budha 8 151 45 Katholik 9 158 54 10 11 176 82 12 69 13 163 57 14 15 164 16 50 17 159 61 18 65 19 62 20 169 59 21 173 70
Penyajian Tabel Rata-rata Tinggi & Berat Tinggi Berat Laki-laki 166.25 Rekapitulasi menurut Agama Agama Frekuensi Persen Islam 13 61.90 Kristen 4 19.05 Katholik 2 9.52 Hindu 1 4.76 Budha Rekapitulasi menurut Sex Sex Frek. Persen Laki-laki 12 57.14 Perempuan 9 42.86 Rata-rata Tinggi & Berat Tinggi Berat Laki-laki 166.25 64.75 Perempuan 160.56 53.89 Gabungan 163.81 60.10
Penyajian Grafik
Ilustrasi II Penyajian Dengan Tabel Data Pengamatan Tanaman Obs Tinggi Pohon (m) Diameter Pohon (m) Varietas 1 3.5 0.25 A 2 4.0 0.40 3 2.8 0.20 B 4 3.2 0.21 C 5 3.6 0.30 6 4.2 0.35 7 2.9 0.22 8 2.5 0.18 9 3.8 0.38 10 4.6 0.41 11 2.2 0.15 12 3.4 0.28 D 13 0.37 14 4.8 0.39 15 5.0 Penyajian Dengan Tabel Varietas Count CumCnt Percent CumPct A 5 5 33.33 33.33 B 3 8 20.00 53.33 C 3 11 20.00 73.33 D 4 15 26.67 100.00
Penyajian Dengan Gambar
Penyajian Dengan Stem-Leaf
Penyajian Dengan Stem-Leaf Stem-and-Leaf Display: Tinggi Pohon (m), Diameter Pohon (m) Stem-and-leaf of Tinggi Pohon (m) N = 15, Leaf Unit = 0.10 2 2 2 589 3 24 3 568 4 022 4 68 5 0 Stem-and-leaf of Diameter Pohon (m) N = 15, Leaf Unit = 0.010 1 58 2 012 2 58 3 0 3 5789 4 001
Example: Hudson Auto Repair Sample of Parts Cost for 50 Tune-ups
5 6 7 8 9 10 2 7 2 2 2 2 5 6 7 8 8 8 9 9 9 1 1 2 2 3 4 4 5 5 5 6 7 8 9 9 9 0 0 2 3 5 8 9 1 3 7 7 7 8 9 1 4 5 5 9 a stem a leaf
Penyajian Dengan Box-plot
Peringkasan Data (Pemusatan dan Penyebaran) Beberapa ukuran pemusatan, yaitu: Modus: Nilai pengamatan yang paling sering muncul Median: Pengamatan yang ditengah-tengah dari data terurut Quartil: Nilai-nilai yang membagi data terurut menjadi 4 bagian yang sama Mean: merupakan pusat massa (centroid) sehingga simpangan kiri dan simpangan kanan sama besar
Beberapa ukuran penyebaran, yaitu: Range: besarnya penyebaran data dari data terkecil sampai data terbesar Interquartile Range: besarnya penyebaran data yang diukur mulai quartile satu sampai quartile tiga atau besarnya penyebaran data dari 50% pengamatan ditengah Ragam: merupakan rata-rata jarak kuadrat setiap titik pengataman terhadap nilai mean (rata-rata)
Langkah-langkah teknis Median Urutkan data dari kecil ke besar Cari posisi median (nmed=(n+1)/2) Nilai median Jika nmed bulat, maka Median=X(n+1)/2 Jika nmed pecahan, maka Median=(X(n)/2+ X(n)/2+1)/2 (rata-rata dua pengamatan yang berada sebelum dan setelah posisi median)
Kuartil (Quartile) Metode Belah dua Urutkan data dari kecil ke besar Cari posisi kuartil nq2=(n+1)/2 nq1=(nq2*+1)/2= nq3, nq2* posisi kuartil dua terpangkas (pecahan dibuang) Nilai kuartil 2 ditentukan sama seperti mencari nilai median. Kuartil 1 dan 3 prinsipnya sama seperti median tapi kuartil 1 dihitung dari kiri, sedangkan kuartil 3 dihitung dari kanan.
Quartiles divide the sorted data into quarters Quartiles divide the sorted data into quarters. Hence, for the first quartile (Q1) 25% of the data is below it and 75% above it The second quartile (Q2)-this is also the median) has 50% of the data below it and 50% above it Finally, 75% of the observations are below Q3 while 25% are above
Metode Interpolasi Urutkan data dari kecil ke besar Cari posisi kuartil nq1=(1/4)(n+1) nq2=(2/4)(n+1) nq3=(3/4)(n+1) Nilai kuartil dihitung sebagai berikut: Xqi=Xa,i + hi (Xb,i-Xa,i) Xa,i = pengamatan sebelum posisi kuartil ke-i, Xb,i = pengamatan setelah posisi kuartil ke-i dan hi adalah nilai pecahan dari posisi kuartil
Rata-rata (Mean) Populasi: Sampel:
Jarak Antar Kuartil (Interquartile range) Wilayah (Range) W=Xmax-Xmin Jarak Antar Kuartil (Interquartile range) JAK=q3-q1
Ragam (Variance) Populasi : Sampel:
Simpangan baku (standard deviation) Merupakan akar dari ragam yaitu simpangan baku populasi atau s simpangan baku sampel
Data pada ilustrasi II diolah menggunakan MINITAB Descriptive Statistics: Tinggi Pohon (m), Diameter Pohon (m) Variable N N* Mean StDev Variance Minimum Q1 Median Tinggi Pohon (m) 15 0 3.647 0.837 0.700 2.200 2.900 3.600 Diameter Pohon ( 15 0 0.2993 0.0919 0.00845 0.1500 0.2100 0.3000 Variable Q3 Maximum Range IQR Tinggi Pohon (m) 4.200 5.000 2.800 1.300 Diameter Pohon ( 0.3900 0.4100 0.2600 0.1800 Descriptive Statistics: Tinggi Pohon (m) Variable Varietas N N* Mean StDev Variance Minimum Q1 Tinggi Pohon (m) A 5 0 3.620 0.890 0.792 2.200 2.850 B 3 0 2.733 0.208 0.0433 2.500 2.500 C 3 0 3.667 0.503 0.253 3.200 3.200 D 4 0 4.350 0.719 0.517 3.400 3.600 Variable Varietas Median Q3 Maximum Range IQR Tinggi Pohon (m) A 3.800 4.300 4.600 2.400 1.450 B 2.800 2.900 2.900 0.400 0.400 C 3.600 4.200 4.200 1.000 1.000 D 4.500 4.950 5.000 1.600 1.350
Modus Contoh: Data hasil pengamatan jumlah sumbangan perorangan (dalam Rp 1000,-): 9, 10, 5, 9, 9, 7, 8, 6, 10 dan 11 Nilai yang yang terjadi dengan frekuensi paling tinggi (modus) = Rp 9.000,- Contoh: Data hasil pengamatan frekuensi mahasiswa nonton film per bulan: 2, 0, 3, 1, 2, 4, 2, 5, 4, 0, 1 dan 4 Dalam kasus ini terdapat 2 modus, yaitu 2 dan 4 (sebaran demikian dikatakan bimodus)
Median Contoh: Hasil pengamatan (telah diurutkan): 1, 2, 3, 4, dan 5 Amatan yang ditengah (median) = 3 Contoh: Hasil pengamatan (setelah dirutkan): 1, 2, 3 dan 4 Amatan yang ditengah (median) = (2+3)/2 = 2,5
For example, suppose you want to find the median for the following set of data:74, 66, 69, 68, 73, 70 First we arrange the data in an ordered array: 66, 68, 69, 73, 70, 74 Since there is an even number of data, the average of the middle two numbers (i.e. 69 and 73) is the median (142/2=71)
Generally the median provides a better measure of location than the mean when there are extremely large or small observations (i.e., when the data are skewed to the right or to the left If the median is less than the mean, the data set is skewed to the right If the median is greater than the mean, the data is skewed to the left
The median is less than the mean The median is greater than the mean
Quartil Contoh: Data hasil pengamatan (setelah diurutkan) adalah: 48, 49, 57, 61, 79, 80, 80, 81, 83 dan 90 Q1= 57 Q2=79,5 Q2 tidak lain adalah median Q3=81 Jangkauan antar kuartil (JAK)=Q3-Q1 = 81-57 = 24
Contoh: Sample 1 97 98 99 100 101 102 103 Sample 2 49 50 51 149 150 151 Sample 3 1 2 3 197 198 199
IQ (Interquartile) range for sample 1: The median is the 4th largest observation which is 100 There are three data points below our median (97, 98, 99) The median of these values is 98 There are three data points above our median (101, 102, 103) The median of these values is 102 Hence, our IQ range is 102-98=4
Mean (Rata-rata) Rata-rata sampel, = 708/10 = 70,8 Wilayah (Range), = 90 – 48 = 42 Contoh: Data hasil pengamatan (setelah diurutkan) adalah: 48, 49, 57, 61, 79, 80, 80, 81, 83 dan 90
Varian (Ragam) Varian sampel, = 2.140/(10-1)= 238 Standar Devisasi (simpangan baku), s = akar dari ragam = 15,43 No. Xi X-bar (Xi-X-bar) (Xi-X-bar)^2 1 48 70,8 -22,8 519,84 2 49 -21,8 475,24 3 57 -13,8 190,44 4 61 -9,8 96,04 5 79 8,2 67,24 6 80 9,2 84,64 7 8 81 10,2 104,04 9 83 12,2 148,84 10 90 19,2 368,64 Rata-rata Jumlah 708 2.140
The Empirical Rule The Empirical Rule is applicable for approximately mound-shaped distributions and relates X and s as follows: (figures are “rule of thumb”) 67% of all values within X s 95% of all values within X 2s 99% of all values within X 3s Values outside this latter range are often considered unusual.
Box-plot Memberi informasi visual tentang lokasi, pencaran, kemenjuluran, dan informasi tentang ekor sebaran contoh IQR Q1 Q3 Me-dian
1,5.IQR IQR 3,0.IQR 1,5.IQR 3,0.IQR Lower adjacent value Q1 Me-dian Q3 Upper adjacent value Minor outlier Extrem Outlier (pencilan)
50 Days of Photocopier Usage Day Usage Day Usage Day Usage --------------------------------------------------------------------------------------------------------------------------------------------- 1 500 18 360 35 150 2 420 19 310 36 140 3 440 20 320 37 130 4 480 21 290 38 150 5 450 22 290 39 130 6 460 23 270 40 110 7 450 24 250 41 90 8 420 25 240 42 80 9 410 26 250 43 90 10 405 27 250 44 70 11 380 28 230 45 20 12 360 29 240 46 50 13 360 30 220 47 40 14 370 31 190 48 20 15 350 32 150 49 30 16 320 33 170 50 30 17 350 34 120
Box-and-Whisker Plots Most commonly called boxplots. Consist of a “five-number summary” and four “outlier points” min, Q1, Q2, Q3, max Inner LOP = Q1-1.5(IQR) Outer LOP = Q1-3(IQR) Inner UOP = Q3+1.5(IQR) Outer UOP = Q3+3(IQR) (L=Lower, O=outlier, P=Point, IQR=Inter Quartile Range) min = 20 max = 500 Q1 = 127.5 Q2 = 250 Q3 = 362.5 Inner LOP = 127.5 - 1.5(235) = -225.5 copies (N/A) Outer LOP= 127.5 - 3.0(235) = -577.5 copies (N/A) Inner UOP = 362.5 + 1.5(235) = 615 copies Outer UOP= 362.5 + 3.0(235) = 1,067.5 copies NO OUTLIERS BY THESE MEASURES!
Soal Latihan Dari hasil pengukuran ini: 0.0, 0.8, 1.0, 1.2, 1.3, 1.3, 1.4, 2.4, dan 4.6, Tentukan median, modus, mean, varian, simpangan baku, jangkauan kuartil Buat diagram stem-leaf Buat diagrm box-plot, dan jelaskan bentuk sebarannya terutama dalam kaitan dengan pencilannya.
Buat diagram box-plot daata berikut: 12, 14, 10, 17, 23 dan 4. Jelaskan!
Referensi: Koopmans, L.H. 1987. Introduction to Contemporary Statistical Methods 2nd ed. Duxbury, Press. Boston.
Data Pengamatan Tanaman Obs Tinggi Pohon (m) Diameter Pohon (m) Varietas 1 3,5 0,25 A 2 4,0 0,40 3 2,8 0,20 B 4 3,2 0,21 C 5 3,6 0,30 6 4,2 0,35 7 2,9 0,22 8 2,5 0,18 9 3,8 0,38 10 4,6 0,41 11 2,2 0,15 12 3,4 0,28 D 13 0,37 14 4,8 0,39 15 5,0 Ukuran Pemusatan: Modus Median Mean (Rata-rata) Ukuran Penyebaran: Min. Max. Range q1 q2 q3 JAK atau IQR Varian (Ragam) Standar Deviasi
Ukuran Pemusatan: Modus Median Mean (Rata-rata) Ukuran Penyebaran: Data Pengamatan Tanaman Obs Tinggi Pohon (m) Diameter Pohon (m) 3,5 4,0 2,8 3,2 3,6 4,2 2,9 2,5 3,8 4,6 2,2 3,4 4,8 5,0 0,25 0,40 0,20 0,21 0,30 0,35 0,22 0,18 0,38 0,41 0,15 0,28 0,37 0,39 Ukuran Pemusatan: Modus Median Mean (Rata-rata) Ukuran Penyebaran: Min. Max. Range q1 q2 q3 JAK atau IQR Varian (Ragam) Standar Deviasi