Presentasi sedang didownload. Silahkan tunggu

Presentasi sedang didownload. Silahkan tunggu

Pertemuan Ke-2 Data Berstruktur Tunggal

Presentasi serupa


Presentasi berjudul: "Pertemuan Ke-2 Data Berstruktur Tunggal"— Transcript presentasi:

1 Pertemuan Ke-2 Data Berstruktur Tunggal

2 Konsep Mahasiswa memahami: Penataan data:
Tabel frekuensi (Diskrit dan Kontinu) Diagram dahan daun Diagram Kotak dan Garis

3 PEMERIKSAAN POLA - DATA BERSTRUKTUR TUNGGAL -
Kumpulan data yang berupa hasil pengukuran terhadap peubah tertentu pada umumnya tidak akan memiliki nilai yang persis sama satu dengan lainnya. Variasi atau keberagaman nilai-nilai pengamatan ini dapat dilihat dari pola sebarannya. Pola sebaran ini sangat berguna pula dalam penentuan karakteristik data tersebut. Penciri numerik yang penting : ukuran pemusatan dan penyebaran data. Pemeriksaan bentuk sebaran dapat dilakukan dengan DIAGRAM DAHAN DAUN (STEM-AND-LEAF PLOT)

4 DIAGRAM DAHAN DAUN (STEM-AND-LEAF PLOT)
Diagram dahan daun disusun baris per baris secara vertikal dan cukup efektif untuk menggambarkan pola sebaran bagi data yang berukuran kecil. Contoh sederhana : DATA : DAHAN DAUN 1 140 2 3 26 4 1 5 87 6 223 7 455 8 7 Salah satu keuntungan dari diagram ini adalah selain dapat melihat pola sebaran data kita tetap memiliki nilai asli yang akan memudahkan proses mengurutkan data dari nilai yang paling kecil ke nilai terbesar, yang diperlukan dalam analisis data. Kalau kita putar sehingga tersusun secara horisontal maka sebenarnya diagram ini sama dengan diagram titik dan tidak jauh berbeda dengan histogram.

5 Berikut adalah kumpulan 40 angka yang berasal dari sebaran Normal dengan rata-rata 20 dan ragam 25
16.8 25.7 21.4 22.7 28.1 17.5 14.4 20.9 13.1 15.8 21.7 26.2 18.7 20.2 24.6 24.2 14.6 16.9 14.9 26.7 21.6 15.1 6.9 22.6 12.9 14.1 25.8 17.9 17.7 18.6 20.3 24.4 16.6 20.5 19.7 17.3 18.0 13.7 DAHAN DAUN 5 6 9 7 8 9 10 11 12 9 13 17 15 18 16 689 18 067 19 7 21 467 22 67 23 24 246 25 78 26 27 27 28 1 Berdasarkan hasil di atas kita mengharapkan dapat melihat pola yang simetrik, akan tetapi gambaran dari diagram ini tidak menunjukkan hal tersebut secara jelas. Patokan kesimetrisan lebih sederhana dibandingkan dengan pemeriksaan kenormalan data yang membutuhkan pengertian hitung peluang. Proses selanjutnya : PENYARIAN DATA

6 HASIL PENYARIAN DATA DIAGRAM DAHAN DAUN YANG DISEDERHANAKAN
0 . t f s 6 * 1 . t 233 f s * 8889 t 22 f s 66 * 8 Gambar di samping memberikan kesan adanya kesimetrikan yang lebih jelas dari gambar pertama Ket : . : 0 dan 1 t : 2 dan 3 (two, three) f : 4 dan 5 (four, five) s : 6 dan 7 (six, seven) * : 8 dan 9 Data yang dipakai merupakan hasil pembulatan ke bawah dari data asli.

7 RINGKASAN DATA - BOX PLOT -
Diagram Kotak Garis (Box Plot)  merupakan hasil penyarian data dari ringkasan 5-angka b = nilai maks Bentuk kotak mencerminkan gambaran dari 50% data yang terletak di bagian tengah sedangkan garis menggambarkan 25% data yang berada di ujung kumpulan data. Q3 = Kuartil 3 Q2 = Median Q1 = Kuartil 1 k = nilai min

8 Penerapan dari data sebelumnya :
DAHAN DAUN FK 5 6 9 1 7 8 9 10 11 12 9 2 23 27 Ringkasan 5 angka : Me = ( )/2 =18.65 b = k = 6.9 Q1 = ( )/2 = Q3 = ( )/2 = 22.15 30 20 10 28.1 6.9

9 (atau paling tidak relatif sama)
Pola sebaran yang simetrik : Me = (Q1+Q3)/2 = (k+b)/2 (atau paling tidak relatif sama) Note : Misal d = (Q3 - Q1). Kalau data simetrik maka cukup beralasan untuk menganggap bahwa Q3 - Me = Me - Q1 = d/2, sehingga kalau ditetapkan dua buah nilai berupa Q1-3d/2 dan Q3+3d/2 akan menyebabkan nilai selang keduanya memiliki bentuk Me ± 2d. Bentuk ini mengingatkan terhadap selang nilai M ± 1.96 s yang biasa ditemukan kalau berhadapan dengan data yang memiliki sebaran normal. Dari data diperoleh : d = ; BB  Q1-3d/2 = 7.28 ; BA  Q3+3d/2 = 31.07 Terdapat satu pengamatan pencilan yaitu 6.9. Sehingga data ini dikeluarkan dari box plot. Shg boxplot dgn identifikasi pencilan menjadi : Ringkasan 3-angka : Me = 18.65 (Q1+Q3)/2 = 19.15 (k+b)/2 = 17.5 10 20 30 28.1 6.9 12.9

10 Transformasi untuk kesimetrikan data
Contoh data: Pulau Nama Luas (km2) Sumatera Kerinci Laut Tawar Maninjau Ranau Singkarak Toba 121.9 55.3 98.0 43.8 110.0 114.6 Kalimantan Belidah Jampang Luar Prian 117.5 225.0 97.5 548.5 Sulawesi Semayang Lindu Lakalona Matana Poso Sidenreng Tempe Towuti 236.3 15.6 31.2 156.3 281.3 46.9 578.1 DIAGRAM DAHAN DAUN : * 559 * 5 2 . 23 * 8 3 . * 4 . 5 . 4 * 7 Ket : . : digit 0, 1, 2, 3, 4 * : digit 5, 6, 7, 8, 9 Data mengalami penyesuaian. Karena kisaran dari maka kisaran diperkecil dari

11 Ringkasan 5-angka Ringkasan 3-angka Me Q1 Q3 (Q1+Q3)/2 k b (k + b)/2 Ringkasan 5 angka  untuk menggambarkan diagram kotak garis Ringkasan 3 angka  untuk memeriksa pola kesimetrikan Ringkasan 5-angka Ringkasan 3-angka 112 46 225 135.5 15 578 296.5 Dari ringkasan 3 angka, ada kenaikan yang cukup mencolok, maka kita ragukan kesimetrikan pola data Pertanyaan : Apakah dengan transformasi data akan didapatkan pola yang lebih simetrik ??? 281.3 200 400 600  

12 Transformasi akar-dua
10.58 6.78 15.00 10.59 3.87 24.00 13.93 Transformasi log 2.05 1.66 2.35 2.00 1.17 2.76 1.96 5 10 15 20 25 1.1 1.7 2.3 2.9 Gambar di atas masing-masing adalah box plot hasil transformasi akar dua dan logaritma. Transformasi logaritma lebih kuat akibatnya daripada transformasi akar. Akan tetapi karena data ini diukur dalam km2 maka transformasi akar mungkin lebih beralasan untuk dipergunakan karena hasil transformasi ini bisa diartikan pengukur panjang, lebar atau radius. Mencari transformasi yang cocok dalam arti berhasil memperbaiki perilaku data dan memberikan pengertian yang logis membutuhkan pertimbangan yang lebih luas dari sekedar mencari kesimetrikan

13 BOX PLOT DAN PEMBANDINGAN DATA
Salah satu alat pembandingan data adalah boxplot dengan cara menggambarkan boxplot masing-masing kelompok secara berdampingan sehingga perbandingan lokasi pemusatan maupun rentangan penyebaran data antar kelompok dapat dilihat secara sekaligus. Secara visual boxplot dapat menggambarkan lokasi pemusatan, rentang penyebaran dan kemiringan pola sebaran data. Lokasi pemusatan data diwakili median, rentang penyebaran merupakan jarak antar quartil (d=IQR). Posisi median di dalam kotak menunjukkan kemiringan pola sebaran. Letak median yang lebih dekat Q1 mencirikan suatu sebaran dengan kemiringan positif atau memanjang ke arah nilai-nilai yang besar, dan kemiringan negatif terjadi bila posisi median lebih dekat ke Q3. Panjangnya garis yang menjulur ke luar dari kotak menjadi petunjuk adanya data yang agak jauh dari kumpulannya dan hal ini tidak selalu berarti pola sebaran tersebut miring. Selama posisi median terhadap Q1 maupun Q3 relatif seimbang, garis yang terlalu panjang hanya menunjukkan bahwa sebaran data itu memiliki ekor atau kemenjuluran yang lebih panjang dari semestinya.

14 Contoh : Laju pertumbuhan penduduk per tahun menurut kabupaten di propinsi Jawa Barat dan Jawa Tengah Diagram dahan daun Jawa Barat Dahan Daun 1 2 3 4 5 . * 244 89 555678 Jawa Tengah Dahan Daun 1 2 3 4 5 . * 568 6 JAWA BARAT 2.30 2.05 2.65 2.35 1.21 4.52 2.86 JAWA TENGAH 1.60 1.20 1.95 1.57 0.46 5.21 2.83

15 1 2 3 4 5 6 JABAR JATENG 3.31 2.67 Kehomogenan rentangan penyebaran dari beberapa kelompok data akan menyederhanakan proses pembandingan, karena pusat perhatian ada pada lokasi pemusatan saja dalam hal ini perbandingan median antar kelompok data tersebut. Sebelum dilakukan transformasi untuk kehomogenan rentang penyebaran terlebih dahulu memperbaiki data untuk mengeluarkan pencilan Kesimpulan : Ada 25% dari kabupaten di Jateng yang memiliki laju pertumbuhan lebih kecil dari kabupaten Ciamis (nilai terkecil untuk Jabar). Demikian pula dapat dilihat bahwa Q3 Jateng lebih kecil dari Q1 Jabar. Daerah yang memencil mungkin disebabkan adanya pusat-pusat pertumbuhan. seperti DKI Jakarta dan wilayah Jabodetabek

16 PEMERIKSAAN ASUMSI SEBARAN DATA
Pola sebaran teoritis untuk data (Binom, Normal, Eksponensial, Poisson) memegang peranan penting dalam analisis data terutama menyangkut tahap pendugaan parameter, pengujian hipotesis dan penetapan taraf kepercayaan atau taraf nyata atas kesimpulan yang akan diambil. Dari populasi Normal  karakteristik utama adalah nilai rata-rata dan ragam. Pemilihan jenis penduga mana yang dianggap lebih baik sangat dipengaruhi oleh perilaku data dan kriteria yang dipilih. Untuk pengujian hipotesis bagi data yang berasal dari pola sebaran Normal, penduga kuadrat terkecil memiliki keunggulan teoritis dan relatif mudah diterapkan karena teknik analisis telah berkembang lanjut.

17 Hasil analisis data yang didasarkan pada asumsi sebaran tertentu menjadi tidak sah apabila ternyata asumsi tersebut sampai batas-batas tertentu tidak dapat dipenuhi. Memeriksa kebenaran asumsi pola sebaran data  Apakah betul-betul mengikuti pola sebaran normal, dapat didekati dengan sebaran normal atau apakah dapat diubah menjadi berpola normal? Penyimpangan dari asumsi pola sebaran teoritis tidak selalu mempunyai dampak besar terhadap hasil analisis data, kadang-kadang pengaruhnya kecil saja sehingga dapat diabaikan.

18 PEMERIKSAAN DENGAN DIAGRAM KOTAK GARIS YANG DIPERLUAS
Pemeriksaan kesesuaian pola sebaran data pada umumnya kita lakukan terhadap data yang telah diurutkan menurut besarnya Ringkasan 5 angka dapat diperluas lagi menjadi ringkasan 7 angka (dengan menambahkan dua angka “perdelapan”). Atau menjadi ringkasan 9 angka (dengan menambahkan dua buah angka “perenambelas”) urutan “perdelapan” = ([urutan Kuartil]+1)/2 urutan “perenambelas” = ([urutan “perdelapan”]+1)/2

19 RINGKASAN 9-ANGKA Contoh Data : (dibangkitkan dari sebaran normal dengan nilai tengah 20 dan ragam 25) Me K1 D1 E1 k K3 D7 E15 b Merupakan perluasan dari tabel ringkasan 5 - angka 16.8 25.7 21.4 22.7 28.1 17.5 14.4 20.9 13.1 15.8 21.7 26.2 18.7 20.2 24.6 24.2 14.6 16.9 14.9 26.7 21.6 15.1 6.9 22.6 12.9 14.1 25.8 17.9 17.7 18.6 20.3 24.4 16.6 20.5 19.7 17.3 18.0 13.7

20 DAHAN DAUN FK 5 6 9 1 7 8 9 10 11 12 9 2 23 27 RINGKASAN 9-ANGKA YANG DIHASILKAN 18.65 16.20 14.25 13.10 6.90 22.10 25.15 26.20 28.10 Dengan menggantikan lambang-lambang angka ringkasan dengan persentase atau fraksi banyaknya data yang lebih kecil daripada lambang-lambang tersebut didapatkan : 0.5000 0.2500 0.1250 0.0625 0.000 0.7500 0.8750 0.9375 1.0000

21 Sehingga setiap lambang kini akan memiliki sepasang nilai yaitu fraksi dan besarannya disajikan di bawah ini: Dengan mengambil nilai fraksi sebagai x dan besarannya sebai y maka kesembilan lambang tersebut dapat digambarkan menjadi 9 buah titik dalam plot x dan y seperti gambar berikut: k E1 D1 K1 Me K3 D7 E15 b 0.0000 0.0625 0.1250 0.2500 0.5000 0.7500 0.8750 0.9375 1.0000 x 6.90 13.10 14.25 16.20 18.65 22.10 25.15 26.20 28.10 y

22 “Quantile Box Plot”/plot kotak kuantil merupakan cara sederhana tetapi kasar untuk memeriksa pola sebaran data secara nonparametrik Kumpulan data dengan pola simetrik akan memperlihatkan kecenderungan potongan-potongan garis yang membentuk garis lurus Adanya potongan garis yang menaik secara tajam di luar kotak E menunjukkan kemungkinan pencilan, sedangkan kenaikan yang tajam di dalam kotak K dapat memberikan petunjuk bahwa data tersebut mungkin berasal dari dua buah populasi yang berbeda. Data yang tidak berpola simetrik akan terlihat dari kecenderungan potongan-potongan garis tersebut membentuk kurva melengkung.

23 SOAL : DATA A DATA B 42.2 4.0 7.4 15.4 0.6 3.6 31.2 67.2 10.6 6.4 7.6 14.6 31.8 21.4 5.8 4.8 8.6 7.0 7.8 8.8 43.0 10.8 18.4 19.8 1.2 43.4 29.8 2.6 3.8 17.8 68.2 0.4 0.1 1.3 2.0 1.5 1.4 2.6 0.5 2.9 0.8 3.3 2.5 2.3 0.9 3.1 0.7 0.6 2.7 2.4 2.8 0.2 2.2 1.6

24 DATA A DATA B f DAHAN DAUN 9 . 001233444 20 * 56777777888 1 000044 14
. 20 * 1 000044 14 5789 10 2 8 3 111 5 4 233 6 78 DATA B f DAHAN DAUN 5 . 11244 12 * 14 1 34 17 556 (9) 2 3 13 A  Digit pada daun adalah angka satuan B  Digit pada daun adalah angka desimal

25 RINGKASAN 9-ANGKA RINGKASAN 9-ANGKA
DATA A 9.50 6.10 3.70 1.20 0.60 20.60 37.00 43.30 68.20 RINGKASAN 9-ANGKA DATA B 2.10 0.80 0.45 0.20 0.10 2.60 2.75 2.90 3.30 DATA A k E1 D1 K1 Me K3 D7 E15 b 0.0000 0.0625 0.1250 0.2500 0.5000 0.7500 0.8750 0.9375 1.0000 x 0.60 1.20 3.70 6.10 9.50 20.60 37.00 43.30 68.20 y DATA B k E1 D1 K1 Me K3 D7 E15 b 0.0000 0.0625 0.1250 0.2500 0.5000 0.7500 0.8750 0.9375 1.0000 x 0.10 0.20 0.45 0.80 2.10 2.60 2.75 2.90 3.30 y

26 Plot kotak kuantil untuk masing-masing kumpulan data dapat dilihat pada gambar di samping. Pola sebaran data A yang miring ke kanan sebenarnya sudah dapat dilihat dari diagram dahan daun tetapi pola yang melengkung ini ikut memperjelas adanya ketidaksimetrikan

27 Perilaku data B sulit kita deteksi karena berdasarkan gambar di samping orang cenderung menyimpulkan bahwa data tersebut simetrik tetapi pola dalam dahan daun menunjukkan adanya dua puncak


Download ppt "Pertemuan Ke-2 Data Berstruktur Tunggal"

Presentasi serupa


Iklan oleh Google