Pertemuan Ke-2 Data Berstruktur Tunggal

Slides:



Advertisements
Presentasi serupa
DESKRIPSI DATA Pokok bahasan ke-4.
Advertisements

UKURAN NILAI PUSAT UKURAN NILAI PUSAT ADALAH UKURAN YG DAPAT MEWAKILI DATA SECARA KESELURUHAN JENIS UKURAN NILAI PUSAT : MEAN , MEDIAN, MODUS KUARTIL,
Statistika dan Aplikasi Komputer Sesi 2: Ukuran Sentral dan Persebaran
Teori Graf.
Statistika Deskriptif: Distribusi Proporsi
Kuswanto, Uji Normalitas  Untuk keperluan analisis selanjutnya, dalam statistika induktif harus diketahui model distribusinya  Dalam uji.
START.
STAF PENGAJAR FISIKA DEPT. FISIKA, FMIPA, IPB
Wido Hanggoro ` Research and Development Department Indonesia Meteorological Climatological and Geophysical Agency.
Bulan maret 2012, nilai pewarnaan :
PENDUGAAN DAN SELANG KEPERCAYAAN Mennofatria Boer

TENDENSI SENTRAL.
1 Diagram berikut menyatakan jenis ekstrakurikuler di suatu SMK yang diikuti oleh 400 siswa. Persentase siswa yang tidak mengikuti ekstrakurikuler.
di Matematika SMA Kelas XI Sem 1 Program IPS
(UKURAN PEMUSATAN DAN UKURAN PENYEBARAN)
Bab 11A Nonparametrik: Data Frekuensi Bab 11A.
BADAN KOORDINASI KELUARGA BERENCANA NASIONAL DIREKTORAT PELAPORAN DAN STATISTIK DISAJIKAN PADA RADALGRAM JAKARTA, 4 AGUSTUS 2009.
PEMBANDINGAN BERGANDA (Prof. Dr. Kusriningrum)
Bab 11B
Mari Kita Lihat Video Berikut ini.
Statistika Deskriptif
Bab 6B Distribusi Probabilitas Pensampelan
UJI HOMOGENITAS DATA SATU VARIABEL UJI T DAN ANOVA
DISTRIBUSI FREKUENSI By. Raharjo
HITUNG INTEGRAL INTEGRAL TAK TENTU.
STATISTIKA CHATPER 4b (Ukuran Nilai Letak)
STATISTIK - I.
UKURAN PENYEBARAN DATA
Median Lambangnya: Mdn, Me atau Mn
METODE Statistika BAB 1. PENDAHULUAN.
Integrasi Numerik (Bag. 2)
Uji Normalitas.
Ukuran Pemusatan dan Ukuran Penyebaran
DISTRIBUSI FREKUENSI oleh Ratu Ilma Indra Putri. DEFINISI Pengelompokkan data menjadi tabulasi data dengan memakai kelas- kelas data dan dikaitkan dengan.
Pengolahan Citra Digital: Konsep Dasar Representasi Citra
Rabu 23 Maret 2011Matematika Teknik 2 Pu Barisan Barisan Tak Hingga Kekonvergenan barisan tak hingga Sifat – sifat barisan Barisan Monoton.
Soal Latihan.
Eksplorasi Data Membuat dan Mengintepretasi diagram pencar
Nonparametrik: Data Peringkat 2
PERKEMBANGAN KELULUSAN SMP/MTS, SMA/MA DAN SMK KOTA SEMARANG DUA TAHUN TERAKHIR T.P DAN 2013.
Pengujian Hipotesis Parametrik 2
Luas Daerah ( Integral ).
NILAI RATA-RATA (CENTRAL TENDENCY)
UKURAN PEMUSATAN DATA Sub Judul.
Bab 16 Sekor Komposit dan Seleksi Sekor Komposi dan Seleksi
Bulan FEBRUARI 2012, nilai pewarnaan :
AREAL PARKIR PEMERINTAH KABUPATEN JEMBRANA
KINERJA SAMPAI DENGAN BULAN AGUSTUS 2013
DISTRIBUSI NORMAL.
Bab 13A Nonparametrik: Data Peringkat I Bab 13A
Nonparametrik: Data Peringkat 2
PENGUJIAN HIPOTESA Probo Hardini stapro.
Aritmatika Bilangan Biner
Graf.
PENYAJIAN DATA.
Statistika Deskriptif: Statistik Sampel
DISTRIBUSI FREKUENSI.
Statistika Deskriptif: Distribusi Proporsi
Nilai Ujian Statistik 80 orang mahasiswa Fapet UNHAS adalah sebagai berikut:
Teknik Numeris (Numerical Technique)
• Perwakilan BKKBN Provinsi Sulawesi Tengah•
7. RANTAI MARKOV WAKTU KONTINU (Kelahiran&Kematian Murni)
Bab 3B Statistika Deskriptif: Parameter Populasi 2.
UKURAN PEMUSATAN DAN LETAK DATA
Korelasi dan Regresi Ganda
DISTRIBUSI PELUANG Pertemuan ke 5.
Membuat Data Menjadi informasi untuk pengambilan keputusan manajerial
UKURAN PEMUSATAN MK. STATISTIK (MAM 4137) 3 SKS (3-0)
Pemeriksaan Asumsi Sebaran Data
Transcript presentasi:

Pertemuan Ke-2 Data Berstruktur Tunggal

Konsep Mahasiswa memahami: Penataan data: Tabel frekuensi (Diskrit dan Kontinu) Diagram dahan daun Diagram Kotak dan Garis

PEMERIKSAAN POLA - DATA BERSTRUKTUR TUNGGAL - Kumpulan data yang berupa hasil pengukuran terhadap peubah tertentu pada umumnya tidak akan memiliki nilai yang persis sama satu dengan lainnya. Variasi atau keberagaman nilai-nilai pengamatan ini dapat dilihat dari pola sebarannya. Pola sebaran ini sangat berguna pula dalam penentuan karakteristik data tersebut. Penciri numerik yang penting : ukuran pemusatan dan penyebaran data. Pemeriksaan bentuk sebaran dapat dilakukan dengan DIAGRAM DAHAN DAUN (STEM-AND-LEAF PLOT)

DIAGRAM DAHAN DAUN (STEM-AND-LEAF PLOT) Diagram dahan daun disusun baris per baris secara vertikal dan cukup efektif untuk menggambarkan pola sebaran bagi data yang berukuran kecil. Contoh sederhana : DATA : 32 95 11 94 36 91 62 62 74 14 63 58 87 41 10 95 99 75 57 75 DAHAN DAUN 1 140 2 3 26 4 1 5 87 6 223 7 455 8 7 9 54159 Salah satu keuntungan dari diagram ini adalah selain dapat melihat pola sebaran data kita tetap memiliki nilai asli yang akan memudahkan proses mengurutkan data dari nilai yang paling kecil ke nilai terbesar, yang diperlukan dalam analisis data. Kalau kita putar sehingga tersusun secara horisontal maka sebenarnya diagram ini sama dengan diagram titik dan tidak jauh berbeda dengan histogram.

Berikut adalah kumpulan 40 angka yang berasal dari sebaran Normal dengan rata-rata 20 dan ragam 25 16.8 25.7 21.4 22.7 28.1 17.5 14.4 20.9 13.1 15.8 21.7 26.2 18.7 20.2 24.6 24.2 14.6 16.9 14.9 26.7 21.6 15.1 6.9 22.6 12.9 14.1 25.8 17.9 17.7 18.6 20.3 24.4 16.6 20.5 19.7 17.3 18.0 13.7 DAHAN DAUN 5 6 9 7 8 9 10 11 12 9 13 17 14 1469 15 18 16 689 17 33579 18 067 19 7 20 22359 21 467 22 67 23 24 246 25 78 26 27 27 28 1 Berdasarkan hasil di atas kita mengharapkan dapat melihat pola yang simetrik, akan tetapi gambaran dari diagram ini tidak menunjukkan hal tersebut secara jelas. Patokan kesimetrisan lebih sederhana dibandingkan dengan pemeriksaan kenormalan data yang membutuhkan pengertian hitung peluang. Proses selanjutnya : PENYARIAN DATA

HASIL PENYARIAN DATA DIAGRAM DAHAN DAUN YANG DISEDERHANAKAN 0 . t f s 6 * 1 . t 233 f 444455 s 66677777 * 8889 2 . 00000111 t 22 f 44455 s 66 * 8 Gambar di samping memberikan kesan adanya kesimetrikan yang lebih jelas dari gambar pertama Ket : . : 0 dan 1 t : 2 dan 3 (two, three) f : 4 dan 5 (four, five) s : 6 dan 7 (six, seven) * : 8 dan 9 Data yang dipakai merupakan hasil pembulatan ke bawah dari data asli.

RINGKASAN DATA - BOX PLOT - Diagram Kotak Garis (Box Plot)  merupakan hasil penyarian data dari ringkasan 5-angka b = nilai maks Bentuk kotak mencerminkan gambaran dari 50% data yang terletak di bagian tengah sedangkan garis menggambarkan 25% data yang berada di ujung kumpulan data. Q3 = Kuartil 3 Q2 = Median Q1 = Kuartil 1 k = nilai min

Penerapan dari data sebelumnya : DAHAN DAUN FK 5 6 9 1 7 8 9 10 11 12 9 2 13 17 4 14 1469 8 15 18 10 16 689 13 17 33579 18 18 067 21 19 7 22 20 22359 27 21 467 30 22 67 32 23 24 246 35 25 78 37 26 27 39 27 28 1 40 Ringkasan 5 angka : Me = (18.6+18.7)/2 =18.65 b = 28.1 k = 6.9 Q1 = (15.8+16.6)/2 = 16.2 Q3 = (21.7+22.6)/2 = 22.15 30 20 10 28.1 6.9

(atau paling tidak relatif sama) Pola sebaran yang simetrik : Me = (Q1+Q3)/2 = (k+b)/2 (atau paling tidak relatif sama) Note : Misal d = (Q3 - Q1). Kalau data simetrik maka cukup beralasan untuk menganggap bahwa Q3 - Me = Me - Q1 = d/2, sehingga kalau ditetapkan dua buah nilai berupa Q1-3d/2 dan Q3+3d/2 akan menyebabkan nilai selang keduanya memiliki bentuk Me ± 2d. Bentuk ini mengingatkan terhadap selang nilai M ± 1.96 s yang biasa ditemukan kalau berhadapan dengan data yang memiliki sebaran normal. Dari data diperoleh : d = 5.95 ; BB  Q1-3d/2 = 7.28 ; BA  Q3+3d/2 = 31.07 Terdapat satu pengamatan pencilan yaitu 6.9. Sehingga data ini dikeluarkan dari box plot. Shg boxplot dgn identifikasi pencilan menjadi : Ringkasan 3-angka : Me = 18.65 (Q1+Q3)/2 = 19.15 (k+b)/2 = 17.5 10 20 30 28.1 6.9 12.9

Transformasi untuk kesimetrikan data Contoh data: Pulau Nama Luas (km2) Sumatera Kerinci Laut Tawar Maninjau Ranau Singkarak Toba 121.9 55.3 98.0 43.8 110.0 114.6 Kalimantan Belidah Jampang Luar Prian 117.5 225.0 97.5 548.5 Sulawesi Semayang Lindu Lakalona Matana Poso Sidenreng Tempe Towuti 236.3 15.6 31.2 156.3 281.3 46.9 578.1 DIAGRAM DAHAN DAUN : 0 . 13344 * 559 1 . 1112 * 5 2 . 23 * 8 3 . * 4 . 5 . 4 * 7 Ket : . : digit 0, 1, 2, 3, 4 * : digit 5, 6, 7, 8, 9 Data mengalami penyesuaian. Karena kisaran dari 15.6 - 578.1 maka kisaran diperkecil dari 1 - 57

Ringkasan 5-angka Ringkasan 3-angka Me Q1 Q3 (Q1+Q3)/2 k b (k + b)/2 Ringkasan 5 angka  untuk menggambarkan diagram kotak garis Ringkasan 3 angka  untuk memeriksa pola kesimetrikan Ringkasan 5-angka Ringkasan 3-angka 112 46 225 135.5 15 578 296.5 Dari ringkasan 3 angka, ada kenaikan yang cukup mencolok, maka kita ragukan kesimetrikan pola data Pertanyaan : Apakah dengan transformasi data akan didapatkan pola yang lebih simetrik ??? 281.3 200 400 600  

Transformasi akar-dua 10.58 6.78 15.00 10.59 3.87 24.00 13.93 Transformasi log 2.05 1.66 2.35 2.00 1.17 2.76 1.96 5 10 15 20 25 1.1 1.7 2.3 2.9 Gambar di atas masing-masing adalah box plot hasil transformasi akar dua dan logaritma. Transformasi logaritma lebih kuat akibatnya daripada transformasi akar. Akan tetapi karena data ini diukur dalam km2 maka transformasi akar mungkin lebih beralasan untuk dipergunakan karena hasil transformasi ini bisa diartikan pengukur panjang, lebar atau radius. Mencari transformasi yang cocok dalam arti berhasil memperbaiki perilaku data dan memberikan pengertian yang logis membutuhkan pertimbangan yang lebih luas dari sekedar mencari kesimetrikan

BOX PLOT DAN PEMBANDINGAN DATA Salah satu alat pembandingan data adalah boxplot dengan cara menggambarkan boxplot masing-masing kelompok secara berdampingan sehingga perbandingan lokasi pemusatan maupun rentangan penyebaran data antar kelompok dapat dilihat secara sekaligus. Secara visual boxplot dapat menggambarkan lokasi pemusatan, rentang penyebaran dan kemiringan pola sebaran data. Lokasi pemusatan data diwakili median, rentang penyebaran merupakan jarak antar quartil (d=IQR). Posisi median di dalam kotak menunjukkan kemiringan pola sebaran. Letak median yang lebih dekat Q1 mencirikan suatu sebaran dengan kemiringan positif atau memanjang ke arah nilai-nilai yang besar, dan kemiringan negatif terjadi bila posisi median lebih dekat ke Q3. Panjangnya garis yang menjulur ke luar dari kotak menjadi petunjuk adanya data yang agak jauh dari kumpulannya dan hal ini tidak selalu berarti pola sebaran tersebut miring. Selama posisi median terhadap Q1 maupun Q3 relatif seimbang, garis yang terlalu panjang hanya menunjukkan bahwa sebaran data itu memiliki ekor atau kemenjuluran yang lebih panjang dari semestinya.

Contoh : Laju pertumbuhan penduduk per tahun menurut kabupaten di propinsi Jawa Barat dan Jawa Tengah Diagram dahan daun Jawa Barat Dahan Daun 1 2 3 4 5 . * 244 89 011233334 555678 Jawa Tengah Dahan Daun 1 2 3 4 5 . * 568 00122233344 56677788889 0000134 6 JAWA BARAT 2.30 2.05 2.65 2.35 1.21 4.52 2.86 JAWA TENGAH 1.60 1.20 1.95 1.57 0.46 5.21 2.83

1 2 3 4 5 6 JABAR JATENG   3.31 2.67 Kehomogenan rentangan penyebaran dari beberapa kelompok data akan menyederhanakan proses pembandingan, karena pusat perhatian ada pada lokasi pemusatan saja dalam hal ini perbandingan median antar kelompok data tersebut. Sebelum dilakukan transformasi untuk kehomogenan rentang penyebaran terlebih dahulu memperbaiki data untuk mengeluarkan pencilan Kesimpulan : Ada 25% dari kabupaten di Jateng yang memiliki laju pertumbuhan lebih kecil dari kabupaten Ciamis (nilai terkecil untuk Jabar). Demikian pula dapat dilihat bahwa Q3 Jateng lebih kecil dari Q1 Jabar. Daerah yang memencil mungkin disebabkan adanya pusat-pusat pertumbuhan. seperti DKI Jakarta dan wilayah Jabodetabek

PEMERIKSAAN ASUMSI SEBARAN DATA Pola sebaran teoritis untuk data (Binom, Normal, Eksponensial, Poisson) memegang peranan penting dalam analisis data terutama menyangkut tahap pendugaan parameter, pengujian hipotesis dan penetapan taraf kepercayaan atau taraf nyata atas kesimpulan yang akan diambil. Dari populasi Normal  karakteristik utama adalah nilai rata-rata dan ragam. Pemilihan jenis penduga mana yang dianggap lebih baik sangat dipengaruhi oleh perilaku data dan kriteria yang dipilih. Untuk pengujian hipotesis bagi data yang berasal dari pola sebaran Normal, penduga kuadrat terkecil memiliki keunggulan teoritis dan relatif mudah diterapkan karena teknik analisis telah berkembang lanjut.

Hasil analisis data yang didasarkan pada asumsi sebaran tertentu menjadi tidak sah apabila ternyata asumsi tersebut sampai batas-batas tertentu tidak dapat dipenuhi. Memeriksa kebenaran asumsi pola sebaran data  Apakah betul-betul mengikuti pola sebaran normal, dapat didekati dengan sebaran normal atau apakah dapat diubah menjadi berpola normal? Penyimpangan dari asumsi pola sebaran teoritis tidak selalu mempunyai dampak besar terhadap hasil analisis data, kadang-kadang pengaruhnya kecil saja sehingga dapat diabaikan.

PEMERIKSAAN DENGAN DIAGRAM KOTAK GARIS YANG DIPERLUAS Pemeriksaan kesesuaian pola sebaran data pada umumnya kita lakukan terhadap data yang telah diurutkan menurut besarnya Ringkasan 5 angka dapat diperluas lagi menjadi ringkasan 7 angka (dengan menambahkan dua angka “perdelapan”). Atau menjadi ringkasan 9 angka (dengan menambahkan dua buah angka “perenambelas”) urutan “perdelapan” = ([urutan Kuartil]+1)/2 urutan “perenambelas” = ([urutan “perdelapan”]+1)/2

RINGKASAN 9-ANGKA Contoh Data : (dibangkitkan dari sebaran normal dengan nilai tengah 20 dan ragam 25) Me K1 D1 E1 k K3 D7 E15 b Merupakan perluasan dari tabel ringkasan 5 - angka 16.8 25.7 21.4 22.7 28.1 17.5 14.4 20.9 13.1 15.8 21.7 26.2 18.7 20.2 24.6 24.2 14.6 16.9 14.9 26.7 21.6 15.1 6.9 22.6 12.9 14.1 25.8 17.9 17.7 18.6 20.3 24.4 16.6 20.5 19.7 17.3 18.0 13.7

DAHAN DAUN FK 5 6 9 1 7 8 9 10 11 12 9 2 13 17 4 14 1469 8 15 18 10 16 689 13 17 33579 18 18 067 21 19 7 22 20 22359 27 21 467 30 22 67 32 23 24 246 35 25 78 37 26 27 39 27 28 1 40 RINGKASAN 9-ANGKA YANG DIHASILKAN 18.65 16.20 14.25 13.10 6.90 22.10 25.15 26.20 28.10 Dengan menggantikan lambang-lambang angka ringkasan dengan persentase atau fraksi banyaknya data yang lebih kecil daripada lambang-lambang tersebut didapatkan : 0.5000 0.2500 0.1250 0.0625 0.000 0.7500 0.8750 0.9375 1.0000

Sehingga setiap lambang kini akan memiliki sepasang nilai yaitu fraksi dan besarannya disajikan di bawah ini: Dengan mengambil nilai fraksi sebagai x dan besarannya sebai y maka kesembilan lambang tersebut dapat digambarkan menjadi 9 buah titik dalam plot x dan y seperti gambar berikut: k E1 D1 K1 Me K3 D7 E15 b 0.0000 0.0625 0.1250 0.2500 0.5000 0.7500 0.8750 0.9375 1.0000 x 6.90 13.10 14.25 16.20 18.65 22.10 25.15 26.20 28.10 y

“Quantile Box Plot”/plot kotak kuantil merupakan cara sederhana tetapi kasar untuk memeriksa pola sebaran data secara nonparametrik Kumpulan data dengan pola simetrik akan memperlihatkan kecenderungan potongan-potongan garis yang membentuk garis lurus Adanya potongan garis yang menaik secara tajam di luar kotak E menunjukkan kemungkinan pencilan, sedangkan kenaikan yang tajam di dalam kotak K dapat memberikan petunjuk bahwa data tersebut mungkin berasal dari dua buah populasi yang berbeda. Data yang tidak berpola simetrik akan terlihat dari kecenderungan potongan-potongan garis tersebut membentuk kurva melengkung.

SOAL : DATA A DATA B 42.2 4.0 7.4 15.4 0.6 3.6 31.2 67.2 10.6 6.4 7.6 14.6 31.8 21.4 5.8 4.8 8.6 7.0 7.8 8.8 43.0 10.8 18.4 19.8 1.2 43.4 29.8 2.6 3.8 17.8 68.2 0.4 0.1 1.3 2.0 1.5 1.4 2.6 0.5 2.9 0.8 3.3 2.5 2.3 0.9 3.1 0.7 0.6 2.7 2.4 2.8 0.2 2.2 1.6

DATA A DATA B f DAHAN DAUN 9 . 001233444 20 * 56777777888 1 000044 14 . 001233444 20 * 56777777888 1 000044 14 5789 10 2 8 3 111 5 4 233 6 78 DATA B f DAHAN DAUN 5 . 11244 12 * 5678889 14 1 34 17 556 (9) 2 000223334 555666677899 3 13 A  Digit pada daun adalah angka satuan B  Digit pada daun adalah angka desimal

RINGKASAN 9-ANGKA RINGKASAN 9-ANGKA DATA A 9.50 6.10 3.70 1.20 0.60 20.60 37.00 43.30 68.20 RINGKASAN 9-ANGKA DATA B 2.10 0.80 0.45 0.20 0.10 2.60 2.75 2.90 3.30 DATA A k E1 D1 K1 Me K3 D7 E15 b 0.0000 0.0625 0.1250 0.2500 0.5000 0.7500 0.8750 0.9375 1.0000 x 0.60 1.20 3.70 6.10 9.50 20.60 37.00 43.30 68.20 y DATA B k E1 D1 K1 Me K3 D7 E15 b 0.0000 0.0625 0.1250 0.2500 0.5000 0.7500 0.8750 0.9375 1.0000 x 0.10 0.20 0.45 0.80 2.10 2.60 2.75 2.90 3.30 y

Plot kotak kuantil untuk masing-masing kumpulan data dapat dilihat pada gambar di samping. Pola sebaran data A yang miring ke kanan sebenarnya sudah dapat dilihat dari diagram dahan daun tetapi pola yang melengkung ini ikut memperjelas adanya ketidaksimetrikan

Perilaku data B sulit kita deteksi karena berdasarkan gambar di samping orang cenderung menyimpulkan bahwa data tersebut simetrik tetapi pola dalam dahan daun menunjukkan adanya dua puncak