Pemeriksaan Asumsi Sebaran Data

Slides:



Advertisements
Presentasi serupa
ANALISIS REGRESI (REGRESSION ANALYSIS)
Advertisements

Diagram Kotak-titik (box-plot)
UJI HIPOTESIS Dalam kegiatan penelitian, setelah hipotesis di rumuskan, maka keterlibatan statistik adalah sebagai alat untuk menganalisis data guna.
BAB VI UKURAN VARIASI ATAU DISPERSI (Pengukuran Dispersi) (Pertemuan ke-8) Oleh: Andri Wijaya, S.Pd., S.Psi., M.T.I. Program Studi Sistem Informasi Sekolah.
Pendugaan Parameter Pendugaan Titik dan Pendugaan Selang
ANALISIS REGRESI Pertemuan ke 12.
Metode Statistika (STK211)
Pengujian asumsi dalam ANOVA dan Transformasi Data

PENARIKAN SAMPEL & PENDUGAAN PARAMETER
Karakteristik Butir Model Logistik
DISTRIBUSI FREQUENSI Definisi: Susunan data menurut besarnya atau menurut katagorinya MEMBUAT TABEL DISTRIBUSI FREQUENSI Contoh: Terdapat data berat badan.
BAB 15 ANALISIS REGRESI DAN KORELASI LINIER
1 6 Statistika Deskriptif. © John Wiley & Sons, Inc. Applied Statistics and Probability for Engineers, by Montgomery and Runger. Ringkasan Numerik dari.
1. Statistika dan Statistik
Distribusi Frekuensi Pokok Bahasan ke-3.
Pendugaan Parameter.
D0124 Statistika Industri Pertemuan 15 dan 16
Distribusi Probabilitas Normal
VIII. UJI HIPOTESIS Pernyataan Salah Benar Ada 2 Hipotesis
METODE STATISTIKA (STK211)
BAB 15 ANALISIS REGRESI DAN KORELASI LINIER
TENDENSI SENTRAL.
Dosen pengasuh: Moraida hasanah, S.Si.,M.Si
Ukuran Kemiringan (Skewness) dan Ukuran Keruncingan (Kurtosis)
PENGOLAHAN DATA DAN PENYAJIAN DATA
Probabilitas dan Statistik
D0124 Statistika Industri Pertemuan 3 dan 4
Pertemuan III: Penyajian Data (jilid 2)
METODE STATISTIKA (STK211)
Pengujian Korelasi Diri Pertemuan 16
STATISTIKA INFERENSI : UJI HIPOTESIS (SAMPEL TUNGGAL)
BIOSTATISTIK DESKRIPTIF
UKURAN NILAI SENTRAL&UKURAN PENYEBARAN
UKURAN VARIASI ATAU DISPERSI (Pengukuran Dispersi)
MODUL IV ESTIMASI/PENDUGAAN (3) A. ESTIMASI RAGAM
UKURAN NILAI SENTRAL&UKURAN PENYEBARAN
STATISTIKA INFERENSI : UJI HIPOTESIS (SAMPEL TUNGGAL)
TEORI PENARIKAN CONTOH DAN SEBAGAINYA
PENDUGAAN SELANG RAGAM DAN PROPORSI
PROBABILITAS dan DISTRIBUSI
Regresi Linier Sederhana
BAB 9 PENGUJIAN HIPOTESIS
BAB 3 PENARIKAN SAMPEL DAN PENDUGAAN
Penerapan selain sebaran Normal
Regresi Linier Sederhana dan Korelasi
Pertemuan 21 Pemeriksaan penyimpangan regresi
UKURAN NILAI SENTRAL&UKURAN PENYEBARAN
UKURAN PEMUSATAN DATA BERKELOMPOK
DISTRIBUSI NORMAL Data merupakan data kontinu (interval atau rasio)
STATISTIKA LINGKUNGAN
? 1. Konsep Statistika STATISTIKA : Kegiatan untuk : mengumpulkan data
Contoh soal Jangkauan (data belum dikelompokkan):
Apa itu Statistik? Apa Peranan statistik?.
OLEH : RESPATI WULANDARI, M.KES
BAB IV PENGUJIAN HIPOTESIS
PENCARIAN DISTRIBUSI.
STATISTIKA Pertemuan 3: Ukuran Pemusatan dan Penyebaran
DISTRIBUSI FREQUENSI Definisi: Susunan data menurut besarnya atau menurut katagorinya MEMBUAT TABEL DISTRIBUSI FREQUENSI Contoh: Terdapat data berat badan.
Pengujian asumsi dalam ANOVA dan Transformasi Data
RINGKASAN NUMERIK Untuk setiap angkatan data mempunyai pola tertentu dan menggambarkannya diperlukan seluruh titik data Menggunakan seluruh titik data.
DISTRIBUSI NORMAL DAN CARA PENGGUNAANNYA
ANALISIS REGRESI & KORELASI
C. Ukuran Penyebaran Data
Peta Konsep. Peta Konsep C. Ukuran Penyebaran Data.
BAB VII UKURAN UKURAN KEMIRINGAN & KERUNCINGAN
STATISTIKA 2 3. Pendugaan Parameter I OLEH: RISKAYANTO
4. Pendugaan Parameter II
DESKRIPSI DATA Pertemuan 3.
Contoh soal Jangkauan (data belum dikelompokkan):
Transcript presentasi:

Pemeriksaan Asumsi Sebaran Data

Do you remember this picture?

PEMERIKSAAN ASUMSI SEBARAN DATA Pola sebaran teoritis untuk data (Binom, Normal, Eksponensial, Poisson) memegang peranan penting dalam analisis data terutama menyangkut tahap pendugaan parameter, pengujian hipotesis dan penetapan taraf kepercayaan atau taraf nyata atas kesimpulan yang akan diambil. Dari populasi Normal  karakteristik utama adalah nilai rata-rata dan ragam. Pemilihan jenis penduga mana yang dianggap lebih baik sangat dipengaruhi oleh perilaku data dan kriteria yang dipilih. Untuk pengujian hipotesis bagi data yang berasal dari pola sebaran Normal, penduga kuadrat terkecil memiliki keunggulan teoritis dan relatif mudah diterapkan karena teknik analisis telah berkembang lanjut.

Hasil analisis data yang didasarkan pada asumsi sebaran tertentu menjadi tidak sah apabila ternyata asumsi tersebut sampai batas-batas tertentu tidak dapat dipenuhi. Memeriksa kebenaran asumsi pola sebaran data  Apakah betul-betul mengikuti pola sebaran normal, dapat didekati dengan sebaran normal atau apakah dapat diubah menjadi berpola normal? Penyimpangan dari asumsi pola sebaran teoritis tidak selalu mempunyai dampak besar terhadap hasil analisis data, kadang-kadang pengaruhnya kecil saja sehingga dapat diabaikan.

PEMERIKSAAN DENGAN DIAGRAM KOTAK GARIS YANG DIPERLUAS Pemeriksaan kesesuaian pola sebaran data pada umumnya kita lakukan terhadap data yang telah diurutkan menurut besarnya Ringkasan 5 angka dapat diperluas lagi menjadi ringkasan 7 angka (dengan menambahkan dua angka “perdelapan”). Atau menjadi ringkasan 9 angka (dengan menambahkan dua buah angka “perenambelas”) urutan “perdelapan” = ([urutan Kuartil]+1)/2 urutan “perenambelas” = ([urutan “perdelapan”]+1)/2

RINGKASAN 9-ANGKA Contoh Data : (dibangkitkan dari sebaran normal dengan nilai tengah 20 dan ragam 25) Me K1 D1 E1 k K3 D7 E15 b Merupakan perluasan dari tabel ringkasan 5 - angka 16.8 25.7 21.4 22.7 28.1 17.5 14.4 20.9 13.1 15.8 21.7 26.2 18.7 20.2 24.6 24.2 14.6 16.9 14.9 26.7 21.6 15.1 6.9 22.6 12.9 14.1 25.8 17.9 17.7 18.6 20.3 24.4 16.6 20.5 19.7 17.3 18.0 13.7

DAHAN DAUN FK 5 6 9 1 7 8 9 10 11 12 9 2 13 17 4 14 1469 8 15 18 10 16 689 13 17 33579 18 18 067 21 19 7 22 20 22359 27 21 467 30 22 67 32 23 24 246 35 25 78 37 26 27 39 27 28 1 40 RINGKASAN 9-ANGKA YANG DIHASILKAN 18.65 16.20 14.25 13.10 6.90 22.10 25.15 26.20 28.10 Dengan menggantikan lambang-lambang angka ringkasan dengan persentase atau fraksi banyaknya data yang lebih kecil daripada lambang-lambang tersebut didapatkan : 0.5000 0.2500 0.1250 0.0625 0.000 0.7500 0.8750 0.9375 1.0000

Sehingga setiap lambang kini akan memiliki sepasang nilai yaitu fraksi dan besarannya disajikan di bawah ini: Dengan mengambil nilai fraksi sebagai x dan besarannya sebai y maka kesembilan lambang tersebut dapat digambarkan menjadi 9 buah titik dalam plot x dan y seperti gambar berikut: k E1 D1 K1 Me K3 D7 E15 b 0.0000 0.0625 0.1250 0.2500 0.5000 0.7500 0.8750 0.9375 1.0000 x 6.90 13.10 14.25 16.20 18.65 22.10 25.15 26.20 28.10 y

“Quantile Box Plot”/plot kotak kuantil merupakan cara sederhana tetapi kasar untuk memeriksa pola sebaran data secara nonparametrik Kumpulan data dengan pola simetrik akan memperlihatkan kecenderungan potongan-potongan garis yang membentuk garis lurus Adanya potongan garis yang menaik secara tajam di luar kotak E menunjukkan kemungkinan pencilan, sedangkan kenaikan yang tajam di dalam kotak K dapat memberikan petunjuk bahwa data tersebut mungkin berasal dari dua buah populasi yang berbeda. Data yang tidak berpola simetrik akan terlihat dari kecenderungan potongan-potongan garis tersebut membentuk kurva melengkung.

SOAL : DATA A DATA B 42.2 4.0 7.4 15.4 0.6 3.6 31.2 67.2 10.6 6.4 7.6 14.6 31.8 21.4 5.8 4.8 8.6 7.0 7.8 8.8 43.0 10.8 18.4 19.8 1.2 43.4 29.8 2.6 3.8 17.8 68.2 0.4 0.1 1.3 2.0 1.5 1.4 2.6 0.5 2.9 0.8 3.3 2.5 2.3 0.9 3.1 0.7 0.6 2.7 2.4 2.8 0.2 2.2 1.6

DATA A DATA B f DAHAN DAUN 9 . 001233444 20 * 56777777888 1 000044 14 . 001233444 20 * 56777777888 1 000044 14 5789 10 2 8 3 111 5 4 233 6 78 DATA B f DAHAN DAUN 5 . 11244 12 * 5678889 14 1 34 17 556 (9) 2 000223334 555666677899 3 13 A  Digit pada daun adalah angka satuan B  Digit pada daun adalah angka desimal

RINGKASAN 9-ANGKA RINGKASAN 9-ANGKA DATA A 9.50 6.10 3.70 1.20 0.60 20.60 37.00 43.30 68.20 RINGKASAN 9-ANGKA DATA B 2.10 0.80 0.45 0.20 0.10 2.60 2.75 2.90 3.30 DATA A k E1 D1 K1 Me K3 D7 E15 b 0.0000 0.0625 0.1250 0.2500 0.5000 0.7500 0.8750 0.9375 1.0000 x 0.60 1.20 3.70 6.10 9.50 20.60 37.00 43.30 68.20 y DATA B k E1 D1 K1 Me K3 D7 E15 b 0.0000 0.0625 0.1250 0.2500 0.5000 0.7500 0.8750 0.9375 1.0000 x 0.10 0.20 0.45 0.80 2.10 2.60 2.75 2.90 3.30 y

Plot kotak kuantil untuk masing-masing kumpulan data dapat dilihat pada gambar di samping. Pola sebaran data A yang miring ke kanan sebenarnya sudah dapat dilihat dari diagram dahan daun tetapi pola yang melengkung ini ikut memperjelas adanya ketidaksimetrikan

Perilaku data B sulit kita deteksi karena berdasarkan gambar di samping orang cenderung menyimpulkan bahwa data tersebut simetrik tetapi pola dalam dahan daun menunjukkan adanya dua puncak

PLOT KUANTIL-KUANTIL Istilah kuantil = istilah persentil Misal : jika ditetapkan nilai kuantil 0.67 untuk suatu kumpulan data, maka hal ini berarti ada 0.67 bagian data yang nilainya lebih kecil dari nilai kuantil dan 0.33 bagian lainnya memiliki nilai yang lebih tinggi. Nilai kuantil ini dilambangkan dengan Q (0.67) Penetapan nilai kuantil dapat dilakukan jika data yang kita miliki telah diurutkan dari kecil-besar. Untuk suatu kumpulan data yi, i = 1, …, n setelah diurutkan akan menghasilkan kumpulan baru yaitu y(i) dengan penunjuk (i) adalah nomor urut besarnya data tersebut dan setiap y(i) adalah nilai kuantil i/n Dalam praktek kita definisikan kuantil sebagai berikut: Q (pi) = y(i) untuk i = 1, …, n pi = (i-0.5)/n

Alasan pemilihan pi = (i-0.5)/n Seandainya n = 10 dan digunakan i/n maka Q (0.25) akan berada di antara urutan ke-2 dan ke-3 yang menyebabkan tidak ada satu nilai pengamatan pun yang dapat membagi data tersebut menjadi dua yaitu 0.25 bagian di bawah dan 0.75 bagian atasnya Kalau kita menggunakan (i-0.5)/n maka Q(0.25) = y(3) dianggap setengahnya berada di bagian bawah dan setengahnya lagi di bagian atas sehingga tercapai pembagian 0.25 dan 0.75 ingat bahwa Q (0.25) tidak lain adalah kuartil 1

Plot kuantil adalah plot antara nilai y(i) dengan fraksi pi Plot kuantil adalah plot antara nilai y(i) dengan fraksi pi. Plot ini lebih terperinci dibandingkan dengan plot kotak kuantil karena semua pengamatan ditampilkan dalam plot. Tujuan : Memeriksa kesesuaian pola sebaran data terhadap pola sebaran teoritik  membandingkan antara kuantil yang didasarkan pada data (kuantil empirik) dengan kuantil dari sebaran tertentu (kuantil teoritik) melalui plot kuantil-kuantil atau plot Q-Q.

Fungsi peluang sebaran normal: Pola sebaran teoritik yang banyak melandasi analisis data adalah Sebaran Normal Fungsi peluang sebaran normal: f 0.2 0.4 0.6 0.8 x -2 -1 4 6 1 -1- --  2 -- Bentuk Sebaran Normal dicirikan oleh dua paramater: rata-rata () dan ragam (2)

BENTUK SEBARAN NORMAL BAKU YANG MEMILIKI --  -- -3 -2 -1 1 2 3 f x 0.3413 0.1360 0.0213 BENTUK SEBARAN NORMAL BAKU YANG MEMILIKI  = 0 DAN =1 Catatan : titik -1 dan +1  titik belok luas daerah antara titik belok = 2 (0.3413) = 0.6826

F {Q (pi) }= pi dan Q (pi) = F-1 (pi) Fungsi F(z) dikenal sebagai fungsi sebaran Normal Kumulatif. Hubungan dengan Kuantil dapat dilihat di bawah ini : Q (0.0014) = -3 Q (0.0227) = -2 Q (0.9773) = 2 Q (0.9986) = 3 Sehingga secara umum dapat dirumuskan bahwa : F {Q (pi) }= pi dan Q (pi) = F-1 (pi) di mana F-1 adalah kebalikan fungsi F dan pi = (i-0.5)/n, pi dalam fungsi sebaran kumulatif berarti peluang. untuk menghitung luas daerah di bawah kurva normal baku melalui tabel.

Prosedur pemeriksaan kenormalan data dengan menggunakan plot Q-Q Buat statistik peringkat y(1), …, y(i), …, y(n) dengan y(1) statistik peringkat pertama (minimum) y(i) statistik peringkat ke-i y(n) statistik peringkat ke-n (maksimum) Untuk setiap y(i) ditetapkan nilai pi = (i-0.5)/n. Plot antara y(i) dengan pi adalah plot kuantil empirik. Untuk setiap pi, kita tetapkan F-1(pi) = Q (pi) dengan bantuan tabel sebaran normal baku. Nilai Q (pi) adalah kuantil Normal Baku. Plot antara Q (pi) dan pi adalah plot kuantil teoritik Selanjutnya buat plot antara y(i) dengan Q (pi) yang merupakan plot kuantil-kuantil

Contoh data : 3.97 4.68 5.08 5.14 4.76 4.12 5.47 5.04 6.02 6.21 4.42 5.44 4.15 5.49 5.67 3.79 5.13 3.80 5.89 4.22 Urutan y(i) pi = (i-0.5)/n Q (pi) 1 3.79 0.025 -1.960 2 3.80 0.075 -1.440 3 3.97 0.125 -1.150 4 4.12 0.175 -0.935 5 4.15 0.225 -0.755 6 4.22 0.275 -0.598 7 4.42 0.325 -0.454 8 4.68 0.375 -0.319 9 4.76 0.425 -0.189 10 5.04 0.475 -0.063 11 5.08 0.525 0.063 12 5.13 0.575 0.189 13 5.14 0.625 0.319 14 5.44 0.675 0.454 15 5.47 0.725 0.598 16 5.49 0.775 0.755 17 5.67 0.825 0.935 18 5.89 0.875 1.150 19 6.02 0.925 1.440 20 6.21 0.975 1.960

Pola pencaran titik-titik dalam plot membentuk garis lurus menjadi petunjuk bahwa sebaran data dapat didekati oleh pola sebaran normal

Pola pencaran titik-titik dalam plot cenderung tidak membentuk garis lurus karena titik-titik sebelah kiri maupun kanan cenderung menjauh dari pola garis lurus

Pola pencaran titik-titik dalam plot cenderung tidak membentuk garis lurus karena titik-titik sebelah kiri maupun kanan cenderung menjauh dari pola garis lurus dan membentuk pola sigmoid

Merupakan plot antara kuantil kuantil empirik dengan teoritik yang merupakan plot antara nilai-nilai pada sumbu Y kedua kuantil tersebut

Jika sebaran teoritik dapat merupakan pendekatan untuk pola sebaran data yang kita miliki, maka kuantil empirik tersebut akan memiliki kemiripan dengan kuantil yang didasarkan pada sebaran tertentu dan titik-titik dalam plot akan berkisar di seputar garis y = x. Garis ini menjadi patokan dalam memeriksa kesesuaian pola sebaran data apabila data tersebut telah dibakukan sebelumnya. Seandainya data belum dibakukan maka garis patokan adalah y =  + x atau y(i) =  +  Q(pi)

Catatan: Meskipun sebenarnya sebaran data dapat didekati oleh pola sebaran teoritik tertentu, namun keragaman yang terkandung dalam data akan menyebabkan adanya penyimpangan dari pola garis lurus. Setiap plot kuantil-kuantil hanya memeriksa pola sebaran dari satu peubah saja, sedangkan pola hubungan yang terjadi antara satu peubah dengan peubah lain tidak terdeteksi dalam plot ini. Plot Q-Q ini umumnya digunakan dalam memeriksa pola dari sisaan setelah dilakukan analisis data.