UJI KENORMALAN KOLMOGOROV-SMIRNOV TEST DAN SHAPIRO WILKS Oleh: Ayub Qolbani 07/11.6576 2-I
KOLMOGOROV-SMIRNOV Diperkenalkan ahli Matematik asal Rusia: A. N. Kolmogorov (1933) and Smirnov (1939) Digunakan untuk ukuran sampel yang lebih kecil dan data bersifat kontinu Intinya dalam pengujian ini, kita melihat dua fungsi distribusi kumulatif, yaitu hipotesis fungsi distribusi kumulatif ( ๐น ๐(๐ฅ) ) dan fungsi distribusi kumulatif sampel (๐ (๐ฅ) )
Tujuan: jika perbedaan kedua fungsi kumulatif tersebut kecil, maka hipotesa bisa diterima (Terima H0) Asumsi dalam pengujian ini: Data terdiri dari observasi yang saling bebas X1, X2, X3,.......,Xn, yang berasal dari distribusi ๐น ๐ฅ yang tidak diketahui
TAHAPAN PENGUJIAN 1. Dua sisi H0: F(x) = Fo(x) H1: F(x) = F(x) โ Fo(x) Satu sisi H0: F(x)โฅ Fo(x) ; H1: F(x) < Fo(x) atau H0: F(x)โค Fo(x) ; H1: F(x) > Fo(x) 2. Nilai statistik; n; ฮฑ
3. Uji Statistik Misal S(x) fungsi distribusi dari sampel: S(x)=proporsi dari observasi sampel yang lebih kecil atau sama dengan x = ๐๐ข๐๐๐โ ๐ ๐๐๐๐๐ โค ๐ฅ ๐ Wilayah kritis: D = maks |S(x)-F(ox)| D : nilai tertinggi dari perbedaan antara S(x) dan F(ox) 4. Penghitungan nilai statistik (observasi)
5. Keputusan : Tolak H0 jika D observasi >(1-ฮฑ) yang ditunjukkan pada tabel Kolmogorov-Smirnov Terima H0 jika D observasi โค (1-ฮฑ) 6. Kesimpulan: Menyesuaikan dengan pertanyaan
Contoh kasus Sebuah riset yang dilakukan oleh ilmuwan di Hamburg, Jerman melaporkan berat dari 36 ginjal kelinci sebelum mereka melakukan eksperimen. Ujilah apakah sampel berasal dari distribusi normal dengan rata-rata 85 gram dan standar deviasi 15 gram (ฮฑ=5%) Data: 58 78 84 90 97 70 90 86 82 59 90 70 74 83 90 76 88 84 68 98 70 94 70 110 67 68 75 80 68 82 104 84 98 80 92 112
Penyelesaian 1. H0 : distribusi sampel mengikuti distribusi normal H1 : distribusi sampel tidak mengikuti distribusi normal 2. ฮฑ=0.05 ; ฮผ=85 ; ฯ=15 3. Uji Statistik D=max |S(x)-F(ox)| Wilayah kritis D>0.224 (berdasarkan tabel)
4. Statistik Hitung Menghitung S(x) f(x) S(x) 58 1 1/36=0.0278 84 3 22/36=0.6111 59 2/36=0.0556 86 23/36=0.6389 67 3/36=0.0833 88 24/36=0.6667 68 6/36=0.1667 90 4 28/36=0.7778 70 10/36=0.2778 92 29/36=0.8056 74 11/30=0.3056 93 30/36=0.8333 75 12/36=0.3333 94 31/36=0.8611 76 13/36=0.3611 97 32/36=0.8889 78 14/36=0.3889 98 33/36=0.9167 80 2 16/36=0.4444 104 34/36=0.9444 82 18/36=0.5000 110 35/36=0.9722 83 19/36=0.5278 112 36/36=1.0000
Menghitung Fo(x) x Z=(x-85)/15 Fo(x) 58 -1,8 0.0359 84 -0,06667 0.4721 -1,73333 0.0418 86 0,066667 0.5279 67 -1,2 0.1151 88 0,2 0.5793 68 -1,13333 0.1292 90 0,333333 0.6293 70 -1 0.1587 92 0,466667 0.6808 74 -0,73333 0.2327 93 0,533333 0.7019 75 -0,66667 0.2514 94 0,6 0.7257 76 -0,6 0.2743 97 0,8 0.7881 78 -0,46667 0.3912 98 0,866667 0.8078 80 -0,33333 0.3707 104 1,266667 0.8980 82 -0,2 0.4207 110 1,666667 0.9525 83 -0,13333 0.4483 112 1,8 0.9641
Menghitung |S(x)-Fo(x)| 58 0,0081 84 0,1390 59 0,0138 86 0,1110 67 0,0318 88 0,0874 68 0,0375 90 0,1485 70 0,1191 92 0,1248 74 0,0729 93 0,1314 75 0,0819 94 0,1354 76 0,0868 97 0,1008 78 0,0023 98 0,1089 80 0,0737 104 0,0464 82 0,0793 110 0,0197 83 0,0795 112 0,0359
D= max |S(x)-Fo(x)| = 0. 1485 5. Keputusan : Terima H0 karena D < 0 D= max |S(x)-Fo(x)| = 0.1485 5. Keputusan : Terima H0 karena D < 0.224 6. Kesimpulan: Dengan tingkat kepercayaan 95%, dapat disimpulkan bahwa data berat ginjal kelinci berasal dari distribusi normal dengan ฮผ=85 gram dan ฯ=15 gram
UJI SHAPIRO WILKS Metode Shapiro Wilk menggunakan data dasar yang belum diolah dalam tabel distribusi frekuensi. Data diurut, kemudian dibagi dalam dua kelompok untuk dikonversi dalam Shapiro Wilk. Dapat juga dilanjutkan transformasi dalam nilai Z untuk dapat dihitung luasan kurva normal. Persyaratan Data berskala interval atau ratio (kuantitatif) Data tunggal / belum dikelompokkan pada tabel distribusi frekuensi Data dari sampel random
Signifikansi Signifikansi dibandingkan dengan tabel Shapiro Wilk Signifikansi Signifikansi dibandingkan dengan tabel Shapiro Wilk. Signifikansi uji nilai T3 dibandingkan dengan nilai tabel Shapiro Wilk, untuk dilihat posisi nilai probabilitasnya (p). Jika nilai p lebih dari 5%, maka Ho diterima. Jika nilai p kurang dari 5%, maka Ho ditolak. Jika digunakan rumus G, maka digunakan tabel distribusi normal.
CONTOH KASUS Untuk menyukseskan program BLT dan Raskin di Kecamatan Sukamaju, diadakan survei untuk mengetahui jumlah Rumah Tangga Miskin di daerah tersebut. Diperoleh data jumlah RT miskin per desa sebagai berikut: 18, 30, 14, 20, 9, 26, 18, 34, 13, 16, 33, 26, 42, 11, 20, 32, 16, 15, 18, 25, 40, 32, 30, 27 Selidikilah data Rumah Tangga Miskin tersebut, apakah data tersebut diambil dari populasi yang berdistribusi normal pada ฮฑ = 5% ?
PENYELESAIAN 1. Ho : data berasal dari distribusi normal H1 : data tidak berasal dari populasi normal 2. ฮฑ = 0,05 3. Statistik Uji
4. Statistik Hitung No xi xi-x bar (๐๐โ๐ ๐๐๐) ๐ 1 9 -14,5416 211,4581306 13 25 1,4584 2,12693056 2 11 -12,5416 157,2917306 14 26 2,4584 6,04373056 3 -10,5416 111,1253306 15 4 -9,5416 91,04213056 16 27 3,4584 11,96053056 5 -8,5416 72,95893056 17 30 6,4584 41,71093056 6 -7,5416 56,87573056 18 7 19 32 8,4584 71,54453056 8 -5,5416 30,70933056 20 21 33 9,4584 89,46133056 10 22 34 10,4584 109,3781306 -3,5416 12,54293056 23 40 16,4584 270,8789306 12 24 42 18,4584 340,7125306 Rata-rata statistik = 23,54167 1937,958333
Lanjutan i ai X(n-i+1)-Xi ai[X(n-i+1)-Xi] 1 0,4493 42-9 = 33 14,8269 2 0,3098 40-11=29 8,9842 3 0,2554 34-13=21 5,3634 4 0,2145 33-14=19 4,0755 5 0,1807 32-15=17 3,0719 6 0,1512 32-16=16 2,4192 7 0,1245 30-16=14 1,7430 8 0,0997 30-18=12 1,1964 9 0,0764 27-18=9 0,6876 10 0,0539 26-18=8 0,4851 11 0,0321 26-20=6 0,1926 12 0,0107 25-20=5 0,0535 JUMLAH 43,0993
= 0.9585 Nilai T tabel ฮฑ (0.05; 24)= 0.916 Wilayah kritis T3 obs > T tabel 5. Keputusan: Terima H0 karena T3 obs>T tabel (Shapiro Wilks) 6. Kesimpulan: Dengan tingkat kepercayaan 95%, dapat disimpulkan bahwa data jumlah rumah tangga miskin di Kecamatan Sukamaju berdistribusi normal.
ย ย
Tabel koefisien Shapiro Wilk
SEKIAN DAN TERIMA KASIH