JENIS-JENIS DATA BAHAN KULIAH MK ANALISIS DATA KATEGORIK PADA SEKOLAH TINGG ILMU STATISTIK
SYARAT DATA BAIK Data harus obyektif, sesuai dengan keadaan sebenarnya (as it is). Data harus bisa mewakili (representative). Kesalahan baku (standard error) harus kecil. Suatu perkiraan (estimate) dikatakan baik (memiliki tingkat ketelitian tinggi) jika kesalahan bakunya kecil. Syarat (2) & (3) sering disebut sebagai syarat data yang dapat diandalkan (reliable). Harus tepat waktu (up to date). Harus relevan, yaitu data yang dikumpulkan harus ada hubungannya dengan masalah yang akan dipecahkan. Koord. Tim ADK
JENIS DATA Contoh: 1. Menurut Skala Pengukurannya a. Nominal, sifatnya hanya untuk membedakan antar kelompok. Contoh: Jenis kelamin (Laki-laki, Perempuan) Jurusan dalam suatu sekolah tinggi (Manajemen, Akuntansi) Religious affiliation (Catholic, Protestant, Jewish, Muslim, other), Mode of transportation to work (automobile, bicycle, bus, subway, walk), Favorite type of music (classical, country, jazz, rock ), choice of residence (apartment, house, other) Koord. Tim ADK
JENIS DATA Tingkat pendidikan (SD, SMP, SMA), 1. Menurut Skala Pengukurannya (L) b. Ordinal, selain memiliki sifat nominal, juga menunjukkan peringkat. Contoh: Tingkat pendidikan (SD, SMP, SMA), Skala perusahaan (besar, sedang) Size of automobile (subcompact, compact, midsize, large), Social class (upper, middle, lower), Political philosophy (liberal, moderate, conservative), Patient condition (good, fair, serious, critical) Koord. Tim ADK
JENIS DATA 1. Menurut Skala Pengukuran (L) c. Interval, memiliki sifat data ordinal, memiliki titik nol yang tidak tetap. Contoh: Temperatur (Fahrenheit, Celcius), IQ, aptitude, prestasi d. Rasio, selain memiliki sifat data interval, skala rasio memiliki angka 0 (nol) yang mutlak dan perbandingan antara dua nilai mempunyai arti. Tinggi badan, Berat badan, Waktu Koord. Tim ADK
JENIS DATA Sumber: Azen & Walker (2011) Koord. Tim ADK
JENIS DATA 2. Menurut Sifatnya. Data Kualitatif, yaitu data yang tidak berbentuk angka, misal berupa sifat, kualitas, atau kondisi. Skala pengukuran: Nominal atau Ordinal Misalnya prestasi siswa sangat meningkat, biaya sekolah sangat mahal, penyaluran BOS sangat lancar, dan lain sebagainya. Data Kuantitatif, yaitu data dalam bentuk angka. Skala pengukuran: Interval atau Rasio Misalnya rata-rata nilai matematika siswa 80, biaya SPP perbulan Rp 100.000,-, 99% siswa dinyatakan tamat dan lulus, dan sebagainya. Koord. Tim ADK
JENIS DATA 3. Menurut Waktu Pengumpulannya. Data Cross Section, yaitu data yg dikumpulkan pada suatu waktu tertentu (at a point of time) yg bisa menggambarkan keadaan/kegiatan pd waktu tsb. Misalnya, suatu sekolah yang mengumpulkan data anak usia sekolah di sekitar sekolah pada tahun tertentu. Data Berkala (Time Series Data), data yang dikumpulkan dari waktu ke waktu utk memberikan gambaran tentang perkembangan suatu kegiatan. Misalnya, banyaknya pendaftar pada suatu sekolah tertentu selama 10 tahun terakhir. Koord. Tim ADK
APA ITU DATA KATEGORIK? (Cakupan dalam Matakuliah ADK) Pembedaan antara Response dan Explanatory Variable menitikberatkan pada response variable yg bersifat kategorik Pembedaan menurut Measurement Scale menitikberatkan pada response variable dg skala nominal atau ordinal Pembedaan antara Data Diskrit atau Kontinu variabel diskrit: nominal, ordinal, interval dengan nilai yg sedikit (terbatas), variabel kontinu yg telah dikategorikan Pembedaan menurut Kuantitatif dan Kualitatif Variable menitikberatkan pada response variable kualitatif Koord. Tim ADK
ANALISIS DATA KATEGORIK vs DATA NUMERIK/KUANTITATIF Ukuran-ukuran statistik yang dapat digunakan Distribusi probabilita Prosedur inferensia statistical modeling Koord. Tim ADK
SKALA PENGUKURAN DATA & UKURAN STATISTIK Ukuran Pusat Ukuran Variasi Nominal Modus - Ordinal Modus, Median Range Interval Modus, Median, Rata-rata Hitung Range, Standard Deviasi, Variance Rasio Modus, Median, Rata-rata Hitung, Rata-rata Geometrik, Rata-rata Harmonis Range, Standard Deviasi, Variance, Coefisien Variasi Koord. Tim ADK Koord. Tim ADK
STATISTICAL TOOLS vs TIPE DATA Koord. Tim ADK
REF: Agresti, A. Categorical Data Analysis. New York: John wiley & Sons, 1990 Fienberg, SE. The Analysis of Cross-Classified Categorical Data. Massachusets: MIT Press, 1978 Azen, R. and Walker, C.M. (2011). Categorical Data Analysis for the Behavioral and Social Sciences. New York: Taylor and Francis Group, LLC Hosmer DW & Lemeshow DW. Applied Logistic Regression, New York: John wiley & Sons, 1989 Agung Priyo Utomo - agung@stis.ac.id
DISTRIBUSI PROBABILITA DISKRIT Koord. Tim ADK
DISTRIBUSI PROBABILITA KONSEP PENTING: Variabel Acak (Random Variables) Tipe Distribusi Probabilita (Diskrit & Kontinu) Nilai harapan (Expected Value) dan Varian (Variance) Berbagai Jenis Distribusi Probabilita Diskrit Binomial Multinomial Poisson Negatif Binomial Hypergeometrik Koord. Tim ADK
KONSEP PENTING Variabel Acak (Random Variables) Anderson (2002): Variabel acak merupakan gambaran secara numerik mengenai hasil dari suatu percobaan Walpole (1982): Variabel acak merupakan suatu fungsi yang nilainya berupa bilangan nyata yang ditentukan oleh setiap unsur dalam ruang contoh. Koord. Tim ADK
KONSEP PENTING (L) Variabel acak dapat dibagi dalam 2 jenis: Diskrit, yaitu bila suatu ruang contoh mengandung jumlah titik contoh yang terhingga atau suatu barisan unsur yang tidak pernah berakhir tetapi yang sama banyaknya dengan bilangan cacah. Contoh: Jumlah penderita HIV/AIDS pada tahun tertentu, jumlah mahasiswa, jumlah anak jalanan, dsb Kontinu, yaitu bila suatu ruang contoh mengandung takhingga banyaknya titik contoh yang sama dengan banyaknya titik pada sebuah ruas garis Contoh: Pendapatan seseorang perbulan, skor emosional seseorang, jarak antar wilayah, dsb Koord. Tim ADK
DEFINISI DISTRIBUSI PROBABILITA Distribusi probabilita untuk suatu random variabel menggambarkan bagaimana probabilita terditribusi untuk setiap nilai random variabel. Distribusi probabilita didefinisikan dengan suatu fungsi probabilita, dinotasikan dengan f(x), yang menunjukkan probabilita untuk setiap nilai random variabel. Ada 2 tipe distribusi probabilita: Diskrit Kontinu Koord. Tim ADK
DISTRIBUSI PROBABILITA DISKRIT Distribusi probabilita diskrit, yaitu apabila random variabel yang digunakan diskrit. Syarat: p(x) ≥ 0 peluang suatu kejadian tidak pernah bernilai negatif p(x) = 1 total peluang semua kejadian yang mungkin Distribusi probabilita diskrit dapat digambarkan dalam bentuk tabel, grafik, maupun persamaan. Koord. Tim ADK
DISTRIBUSI PROBABILITA DISKRIT (L) Contoh distribusi probabilita diskrit Misal data penderita gangguan mental di wilayah A, distribusi probabilita adalah sebagai berikut: Jumlah penderita Jumlah desa X p(x) 80 0,40 1 50 0,25 2 40 0,20 3 10 0,05 4 20 0,10 200 1,00 Koord. Tim ADK
DISTRIBUSI PROBABILITA DISKRIT (L) Representasi distribusi probabilita data penderita gangguan mental di wilayah A secara grafik: Probabilita Nilai variabel acak x (penderita gangguan mental) Koord. Tim ADK
1. BINOMIAL Sifat percobaan Binomial Percobaan dilakukan dalam n kali ulangan yang sama. Kemungkinan yang terjadi pada tiap ulangan hanya ada 2, yaitu “sukses” atau “gagal”. Probabilita “sukses” yang dinotasikan dengan p selalu tetap pada tiap ulangan. Tiap ulangan saling bebas (independent). Koord. Tim ADK
1. BINOMIAL (L) Fungsi Probabilita Binomial dimana x = banyaknya sukses yang terjadi dalam n kali ulangan p = probabilita “sukses” n = banyaknya ulangan Nilai Harapan (Expected Value): E(x) = = np Varian: Var(x) = 2 = np(1 - p) Koord. Tim ADK
1. BINOMIAL (L) CONTOH: RS A Misalkan di RS A terdapat 3 orang pasien sakit jantung, dan pimpinan RS yakin bahwa probabilita pasien dapat sembuh adalah 0,1. Berapa probabilita bahwa 1 orang akan sembuh? Pada kasus ini, p = 0,1 n = 3 x = 1 Koord. Tim ADK
1. BINOMIAL (L) CONTOH: RS A = (3)(0,1)(0,81) = 0,243 Nilai Harapan: E(x) = = np = 3.(0,1) = 0,3 Varian: Var(x) = 2 = np(1 - p) = 3(0,1)(0,9) = 0,27 Simpangan Baku: = 0,52 Koord. Tim ADK
1. BINOMIAL (L) Binomial (Lanjutan) CONTOH: RS A Menggunakan Tabel Binomial Koord. Tim ADK
1. BINOMIAL (L) Jika n , maka Bin(n,p) ~ Normal Transformasi: Penyesuaian variabel diskrit ke distribusi kontinu diperlukan faktor koreksi kontinuitas (continuity correction) sebesar |0,5| Koord. Tim ADK
KASUS Batuk Total Ya Tidak Merokok 7 6 13 4 8 12 11 14 25 Suatu penelitian cross- sectional dilakukan dengan menentukan dan mengambil total ukuran sampel sebanyak 25 orang. Kemudian ditanya apakah mereka sering menderita batuk atau tidak. Jawaban mereka diklasifikasikan menurut apakah mereka mempunyai kebiasaan merokok atau tidak. Datanya sbb: Bila dipilih 10 orang secara acak dari kelompok tersebut, berapa peluang yang terpilih 3 orang yg merokok sering menderita batuk, 2 orang tidak merokok sering menderita batuk, dan 5 orang tidak merokok yg tidak sering menderita batuk? Koord. Tim ADK
2. MULTINOMIAL Contoh: Pendapatan keluarga dapat diklasifikasikan ke dalam 5 kelompok Tikus dapat merespon suatu stimulus dengan 3 cara Produk suatu industri dapat diklasifikasikan dalam “kualitas baik”, “kualitas sedang”, “kualitas buruk” Tingkat kecerdasan seseorang dapat dikategorikan menjadi “tinggi”, “sedang”, “rendah” Koord. Tim ADK
2. MULTINOMIAL (L) Definisi: Bila suatu percobaan (trial) dpt menghasilkan k outcomes O1, O2, …, Ok dg peluang p1, p2, …, pk, maka variabel acak X1, X2, …, Xk yg menyatakan banyaknya kejadian O1, O2, …, Ok dlm n percobaan akan berdistribusi multinomial dg fungsi peluang: Rata-rata: E(Xi) = μ = npi Varian: Var(Xi) = npi(1-pi) Koord. Tim ADK
2. MULTINOMIAL (L) Jika n , maka Multinomial ~ 2 banyak digunakan dalam cross-tabulation analysis Sifat-sifat: Terdiri dari n percobaan yang identik dan bersifat bebas Outcome dari tiap percobaan mpk salah satu dari k kategori yg mungkin Prob dr suatu kategori i (pi) bersifat konstan dari satu percobaan ke percobaan lain, dimana p1 + p2 +…+ pk = 1 Pengamatan dan penghitungan dilakukan pada banyaknya observasi dari outcome untuk tiap kategori, yaitu O1, O2, …, Ok, dimana O1 + O2 + … + Ok = n Koord. Tim ADK
Distribusi binomial maupun multinomial mensyaratkan bahwa ukuran sampel (n) tetap Bagaimana jika kejadian atau percobaan memiliki n yang tidak tetap atau bahkan tak terhingga? Contoh: Banyaknya kecelakaan lalu lintas di suatu persimpangan jalan selama waktu tertentu Banyaknya siswa yang kesurupan di suatu sekolah dalam suatu bulan tertentu Banyaknya bakteri dalam suatu cairan persatuan volume Banyaknya orang stres di suatu wilayah dalam satu minggu tertentu Koord. Tim ADK
Sifat percobaan Poisson Peluang suatu kejadian adalah sama untuk 2 (dua) interval yang sama. Kejadian pada suatu interval saling bebas dengan kejadian pada interval yang lain Peluang suatu kejadian “sukses” dalam suatu percobaan tertentu adalah kecil Jika n , dan p 0, maka np = λ, dimana λ mpk parameter distribusi poisson Merupakan pendekatan yg akurat untuk distribusi binomial, khususnya jika np < 7 Koord. Tim ADK
Fungsi Probabilita Poisson x = 0, 1, 2, … dimana x = banyaknya kejadian pada interval waktu tertentu λ = rata-rata banyaknya kejadian pada interval waktu tertentu e = 2.71828 Rata-rata = Varian = λ Koord. Tim ADK
CONTOH: RUMAH SAKIT MERCY Di RS Mercy, rata-rata pasien mendatangi UGD pada akhir minggu adalah 3 pasien per jam. Berapa probabilita ada 4 pasien mendatangi UGD pada akhir minggu? λ = 3 pasien perjam, x = 4 Berapa peluang lebih dari 3 pasien mendatangi UGD pada akhir minggu? Koord. Tim ADK
CONTOH: RUMAH SAKIT MERCY Menggunakan Tabel Poisson Koord. Tim ADK
4. NEGATIVE BINOMIAL Random variabel yang diamati menyatakan banyaknya percobaan/trial untuk menghasilkan sukses yang ke-k Ilustrasi: x ● ● ● … ● ● Sukses ke-k x–1 trial Fungsi peluang: 𝑓 𝑥 = 𝑥−1 𝑘−1 𝑝 𝑘 (1−𝑝) 𝑥−𝑘 x = k, k+1, k+2, … k = 1, 2, … Rata-rata = E(X) = 𝑘 𝑝 Varian = Var(X) = 𝑘(1−𝑝) 𝑝 2
5. HIPERGEOMETRIK Pada distribusi hypergeometrik, antar ulangan tidak bebas dan peluang sukses berubah dari satu ulangan ke ulangan yang lain Fungsi Probabilita Hipergeometrik dimana x = banyaknya sukses dalam n kali ulangan n = banyaknya ulangan N = banyaknya elemen populasi r = banyaknya sukses dalam populasi Koord. Tim ADK
5. HIPERGEOMETRIK (L) CONTOH: BATERAI BOB Bob berniat mengganti 2 baterai yang mati, namun ia tidak sengaja mencampurnya dengan 2 baterai yang baru. Keempat baterai terlihat identik. Berapa probabilita Bob mengambil 2 baterai yang masih baru? Koord. Tim ADK
RANGKUMAN
Problems Koord. Tim ADK