Presentasi sedang didownload. Silahkan tunggu

Presentasi sedang didownload. Silahkan tunggu

JENIS-JENIS DATA BAHAN KULIAH MK ANALISIS DATA KATEGORIK

Presentasi serupa


Presentasi berjudul: "JENIS-JENIS DATA BAHAN KULIAH MK ANALISIS DATA KATEGORIK"— Transcript presentasi:

1 JENIS-JENIS DATA BAHAN KULIAH MK ANALISIS DATA KATEGORIK
PADA SEKOLAH TINGG ILMU STATISTIK

2 SYARAT DATA BAIK Data harus obyektif, sesuai dengan keadaan sebenarnya (as it is). Data harus bisa mewakili (representative). Kesalahan baku (standard error) harus kecil. Suatu perkiraan (estimate) dikatakan baik (memiliki tingkat ketelitian tinggi) jika kesalahan bakunya kecil. Syarat (2) & (3) sering disebut sebagai syarat data yang dapat diandalkan (reliable). Harus tepat waktu (up to date). Harus relevan, yaitu data yang dikumpulkan harus ada hubungannya dengan masalah yang akan dipecahkan. Koord. Tim ADK

3 JENIS DATA Contoh: 1. Menurut Skala Pengukurannya
a. Nominal, sifatnya hanya untuk membedakan antar kelompok. Contoh: Jenis kelamin (Laki-laki, Perempuan) Jurusan dalam suatu sekolah tinggi (Manajemen, Akuntansi) Religious affiliation (Catholic, Protestant, Jewish, Muslim, other), Mode of transportation to work (automobile, bicycle, bus, subway, walk), Favorite type of music (classical, country, jazz, rock ), choice of residence (apartment, house, other) Koord. Tim ADK

4 JENIS DATA Tingkat pendidikan (SD, SMP, SMA),
1. Menurut Skala Pengukurannya (L) b. Ordinal, selain memiliki sifat nominal, juga menunjukkan peringkat. Contoh: Tingkat pendidikan (SD, SMP, SMA), Skala perusahaan (besar, sedang) Size of automobile (subcompact, compact, midsize, large), Social class (upper, middle, lower), Political philosophy (liberal, moderate, conservative), Patient condition (good, fair, serious, critical) Koord. Tim ADK

5 JENIS DATA 1. Menurut Skala Pengukuran (L)
c. Interval, memiliki sifat data ordinal, memiliki titik nol yang tidak tetap. Contoh: Temperatur (Fahrenheit, Celcius), IQ, aptitude, prestasi d. Rasio, selain memiliki sifat data interval, skala rasio memiliki angka 0 (nol) yang mutlak dan perbandingan antara dua nilai mempunyai arti. Tinggi badan, Berat badan, Waktu Koord. Tim ADK

6 JENIS DATA Sumber: Azen & Walker (2011) Koord. Tim ADK

7 JENIS DATA 2. Menurut Sifatnya. Data Kualitatif, yaitu data yang tidak berbentuk angka, misal berupa sifat, kualitas, atau kondisi. Skala pengukuran: Nominal atau Ordinal Misalnya prestasi siswa sangat meningkat, biaya sekolah sangat mahal, penyaluran BOS sangat lancar, dan lain sebagainya. Data Kuantitatif, yaitu data dalam bentuk angka. Skala pengukuran: Interval atau Rasio Misalnya rata-rata nilai matematika siswa 80, biaya SPP perbulan Rp ,-, 99% siswa dinyatakan tamat dan lulus, dan sebagainya. Koord. Tim ADK

8 JENIS DATA 3. Menurut Waktu Pengumpulannya. Data Cross Section, yaitu data yg dikumpulkan pada suatu waktu tertentu (at a point of time) yg bisa menggambarkan keadaan/kegiatan pd waktu tsb. Misalnya, suatu sekolah yang mengumpulkan data anak usia sekolah di sekitar sekolah pada tahun tertentu. Data Berkala (Time Series Data), data yang dikumpulkan dari waktu ke waktu utk memberikan gambaran tentang perkembangan suatu kegiatan. Misalnya, banyaknya pendaftar pada suatu sekolah tertentu selama 10 tahun terakhir. Koord. Tim ADK

9 APA ITU DATA KATEGORIK? (Cakupan dalam Matakuliah ADK)
Pembedaan antara Response dan Explanatory Variable  menitikberatkan pada response variable yg bersifat kategorik Pembedaan menurut Measurement Scale  menitikberatkan pada response variable dg skala nominal atau ordinal Pembedaan antara Data Diskrit atau Kontinu  variabel diskrit: nominal, ordinal, interval dengan nilai yg sedikit (terbatas), variabel kontinu yg telah dikategorikan Pembedaan menurut Kuantitatif dan Kualitatif Variable  menitikberatkan pada response variable kualitatif Koord. Tim ADK

10 ANALISIS DATA KATEGORIK vs DATA NUMERIK/KUANTITATIF
Ukuran-ukuran statistik yang dapat digunakan Distribusi probabilita Prosedur inferensia  statistical modeling Koord. Tim ADK

11 SKALA PENGUKURAN DATA & UKURAN STATISTIK
Ukuran Pusat Ukuran Variasi Nominal Modus - Ordinal Modus, Median Range Interval Modus, Median, Rata-rata Hitung Range, Standard Deviasi, Variance Rasio Modus, Median, Rata-rata Hitung, Rata-rata Geometrik, Rata-rata Harmonis Range, Standard Deviasi, Variance, Coefisien Variasi Koord. Tim ADK Koord. Tim ADK

12 STATISTICAL TOOLS vs TIPE DATA
Koord. Tim ADK

13 REF: Agresti, A. Categorical Data Analysis. New York: John wiley & Sons, 1990 Fienberg, SE. The Analysis of Cross-Classified Categorical Data. Massachusets: MIT Press, 1978 Azen, R. and Walker, C.M. (2011). Categorical Data Analysis for the Behavioral and Social Sciences. New York: Taylor and Francis Group, LLC Hosmer DW & Lemeshow DW. Applied Logistic Regression, New York: John wiley & Sons, 1989 Agung Priyo Utomo -

14 DISTRIBUSI PROBABILITA DISKRIT
Koord. Tim ADK

15 DISTRIBUSI PROBABILITA
KONSEP PENTING: Variabel Acak (Random Variables) Tipe Distribusi Probabilita (Diskrit & Kontinu) Nilai harapan (Expected Value) dan Varian (Variance) Berbagai Jenis Distribusi Probabilita Diskrit Binomial Multinomial Poisson Negatif Binomial Hypergeometrik Koord. Tim ADK

16 KONSEP PENTING Variabel Acak (Random Variables) Anderson (2002):
Variabel acak merupakan gambaran secara numerik mengenai hasil dari suatu percobaan Walpole (1982): Variabel acak merupakan suatu fungsi yang nilainya berupa bilangan nyata yang ditentukan oleh setiap unsur dalam ruang contoh. Koord. Tim ADK

17 KONSEP PENTING (L) Variabel acak dapat dibagi dalam 2 jenis:
Diskrit, yaitu bila suatu ruang contoh mengandung jumlah titik contoh yang terhingga atau suatu barisan unsur yang tidak pernah berakhir tetapi yang sama banyaknya dengan bilangan cacah. Contoh: Jumlah penderita HIV/AIDS pada tahun tertentu, jumlah mahasiswa, jumlah anak jalanan, dsb Kontinu, yaitu bila suatu ruang contoh mengandung takhingga banyaknya titik contoh yang sama dengan banyaknya titik pada sebuah ruas garis Contoh: Pendapatan seseorang perbulan, skor emosional seseorang, jarak antar wilayah, dsb Koord. Tim ADK

18 DEFINISI DISTRIBUSI PROBABILITA
Distribusi probabilita untuk suatu random variabel menggambarkan bagaimana probabilita terditribusi untuk setiap nilai random variabel. Distribusi probabilita didefinisikan dengan suatu fungsi probabilita, dinotasikan dengan f(x), yang menunjukkan probabilita untuk setiap nilai random variabel. Ada 2 tipe distribusi probabilita: Diskrit Kontinu Koord. Tim ADK

19 DISTRIBUSI PROBABILITA DISKRIT
Distribusi probabilita diskrit, yaitu apabila random variabel yang digunakan diskrit. Syarat: p(x) ≥ 0  peluang suatu kejadian tidak pernah bernilai negatif  p(x) = 1  total peluang semua kejadian yang mungkin Distribusi probabilita diskrit dapat digambarkan dalam bentuk tabel, grafik, maupun persamaan. Koord. Tim ADK

20 DISTRIBUSI PROBABILITA DISKRIT (L)
Contoh distribusi probabilita diskrit Misal data penderita gangguan mental di wilayah A, distribusi probabilita adalah sebagai berikut: Jumlah penderita Jumlah desa X p(x) 80 0,40 1 50 0,25 2 40 0,20 3 10 0,05 4 20 0,10 200 1,00 Koord. Tim ADK

21 DISTRIBUSI PROBABILITA DISKRIT (L)
Representasi distribusi probabilita data penderita gangguan mental di wilayah A secara grafik: Probabilita Nilai variabel acak x (penderita gangguan mental) Koord. Tim ADK

22 1. BINOMIAL Sifat percobaan Binomial
Percobaan dilakukan dalam n kali ulangan yang sama. Kemungkinan yang terjadi pada tiap ulangan hanya ada 2, yaitu “sukses” atau “gagal”. Probabilita “sukses” yang dinotasikan dengan p selalu tetap pada tiap ulangan. Tiap ulangan saling bebas (independent). Koord. Tim ADK

23 1. BINOMIAL (L) Fungsi Probabilita Binomial
dimana x = banyaknya sukses yang terjadi dalam n kali ulangan p = probabilita “sukses” n = banyaknya ulangan Nilai Harapan (Expected Value): E(x) =  = np Varian: Var(x) = 2 = np(1 - p) Koord. Tim ADK

24 1. BINOMIAL (L) CONTOH: RS A
Misalkan di RS A terdapat 3 orang pasien sakit jantung, dan pimpinan RS yakin bahwa probabilita pasien dapat sembuh adalah 0,1. Berapa probabilita bahwa 1 orang akan sembuh? Pada kasus ini, p = 0,1 n = x = 1 Koord. Tim ADK

25 1. BINOMIAL (L) CONTOH: RS A = (3)(0,1)(0,81) = 0,243
Nilai Harapan: E(x) =  = np = 3.(0,1) = 0,3 Varian: Var(x) = 2 = np(1 - p) = 3(0,1)(0,9) = 0,27 Simpangan Baku:  = 0,52 Koord. Tim ADK

26 1. BINOMIAL (L) Binomial (Lanjutan) CONTOH: RS A
Menggunakan Tabel Binomial Koord. Tim ADK

27 1. BINOMIAL (L) Jika n  , maka Bin(n,p) ~ Normal Transformasi: Penyesuaian variabel diskrit ke distribusi kontinu diperlukan faktor koreksi kontinuitas (continuity correction) sebesar |0,5| Koord. Tim ADK

28 KASUS Batuk Total Ya Tidak Merokok 7 6 13 4 8 12 11 14 25 Suatu penelitian cross- sectional dilakukan dengan menentukan dan mengambil total ukuran sampel sebanyak 25 orang. Kemudian ditanya apakah mereka sering menderita batuk atau tidak. Jawaban mereka diklasifikasikan menurut apakah mereka mempunyai kebiasaan merokok atau tidak. Datanya sbb: Bila dipilih 10 orang secara acak dari kelompok tersebut, berapa peluang yang terpilih 3 orang yg merokok sering menderita batuk, 2 orang tidak merokok sering menderita batuk, dan 5 orang tidak merokok yg tidak sering menderita batuk? Koord. Tim ADK

29 2. MULTINOMIAL Contoh: Pendapatan keluarga dapat diklasifikasikan ke dalam 5 kelompok Tikus dapat merespon suatu stimulus dengan 3 cara Produk suatu industri dapat diklasifikasikan dalam “kualitas baik”, “kualitas sedang”, “kualitas buruk” Tingkat kecerdasan seseorang dapat dikategorikan menjadi “tinggi”, “sedang”, “rendah” Koord. Tim ADK

30 2. MULTINOMIAL (L) Definisi: Bila suatu percobaan (trial) dpt menghasilkan k outcomes O1, O2, …, Ok dg peluang p1, p2, …, pk, maka variabel acak X1, X2, …, Xk yg menyatakan banyaknya kejadian O1, O2, …, Ok dlm n percobaan akan berdistribusi multinomial dg fungsi peluang: Rata-rata: E(Xi) = μ = npi Varian: Var(Xi) = npi(1-pi) Koord. Tim ADK

31 2. MULTINOMIAL (L) Jika n  , maka Multinomial ~ 2  banyak digunakan dalam cross-tabulation analysis Sifat-sifat: Terdiri dari n percobaan yang identik dan bersifat bebas Outcome dari tiap percobaan mpk salah satu dari k kategori yg mungkin Prob dr suatu kategori i (pi) bersifat konstan dari satu percobaan ke percobaan lain, dimana p1 + p2 +…+ pk = 1 Pengamatan dan penghitungan dilakukan pada banyaknya observasi dari outcome untuk tiap kategori, yaitu O1, O2, …, Ok, dimana O1 + O2 + … + Ok = n Koord. Tim ADK

32 Distribusi binomial maupun multinomial mensyaratkan bahwa ukuran sampel (n) tetap
Bagaimana jika kejadian atau percobaan memiliki n yang tidak tetap atau bahkan tak terhingga? Contoh: Banyaknya kecelakaan lalu lintas di suatu persimpangan jalan selama waktu tertentu Banyaknya siswa yang kesurupan di suatu sekolah dalam suatu bulan tertentu Banyaknya bakteri dalam suatu cairan persatuan volume Banyaknya orang stres di suatu wilayah dalam satu minggu tertentu Koord. Tim ADK

33 Sifat percobaan Poisson
Peluang suatu kejadian adalah sama untuk 2 (dua) interval yang sama. Kejadian pada suatu interval saling bebas dengan kejadian pada interval yang lain Peluang suatu kejadian “sukses” dalam suatu percobaan tertentu adalah kecil Jika n  , dan p  0, maka np = λ, dimana λ mpk parameter distribusi poisson Merupakan pendekatan yg akurat untuk distribusi binomial, khususnya jika np < 7 Koord. Tim ADK

34 Fungsi Probabilita Poisson
x = 0, 1, 2, … dimana x = banyaknya kejadian pada interval waktu tertentu λ = rata-rata banyaknya kejadian pada interval waktu tertentu e = Rata-rata = Varian = λ Koord. Tim ADK

35 CONTOH: RUMAH SAKIT MERCY
Di RS Mercy, rata-rata pasien mendatangi UGD pada akhir minggu adalah 3 pasien per jam. Berapa probabilita ada 4 pasien mendatangi UGD pada akhir minggu? λ = 3 pasien perjam, x = 4 Berapa peluang lebih dari 3 pasien mendatangi UGD pada akhir minggu? Koord. Tim ADK

36 CONTOH: RUMAH SAKIT MERCY Menggunakan Tabel Poisson
Koord. Tim ADK

37 4. NEGATIVE BINOMIAL Random variabel yang diamati menyatakan banyaknya percobaan/trial untuk menghasilkan sukses yang ke-k Ilustrasi: x ● ● ● … ● ● Sukses ke-k x–1 trial Fungsi peluang: 𝑓 𝑥 = 𝑥−1 𝑘−1 𝑝 𝑘 (1−𝑝) 𝑥−𝑘 x = k, k+1, k+2, … k = 1, 2, … Rata-rata = E(X) = 𝑘 𝑝 Varian = Var(X) = 𝑘(1−𝑝) 𝑝 2

38 5. HIPERGEOMETRIK Pada distribusi hypergeometrik, antar ulangan tidak bebas dan peluang sukses berubah dari satu ulangan ke ulangan yang lain Fungsi Probabilita Hipergeometrik dimana x = banyaknya sukses dalam n kali ulangan n = banyaknya ulangan N = banyaknya elemen populasi r = banyaknya sukses dalam populasi Koord. Tim ADK

39 5. HIPERGEOMETRIK (L) CONTOH: BATERAI BOB
Bob berniat mengganti 2 baterai yang mati, namun ia tidak sengaja mencampurnya dengan 2 baterai yang baru. Keempat baterai terlihat identik. Berapa probabilita Bob mengambil 2 baterai yang masih baru? Koord. Tim ADK

40 RANGKUMAN

41 Problems Koord. Tim ADK


Download ppt "JENIS-JENIS DATA BAHAN KULIAH MK ANALISIS DATA KATEGORIK"

Presentasi serupa


Iklan oleh Google