Presentasi sedang didownload. Silahkan tunggu

Presentasi sedang didownload. Silahkan tunggu

JENIS-JENIS DATA 1 BAHAN KULIAH MK ANALISIS DATA KATEGORIK PADA SEKOLAH TINGG ILMU STATISTIK.

Presentasi serupa


Presentasi berjudul: "JENIS-JENIS DATA 1 BAHAN KULIAH MK ANALISIS DATA KATEGORIK PADA SEKOLAH TINGG ILMU STATISTIK."— Transcript presentasi:

1 JENIS-JENIS DATA 1 BAHAN KULIAH MK ANALISIS DATA KATEGORIK PADA SEKOLAH TINGG ILMU STATISTIK

2 SYARAT DATA BAIK 1.Data harus obyektif, sesuai dengan keadaan sebenarnya (as it is). 2.Data harus bisa mewakili (representative). 3.Kesalahan baku (standard error) harus kecil. Suatu perkiraan (estimate) dikatakan baik (memiliki tingkat ketelitian tinggi) jika kesalahan bakunya kecil. Syarat (2) & (3) sering disebut sebagai syarat data yang dapat diandalkan (reliable). 4.Harus tepat waktu (up to date). 5.Harus relevan, yaitu data yang dikumpulkan harus ada hubungannya dengan masalah yang akan dipecahkan. KOORD. TIM ADK 2

3 JENIS DATA 1. Menurut Skala Pengukurannya a.Nominal, sifatnya hanya untuk membedakan antar kelompok. Contoh:  Jenis kelamin (Laki-laki, Perempuan)  Jurusan dalam suatu sekolah tinggi (Manajemen, Akuntansi)  Religious affiliation (Catholic, Protestant, Jewish, Muslim, other),  Mode of transportation to work (automobile, bicycle, bus, subway, walk),  Favorite type of music (classical, country, jazz, rock ),  choice of residence (apartment, house, other) KOORD. TIM ADK 3

4 JENIS DATA 1. Menurut Skala Pengukurannya (L) b.Ordinal, selain memiliki sifat nominal, juga menunjukkan peringkat. Contoh:  Tingkat pendidikan (SD, SMP, SMA),  Skala perusahaan (besar, sedang)  Size of automobile (subcompact, compact, midsize, large),  Social class (upper, middle, lower),  Political philosophy (liberal, moderate, conservative),  Patient condition (good, fair, serious, critical) KOORD. TIM ADK 4

5 JENIS DATA 1. Menurut Skala Pengukuran (L) c.Interval, memiliki sifat data ordinal, memiliki titik nol yang tidak tetap. Contoh: Temperatur (Fahrenheit, Celcius), IQ, aptitude, prestasi d. Rasio, selain memiliki sifat data interval, skala rasio memiliki angka 0 (nol) yang mutlak dan perbandingan antara dua nilai mempunyai arti. Contoh: Tinggi badan, Berat badan, Waktu KOORD. TIM ADK 5

6 JENIS DATA KOORD. TIM ADK 6 Sumber: Azen & Walker (2011)

7 JENIS DATA 2. Menurut Sifatnya. a.Data Kualitatif, yaitu data yang tidak berbentuk angka, misal berupa sifat, kualitas, atau kondisi. Skala pengukuran: Nominal atau Ordinal Misalnya prestasi siswa sangat meningkat, biaya sekolah sangat mahal, penyaluran BOS sangat lancar, dan lain sebagainya. b.Data Kuantitatif, yaitu data dalam bentuk angka. Skala pengukuran: Interval atau Rasio Misalnya rata-rata nilai matematika siswa 80, biaya SPP perbulan Rp ,-, 99% siswa dinyatakan tamat dan lulus, dan sebagainya. KOORD. TIM ADK 7

8 JENIS DATA 3.Menurut Waktu Pengumpulannya. a.Data Cross Section, yaitu data yg dikumpulkan pada suatu waktu tertentu (at a point of time) yg bisa menggambarkan keadaan/kegiatan pd waktu tsb. Misalnya, suatu sekolah yang mengumpulkan data anak usia sekolah di sekitar sekolah pada tahun tertentu. b.Data Berkala (Time Series Data), data yang dikumpulkan dari waktu ke waktu utk memberikan gambaran tentang perkembangan suatu kegiatan. Misalnya, banyaknya pendaftar pada suatu sekolah tertentu selama 10 tahun terakhir. KOORD. TIM ADK 8

9 APA ITU DATA KATEGORIK? (CAKUPAN DALAM MATAKULIAH ADK) Pembedaan antara Response dan Explanatory Variable  menitikberatkan pada response variable yg bersifat kategorik Pembedaan menurut Measurement Scale  menitikberatkan pada response variable dg skala nominal atau ordinal Pembedaan antara Data Diskrit atau Kontinu  variabel diskrit: nominal, ordinal, interval dengan nilai yg sedikit (terbatas), variabel kontinu yg telah dikategorikan Pembedaan menurut Kuantitatif dan Kualitatif Variable  menitikberatkan pada response variable kualitatif KOORD. TIM ADK 9

10 ANALISIS DATA KATEGORIK VS DATA NUMERIK/KUANTITATIF Ukuran-ukuran statistik yang dapat digunakan Distribusi probabilita Prosedur inferensia  statistical modeling KOORD. TIM ADK 10

11 SKALA PENGUKURAN DATA & UKURAN STATISTIK SkalaUkuran PusatUkuran Variasi NominalModus- OrdinalModus, MedianRange IntervalModus, Median, Rata-rata Hitung Range, Standard Deviasi, Variance Rasio Modus, Median, Rata-rata Hitung, Rata-rata Geometrik, Rata-rata Harmonis Range, Standard Deviasi, Variance, Coefisien Variasi KOORD. TIM ADK 11 Koord. Tim ADK

12 KOORD. TIM ADK 12 STATISTICAL TOOLS VS TIPE DATA

13 REF: AGUNG PRIYO UTOMO - 13 Agresti, A. Categorical Data Analysis. New York: John wiley & Sons, 1990 Fienberg, SE. The Analysis of Cross-Classified Categorical Data. Massachusets: MIT Press, 1978 Azen, R. and Walker, C.M. (2011). Categorical Data Analysis for the Behavioral and Social Sciences. New York: Taylor and Francis Group, LLC Hosmer DW & Lemeshow DW. Applied Logistic Regression, New York: John wiley & Sons, 1989

14 DISTRIBUSI PROBABILITA DISKRIT KOORD. TIM ADK

15 DISTRIBUSI PROBABILITA KONSEP PENTING: Variabel Acak (Random Variables) Tipe Distribusi Probabilita (Diskrit & Kontinu) Nilai harapan (Expected Value) dan Varian (Variance) Berbagai Jenis Distribusi Probabilita Diskrit  Binomial  Multinomial  Poisson  Negatif Binomial  Hypergeometrik Koord. Tim ADK

16 KONSEP PENTING Variabel Acak (Random Variables)  Anderson (2002): Variabel acak merupakan gambaran secara numerik mengenai hasil dari suatu percobaan  Walpole (1982): Variabel acak merupakan suatu fungsi yang nilainya berupa bilangan nyata yang ditentukan oleh setiap unsur dalam ruang contoh. Koord. Tim ADK

17 Variabel acak dapat dibagi dalam 2 jenis:  Diskrit, yaitu bila suatu ruang contoh mengandung jumlah titik contoh yang terhingga atau suatu barisan unsur yang tidak pernah berakhir tetapi yang sama banyaknya dengan bilangan cacah. Contoh: Jumlah penderita HIV/AIDS pada tahun tertentu, jumlah mahasiswa, jumlah anak jalanan, dsb  Kontinu, yaitu bila suatu ruang contoh mengandung takhingga banyaknya titik contoh yang sama dengan banyaknya titik pada sebuah ruas garis Contoh: Pendapatan seseorang perbulan, skor emosional seseorang, jarak antar wilayah, dsb KONSEP PENTING (L) Koord. Tim ADK

18 DEFINISI DISTRIBUSI PROBABILITA Distribusi probabilita untuk suatu random variabel menggambarkan bagaimana probabilita terditribusi untuk setiap nilai random variabel. Distribusi probabilita didefinisikan dengan suatu fungsi probabilita, dinotasikan dengan f(x), yang menunjukkan probabilita untuk setiap nilai random variabel. Ada 2 tipe distribusi probabilita: 1.Diskrit 2.Kontinu Koord. Tim ADK

19 DISTRIBUSI PROBABILITA DISKRIT Distribusi probabilita diskrit, yaitu apabila random variabel yang digunakan diskrit.  Syarat: a.p(x) ≥ 0  peluang suatu kejadian tidak pernah bernilai negatif b.  p(x) = 1  total peluang semua kejadian yang mungkin  Distribusi probabilita diskrit dapat digambarkan dalam bentuk tabel, grafik, maupun persamaan. Koord. Tim ADK

20 Contoh distribusi probabilita diskrit Misal data penderita gangguan mental di wilayah A, distribusi probabilita adalah sebagai berikut: Jumlah penderitaJumlah desaXp(x) 08000, , , , , ,00 DISTRIBUSI PROBABILITA DISKRIT (L) Koord. Tim ADK

21 Representasi distribusi probabilita data penderita gangguan mental di wilayah A secara grafik: Probabilita Nilai variabel acak x (penderita gangguan mental) DISTRIBUSI PROBABILITA DISKRIT (L) Koord. Tim ADK

22 Sifat percobaan Binomial Percobaan dilakukan dalam n kali ulangan yang sama. Kemungkinan yang terjadi pada tiap ulangan hanya ada 2, yaitu “sukses” atau “gagal”. Probabilita “sukses” yang dinotasikan dengan p selalu tetap pada tiap ulangan. Tiap ulangan saling bebas (independent). Koord. Tim ADK 1. BINOMIAL

23 Fungsi Probabilita Binomial dimana x =banyaknya sukses yang terjadi dalam n kali ulangan p = probabilita “sukses” n =banyaknya ulangan Nilai Harapan (Expected Value): E(x) =  = np Varian: Var(x) =  2 = np(1 - p) Koord. Tim ADK 1. BINOMIAL (L)

24 CONTOH: RS A Misalkan di RS A terdapat 3 orang pasien sakit jantung, dan pimpinan RS yakin bahwa probabilita pasien dapat sembuh adalah 0,1. Berapa probabilita bahwa 1 orang akan sembuh? Pada kasus ini, p = 0,1 n = 3 x = 1 Koord. Tim ADK 1. BINOMIAL (L)

25 CONTOH: RS A = (3)(0,1)(0,81) = 0,243 Nilai Harapan: E(x) =  = np = 3.(0,1) = 0,3 Varian: Var(x) =  2 = np(1 - p) = 3(0,1)(0,9) = 0,27 Simpangan Baku:  = 0,52 Koord. Tim ADK 1. BINOMIAL (L)

26 Binomial (Lanjutan) CONTOH: RS A Menggunakan Tabel Binomial 1. BINOMIAL (L) Koord. Tim ADK

27 Jika n  , maka Bin(n,p) ~ Normal Transformasi: Penyesuaian variabel diskrit ke distribusi kontinu diperlukan faktor koreksi kontinuitas (continuity correction) sebesar |0,5| 1. BINOMIAL (L) KOORD. TIM ADK

28 KASUS Suatu penelitian cross- sectional dilakukan dengan menentukan dan mengambil total ukuran sampel sebanyak 25 orang. Kemudian ditanya apakah mereka sering menderita batuk atau tidak. Jawaban mereka diklasifikasikan menurut apakah mereka mempunyai kebiasaan merokok atau tidak. Datanya sbb: Batuk Total YaTidak Merokok Ya7613 Tidak4812 Total Bila dipilih 10 orang secara acak dari kelompok tersebut, berapa peluang yang terpilih 3 orang yg merokok sering menderita batuk, 2 orang tidak merokok sering menderita batuk, dan 5 orang tidak merokok yg tidak sering menderita batuk? Koord. Tim ADK

29 Contoh: 1.Pendapatan keluarga dapat diklasifikasikan ke dalam 5 kelompok 2.Tikus dapat merespon suatu stimulus dengan 3 cara 3.Produk suatu industri dapat diklasifikasikan dalam “kualitas baik”, “kualitas sedang”, “kualitas buruk” 4.Tingkat kecerdasan seseorang dapat dikategorikan menjadi “tinggi”, “sedang”, “rendah” 2. MULTINOMIAL KOORD. TIM ADK

30 Definisi: Bila suatu percobaan (trial) dpt menghasilkan k outcomes O 1, O 2, …, O k dg peluang p 1, p 2, …, p k, maka variabel acak X 1, X 2, …, X k yg menyatakan banyaknya kejadian O 1, O 2, …, O k dlm n percobaan akan berdistribusi multinomial dg fungsi peluang: Rata-rata:E(X i ) = μ = np i Varian:Var(X i ) = np i (1-p i ) 2. MULTINOMIAL (L) KOORD. TIM ADK

31 Jika n  , maka Multinomial ~  2  banyak digunakan dalam cross-tabulation analysis Sifat-sifat: 1.Terdiri dari n percobaan yang identik dan bersifat bebas 2.Outcome dari tiap percobaan mpk salah satu dari k kategori yg mungkin 3.Prob dr suatu kategori i (p i ) bersifat konstan dari satu percobaan ke percobaan lain, dimana p 1 + p 2 +…+ p k = 1 4.Pengamatan dan penghitungan dilakukan pada banyaknya observasi dari outcome untuk tiap kategori, yaitu O 1, O 2, …, O k, dimana O 1 + O 2 + … + O k = n 2. MULTINOMIAL (L) KOORD. TIM ADK

32 Distribusi binomial maupun multinomial mensyaratkan bahwa ukuran sampel (n) tetap Bagaimana jika kejadian atau percobaan memiliki n yang tidak tetap atau bahkan tak terhingga? Contoh: 1.Banyaknya kecelakaan lalu lintas di suatu persimpangan jalan selama waktu tertentu 2.Banyaknya siswa yang kesurupan di suatu sekolah dalam suatu bulan tertentu 3.Banyaknya bakteri dalam suatu cairan persatuan volume 4.Banyaknya orang stres di suatu wilayah dalam satu minggu tertentu Koord. Tim ADK

33 Sifat percobaan Poisson Peluang suatu kejadian adalah sama untuk 2 (dua) interval yang sama. Kejadian pada suatu interval saling bebas dengan kejadian pada interval yang lain Peluang suatu kejadian “sukses” dalam suatu percobaan tertentu adalah kecil Jika n  , dan p  0, maka np = λ, dimana λ mpk parameter distribusi poisson Merupakan pendekatan yg akurat untuk distribusi binomial, khususnya jika np < 7 Koord. Tim ADK

34 Fungsi Probabilita Poisson x = 0, 1, 2, … dimana x=banyaknya kejadian pada interval waktu tertentu λ =rata-rata banyaknya kejadian pada interval waktu tertentu e = Rata-rata = Varian = λ Koord. Tim ADK

35 CONTOH: RUMAH SAKIT MERCY Di RS Mercy, rata-rata pasien mendatangi UGD pada akhir minggu adalah 3 pasien per jam. Berapa probabilita ada 4 pasien mendatangi UGD pada akhir minggu? λ = 3 pasien perjam, x = 4 Berapa peluang lebih dari 3 pasien mendatangi UGD pada akhir minggu? Koord. Tim ADK

36 CONTOH: RUMAH SAKIT MERCY Menggunakan Tabel Poisson Koord. Tim ADK

37 4. NEGATIVE BINOMIAL

38 Pada distribusi hypergeometrik, antar ulangan tidak bebas dan peluang sukses berubah dari satu ulangan ke ulangan yang lain Fungsi Probabilita Hipergeometrik dimana x= banyaknya sukses dalam n kali ulangan n = banyaknya ulangan N= banyaknya elemen populasi r = banyaknya sukses dalam populasi 5. HIPERGEOMETRIK Koord. Tim ADK

39 CONTOH: BATERAI BOB Bob berniat mengganti 2 baterai yang mati, namun ia tidak sengaja mencampurnya dengan 2 baterai yang baru. Keempat baterai terlihat identik. Berapa probabilita Bob mengambil 2 baterai yang masih baru? 5. HIPERGEOMETRIK (L) Koord. Tim ADK

40 RANGKUMAN

41 Problems KOORD. TIM ADK


Download ppt "JENIS-JENIS DATA 1 BAHAN KULIAH MK ANALISIS DATA KATEGORIK PADA SEKOLAH TINGG ILMU STATISTIK."

Presentasi serupa


Iklan oleh Google