JENIS-JENIS DATA BAHAN KULIAH MK ANALISIS DATA KATEGORIK

Slides:



Advertisements
Presentasi serupa
DISTRIBUSI PROBABILITAS YANG UMUM
Advertisements

Pertemuan II SEBARAN PEUBAH ACAK
STATISTIKA DISTRIBUSI PROBABILITAS
DISTRIBUSI DISKRIT DAN KONTINYU
POPULASI DAN SAMPEL.
PROBABILITAS.
SEKOLAH TINGGI ILMU STATISTIK
Metode Statistika II Pertemuan 2 Pengajar: Timbang Sirait
TINJAUAN UMUM DATA DAN STATISTIKA
BAHAN AJAR STATISTIKA ELEMENTER MAA 306
SEKILAS STATISTIKA 1. Menjelaskan konsep dasar data & pembagiannya 2
POPULASI DAN SAMPEL.
Pertemuan Ke – 1 BAB I PENDAHULUAN.
STATISTIK vs STATISTIKA
DISTRIBUSI PELUANG.
DISTRIBUSI TEORITIS.
TINJAUAN UMUM DATA DAN STATISTIKA
Probabilitas & Distribusi Probabilitas
TINJAUAN UMUM DATA DAN STATISTIKA
STATISTIK vs STATISTIKA
MATERI APLIKASI STATISTIKA BISNIS
PROGRAM STUDI ILMU KOMUNIKASI UNIVERSITAS ISLAM INDONESIA
Distribusi Poisson Percobaan Poisson memiliki ciri-ciri sbb :
Statistika Oleh : Nopem K.S, S.Pd, M.Pd IKIP BUDI UTOMO MALANG.
DISTRIBUSI PROBABILITAS DISKRET
SAMPLING DAN DISTRIBUSI SAMPLING
BAB IX DISTRIBUSI TEORITIS
Distribusi Probabilitas
DISTRIBUSI TEORETIS Tujuan :
PERTEMUAN. 2. DATA dan distribusi frekuensi
STATISTIKA Srikandi Kumadji.
DISTRIBUSI PROBABILITA DISKRIT
STATISTIK PRESENTED BY : TOTOK SUBAGYO, ST,MM.
PENGANTAR STATISTIKA MANAJEMEN
SRI SULASMIYATI, S.Sos, M.AP
DISTRIBUSI PROBABILITAS / PELUANG
DISTRIBUSI TEORITIS.
PENGERTIAN STATISTIK DAN STATISTIKA
Berkenalan dengan Statistika...
(PROBABILITAS LANJUTAN) DISTRIBUSI PELUANG DISKRIT DAN KONTINU
STATISTIKA Pertemuan 5: Distribusi Peluang Normal Dosen Pengampu MK:
TINJAUAN UMUM DATA DAN STATISTIKA
Konsep dasar Statistik
DISTRIBUSI PROBABILITAS
STATISTIK EKONOMI.
STATISTIKA Srikandi Kumadji.
SRI SULASMIYATI, S.Sos, M.AP
SAMPLING DAN DISTRIBUSI SAMPLING
dahiri.wordpress.com Nama : Dahiri Telpon : Alamat :
TINJAUAN UMUM STATISTIKA
PROBABILITAS dan DISTRIBUSI
Distribusi Probabilitas Diskret
DISTRIBUSI PROBABILITAS
BIOSTATISTIKA.
Analisis data kualitatif (introduction to Categorical data analysis)
? 1. Konsep Statistika STATISTIKA : Kegiatan untuk : mengumpulkan data
Statistik deskriptif Pokok bahasan : 1. Pengumpulan, pengorganisasian, dan penyajian data 2. Distribusi frekuensi dan presentasi grafik 3. Ukuran pemusatan.
STATISTIKA Materi : Pengantar Statistika deskriptif
NOTASI SEBARAN BINOMIAL
Distribusi Probabilitas Diskret
DISTRIBUSI FREKUENSI.
Pertemuan ke-1 Matakuliah Statistika Akuntansi UII
Matematika dan Statistika (Teori) BAB I – Penyajian Data dan Diagram
STATISTIKA Srikandi Kumadji.
TINJAUAN UMUM DATA DAN STATISTIKA
DISTRIBUSI PROBABILITAS YANG UMUM
CHAIRANISA ANWAR, SST. MKM
PENGERTIAN DISTRIBUSI TEORITIS
DISTRIBUSI PROBABILITAS YANG UMUM
. Distribusi Binomial adalah suatu distribusi probabilitas yang dapat digunakan bilamana suatu proses sampling dapat diasumsikan sesuai dengan proses.
Transcript presentasi:

JENIS-JENIS DATA BAHAN KULIAH MK ANALISIS DATA KATEGORIK PADA SEKOLAH TINGG ILMU STATISTIK

SYARAT DATA BAIK Data harus obyektif, sesuai dengan keadaan sebenarnya (as it is). Data harus bisa mewakili (representative). Kesalahan baku (standard error) harus kecil. Suatu perkiraan (estimate) dikatakan baik (memiliki tingkat ketelitian tinggi) jika kesalahan bakunya kecil. Syarat (2) & (3) sering disebut sebagai syarat data yang dapat diandalkan (reliable). Harus tepat waktu (up to date). Harus relevan, yaitu data yang dikumpulkan harus ada hubungannya dengan masalah yang akan dipecahkan. Koord. Tim ADK

JENIS DATA Contoh: 1. Menurut Skala Pengukurannya a. Nominal, sifatnya hanya untuk membedakan antar kelompok. Contoh: Jenis kelamin (Laki-laki, Perempuan) Jurusan dalam suatu sekolah tinggi (Manajemen, Akuntansi) Religious affiliation (Catholic, Protestant, Jewish, Muslim, other), Mode of transportation to work (automobile, bicycle, bus, subway, walk), Favorite type of music (classical, country, jazz, rock ), choice of residence (apartment, house, other) Koord. Tim ADK

JENIS DATA Tingkat pendidikan (SD, SMP, SMA), 1. Menurut Skala Pengukurannya (L) b. Ordinal, selain memiliki sifat nominal, juga menunjukkan peringkat. Contoh: Tingkat pendidikan (SD, SMP, SMA), Skala perusahaan (besar, sedang) Size of automobile (subcompact, compact, midsize, large), Social class (upper, middle, lower), Political philosophy (liberal, moderate, conservative), Patient condition (good, fair, serious, critical) Koord. Tim ADK

JENIS DATA 1. Menurut Skala Pengukuran (L) c. Interval, memiliki sifat data ordinal, memiliki titik nol yang tidak tetap. Contoh: Temperatur (Fahrenheit, Celcius), IQ, aptitude, prestasi d. Rasio, selain memiliki sifat data interval, skala rasio memiliki angka 0 (nol) yang mutlak dan perbandingan antara dua nilai mempunyai arti. Tinggi badan, Berat badan, Waktu Koord. Tim ADK

JENIS DATA Sumber: Azen & Walker (2011) Koord. Tim ADK

JENIS DATA 2. Menurut Sifatnya. Data Kualitatif, yaitu data yang tidak berbentuk angka, misal berupa sifat, kualitas, atau kondisi. Skala pengukuran: Nominal atau Ordinal Misalnya prestasi siswa sangat meningkat, biaya sekolah sangat mahal, penyaluran BOS sangat lancar, dan lain sebagainya. Data Kuantitatif, yaitu data dalam bentuk angka. Skala pengukuran: Interval atau Rasio Misalnya rata-rata nilai matematika siswa 80, biaya SPP perbulan Rp 100.000,-, 99% siswa dinyatakan tamat dan lulus, dan sebagainya. Koord. Tim ADK

JENIS DATA 3. Menurut Waktu Pengumpulannya. Data Cross Section, yaitu data yg dikumpulkan pada suatu waktu tertentu (at a point of time) yg bisa menggambarkan keadaan/kegiatan pd waktu tsb. Misalnya, suatu sekolah yang mengumpulkan data anak usia sekolah di sekitar sekolah pada tahun tertentu. Data Berkala (Time Series Data), data yang dikumpulkan dari waktu ke waktu utk memberikan gambaran tentang perkembangan suatu kegiatan. Misalnya, banyaknya pendaftar pada suatu sekolah tertentu selama 10 tahun terakhir. Koord. Tim ADK

APA ITU DATA KATEGORIK? (Cakupan dalam Matakuliah ADK) Pembedaan antara Response dan Explanatory Variable  menitikberatkan pada response variable yg bersifat kategorik Pembedaan menurut Measurement Scale  menitikberatkan pada response variable dg skala nominal atau ordinal Pembedaan antara Data Diskrit atau Kontinu  variabel diskrit: nominal, ordinal, interval dengan nilai yg sedikit (terbatas), variabel kontinu yg telah dikategorikan Pembedaan menurut Kuantitatif dan Kualitatif Variable  menitikberatkan pada response variable kualitatif Koord. Tim ADK

ANALISIS DATA KATEGORIK vs DATA NUMERIK/KUANTITATIF Ukuran-ukuran statistik yang dapat digunakan Distribusi probabilita Prosedur inferensia  statistical modeling Koord. Tim ADK

SKALA PENGUKURAN DATA & UKURAN STATISTIK Ukuran Pusat Ukuran Variasi Nominal Modus - Ordinal Modus, Median Range Interval Modus, Median, Rata-rata Hitung Range, Standard Deviasi, Variance Rasio Modus, Median, Rata-rata Hitung, Rata-rata Geometrik, Rata-rata Harmonis Range, Standard Deviasi, Variance, Coefisien Variasi Koord. Tim ADK Koord. Tim ADK

STATISTICAL TOOLS vs TIPE DATA Koord. Tim ADK

REF: Agresti, A. Categorical Data Analysis. New York: John wiley & Sons, 1990 Fienberg, SE. The Analysis of Cross-Classified Categorical Data. Massachusets: MIT Press, 1978 Azen, R. and Walker, C.M. (2011). Categorical Data Analysis for the Behavioral and Social Sciences. New York: Taylor and Francis Group, LLC Hosmer DW & Lemeshow DW. Applied Logistic Regression, New York: John wiley & Sons, 1989 Agung Priyo Utomo - agung@stis.ac.id

DISTRIBUSI PROBABILITA DISKRIT Koord. Tim ADK

DISTRIBUSI PROBABILITA KONSEP PENTING: Variabel Acak (Random Variables) Tipe Distribusi Probabilita (Diskrit & Kontinu) Nilai harapan (Expected Value) dan Varian (Variance) Berbagai Jenis Distribusi Probabilita Diskrit Binomial Multinomial Poisson Negatif Binomial Hypergeometrik Koord. Tim ADK

KONSEP PENTING Variabel Acak (Random Variables) Anderson (2002): Variabel acak merupakan gambaran secara numerik mengenai hasil dari suatu percobaan Walpole (1982): Variabel acak merupakan suatu fungsi yang nilainya berupa bilangan nyata yang ditentukan oleh setiap unsur dalam ruang contoh. Koord. Tim ADK

KONSEP PENTING (L) Variabel acak dapat dibagi dalam 2 jenis: Diskrit, yaitu bila suatu ruang contoh mengandung jumlah titik contoh yang terhingga atau suatu barisan unsur yang tidak pernah berakhir tetapi yang sama banyaknya dengan bilangan cacah. Contoh: Jumlah penderita HIV/AIDS pada tahun tertentu, jumlah mahasiswa, jumlah anak jalanan, dsb Kontinu, yaitu bila suatu ruang contoh mengandung takhingga banyaknya titik contoh yang sama dengan banyaknya titik pada sebuah ruas garis Contoh: Pendapatan seseorang perbulan, skor emosional seseorang, jarak antar wilayah, dsb Koord. Tim ADK

DEFINISI DISTRIBUSI PROBABILITA Distribusi probabilita untuk suatu random variabel menggambarkan bagaimana probabilita terditribusi untuk setiap nilai random variabel. Distribusi probabilita didefinisikan dengan suatu fungsi probabilita, dinotasikan dengan f(x), yang menunjukkan probabilita untuk setiap nilai random variabel. Ada 2 tipe distribusi probabilita: Diskrit Kontinu Koord. Tim ADK

DISTRIBUSI PROBABILITA DISKRIT Distribusi probabilita diskrit, yaitu apabila random variabel yang digunakan diskrit. Syarat: p(x) ≥ 0  peluang suatu kejadian tidak pernah bernilai negatif  p(x) = 1  total peluang semua kejadian yang mungkin Distribusi probabilita diskrit dapat digambarkan dalam bentuk tabel, grafik, maupun persamaan. Koord. Tim ADK

DISTRIBUSI PROBABILITA DISKRIT (L) Contoh distribusi probabilita diskrit Misal data penderita gangguan mental di wilayah A, distribusi probabilita adalah sebagai berikut: Jumlah penderita Jumlah desa X p(x) 80 0,40 1 50 0,25 2 40 0,20 3 10 0,05 4 20 0,10 200 1,00 Koord. Tim ADK

DISTRIBUSI PROBABILITA DISKRIT (L) Representasi distribusi probabilita data penderita gangguan mental di wilayah A secara grafik: Probabilita Nilai variabel acak x (penderita gangguan mental) Koord. Tim ADK

1. BINOMIAL Sifat percobaan Binomial Percobaan dilakukan dalam n kali ulangan yang sama. Kemungkinan yang terjadi pada tiap ulangan hanya ada 2, yaitu “sukses” atau “gagal”. Probabilita “sukses” yang dinotasikan dengan p selalu tetap pada tiap ulangan. Tiap ulangan saling bebas (independent). Koord. Tim ADK

1. BINOMIAL (L) Fungsi Probabilita Binomial dimana x = banyaknya sukses yang terjadi dalam n kali ulangan p = probabilita “sukses” n = banyaknya ulangan Nilai Harapan (Expected Value): E(x) =  = np Varian: Var(x) = 2 = np(1 - p) Koord. Tim ADK

1. BINOMIAL (L) CONTOH: RS A Misalkan di RS A terdapat 3 orang pasien sakit jantung, dan pimpinan RS yakin bahwa probabilita pasien dapat sembuh adalah 0,1. Berapa probabilita bahwa 1 orang akan sembuh? Pada kasus ini, p = 0,1 n = 3 x = 1 Koord. Tim ADK

1. BINOMIAL (L) CONTOH: RS A = (3)(0,1)(0,81) = 0,243 Nilai Harapan: E(x) =  = np = 3.(0,1) = 0,3 Varian: Var(x) = 2 = np(1 - p) = 3(0,1)(0,9) = 0,27 Simpangan Baku:  = 0,52 Koord. Tim ADK

1. BINOMIAL (L) Binomial (Lanjutan) CONTOH: RS A Menggunakan Tabel Binomial Koord. Tim ADK

1. BINOMIAL (L) Jika n  , maka Bin(n,p) ~ Normal Transformasi: Penyesuaian variabel diskrit ke distribusi kontinu diperlukan faktor koreksi kontinuitas (continuity correction) sebesar |0,5| Koord. Tim ADK

KASUS Batuk Total Ya Tidak Merokok 7 6 13 4 8 12 11 14 25 Suatu penelitian cross- sectional dilakukan dengan menentukan dan mengambil total ukuran sampel sebanyak 25 orang. Kemudian ditanya apakah mereka sering menderita batuk atau tidak. Jawaban mereka diklasifikasikan menurut apakah mereka mempunyai kebiasaan merokok atau tidak. Datanya sbb: Bila dipilih 10 orang secara acak dari kelompok tersebut, berapa peluang yang terpilih 3 orang yg merokok sering menderita batuk, 2 orang tidak merokok sering menderita batuk, dan 5 orang tidak merokok yg tidak sering menderita batuk? Koord. Tim ADK

2. MULTINOMIAL Contoh: Pendapatan keluarga dapat diklasifikasikan ke dalam 5 kelompok Tikus dapat merespon suatu stimulus dengan 3 cara Produk suatu industri dapat diklasifikasikan dalam “kualitas baik”, “kualitas sedang”, “kualitas buruk” Tingkat kecerdasan seseorang dapat dikategorikan menjadi “tinggi”, “sedang”, “rendah” Koord. Tim ADK

2. MULTINOMIAL (L) Definisi: Bila suatu percobaan (trial) dpt menghasilkan k outcomes O1, O2, …, Ok dg peluang p1, p2, …, pk, maka variabel acak X1, X2, …, Xk yg menyatakan banyaknya kejadian O1, O2, …, Ok dlm n percobaan akan berdistribusi multinomial dg fungsi peluang: Rata-rata: E(Xi) = μ = npi Varian: Var(Xi) = npi(1-pi) Koord. Tim ADK

2. MULTINOMIAL (L) Jika n  , maka Multinomial ~ 2  banyak digunakan dalam cross-tabulation analysis Sifat-sifat: Terdiri dari n percobaan yang identik dan bersifat bebas Outcome dari tiap percobaan mpk salah satu dari k kategori yg mungkin Prob dr suatu kategori i (pi) bersifat konstan dari satu percobaan ke percobaan lain, dimana p1 + p2 +…+ pk = 1 Pengamatan dan penghitungan dilakukan pada banyaknya observasi dari outcome untuk tiap kategori, yaitu O1, O2, …, Ok, dimana O1 + O2 + … + Ok = n Koord. Tim ADK

Distribusi binomial maupun multinomial mensyaratkan bahwa ukuran sampel (n) tetap Bagaimana jika kejadian atau percobaan memiliki n yang tidak tetap atau bahkan tak terhingga? Contoh: Banyaknya kecelakaan lalu lintas di suatu persimpangan jalan selama waktu tertentu Banyaknya siswa yang kesurupan di suatu sekolah dalam suatu bulan tertentu Banyaknya bakteri dalam suatu cairan persatuan volume Banyaknya orang stres di suatu wilayah dalam satu minggu tertentu Koord. Tim ADK

Sifat percobaan Poisson Peluang suatu kejadian adalah sama untuk 2 (dua) interval yang sama. Kejadian pada suatu interval saling bebas dengan kejadian pada interval yang lain Peluang suatu kejadian “sukses” dalam suatu percobaan tertentu adalah kecil Jika n  , dan p  0, maka np = λ, dimana λ mpk parameter distribusi poisson Merupakan pendekatan yg akurat untuk distribusi binomial, khususnya jika np < 7 Koord. Tim ADK

Fungsi Probabilita Poisson x = 0, 1, 2, … dimana x = banyaknya kejadian pada interval waktu tertentu λ = rata-rata banyaknya kejadian pada interval waktu tertentu e = 2.71828 Rata-rata = Varian = λ Koord. Tim ADK

CONTOH: RUMAH SAKIT MERCY Di RS Mercy, rata-rata pasien mendatangi UGD pada akhir minggu adalah 3 pasien per jam. Berapa probabilita ada 4 pasien mendatangi UGD pada akhir minggu? λ = 3 pasien perjam, x = 4 Berapa peluang lebih dari 3 pasien mendatangi UGD pada akhir minggu? Koord. Tim ADK

CONTOH: RUMAH SAKIT MERCY Menggunakan Tabel Poisson Koord. Tim ADK

4. NEGATIVE BINOMIAL Random variabel yang diamati menyatakan banyaknya percobaan/trial untuk menghasilkan sukses yang ke-k Ilustrasi: x ● ● ● … ● ● Sukses ke-k x–1 trial Fungsi peluang: 𝑓 𝑥 = 𝑥−1 𝑘−1 𝑝 𝑘 (1−𝑝) 𝑥−𝑘 x = k, k+1, k+2, … k = 1, 2, … Rata-rata = E(X) = 𝑘 𝑝 Varian = Var(X) = 𝑘(1−𝑝) 𝑝 2

5. HIPERGEOMETRIK Pada distribusi hypergeometrik, antar ulangan tidak bebas dan peluang sukses berubah dari satu ulangan ke ulangan yang lain Fungsi Probabilita Hipergeometrik dimana x = banyaknya sukses dalam n kali ulangan n = banyaknya ulangan N = banyaknya elemen populasi r = banyaknya sukses dalam populasi Koord. Tim ADK

5. HIPERGEOMETRIK (L) CONTOH: BATERAI BOB Bob berniat mengganti 2 baterai yang mati, namun ia tidak sengaja mencampurnya dengan 2 baterai yang baru. Keempat baterai terlihat identik. Berapa probabilita Bob mengambil 2 baterai yang masih baru? Koord. Tim ADK

RANGKUMAN

Problems Koord. Tim ADK