PENGERTIAN DAN PROSEDUR CLUSTER SAMPLING
Definisi: Cluster Sampling adalah suatu metode penarikan contoh dimana masing-masing unit penarikan contohnya merupakan kumpulan elemen-elemen yang tidak saling tumpang tindih. Keragaman dalam cluster umumnya tinggi sedang antar cluster rendah, sehingga jumlah elemen dalam cluster harus kecil dan jumlah cluster harus besar.
Cluster atau unit sampling Ilustrasi: Populasi Variabel Elemen Cluster atau unit sampling Kota A Karakteristik rumah tangga Tempat tinggal Blok Kota B Pembelian baju Orang Sekolah Rencana karir Siswa Kelas Orang Desa Sikap sosial Orang Dewasa Desa File asuransi kesehatan Data medis Kartu Kelompok dari 10 kartu berurutan
Alasan: Seringkali dalam survei contoh, kita dihadapkan pada persoalan daftar kerangka contoh yang memuat seluruh unit-unit analisis dalam populasi tidak tersedia secara lengkap dan mutakhir, dan biaya untuk membuat daftar kerangka contoh sangat mahal, Biaya trasport antar unit-unit contoh sangat mahal dan tidak sebanding dengan biaya untuk penelitian per unit contoh
Keuntungan: Pegumpulan data untuk elemen yang berdekatan mudah, cepat dan secara operasional lebih baik/nyaman, Biaya kecil dibanding SRS pada penghematan waktu perjalanan, identifikasi, contact, dll, Ketika kerangka sampling dari elemen mungkin tidak tersedia dengan mudah. Kelemahan: Standard error yang dihasilkan sering lebih tinggi dibandingkan dengan metode sampling lain, karena listing unit dalam cluster yang sama sering homogen.
Cara menentukan unit-unit yang diteliti: Semua unit yang berada di dalam cluster-cluster terpilih dimasukan sebagai anggota contoh (Single Stage Cluster Sampling). Tidak semua unit di dalam cluster-cluster terpilih diteliti (Multi Stage Cluster Sampling).
Single Stage Cluster Sampling Digunakan dalam situasi dimana biaya menghasilkan setiap unit listing dalam cluster tidak lebih tinggi dari pada biaya menghasilkan sebagian dari unit listing. Contoh: Sebuah survei mengenai riwayat penyakit dimana rumah sakit sebagai cluster dan pasiennya sebagai listing unit. Bila informasi yang dibutuhkan mengenai rangkuman riwayat pasien sudah tersedia pada data base komputer mungkin lebih murah dan enak bila seluruh pasien dijadikan unit listing. Namun bila tidak tersedia atau harus kita rangkum lagi, mungkin lebih baik kita pilih sampel.
Equal Size Cluster Sampling Umumnya merupakan hasil dari kondisi-kondisi yang direncanakan dan jarang sekali terjadi di alam atau dalam masyarakat, contohnya: rokok dalam pak, mie dalam kardus, dsb. Elemen Cluster 1 2 … i N Y11 Y21 Yi1 YM1 Y12 Y22 Yi2 YM2 . j Y1j Y2j Yij YMj M Y1n Y2n Yin YMn Total Y1. Y2. Yi. YM. Mean Y1./n Y2./n Yi./n YM./n
Notasi:
Notasi (lanjutan):
Equal Size Cluster Sampling (lanjutan) Teorema: Dalam SRS-WOR dari n cluster yang berisi M elemen yang berasal dari sebuah populasi N cluster, rata rata adalah perkiraan tak bias dari dengan varians: M = 1, varians cluster akan sama dengan varians SRS (dengan nM elemen) M > 1 dan positif, varians cluster akan lebih besar dari varians rata-rata per elemen M > 1 dan negatif, varians cluster akan lebih kecil dari varians rata-rata per elemen
Equal Size Cluster Sampling (lanjutan) Teorema: Dalam SRS-WOR dari n cluster yang berisi M elemen yang berasal dari sebuah populasi N cluster, total populasi yang tidak biasnya adalah: dengan varians:
Relatif Efisiensi Relatif efisiensi dari sampling cluster adalah merupakan perbandingan antara varians cluster dengan varians SRS
Relatif Efisiensi (lanjutan) RE dapat dengan mudah dihitung dengan terlebih dahulu menduga besarnya dari sampel. Untuk N besar, rumus RE dapat disederhanakan:
Deff = 1 + (M-1) Cluster sampling akan lebih efisien bila nilai adalah negatif namun dalam prakteknya lebih sering bernilai positif
Tabel Anova Source of Variance Degrees of freedom Mean Square Between Cluster (n-1) Within Cluster n(M-1) Total nM-1
Jumlah Cluster Ukuran Cluster S2 Cluster Sampling Koefisien Korelasi Antar kelas S2
Cluster Sampling for Proportion Misalkan ai menotasikan jumlah elemen-elemen dalam cluster ke-i yang memiliki karakteristik tertentu, maka proporsi elemen-elemen dalam sampel sebanyak n cluster yang memiliki karakteristik tersebut adalah: Dengan varians:
Unequal Size Cluster Sampling Anggap ada sejumlah N cluster dan setiap cluster berisi Mi elemen; (i = 1,2,3,…N), maka mean populasi setiap elemen adalah
Mo tidak diketahui dan variasi ukuran cluster tidak jauh berbeda Unequal Size Cluster Sampling (lanjutan) Sebuah sampel diambil secara acak, wor, dari se-jumlah n cluster dan seluruh elemen dalam cluster diteliti, maka penduga rata-ratanya adalah: 1. Penduga yang bias: Mo tidak diketahui dan variasi ukuran cluster tidak jauh berbeda Dengan varians:
Mo tidak diketahui dan mempertimbangkan variasi ukuran cluster Unequal Size Cluster Sampling (lanjutan) 2. Penduga yang bias, tapi konsisten: Mo tidak diketahui dan mempertimbangkan variasi ukuran cluster Dengan varians:
Unequal Size Cluster Sampling (lanjutan) 3. Penduga yang unbias: Mo diketahui (dalam prakteknya sulit diperoleh) dan varians yang dihasilkan cenderung besar Dengan varians:
RE dari Unequal Size Cluster Sampling (lanjutan)
Unequal Size Cluster Sampling (lanjutan) Penduga Proporsi Dengan varians:
Banyaknya Cluster terpilih naik So, bagaimana agar seimbang??? Optimum Cluster Size Varians naik Cluster size naik Biaya turun Varians turun Banyaknya Cluster terpilih naik Biaya naik So, bagaimana agar seimbang???
Optimum cluster size dan banyaknya cluster terpilih Biaya tetap varian minimum dan varian tetap biaya minimum
Biaya pencacahan per unit Biaya Survei Biaya per cluster C = C0 + C1 n + C2 nM Biaya tetap Biaya pencacahan per unit
Konstanta tergantung pada region area Konstanta tergantung pada region area Biaya kegiatan awal (identifikasi, kontak, dll) Biaya perjalanan
Mi sering diketahui berupa perkiraan atau keadaan yang lampau. Varying Probability Cluster Sampling Dalam situasi praktis biasanya ukuran cluster mempunyai korelasi positif dengan variabel yang diteliti. Penarikan sampel bisa dengan peluang banyaknya elemen dalam cluster atau karakteristik lainnya. Mi sering diketahui berupa perkiraan atau keadaan yang lampau.
Bila unit diambil dengan PPS dimana pi = Mi/M0 dan dilakukan WR, maka: PPS WR dengan size banyaknya elemen PPS WR dengan size bukan banyaknya elemen
n11 n12 n21 n22 Stratified Cluster Sampling N1 Cluster N Cluster y111 y112 . y11M y121 y122 . y12M y211 y212 . y21M y221 y222 . y22M
Stratified Cluster Sampling