Teknik Sampling R. Widya Setiabudi Sumadinata, S.IP.,S.Si.,MT. Jurusan Hubungan Internasional FISIP UNPAD 2008
Tujuan Perkuliahan Setelah mengikuti perkuliahan ini mahasiswa akan mampu: Menjelaskan perbedaan sampel dan populasi Menjelaskan berbagai metode sampling Memahami keterkaitan the Central Limit Theorem dgn teknik sampling Memahami konsep Standard Error Memahami Standard Normal Curve Memahami Point and Interval Estimate calculations
Pendahuluan Sampling terkait dengan pengumpulan data Data berada dalam suatu “semesta” yang disebut populasi Populasi adalah keseluruhan elemen atau unsur yang akan kita teliti Populasi dapat berupa sekelompok orang, kejadian, atau benda, yang dijadikan obyek penelitian Jika seluruh unit populsi ingin diukur maka kita melakukan sensus Hasil pengukuran yang diambil dari suatu populasi disebut parameter Sensus tidak selalu dapat dilakukan karena berbagai alasan
Mengapa Sampling ? populasi demikian banyaknya sehingga dalam prakteknya tidak mungkin seluruh elemen diteliti keterbatasan waktu penelitian, biaya, dan sumber daya manusia kadang, penelitian yang dilakukan terhadap sampel bisa lebih reliabel daripada terhadap populasi misalnya, karena elemen sedemikian banyaknya maka akan memunculkan kelelahan fisik dan mental para pencacahnya sehingga banyak terjadi kekeliruan. (Uma Sekaran, 1992)
Ilustrasi Berita PR: Kota Bandung Udaranya Tercemar ! Diduga penyebab utamanya asap kendaraan bermotor Pemkot ingin mengecek apakah Ranmor yang ada di Bandung dapat lolos uji emisi gas buang Tentu saja tidak dapat diuji seluruh kendaraan yang ada di kota Bandung Tdk semua unit dalam populasi dpt diidentifikasi Contohnya: Ingin mengukur tingkat polusi udara kota Bandung: Harus diambil sampel Bahkan bila populasi dapat diukur, maka muncul hambatan berikutnya: Terlalu mahal Terlalu banyak menyita waktu untuk mengukurnya Data bisa obsolete
Alasan lain mengapa harus Sampling ? Mempelajari populasi malah bisa jadi hasilnya tidak akurat, terutama populasinya besar. Manajemen proyeknya lebih gampang dengan sampling: bisa ada waktu tambahan untuk memperbaiki interview/questionnaire design prosedur mendapatkan responden (yang sulit ditemukan) rekrutmen, pendidikan dan latihan, serta supervisi data collectors
Gambaran Sampling When we undertake a survey, to collect data, we are effectively sampling from a population. It is therefore necessary to define the population and the sampling method (of which there are many). population Samples
Definisikan Populasi Secara Tepat Jika yang ingin diteliti adalah sikap konsumen terhadap satu produk tertentu, maka populasinya adalah seluruh konsumen produk tersebut. Jika yang diteliti adalah laporan keuangan perusahaan “X”, maka populasinya adalah keseluruhan laporan keuangan perusahaan “X” tersebut, Jika yang diteliti adalah motivasi pegawai di departemen “A” maka populasinya adalah seluruh pegawai di departemen “A”. Jika yang diteliti adalah efektivitas gugus kendali mutu (GKM) organisasi “Y”, maka populasinya adalah seluruh GKM organisasi “Y”
Mendefinisikan Populasi Jika yang ingin diteliti adalah sikap warga Jawa Barat terhadap kandidat gubernur maka populasinya adalah … Jika Anda meneliti pengaruh narkoba terhadap resiko melahirkan maka populasinya adalah … Jadi hati-hati dalam menentukan populasi
Kesalahan Menentukan Populasi Misalnya memilih populasi di mal pada hari sabtu untuk memilih sampel secara acak: Kemungkinan overrepresent weekdays worker dan underrepresent kelompok lain seperti anak2, pensiunan, pengangguran Pemilihan mal, mal “elit” sampel lebih representatif ke golongan A, mal “kurang elit” sampel lebih representatif ke golongan menengah ke bawah Akibatnya populasi yang direpresentasikan hanya bisa: para pengunjung mal “X” hari Sabtu Nilai generalisasi yang rendah.
Cara Mendefinisikan Populasi tentukan kriteria yang digunakan untuk menentukan kasus2/item2 apa yang masuk populasi dan kasus2/item2 mana yang tidak masuk. Seringkali ikut menentukan populasi target: lokasi dan waktu. mengapa memilih target populasi “A”? Tujuan dan pertimbangan praktis mempengaruhi (seperti setiap hal lainnya, apa reasoning-nya). Contoh: “Mahasiswa FISIP”, apakah Jurusan HI, Ane, Ani? apakah program S1 saja? S2?
Ideal Sample a representative sample has similar characteristics in similar proportions to those in the target population the method of sampling needs to be unbiased So, you need to know the characteristics of the target population before you can select a representative sample the people in the target population are called the sampling frame the characteristics of a sampling frame concern information about the people.These may be: Gender Ages Marital Status Economic Groupings The importance of the characteristics within the sampling frame will depend on the subject of the survey.
dapat mewakili sebanyak mungkin karakteristik populasi harus valid, yaitu bisa mengukur sesuatu yang seharusnya diukur kalau yang ingin diukur adalah masyarakat Sunda sedangkan yang dijadikan sampel adalah hanya orang Banten saja, maka sampel tersebut tidak valid, karena tidak mengukur sesuatu yang seharusnya diukur (orang Sunda). valid ditentukan oleh dua pertimbangan
Sampling Methods RANDOM SAMPLING STRATIFIED SAMPLING QUOTA SAMPLING CLUSTER SAMPLING SNOWBALL SAMPLING CONVENIENCE SAMPLING PANELS FOCUS GROUPS
X X X THE SAMPLE MEAN IS AND THE POPULATION MEAN is µ The Greek letter µ is commonly used to denote the population mean. The symbol – (the letter X with a vertical bar above it) is used to denote the sample mean. It is a convention in statistics to use Greek letters for population quantities and Western alphabetic characters for sample estimates. is an estimator of µ. We may, of course, wish to estimate other quantities as well as the mean. X X
Central Limit Theorem
Standard Error Note: Standard Error of the Mean The value / N is usually dignified with the special title of standard error of the mean. It is an important value because it tells the analyst how accurate (variable) the sample statistic is. Most sample statistics have their own standard error.
Standard Error Example
Standard Error Example
Tables for Standard Normal Curve (extract)
Point and Interval Estimates The population mean, (receipts in a small firm) is £50, with standard deviation £10. A sample of 36 accounts is taken, and the mean for this sample is calculated. The sample mean will vary, according to the particular random sample chosen. Calculate the values, a and b, such that the following 3 conditions are satisfied. (i). Pr(a < X < b) = 0.95 (ii). Pr(X < a) = 0.025 (iii). Pr(X > b) = 0.025
Point and Interval Estimates
Point and Interval Estimates
Point and Interval Estimates
Point and Interval Estimates For the same data, calculate the values a and b such that the following 3 conditions are satisfied. i. Pr(a < X < b) = 0.99 ii. Pr( X < a) = 0.005 iii. Pr( X > b) = 0.005
Point and Interval Estimates
Point and Interval Estimates We require 2 values a and b which satisfy all the conditions. In equation 1 of the earlier solution, instead of -1.96, the value of Z becomes -2.575. In equation 2 instead of 1.96, the value of Z becomes 2.575. (I have chosen + and -2.575 rather than 2.57 or 2.58 because the appropriate area for 99% lies approximately halfway between these two latter values). Recalculation of these equations gives a = £45.71 b = £54.29
Summary of Lecture In this lecture you have examined the following: The differences in samples and population Sampling Methods The Central Limit Theorem The Standard Error The Standard Normal Curve Point and Interval Estimates You should now complement these areas with readings from the recommended texts and resources for sampling.
Lecture 2a Workshop 2a Lecture 2a: Will develop sampling onto hypothesis testing Workshop 2a : Will practice examples for sampling
Apakah Sampel Itu ? Bagian dari proses pengumpulan data Data berada dalam suatu “semesta” data populasi
Dasar Pemikiran Pada suatu penelitian, tidak selalu diperlukan untuk meneliti semua individu dalam populasi (sensus), karena beberapa alasan Biaya yang besar Waktu yang lama “destructive sampling” Dengan meneliti sebagian dari populasi (sampling), diharapkan dapat menggambarkan sifat populasi.
Ukuran Sampel Derajat keseragaman Presisis yang dikehendaki Rancangan analisis
Perancangan Sampling Dapat dibedakan menjadi 2, yaitu: Probability Sampling Non Probability Sampling
Teknik/Metode Sampling Sampling Random (Probability Sampling) Simple Random Sampling Stratified Sampling Cluster Sampling Systematical Sampling Sampling Non-Random (Non Probability Sampling) Convenience Sampling Purposive Sampling Quota Sampling
Probability Sampling Menentukan probabilitas atau besarnya kemungkinan setiap unsur dijadikan sampel Dalam merencanakan sampling probabilitas, idealnya peneliti telah memenuhi beberapa persyaratan berikut: Diketahui besarnya populasi induk Besarnya sampel yang diinginkan telah ditentukan Setiap unsur atau kelompok unsur harus memiliki peluang yang sama untuk dijadikan sampel
Cara Stratifikasi Populasi dianggap heterogen Dikelompokkan: subpopulasi anggota kelompok subpopulasi menjadi homogen Dari tiap subpopulasi scr acak diambil anggota sampelnya Berapa jumlah sampel yang diambil dari tiap populasi ? Jika jml elemen tiap populasi sama Misalnya jumlah sampel sdh diketahui mis. 150 sama jmlhnya Jika jml elemen tiap populasi beda: A:10, B:20,C:30,D:40, nA=(10/100)x 150
Cara Klaster Simple random sampling dan stratified random sampling berasumsi ada list lengkap dari anggota populasi. Kalau tidak ada? Cluster sampling bisa digunakan. Pertimbangan biaya juga merupakan alasan lainnya. Populasi dibagi-bagi menjadi sekelompok kasus yang disebut clusters biasanya berdasarkan pembagian alami seperti lokasi, golongan sosioekonomi, dsb. Beda dengan stratified: stratified mengambil sampel dari tiap strata cluster sampling tidak mengambil sampel dari tiap cluster, hanya cluster yang dipilih saja. bila stratifikasi subpopulasinya homogen bila subpopulasinya heterogen klaster Kurang akurat dibandingkan dengan simple random sampling atau stratified random sampling untuk jumlah n yang sama. Akurasi dapat ditingkatkan dengan mengambil sampel dari cluster2 lain
Sistematik Sampling Systematic sampling: memilih kasus setiap interval dari list lengkap anggota populasi. Syaratnya dua: Sampling interval (K) Dan lokasi start. Misalnya perlu sampel 100 dari 2500 orang, interval = 2500/100 = 25 (sampling interval). Kemudian tentukan nomor secara acak dari 1 sampai 25. Misalnya 19, berikutnya berarti 44, 69, dan seterusnya.
Non Probability Sampling Tidak mengukur sejauh mana karakteristik sampel mendekati parapemeter populasi induknya, sehingga dalam kenyatannya peneliti pada umumnya tidak dapat engidentifikasikan populasi induk sama sekali. Oleh karena itu sampel yang diambil tidak dapat digeneralisasikan pada populasi tempat sampel tersebut diambil. Karena itu kesalahan sampling tidak perlu dibahas karena memang perencanaan sampling Nonprobabilitas tidak dirancang ntuk bisa menyajian fungsi nferensial Kelemahan: Tidak ada kontrol terhadap investigator bias dalam pemilihan sampel Variabilitasnya tidak bisa dihitung menggunakan probability sampling theory tidak bisa menghitung sampling error atau sample precision.
Non Probability Sampling Convenience sample: also called an "accidental" sample or "man-in-the-street" samples. The researcher selects units that are convenient, close at hand, easy to reach, etc. Purposive sample: the researcher selects the units with some purpose in mind, for example, students who live in dorms on campus, or experts on urban development. Quota sample: the researcher constructs quotas for different types of units. For example, to interview a fixed number of shoppers at a mall, half of whom are male and half of whom are female.
Nonprobability Sampling (2) Dalam banyak kasus, cara sampling ini lebih tepat atau praktis: Situasi di mana jumlah kasus yang bisa diteliti terlalu sedikit, misalnya karena biaya terlalu besar untuk menyelidiki banyak kasus (misalnya unit analisa kota, negara, atau yang besar-besar lainnya), sementara probability sampling kurang reliabel untuk jumlah kasus yang terlalu sedikit. Peneliti hanya bisa bekerja dengan kasus yang ada saja Di awal penelitian suatu permasalahan, di mana tujuannya baru mengumpulkan informasi mengenai gejala (tujuan eksploratif), cukuplah menggunakan nonprobability sampling, belum diperlukan generalisasi statistik yang akurat. Kalau populasinya sendiri jumlah anggotanya kecil (misalnya di bawah 100).
Convenience sampling (1) Alias: incidental, accidental, haphazard, fortuitous sampling Peneliti memilih sejumlah kasus yang conveniently/readily available. Metode ini cepat, mudah, dan murah. Kalau penelitian permasalahan baru tahap awal dan generalisasi bukan masalah, metode ini boleh2 saja. Tapi karena sampel yang cuma “sedapatnya”, tidak bisa ditentukan hasil penelitian ini bisa diterapkannya ke mana kecuali ke sampel itu sendiri. In attempting to make inferences from such a sample, “one can only hope that one is not being to grossly misled” (sangat sinis)
Peneliti menggunakan expert judgement untuk memilih kasus2 yang “representatif” atau “tipikal” dari populasi. Pertama, identifikasi sumber2 variasi yang penting dari populasi. Berikutnya memilih kasus2 sesuai sumber2 variasi tersebut. Bisa dipilih satu kasus atau satu subpopulasi yang dianggap “representatif” atau “tipikal” yang memiliki karakteristik tertentu. Atau memilih beberapa kasus yang mewakili perbedaan2 utama dalam populasi. Teknik purposive sampling lainnya, biasanya untuk prediksi hasil election, adalah memilih propinsi tertentu yang telah bertahun-tahun memprediksikan hasil penghitungan suara nasional secara tepat.
Purposive sampling (2) Misalnya kalau di propinsi A partai X menang maka diprediksikan dengan sangat yakin (keyakinan sebesar korelasi historisnya) bahwa secara nasional partai X bakal menang. Tetap kurang bisa diterima dibandingkan probability sampling jika diperlukan generalisasi yang tepat dan akurat. Tetapi kalau berbagai hal membatasi, ya boleh lah. Secara umum lebih “kuat” dibandingkan convenience sampling tapi sangat tergantung expert judgement-nya peneliti. Kelemahan utama: informed selection seperti itu memerlukan pengetahuan yang cukup mengenai populasi.
Quota Sampling Quota sampling adalah sejenis purposive sampling yang ada kemiripan dengan proportionate stratified random sampling: Pertama, populasi dibagi-bagi menjadi strata yang relevan seperti usia, jenis kelamin, lokasi, dsb. Proporsi tiap strata diperkirakan atau ditentukan berdasarkan data eksternal kemudian total sampel dibagi-bagi sesuai proporsi ke tiap strata (kuota). Untuk memenuhi jumlah sampel untuk tiap strata, peneliti menggunakan expert judgement-nya. Misalnya populasi 55% pria 45% wanita. Sampel 100 orang berarti 55 pria dan 45 wanita. Pemilihan sampelnya sendiri tergantung penilaian peneliti. Bedanya dengan stratified random sampling, sampel diambil secara acak sedangkan dalam quota sampling, sampelnya dipilih berdasarkan pendapat subjektif peneliti pokoknya kuotanya terpenuhi (mirip2 convenience sampling).
Quota Sampling (2) Total sampel juga a convenience sample tapi ada kemiripan dengan populasi dalam karakteristik2 penting tertentu (karena pembuatan stratanya). Bias peneliti sangat mempengaruhi: pemilihan teman sebagai sampel, milih lokasi2 yang nyaman, dan sebagainya. Keuntungan: tidak perlu membuat sampling frame kalau perlu konfirmasi tinggal cari lagi yang baru asal kuota terpenuhi, tidak perlu menghubungi responden yang telah diwawancarai. Cepat, mudah dan murah.
Memilih Desain Sampling Tergantung pada: What is the stage of research? How will the data be used? What are the available resources for drawing the sample? How will the data be collected? Stage of research and data use Akurasi tidak terlalu penting kalau baru eksplorasi gejala, hal yang penting adalah menemukan pola2 tertentu dulu dan membuat hipotesis2 untuk penelitian lanjutan. Peneliti perlu menggunakan good judgement mereka untuk mendapatkan sampel yang tepat nonprobability sampling bisa digunakan Kalau cuma pingin me-list semua varians, cukup dengan sejumlah sampel dengan pendekatan nonprobability. Kalau hasil penelitian akan menjadi bahan decision making pemerintah misalnya, presisi diperlukan. Perlu probability sampling yang terkontrol dan jumlah sampel yang relatif banyak.
Memilih Desain (2) Available resources Method of data collection Jika akurasi menjadi pertimbangan utama, perlu digunakan sampling design yang menghasilkan sampel yang paling presisi. Tapi biayanya bisa jadi sangat mahal. Waktu, uang, bahan2 yang diperlukan, lokasi melimitasi sampling design. Sampling design disesuaikan kemampuan, kecil tapi jika prosedur-nya bagus hasilnya pun bagus. Method of data collection Keempat pendekatan (eksperimen, field research, survey research, documentary research) masing-masing berurusan dengan sampel. Eksperimen biasanya pakai convenience sampling, survai biasanya probability sampling, field research biasanya convenience atau purposive, documentary research sering menggunakan probability sampling.
Ukuran Sampel Ukuran Vs Kerepresentatifan (keterwakilan) Secara umum, semakin besar ukuran sampel akan semakin baik, karena ukuran sampel yang besar cenderung memiliki error yang kecil, sebagaimana telah kita temui pada latihan menggunakan tabel bilangan acak (random numbers). Namun demikian bukan berarti bahwa ukuran sampel yang besar sudah cukup memberikan garansi untuk mendapatkan hasil yang akurat. Sebagai contoh, Jika satu dari dua sampel dari seluruh negara terdiri dari satu jenis kelamin saja, berdasarkan ukurannya sampel ini besar amun tidak representatif. Ukuran oleh karena itu tidak lebih penting daripada kereprsentatifan.
Pertimbangan menentukan ukuran sampel Tingkat kesalahan Derajat keseragaman Rencana analisis Biaya, waktu, dan tenaga yang tersedia . (Singarimbun dan Effendy, 1989). Makin tidak seragam sifat atau karakter setiap elemen populasi, makin banyak sampel yang harus diambil. Jika rencana analisisnya mendetail atau rinci maka jumlah sampelnya pun harus banyak. Misalnya di samping ingin mengetahui sikap konsumen terhadap kebijakan perusahaan, peneliti juga bermaksud mengetahui hubungan antara sikap dengan tingkat pendidikan. Agar tujuan ini dapat tercapai maka sampelnya harus terdiri atas berbagai jenjang pendidikan SD, SLTP. SMU, dan seterusnya. Makin sedikit waktu, biaya , dan tenaga yang dimiliki peneliti, makin sedikit pula sampel yang bisa diperoleh. Perlu dipahami bahwa apapun alasannya, penelitian haruslah dapat dikelola dengan baik (manageable).
Pertimbangan menentukan ukuran sampel Heterogenitas dari populasi Tingkat presisi yang dikehendaki Tipe sampling design yang digunakan Resources availability Number of breakdowns planned in data analysis
Heterogenitas populasi Heterogenitas mengacu pada derajat perbedaan di antara kasus dalam suatu karakteristik. Semakin heterogen, jumlah kasus yang diperlukan semakin besar agar estimasinya reliabel. Ekstrimnya, kalau semua kasus sama (homogen, unidimensional), jumlah sampel cukup satu, kalau tidak ada yang sama, harus sensus. Satuan pengukuran statistik terbaik untuk heterogenitas populasi adalah standard deviation (s) berhubungan dengan standard error yang tadi dibahas. Rumus standard error = s/√(N). Semakin besar heterogenitas populasi, perlu semakin banyak sampel agar lebih presisi
Tingkat presisi yang dikehendaki Secara teknis mengacu pada standard error (seperti dijelaskan di atas). Tapi lebih mudah diilustrasikan dengan confidence interval. Pernyataan “rata2 populasi ada di antara 2-4” lebih presisi dibandingkan “rata2 populasi ada di antara 1-5”. Rumus standard error s/√(N), sampel perlu diperbesar agar standard error-nya mengecil. Agar standard error turun 1/2, N perlu naik empat kali lipat. Law of diminishing return, setelah terus2an, dibutuhkan jumlah N yang sangat besar agar standard error bisa turun. N = 100 s = 5 N = 400 s = 2.5 N = 2500 s = 1 N = 10000 s = 0.5 Sample size 2000-3000 sebenarnya standard error-nya sudah cukup kecil dan menambah jumlah sampel lagi “is not worth the additional cost”. Sampling design Misalnya tanpa menambah jumlah sampel presisi sampel bisa ditingkatkan dengan menggunakan stratified random sampling dan bukan simple random sampling, tapi cluster sampling perlu lebih banyak sampel. Resources availability
Rumus Ukuran Sampel Rumus Solvin Rumusan Gay Asumsinya bahwa populasi berdistribusi normal Rumusnya: n = N/(1+Ne2) Dimana: n = ukuran sampel N = ukuran populasi e = persen kelonggaran ketidaktelitian karena kesalahan pengambilan sampel. Rumusan Gay Ukuran minimum sampel yang dapat diterima berdasarkan pada desain penelitian yang digunakan, yaitu sebagai berikut: Metode Deskriptif : 10% populasi, untuk populasi relatif kecil minimal 20% populasi. Metode Deskriptif korelasional, minimal 30 subjek. Metode ex post facto, minimal 15 subjek per kelompok. Metode Eksperimental, minimal 15 subjek per kelompok.