Materi 4 Rancangan penarikan sampel tertimbang sendiri ( self-weighting design ) 1) Manfaat Penimbang yang seragam Penarikan sampel dan menentukan peduga, terutama utk penarikan sampling bertahap membutuhkan prosedur yg rumit terutama pada penentuan penduga dalam tabulasinya. Pada bagian ini akan didiskusikan penduga yang sering digunakan serta prosedur yg lebh sederhana, sehingga mengurangi beban saat melakukan tabulasi. Tujuan survei mendptkan penduga karakteristik populasi dg data dari sampel. Utk mendptkan penduga karakteristik populasi, penduga dari sampel perlu ditimbang dg suatu nilai tertentu. Penduga total populasi biasanya dituliskan = jumlah ultimate sampling unit (usu) = nilai karakteristik yg berpadanan dg usu ke – i = penimbang yg berpadanan dg usu ke – i Penimbang tergantung pada prosedur penarikan sampel dan penduga yg ditentukan dan biasanya dipilih yg tidak bias (unbiased). Penimbang pada dikenal sebagai faktor pengali (multiplier, inflation factor), karena dipakai utk mem blow – up nilai yg diperoleh dari sampel utk mendptkan penduga populasi. ( 1 ) ( 1 )
semua unit sampel dinyatakan sebagai Sebagai contoh dalam SRSWR/WOR, sistimatik sirkuler, penimbang yg digunakan pada semua unit sampel dinyatakan sebagai yang merupakan kebalikan fraksi sampling dan dalam sistimatik linear dinyatakan sebagai k (interval pemilihan sampel). Dalam pps sampling, penimbang antar unit biasanya bervariasi, oleh karena itu utk suatu unit sampling penimbang dinyatakan sebagai = jumlah ultimate sampling unit (usu) = peluang terpilihnya unit ke – i Dalam rancangan sampling dua tahap, dengan jumlah sampel pstp (penarikan sampel tahap pertama) sebanyak yg dipilh secara pps, dan unit merupakan jumlah unit pada pstd (penarikan sampel tahap dua) yang dipilih dari secara SRSWOR atau sistimatik linear, penimbang dapat dituliskan Karena penimbang tdk tergantung pada pengamatan sampel secara individual, pertama dihitung penimbang setiap unit penarikan sampel pd tahap pertama dan kemudian digunakan utk mengalikan setiap nilai berbagai karakteristik yg diteliti utk mendptkan nilai peduganya. ( 2 ) ( 3 ) ( 4 )
penimbang yg berlaku utk setiap unit sampling Dalam survei yg besar dg banyak parameter yg diduga, penghitungan penimbang dalam tahapan estimasi menjadi rumit dikaitkan dg waktu dan biaya utk kepraktisan dan efisiensi sampai tahap tabulasi dibutuhkan rancangan sampling yg mempunyai satu penimbang yg berlaku utk setiap unit (rancangan penarikan sampel tertimbang sendiri --self-weighting design atau equi-weighting design) Dalam rancangan penarikan sampel tertimbang sendiri (self-weighting design), persamaan dapat disederhanakan menjadi : penimbang yg berlaku utk setiap unit sampling Rancangan sampel dg penimbang yg seragam utk setiap unit sampling self-weighting design at field stage. Misalnya rancangan sampling bertahap dpt dibuat self weighting design dg cara menentukan banyaknya ultimate sampling unit yg harus dipilih. Dalam kasus tertentu suatu teknik sampling dpt mereduksi banyaknya penimbang pada tahapan tabulasi self-weighting design at tabulation stage. Pada survei yg besar sering digunakan rancangan sampling yg memenuhi syarat ke dua kriteria di atas. ( 1 ) ( 5 )
a) Stratified random sampling. 2) Stratified Sampling a) Stratified random sampling. Pada rancangan stratified sampling SRSWR, SRSWOR, sistimatik sirkuler dan bukan self – weighting, penduga total ditulis = ukuran unit pd stratum ke – h = ukuran sampel pd stratum ke – h = nilai karakteristik pd unit sampel ke – i yg dipilih dari stratum ke – h. Faktor pengali bervariasi antar stratum, kecuali bila sampel dialokasikan secara proporsional thp . Dg demikian, rancangan sampel akan menjadi self – weighting apabila sampel dialokasikan kedalam setiap stratum proporsional thp sdmkian rupa shg atau substitusi ke penduga total dituliskan dg varian ( 6 ) ( 7 ) ( 7 ) ( 6 ) ( 8 ) ( 9 )
b) Stratified PPS sampling Pada rancangan stratified PPS sampling dg pemilihan pada strata secara PPSDP dg size , penduga yg tidak bias dari total karakteristik dituliskan = nilai variabel pd unit sampel ke – i stratum ke – h = size pemilihan sampel pd stratum ke – h, total size = ukuran sampel pd stratum ke – h, ukuran sampel secara keseluruhan (overall sample size) Rasio ( selanjutnya dinyatakan ) dapat diamati di lapangan atau diperoleh dari para pencacah secara mudah. Rancangan akan menjadi self-weighting apabila sampel dialokasikan ke dalam setiap stratum secara proporsional thp size sdmkn rupa shg penduga total karakteristik dpt dituliskan dg varian , ( 10 ) ( 11 ) ( 12 ) ( 13 )
c) Stratified two-stage sampling pstp dipilih secara ppswr dg size pstd sistimatik linear, penduga yg tidak bias dari adalah penimbang penduga nilai total Agar menjadi self-weighting design dan ditentukan sdmkn rupa shg penimbang konstan sebesar . Utk nilai yg belum diketahui, rancangan menjadi self-weighting utk Banyaknya sampel pstd dan pstp ke - i ( 14 ) = nilai pengamatan ke – j, pstp ke – i, yg dipilih dr stratum ke – h = nilai variabel pd pstp ke – i stratum ke – h = interval sampling pd pstp ke – i stratum ke – h = size pemilihan pd pstp ke – I, stratum ke – h = total ukuran pd stratum ke – h = size pemilihan pd stratum ke – h ( 15 ) ( 16 ) ( 17 )
Dari terlihat bhw bila semakin besar ukuran sampel pstd mengecil bila semakin kecil ukuran sampel pstd membesar, melebihi yg dibutuhkan; harus ditentukan utk mendptkan ukuran sampel pstd yg dibutuhkan. Bila sampel yg dibutuhkan secara rerata adalah , maka nilai harapan ukuran sampel dapat dituliskan merupakan kebalikan dari overall sampling fraction ( 17 )
d) Contoh aplikasi (1) Suatu populasi terdiri atas 160 perusahaan industri y terbagi menjadi 6 strata. Ukura sampel yg akan ditarik 20 perusahaan. Rancangan I self-weighting, penarikan dg cara sistimetik linear dg interval 8 pada setiap stratum. Rancangan ini akan menimbul kan beban kerja yg bervariasi antar strata. Utk mengatur agar beban kerja antar strata tidak terlalu berbeda, dibuat rancangan II, yaitu dengan cara mengalikan / membagi interval dg suatu bilangan bulat sdmkn rupa shg beban kerja antar strata berkisar antara 3 – 4 perusahaan. Rancangan II tidak seluruhnya self-weighting, krn penimbang pada beberapa strata berubah seiring dg perubahan interval, shg rancangan II disebut sbg partially self-weighting. Interval pemilihan sampel dan expected sample size disajikan pada tabel berikut. Tabel 4.1. : Ukuran Strata, Interval Sampling dan Nilai Harapan Sampel Jumlah Persh Rancangan I Rancangan II Strata (h) 1 2 3 4 5 6 52 14 25 28 12 29 160 8 6,500 1,750 3,125 3,500 1,500 3,625 16 4 8 3,250 3,500 3 125 3 500 3,000 3,625
Pada rancangan I, interval setiap stratum = 160 / 20 = 8 Interval dikalikan 2 harapan ukuran sampel menjadi setengahnya Interval dibagi 2 harapan ukuran sampel menjadi 2 kali lipat. Rancangan I sampel dialokasikan sebanding ukuran strata shg lebih efisien dibanding rancangan II dlm hal sampling variannya. Rancangan II diterapkan bila ada manfaat dr penyeimbangan beban kerja. (2) Populasi terdiri atas 16 desa yg terbagi menjadi 4 strata. Rancangan sampling stratifikasi dua tahap self-weighting (stratified two stage design self weighting). unit pstp desa unit pstd rumah tangga pstp setiap stratum dipilh satu desa secara pps dg size jumlah penduduk pstd setiap desa terpilih dipilih sejumlah rumahtangga secara sistimatik linear. jumlah rumahtangga 7198 jumlah sampel yg direncanakan 80 faktor pengali yg konstan mrpkn kebalikn overall sampling fraction = 7198 / 80 90 jumlah desa yg diambil dr setiap stratum = 1 ( = 1 ). Rancangan I : diperoleh dr rmus , diperoleh dr rmus Contoh : stratum – 1, desa – 1, = 90 (1) (1618) / 6887 = 21,14 = 360 / 21,14 = 17, 0. Utk Rancangan II, penghitngan intrval dan jmlh rmhtangga terplih rmus yg sama. Rancangan I self weighting, shg faktor pengali sama yaitu 90 Rancangan II keseimbangan beban kerja antar strata. ( 16 ) ( 17 )
(1) (2) (3) (4) (5) (6) (7) (8) (9) (10) 1 2 3 4 Tabel 4.2.: Self Weighting Two Stage Stratified Design No Desa Jumlah Penduduk Jumlah Rumah tangga Rancangan I Rancangan II Strata (1) (2) (3) (4) (5) (6) (7) (8) (9) (10) 1 2 3 4 1618 1402 699 3168 360 255 140 704 21,14 18,31 9,14 41,47 17,0 13,9 15,3 90 21,14 18,31 9,14 41,47 17,0 13,9 15,3 90 1 Sub Jumlah 1 6887 1459 1 2 3 4 4006 7917 2122 2355 728 1588 472 428 21,99 43,44 11,65 12,02 33,1 36,6 40,5 90 43,98 86,88 23,30 25,84 16,6 18,3 20,2 180 2 Sub Jumlah 2 16400 3216 1 2 3 4 490 533 284 2172 98 118 52 434 12,67 13,79 7,34 56,20 7,7 8,6 7,1 90 6,34 6,90 3,67 28,10 15,4 15,2 14,2 45 3 Sub Jumlah 3 3479 702 1 2 3 4 684 2656 2726 2872 155 493 545 638 6,88 26,75 27,45 28,92 22,5 18,1 19,9 22,1 90 6,88 26,75 27,45 28,92 22,5 18,1 19,9 22,1 90 4 Sub Jumlah 4 8938 1821 Jumlah 1 – 4 35704 7198
3) Penarikan sampel tiga tahap Contoh : Sampel tiga tahap pstp psu kecamatan blok sensus sekolah pstd ssu blok sensus ru-ta tani kelas pstg tsu rumah tangga petak sawah murid
Misalkan banyaknya unit yang dapat dijadikan dasar untuk penarikan sampel tahap pertama ( pstp atau first stages sampling unit – fsu) adalah N, banyaknya unit yang dapat dijadikan dasar penarikan sampel tahap ke dua ( pstd atau secondary sampling unit – ssu) pada setiap unit penarikan sampel tahap pertama yang ke-i adalah . Serta banyaknya unit yang dapat dijadikan dasar penarikan sampel tahap ke tiga ( pstg atau third sampling unit – tsu) pada setiap unit penarikan sampel tahap pertama yang ke-i, dan tahap ke dua -j adalah . Apabila penarikan sampel menggunakan PPSDP pada setiap tahapnya, penduga yg tidak bias dari total karakteristik populasi dapat dituliskan : dengan varian : dan penduga varian yg tidak bias : Biaya :
Penarikan sampel dua fase ( Two phase / Double sampling ) Materi 5 Penarikan sampel dua fase ( Two phase / Double sampling ) 1) Pengertian Variabel bantu ( auxiliary variable ) sering digunakan dalam survei, misalnya utk keperluan pembentukan strata atau berbagai penduga ( penduga rasio, regresi dsb) Variabel bantu yg digunakan harus berkorelasi dg vbl utama. Sebagai contoh, suatu survei akan dilakukan utk menduga pengeluaran rumah tangga. Pengeluaran rumah tangga sangat bervariasi antar rumahtangga, shg apabila dilakukan survei langsung ( langsung mengambil sejumlah sampel utk diteliti), memrlukan ukuran jumlah sampel yg banyak. Utk menghemat biaya, jumlah sampel dapat dikurangi dg cara melakukan survei dua fase. Fase 1, diambil sejumlah sampel utk meneliti vbl bantu yg sangat sederhana, misalnya jml art, jenis pekerjaan atau gaya hidup. Vbl bantu tsb digunakan sbg alat utk membuat penduga, strata, atau urutan karakteristik yg akan di gunakan pd pemilihan fase 2. Pada fase 2 dipilih sampel yg relatif lb kecil utk meneliti vbl utama, yaitu pengeluaran rumah tangga. Two stage sampling : - tdk membutuhkan frame sampai usu (ultimate sampling unit) - psu (primary sampling unit) usu - tdk membutuhkan vbl bantu Two phase sampling : - membutuhkan frame sampai usu - psu = usu - lb murah dg memanfaatkan vbl bantu
N unit N unit unit unit sub unit unit Penarikan sampel dua fase akan lb baik apabila : - presisi lb baik dr presisi sampel satu tahap - presisi “melebihi” kenaikan biaya utk pengukuran vbl bantu N unit N unit (psu) frame psu frame usu unit unit pembuatan frame ssu pengukuran vbl bantu (psu) sub unit unit pengukuran vbl utama pengukuran vbl (ssu) Two stage sampling Two phase sampling
Contoh penarikan sampel dua fase utk = 20 , = 5 pemilihan fase pertama pemilihan fase ke dua
2) Double sampling utk stratifikasi Stratified sampling unit dlm populasi dibagi menjdi k strata, unit dlm strata homo- gin; rerata karaktristik antar strata, heterogin. Penimbang strata digunakan utk membuat penduga rerata dan total karakteristik populasi yg tidak bias. Apabila penimbang tdk diketahui dpt menggunakan double sampling sebanyak unit secara SRSWOR, yg akan digunakan sbg penduga penimbang, kemudian mengam- bil subsampel sebanyak unit, dg sampel pd stratum ke – i, utk mengumpulkan informasi karakteristik yg diteliti, sdmkn rupa shg Misal proporsi unit pd stratum ke – i proporsi fsu pd stratum ke – i penduga rerata populasi dapat dituliskan rerata sampel pd studi variat utk stratum ke – i dg varian
utk populasi yg besar, utk alokasi proporsional, Penduga yg tidak bias dari varian di atas
3) Alokasi optimum Fungsi biaya utk double sampling dpt dituliskan biaya overhead (fixed cost) dan biaya per unit utk mengukur vbl bantu dan vbl studi
4) Double sampling utk penduga beda Penduga beda utk menduga memrlukan variabel bantu yg belum dikertahui. Vbl bantu tsb sangat diperlukan untuk meningkatkan presisi. Utk megatasi hal tsb dapat dilakukan dg double sampling. Sampel pendahuluan (SRSWOR) sebanyak diambil utk mengukur vbl bantu . Subsampel (SRSWOR) sebanyak diambil dari sampel pendahuluan tsb utk mengukur vbl . Penduga beda dapat dituliskan diketahui rerata subsampel utk rerata pada sampel pendahuluan merupakan penduga yg tidak bias dari dg varian Penduga yg tidak bias dari varian di atas :
Bila dilakukan pngambilan sampel secara langsung (tidak menggunakan double sampling), untuk biaya akan diperoleh dg varian Utk double sampling akan mempunyai presisi yg lebih baik dari SRSWOR bila
5) Double sampling utk penduga rasio Penduga rasio utk menduga memrlukan variabel bantu yg belum diketahui. Utk megatasi hal tsb dapat dilakukan dg double sampling. Sampel pendahuluan sebanyak diambil utk menduga . Subsampel sebanyak diambil dari sampel pendahuluan tsb utk mengukur vbl . Penduga rasio (bias) dapat dituliskan rerata dari dan yg diperoleh dari subsampel rerata dari yg diperoleh pada sampel pendahuluan dengan varian dan estimatornya Contoh aplikasi dengan angka buku Singh halaman 278 - 283
6) Double sampling utk penduga regresi Penduga regresi utk menduga memrlukan variabel bantu yg belum dketahui. Utk mengatasi hal tsb dapat dilakukan dg double sampling. Sampel pendahuluan sebanyak diambil utk menduga . Subsampel sebanyak diambil dari sampel pendahuluan tsb utk mengukur vbl . Penduga regresi dapat dituliskan rerata dari dan yg diperoleh dari subsampel rerata dari yg diperoleh pada sampel pendahuluan penduga least square dari dengan varian dan estimatornya
7) Double sampling utk penduga pps Penduga pps utk menduga memrlukan variabel bantu yg belum dketahui. Utk mengatasi hal tsb dapat dilakukan dg double sampling. Sampel pendahuluan (SRSWOR) sebanyak diambil utk menduga . Subsampel sebanyak diambil dari sampel pendahuluan tsb (PPSDP) utk mengukur vbl . Penduga PPS (tidak bias) dapat dituliskan diperoleh dari subsampel diperoleh pada sampel pendahuluan dengan varian dan estimatornya
I HEAR I FORGET I SEE I REMEMBER I DO I UNDERSTAND MAAF SEGALA KESALAHAN SELAMAT BELAJAR SEMOGA SEMUA BERHASIL SAMPAI KETEMU DI TINGKAT III
KUIS II 1) Berikan pembahasan tentang equi-weighting design dan partially self-weighting design. Berikan pula contohnya. 2). Dari 10 unit pstp dipilih 3 unit, dan dari Mi unit pstp pada setiap unit ke-i dipilih sebanyak mi unit. Besarnya Mi , Anda tentukan sendiri. Penarikan sampel pada kedua tahap menerapkan metode penarikan sampel acak sederhana dengan pemulihan. Banyaknya sampel pada pstd adalah m1+m2+…+mn. Apabila m1=3, m2=2, dan m3=5 a) tentukan Mi dan buat secara skematis penarikan sampel tsb dg menggunakan gambar seperti di bawah b) tentukan peluang masing-masing tahap serta fraksi samplingnya
3 Stratified cluster sampling a) Stratified sampling sering digunakan karena : - stratifikasi elemen dalam strata diusahakan homogin dan antar strata heterogin varian lebih kecil efisien - stratifikasi menurut unit admisitrasi memudahkan pelaksanaan lapangan - dapat melakukan penarikan sampel dg metode yg berbeda utk setiap stratum - stratifikasi utk keperluan penyajian pada tingkat strata, misal strata wilayah adm atau strata perkotaan dan pedesaan - apabila ada bagian populasi yg mempunyai karakteristik yg ekstrim strata sendiri, misal daerah sulit atau daerah konflik b) Stratifikasi : setiap stratum merupakan kumpulan dari unit sampling. Klaster merupakan unit sampling dapat diterapkan ke berbagai metode sampling, termasuk stratified sampling. Selain klaster dapat juga unit “di atasnya”dijadikan dasar stratifikasi, misalnya bila klasternya blok sensus, unit di atasnya desa dapat dijadikan dasar stratifikasi; bila klasternya kelas, unit di atasnya sekolah dsb. Unit2 tsb dapat juga dijadikan dasar pembuatan strata. c) Klaster dg jumlah unit tidak sama. Penduga ke dua : lihat catatan kuliah utk penduga variannya.
d) = banyaknya art atau pendptan petani pada klastr terpilih ke-i, ruta pertanian ke j = banyaknya ruta pertanian pd klastr (blok sensus) ke i = banyaknya klaster dalam populasi = banyaknya klaster terpilih Perkiraan banyaknya ru ta pertanian saat listing Perkiraan rerata art pd ruta pertanian saat listing : Perkiraan jumlah art ruta pertanian Perkiraan rerata pendptan ru ta pertanian Perkiraan jumlah pendptan ru ta pertanian
Rerata pendptan per ru ta pertanian Rerata pendptan per art pertanian Faktor pengali diabaikan Metode I Metode II Metode III
Pertanyaan : Mengapa penduga regresi kurang baik utk jumlah sampel yg besar ? Mengapa varian klaster cenderung lb besar dari SRS ? Cara memperoleh nilai n yang baik dengan sampling klaster Minta contoh penggunaan rumus klaster pakai angka Penduga regresi - memerlukan variabel lain (covariate) yg berkorelasi dg variabel penduga - memerlukan nilai populasi dari covariate Bila jumlah sampel besar biaya besar dan kurang praktis (menghitung ) 2. Klaster dg jumlah unit sama, dari kuliah yll (teorema 2.1) :
3. Nilai n yg optimum. Klaster satu tahap kurang efisien disebabkan ukuran klaster yang biasanya cukup besar dan karakteristiknya homogen. Oleh karena itu diadakan kompromi yaitu dengan memperbanyak klaster terpilih, tetapi dengan memperkecil ukuran klaster. Unit-unit dalam klaster hanya akan diteliti sebagian. Banyaknya unit yang dipilih dalam setiap klaster perlu ditentukan secara optimal sehingga dapat disesuaikan dengan biaya yang tersedia atau tingkat ketelitian yang dikehendaki. 4. Klaster satu tahap Sampling unit terdiri lebih dari satu elemen (merupakan kelompok elemen). Dalam praktek sampling unit berupa klaster sering digunakan seperti halnya desa dan blok sensus. Contoh di bawah ini akan langsung mengkaji estimasi dan varian dari data sampel. Penekanan lebih pada aplikasi penggunaan rumus. Tabel dibawah merupakan ilustrasi contoh dari hasil suatu survei (sumber besaran data dari Daroga Singh, 1986) yang dilakukan di suatu wilayah yang terdiri dari 20 desa. Data yang dikumpulkan untuk memperkirakan jumlah ternak ayam. Dari kerangka sampel sebanyak 12 desa, dipilih 4 desa dengan acak sederhana (klaster satu tahap). Jumlah usaha dan ternak ayam dipelihara pada desa terpilih tercantum pada kolom (3). Dalam klaster satu tahap seluruh usaha dalam desa terpilih dicacah. Diketahui jumlah usaha di wilayah tersebut:
Jumlah Usaha dan Ternak Ayam Dipelihara pada Desa Terpilih dan Usaha Terpilih Jumlah usaha Jumlah ayam Ternak ayam dipelihara pada usaha terpilih (1) (2) (3) (4) (5) (6) (7) Desa A B C D 102 105 200 88 12546 =123 24150 =230 88200 =441 14080 =160 266, 890, 311, 46, 174, 31, 17, 186, 224, 31, 102, 46, 31, 109, 275, 128, 125, 267, 153, 152, 84, 21, 52, 10, 0, 48, 94, 129, 87, 89, 109, 0, 310, 3 129, 57, 64, 11, 163, 77, 278, 50, 26, 127, 252, 194, 350, 0, 572, 149, 275, 114, 387, 53, 34, 150, 224, 185, 157, 224, 466, 203, 354, 816, 242, 140, 66, 590, 747, 147 247, 622, 225, 278, 181, 132, 659, 403, 281, 236, 595, 265, 431, 190, 348, 232, 88, 1165, 831, 120, 987, 938, 197, 614, 187, 896, 330, 485, 60, 60, 1051, 651, 552, 968, 987 347, 362, 34, 11, 133, 36, 34, 61, 249, 170, 112, 42, 161, 75, 68, 0, 247, 186, 473, 0, 143, 198, 65, 0, 308, 122, 345, 0, 223, 302, 219, 120, 199, 35, 0, 0 m1 = 34 m2 = 36 m3 = 35 m4 = y1 = 4594 y2. =8093 y3. =16492 y4. =5080 =135 =225 =471 =141 Jumlah 495 138976
Penduga cara pertama RSE
Penduga cara ke dua RSE
Penduga cara ke tiga Apabila diketahui ukuran klaster populasi ( ) RSE