Statistik dan Parameter Oleh : Septi Ariadi http://alhada-fisip11.web.unair.ac.id
pengantar Salah satu tugas statistik inferensial adalah melakukan estimasi yakni melakukan penarikan kesimpulan pada populasi berdasarkan pengamatan/ penelitian pada tingkat sampel. Jika pengukuran dan penghitungan dilakukan pada sampel maka data yang diperoleh disebut data deskriptif dari sampel atau statistik. Contoh data hasil pengukuran atau penghitungan pada tingkat sampel adalah mean statistik, mode, standar deviasi sample dan sebagainya. Sementara jika pengukuran atau penghitungan dilakukan pada tingkat populasi maka data yang diperoleh disebut data populasi atau parameter.
Selanjutnya bagaimana melakukan estimasi tentang populasi berdasarkan data terbatas yakni data sampel? Untuk melakukan estimasi tentang kondisi populasi perlu diperoleh pemahaman tentang : Variabilitas statistik – Kesalahan sampel Distribusi statistik Standar kesalahan mean (SDM) Interval kepercayaan
Variabilitas Statistik – Kesalahan Sampel Jika kita melakukan penyelidikan dan menghitung mean dari satu sampel maka mean dari sampel pertama jarang sama hasilnya dengan mean dari sampel kedua. Kemungkinan sama memang ada tetapi dari hasil berbagai penyelidikan jarang ditemukan adanya persamaan. Mengapa? Sebab betapapun sempurnanya randomisasi kita lakukan tetapi sampel kita tidak akan menjadi cermin yang sempurna dari populasi. Kenyataan ini dinamakan kesalahan sampling atau sampling error. Artinya ada kesalahan yang kita alami dalam pengambilan sampel sehingga sampel kita tidak sepenuhnya dapat mewakili populasi. Dengan demikian mean yang kita peroleh dari sampel tidak akan sama dengan mean populasi jika seluruh populasi diukur. Dengan kata lain mean statistik tidak akan sama dengan mean populasi akibat adanya kesalahan sampling.
Kesalahan sampling merupakan hal penting karena sering terjadi dalam tiap penelitian. Oleh sebab itu jika kita mengambil sampel dan menarik kesimpulan pada tingkat populasi maka konklusi nya selalu tidak tepat 100% dengan keadaan populasi di mana sampel diambil. Artinya sedikit banyak akan selalu terjadi kesalahan yang disebut kesalahan generalisasi. Hal ini terjadi karena adanya kesalahan sampling.
Distribusi Statistik Jika kita mengambil terus-menerus sampel dari populasi katakan sebanyak 100 kelompok sampel, maka kalau dihitung meannya akan didapatkan sebanyak 100 mean dengan hasil yang sangat mungkin tidak sama antara mean satu dengan yang lainnya. Artinya ada beda dari 100 mean yang ada dan mean-mean tersebut dapat ditampilkan dalam suatu distribusi. Distribusi mean dari berbagai sampel tersebut dinamakan distribusi sampling dari mean atau sampling distribution of the means.
Informasi apakah yang dapat diperoleh dari ditribusi mean tersebut? Distribusi mean yang ada kalau dicermati ternyata ada kecenderungan membentuk distribusi normal sehingga distribusi dimaksud mengikuti ciri kurve normal. Selain itu jika kita hitung mean dari distribusi mean tersebut maka mean dari mean-mean tersebut akan cenderung mendekati mean populasi dari mana sampel tersebut diambil. Mengapa demikian? Sebab mengukur mean dari mean-mean statistik yang meliputi seluruh individu seluruh populasi akan sama halnya dengan mengukur mean parameter
Berdasarkan distribusi mean tersebut kita juga dapat menentukan variabilitasnya. Salah satu alat statistik yang dapat digunakan untuk mengukur variabilitas adalah standar deviasi (SD). Oleh karena distribusi mean cenderung membentuk distribusi normal maka akan ada sekitar 6 SD dalam jarak/ range distribusi tersebut. Dengan konsep tersebut selanjutnya kita dapat menentukan probabilitas letak mean statistik dan memperkirakan pula letak mean parameter tanpa harus mengukur seluruh populasi. Estimasi kemudian dapat dilakukan dengan mendasarkan pada satu sampel saja yakni sampel yang kita teliti. Statistik yang dapat digunakan untuk melakukan estimasi adalah standar kesalahan mean (SDm) atau standar error of the mean.
Standard Kesalahan mean (SDm) Standar Kesalahan mean adalah suatu estimasi tentang SD dari suatu distribusi mean-mean yang diperoleh dari distribusi mean-mean yang diperoleh dari sampel yang diambil secara random terus menerus dari populasinya. Rumus SDm adalah : SD SDm = √ N – 1 Keterangan: SDm : standard kesalahan mean SD : standar deviasi N : jumlah subyek/ frekuensi Jadi menentukan untuk SDM: (a) Mencari SD dari sampel kita (b) Membagi SD dengan akan dari sejumlah subyek dikurangi 1. Kegunaan penting dari SDm adalah melakukan estimasi tentang letak mean parameter.
Selanjutnya menentukan letak mean parameter (MP) dapat dilakukan dengan menggunakan rumus : MP = MS ± 1,96 SDm dengan taraf kepercayaan sebesar 95 % atau taraf kesalahan sebesar 5%. Dimana : MP adalah mean parameter yang diestimasi. MS adalah mean statistik dan SDm adalah standar kesalahan mean. Jika digunakan taraf kepercayaan sebesar 99% atau taraf kesalahan sebesar 1% maka Mean Parameter diestimasikan dengan rumus: MP = MS ± 2,58 SDm
Interval Kepercayaan Interval kepercayaan adalah suatu interval atau suatu jarak bilangan di mana probabilitas letak tentang letak mean parameter diramalkan. Interval kepercayaan/taraf kepercayaan atau confidence level 95% artinya: suatu deviasi sebesar 1,96 SDm diatas dan dibawah mean mencakup 95% dari frekuensi dalam distribusi normal. Dengan kata lain interval kepercayaan 95% adalah jarak bilangan di mana probabilitas letak mean parameter diestimasikan dengan luas interval antara -1,96 SDm sampai dengan + 1,96 SDm. Jika kita membuat estimasi tentang letak mean parameter dengan taraf kepercayaan 95% maka kita akan menolak tiap estimasi yang menganggap mean dari sampel kita terletak lebih jauh dari 1,96 SDm.
Ringkasan Standar kesalahan mean (SDm) adalah suatu estimasi tentang SD dari distribusi mean-mean. Fungsi : dapat digunakan untuk melakukan estimasi tentang probabilitas letak mean parameter dengan hanya menggunakan satu sampel yang diambil secara random. Asumsi : (a) Berhadapan dengan satu sampel random (b) Data paling rendah berskala interval (c) Akan dilakukan estimasi tentang probabilitas letak mean parameter. Keputusannya: estimasi diterima jika terletak antara batas estimasi mean parameter dengan taraf kepercayaan sebesar 95% atau 99%.
Standard Kesalahan Persentase (SD%) Fungsi : melakukan estimasi tentang presentase parameter. Dapat juga digunakan untuk menguji data hipotetik dalam bentuk persentase. Misalnya : Ada laporan yang menyebutkan bahwa 7 diantara 10 remaja di kota X memiliki kegemaran merokok. Artinya ada sebanyak 70% remaja di kota X gemar merokok. Persoalannya adalah apakah data hipotetik dalam bentuk persentase tersebut dapat dibenarkan atau diterima? Dalam hal ini ada 2 kemungkinan yang terjadi yakni: hipotesis tersebut dapat dibenarkan atau data hipotesis tersebut tidak dapat dibenarkan. Untuk melakukan pembuktian apakah data yang dihipotetikkan/ laporan tersebut dapat diterima atau tidak maka dapat digunakan salah satu instrumen statistik yang disebut standard kesalahan persentase (SD%)
Prosedur pembuktiannya dengan menggunakan rumus : PQ SD% = √ ─── N Di mana : SD% = standar kesalahan persentase P = persentase yang dijadikan hipotesis Q = 100 – P N = jumlah subyek dalam sampel Catatan : P dalam hal ini adalah persentase parameter yang bersifat hipotetis bukanlah persentase empirik yang diperoleh dari sampel kita.
Selanjutnya ditentukan Persentase Parameter ( Pp) : Dengan taraf kepercayaan 95% maka : Pp = Ps ± 1,96 SDm Dimana : Pp = persentase parameter Ps = persentase statistik SD% = standar kesalahan persentase Sementara itu dengan taraf kepercayaan 99% dan taraf kesalahan 1% maka : Pp = Ps ± 2,58 SDm Kesimpulan : Jika persentase hipotetik atau laporan tersebut berada diantara atau dalam jangkauan estimasi maka laporan dinyataka dapat diterima dengan taraf kepercayaan tertentu (95% atau 99%).
Soal Latihan : 1. Suatu kegiatan pengamatan dilakukan dengan tujuan melakukan estimasi tentang lama kerja karyawan yang bekerja di suatu kawasan industri (dinyatakan dalam bulan). Dalam kegiatan ini terekspose sebanyak 100 karyawan sebagai sampel. Berikut distribusi data tentang lama kerja para pekerja industri yang berhasil diamati. Sumber : Data rekaan Berdasarkan data tersebut lakukan estimasi tentang letak mean parameter (berkaitan dengan lama kerja karyawan) jika taraf kepercayaan yang digunakan sebesar 99% dan 95%. Selanjutnya kemukakan kesimpulan & interpreatasi terhadap hasil analisis anda. Lama krj 40-44 45-49 50-54 55-59 60-64 65-69 70-74 Frek. 8 12 19 31 20 6 4
Soal Latihan : 2. Dimisalkan ada laporan yang menyebutkan bahwa 7 diantara 10 pasangan usia subur memanfaatkan IUD sebagai metode kontrasepsi untuk mengatur kepemilikan anak. Selanjutnya dari hasil penelitian yang dilakukan terhadap 500 pasangan usia subur menunjukkan sebanyak 55% pasangan usia subur menggunakan metode kontrasepsi IUD untuk mengatur kehamilan. Berdasarkan data tersebut apakah laporan sebagaimana tersebut diatas secara statistic dapat diterima? (Gunakan taraf kepercayaan 99% dan 95%). Kemukakan kesimpulan dan lakukan interpretasi.