RELIABILITAS & VALIDITAS Oleh : Mariyana Widiastuti, M.Psi., Psi.
SYARAT-SYARAT TES YANG BAlK Sebuah tes dapat dikatakan baik apabila skornya dapat dikatakan sudah sahih (valid) dan andal (reliable).
1. KEANDALAN (VALIDITAS) Validitas berasal dari kata validity yang berarti sejauhmana ketepatan dan kecermatan suatu tes dalam melakukan fungsi ukurnya. Suatu tes dapat dikatakan mempunyai validitas yang tinggi apabila tes tersebut menjalankan fungsi ukurnya, yang sesuai dengan maksud dikenakannya tes tersebut. Suatu tes yang menghasilkan data yang tidak relevan dengan tujuan diadakannya pengukuran dikatakan sebagai tes yang memiliki validitas yang rendah. Sisi lain dari konsep validitas adalah kecermatan pengukuran.
Cont’d Estimasi validitas suatu pengukuran pada umumnya dinyatakan secara empiris oleh suatu koefisien yang kemudian disebut koefisien validitas. Koefisien ini dinyatakan oleh korelasi antara distribusi skor tes yang bersangkutan dengan distribusi suatu skor suatu kriteria. Kriteria ini dapat berupa skor tes lain yang memiliki fungsi yang sama,dan dapat pula berupa ukuran-ukuran yang lain yang relevan (Azwar). Apabila suatu tes diberi simbol X dan skor kriteria diberi simbol Y, maka koefisiensi korelasi antara tes dan kriteria merupakan suatu koefisien validitas dengan simbol 'XY’.
2. KEAJEGAN (RELIABILITAS) Reliabilitas berasal dari kata reliability, yang berasal dari kata rely (=dipercaya) dan ability (=kemampuan). Suatu tes dapat dikatakan reliabel apabila memiliki reliabilitas yang tinggi.
Cont’d Reliabilitas seringkali memiliki beragam istilah lain seperti keterpercayaan, keterandalan, keajegan, konsistensi, kestabilan, dan sebagainya yang kesemuanya itu mengacu kepada konsep reliabilitas yang berarti sejauh mana hasil suatu pengukuran dapat dipercaya. Artinya hasil ukur yang dapat dipercaya apabila dalam beberapa kali pengukuran terhadap kelompok subjek yang sama akan diperoleh hasil yang relatif sama, jikalau aspek yang diukur dalam diri subjek memang belum berubah.
Cont’d Pengertian relatif tersebut menunjukkan bahwa terdapat toleransi terhadap perbedaan-perbedaan kecil di antara hasil pengukuran. Apabila perbedaan hasil pengukuran tersebut besar dari waktu ke waktu, maka tes tersebut tidak dapat dipercaya atau tidak reliabel (Azwar).
Cont’d Untuk mengukur reliabilitas dapat dilakukan dengan perolehan dua nilai dari orang yang sama pada tes yang sama, yakni dengan cara mengulanginya atau dengan memberikan dua bentuk tes yang berbeda tetapi setara. Jika setiap individu dapat mencapai skor yang kurang lebih sama pada kedua pengukuran tersebut, maka berari bahwa tes tersebut reliabel.
Cont’d Meski suatu tes dapat dikatakan reliabel, beberapa perbedaan dapat muncul di antara kedua karena adanya perbedaan peluang dan kesalahan pengukuran. Oleh karena itu, dibutuhkan pengukuran statistik mengenai tingkat hubungan di antara seperangkat pasangan skor. Tingkat hubungan tersebut ditetapkan dengan koefisien korelasi (Atkinson dkk., 1993).
Cont’d Secara teoritis, besamya koefisien reliabilitas berkisar dari 0 sampai I. Akan tetapi pada kenyataannya koefisien korelasi sebesar 1 tidak akan pemah dijumpai. Di samping itu, meskipun koefisien korelasi dapat saja positif (+) maupun negatif (-), reliabilitas koefisien yang besamya kurang dari 0 tidak ada, karena interpretasi reliabilitas selalu mengacu kepada koefisien yang positif
Cont’d Apabila koefisien reliabilitas sebesar rxx.=l, berarti adanya konsistensi yang sempuma pada alat ukur yang bersangkutan. Konsistensi sempuma ini tidak akan pemah terjadi, karena dalam pengukuran psikologis, manusia merupakan sumber error yang potensial.
Cont’d Selain validitas dan reliabilitas, suatu tes yang baik juga harus memenuhi syarat keseragaman prosedur tes Untuk menghindari pengaruh variabel yang mengganggu, Maka suatu tes harus seragam di dalam prosedur. Keseragaman tersebut meliputi: instruksi, batas waktu (speed test atau power test), dan cara skoring. Dalam instruksi misalnya, penjelasan yang diberikan oleh penguji mengenai cara penyajian materi tes seyogyanya harus bersifat standar dari waktu ke waktu (Atkinson dkk., 1993).
Cont’d Akan tetapi tidak semua variabel yang mengganggu dapat kita kendalikan dengan baik, seperti misalnya penampilan umum (ekspresi wajah, nada suara, pakaian, dan sebagainya), jenis kelamin dan suku bangsa penguji juga akan mempengaruhi hasil tes subjek (Atkinson dkk., 1993) . Apabila seorang anak perempuan dari Jawa Tengah mengerjakan tes dengan hasil buruk ketika diuji oleh seorang penguji pria dari Batak, harus dipertimbangkan pula bahwa kecemasan dan motivasi anak tersebut mungkin akan berbeda apabila diuji oleh penguji perempuan dari Jawa.