Rancangan dan Susunan Tes

Slides:



Advertisements
Presentasi serupa
Penyusunan Tes Oleh: Budi Usodo.
Advertisements

PERTEMUAN: 1 I. PENULISAN KARYA ILMIAH
TINJAUAN UMUM DATA DAN STATISTIKA
(Tes Prestasi Belajar – Pertemuan 1)
Tri Hartiti Retnowati Jurusan Pend. Seni rupa FBS UNY
KONSEP PENILAIAN AUTENTIK PADA PROSES DAN HASIL BELAJAR
MANAJEMEN SUMBER DAYA MANUSIA
EVALUASI PEMBELAJARAN IPA
RENCANA PELAKSANAAN PEMBELAJARAN (UNTUK IMPLEMENTASI KURIKULUM 2013)
Konsep Pendekatan Sistem dalam Desain Instruksional
MATERI-4 EVALUASI PEMBELAJARAN
Menyiapkan Tes Esai.
Bab 9 Pengukuran dan desain instrumen dalam survei.
11 dan 12. PENGUMPULAN DATA ARTI PENGUMPULAN DATA
Tes uraian (essay examination)
MATERI-3 EVALUASI PEMBELAJARAN
12. PENGUMPULAN DATA ARTI PENGUMPULAN DATA
PENILAIAN.
JABATAN PROFESIONAL DAN TANTANGAN GURU DALAM PEMBELAJARAN
KEMENTERIAN PENDIDIKAN DAN KEBUDAYAAN BADAN PENGEMBANGAN SUMBER DAYA MANUSIA PENDIDIKAN DAN KEBUDAYAAN DAN PENJAMINAN MUTU PENDIDIKAN KONSEP PENILAIAN.
Validitas & Reliabilitas Instrumen
Prosedur Penilaian dan Teknik Penilaian
PENGUKURAN DALAM PEMANTAUAN MUTU
Tes Psikologi.
Higher Order Thinking ( HOT )
KRITERIA KOMPETENSI / MATERI PENTING
Hubungan Ilmu, Penelitian
12. PENGUMPULAN DATA ARTI PENGUMPULAN DATA
Berpikir Kritis (Critical Thinking)
MEMBUAT PROPOSAL PENELITIAN DAN TUGAS AKHIR
PERTEMUAN 4 HARLINDA SYOFYAN, S.Si., M.Pd
TINJAUAN UMUM DATA DAN STATISTIKA
PENILAIAN KINERJA.
KARAKTERISTIK MATEMATIKA
ASESMEN KINERJA KETERAMPILAN DAN PRODUK
B. METODE PENGUMPULAN DATA
Konstruksi Tes 1 Kontrak Belajar.
PENGEMBANGAN KISI - KISI
Petunjuk Teknis Pengembangan Instrumen Penilaian Tes Tertulis
KONSEP PENILAIAN AUTENTIK PADA PROSES DAN HASIL BELAJAR SEJARAH
EVALUASI PEMBELAJARAN SEJARAH
MENGAJAR UNTUK MEWUJUDKAN TUJUAN IPS
Pembangunan Kasus Bisnis & Penentuan Alternatif
Komunikasi Visual Iklan Cetak
TES PENCAPAIAN PRESTASI TERSTANDARDISASI
Manajemen Proyek Sistem Informasi DAY-2
JABATAN PROFESIONAL DAN TANTANGAN GURU DALAM PEMBELAJARAN
PENILAIAN KELAS DEPARTEMEN PENDIDIKAN NASIONAL BADAN PENELITIAN DAN PENGEMBANGAN PUSAT KURIKULUM JAKARTA, 2004.
KARAKTERISTIK MATEMATIKA
11 dan 12. PENGUMPULAN DATA ARTI PENGUMPULAN DATA
Menyusun Bentuk Tes Jawaban Singkat dan Bentuk Tes Uraian (Essei)
PENILAIAN KELAS DEPARTEMEN PENDIDIKAN NASIONAL BADAN PENELITIAN DAN PENGEMBANGAN PUSAT KURIKULUM JAKARTA, 2004.
ASESMEN ALTERNATIF GALIH ISTININGSIH PGSD UMM.
HAKIKAT BELAJAR & PEMBELAJARAN
KONSEP PENILAIAN AUTENTIK PADA PROSES DAN HASIL BELAJAR
METODOLOGI PENELITIAN (Model Penelitian Tindakan)
DESAIN ANALISIS PEKERJAAN (MSDM 1)
Sistematika Penulisan Karya Ilmiah
Penggunaan Dimensi Belajar
HAKIKAT STRATEGI PEMBELAJARAN
TES ISIAN.
I. PENULISAN KARYA ILMIAH
TINJAUAN UMUM DATA DAN STATISTIKA
KONSEP PENILAIAN AUTENTIK PADA PROSES DAN HASIL BELAJAR
Berpikir Kritis (Critical Thinking)
KONSEP PENILAIAN AUTENTIK PADA PROSES DAN HASIL BELAJAR
Teknik merancang Questioner dalam analisis kebutuhan PL
MATA KULIAH : METODE PENELITIAN
Suatu proses untuk mengambil keputusan dengan menggunakan informasi yang diperoleh melalui pengukuran hasil belajar baik yang menggunakan instrumen tes.
MINAT DAN BAKAT.
Transcript presentasi:

Rancangan dan Susunan Tes

Tujuan Mendeskripsikan isu yang perlu dipertimbangkan ketika merencanakan tes. Mendeskripsikan jenis tujuan pendidikan yang relevan untuk mengorganisasikan item tes (taksonomi tujuan kognitif). Mendeskripsikan pertimbangan perilaku dan isi ketika mempersiapkan item tes (daftar spesifikasi). Mengetahui keunggulan dan kekurangan item respon terseleksi versus tersusun (selected versus constructed response item) dan terbiasa dengan tipe item tes berikut ini : benar-salah, mencocokkan, pilihan ganda, Likert, jawaban pendek, esai, bercerita.

Mengetahui hal-hal yang perlu dipertimbangkan ketika mengumpulkan dan memproduksi tes. Mendeskripsikan keunggulan dan kekurangan pengetahuan lisan. Memahami strategi pengetesan pencapaian prestasi (achievement testing strategy).

Menyiapkan tes karakteristik minat dan kepribadian secara tertulis melibatkan banyak masalah yang berbeda daripada menyusun tes pencapaian prestasi atau kecakapan alami (test of achievement atau aptitude). Sebagian besar guru tidak terbiasa dengan prosedur kompleks yang diikuti oleh para perancang tes professional. Apapun jenis tes ataupun tujuan para pemakai tes, perencanaan isi diperlukan sebelum item yang ada dalam tes ditulis. Perencanaan tes meliputi definisi variable yang jelas atau susunan yang harus diukur, deskripsi orang yang harus diteliti, kondisi pengelolaan tes dan informasi berkenaan dengan pemberian skor, interpretasi skor dan cara penggunaan hasil tes.

Merencanakan Tes Tes Penyaringan Menyusun tes kecakapan alami (aptitude test) untuk menyaring para pelamar pekerjaan tertentu dimulai dengan menganalisis secara mendetail aktivitas yang berisi pekerjaan. Analisis tugas atau analisis pekerjaan (job analysis) terdiri dari menentukan komponen pekerjaan sehingga situasi atau item tes dapat direncanakan untuk memprediksi kinerja karyawan. Spesifikasi meliputi insiden kritis (critical incident) – perilaku yang sangat menentukan kinerja yang berhasil atau tidak berhasil dan informasi lain yang sangat mendeskripsikan aktivitas pekerjaan.

Tes Kecerdasan Seperti dalam menyusun tes lain, sekumpulan item barangkali mengukur aspek susunan “kecerdasan” dikumpulkan. Item ini akan disusun menurut teori perilaku kecerdasan spesifik atau hanya dengan referensi sejenis tugas yang dapat dikerjakan secara lebih efektif oleh orang dengan kecerdasan sangat tinggi daripada orang dengan kecerdasan rendah. Pemilihan item untuk tes akhir akan dibuat berdasarkan hubungan antara respon item terhadap kriteria seperti usia kronologis dan hubungan diantara item tes itu sendiri.

Skala dan Daftar Rinci Kepribadian Berbagai pendekatan, beberapa berdasarkan pada akal sehat (atau pendidikan) yang lain pada teori kepribadian dan yang lain lagi pada prosedur statistik digunakan dalam menyusun daftar rinci kepribadian dan skala peringkat. Banyak instrument pemeriksaan kepribadian yang dipublikasikan telah disusun dengan mengkombinasikan pendekatan teoritis, rasional dan empiris. Salah satu atau lebih pendekatan ini digunakan pada tahap perkembangan instrument yang berbeda.

Tes Pencapaian Prestasi (Achievement Test) Lebih banyak perhatian ditujukan pada prosedur untuk menyusun tes pencapaian prestasi skolastik daripada tes jenis lain. Tes pencapaian prestasi lebih dikelola daripada semua jenis tes lain yang dikumpulkan. Siswa lebih banyak belajar dan mengingat ketika mereka lebih sering dites. Hasil tes tidak terbatas pada mengevaluasi dan memotivasi siswa. Hasil ini juga memberikan informasi bagi guru, administrator sekolah dan orang tua yang memperhatikan tingkat tujuan pendidikan yang akan dicapai. Dengan menghasilkan data yang berkaitan dengan efektifitas kurikulum sekolah dan prosedur pengajaran, skor tes menyumbang pada perencanaan pengajaran bagi individu siswa atau seluruh kelas dan sekolah.

Pertanyaan Bagi Perencana Tes Perhatian seksama pada pertanyaan berikut ini : Pada topik dan materi apa siswa akan dites ? Apa jenis pertanyaan yang harus disusun ? Apa item dan format atau lay-out tes yang harus digunakan ? Kapan, di mana dan bagaimana tes harus dikelola ? Bagaimana lembar jawab tes akan diskor dan dievaluasi ?

Taksonomi Tujuan Kognitif Tujuan taksonomi ini tidak hanya menyusun item untuk mengukur memori hafalan sederhana dan merencanakan item untuk memeriksa pencapaian tujuan pendidikan berkualitas tinggi yang mengharuskan pendalaman materi. Item berikut ini, yang dapat diberikan pada format tes obyektif atau esai menggambarkan taksonomi yang dideskripsikan pada Tabel 2.1

Apa rumus untuk menghitung standard error pengukuran ? (Pengetahuan) Perhatikan grafik berikut ini dan tentukan berapa item harus ditambahkan pada tes 50 item untuk meningkatkan reliabilitas dari 0,60 ke 0,80 (Pemahaman menyeluruh) Hitunglah standard error estimasi untuk tes yang memiliki korelasi 0,70 dengan kriteria yang memiliki standard deviasi 10 . (Penerapan) Bedakan antara tes pencapaian prestasi kelas (classroom achievement test) dengan tes pencapaian prestasi standard (standardized achievement test) mengenai apa yang diukur oleh setiap tes dan bagaimana tes ini digunakan (Analisis) Rumuskan teori yang mengkaitkan antara minat dan kepribadian dan kutiplah bukti penelitian yang sangat mendukung (Sintesis) Evaluasi kritik berkaitan dengan Isi dan penggunaan SAT. (Evaluasi)

Tabel 2.1 Kategori dari Taksonomi of Educational Objectives : The Cognitive Domain Pengetahuan Pengetahuan meliputi pengingatan kembali fakta yang dipelajari sebelumnya. Sampel kata kerja pada item pengetahuan meliputi mendefinisikan, mengidentifikasi, menyusun daftar dan menyebutkan. Sampel item pengetahuan berupa : “Tulis 6 kategori utama dalam Taxonomy of Education Objectives : The Cognitive Domain”.

Pemahaman Pemahaman menyeluruh berarti memahami maksud atau tujuan sesuatu. Sampel kata kerja dalam item pemahaman menyeluruh ini meliputi mengubah, menjelaskan dan meringkas. Sampel item pemahaman menyeluruh ini berupa “Jelaskan apa yang dimaksud oleh peninjau ulang tes ketika ia berkata bahwa tes tidak dapat diandalkan”.

Penerapan Penerapan meliputi penggunaan informasi dan ide pada situasi khusus. Sampel kata kerja pada item penerapan meliputi menghitung, menentukan, memcahkan masalah. Sampel item penerapan adalah “ Hitunglah hasil rata-rata (mean) dan standard deviasi kelompok skor berikut ini”.

Analisis Analisis berarti memecahkan sesuatu untuk mengungkapkan struktur dan hubungan antar-bagian. Sampel kata kerja pada item analisis terdiri dari menganalisis, membedakan dan menghubungkan. Sampel item analisis adalah “ Analisislah unit pengajaran ini ke dalam beberapa kategori perilaku dan isi”

Sintesis Sintesis adalah mengkombinasikan berbagai elemen atau bagian menjadi utuh secara struktural. Sampel kata kerja pada item sintesis ini antara lain merancang, memikirkan, merumuskan dan merencanakan. Sampel item sintesis adalah “ Rancanglah tabel spesifikasi untuk tes mengenai statistika dasar”.

Evaluasi Evaluasi adalah membuat penilaian berdasarkan penalaran. Sampel kata kerja pada item evaluasi antara lain membandingkan , mengkritik, mengevaluasi dan menilai. Sampel item evaluasi berupa “Evaluasilah prosedur yang digunakan dalam membuat standard pada tes ini”.

Tabel Spesifikasi Sebagian besar perancang tes tidak memegang teguh taksonomi formal dalam membuat spesifikasi tujuan yang akan diukur. Lebih mudah menyusun item yang menilai istilah dan fakta pengetahuan daripada item yang mengukur kemampuan untuk menganalisis dan mengevaluasi tetapi item di kategori di 2 kategori terakhir harus juga dimasukkan ke dalam tes.

Menyiapkan item tes Tujuan utama perencanaan tes adalah persiapan outline mendetail seperti tabel spesifikasi yang berfungsi sebagai pedoman dalam menyusun item untuk menilai atau memprediksi tujuan tertentu. Untuk tes obyektif, biasanya direkomendasi bahwa sekitar 20 % lebih item yang sesungguhnya diperlukan harus dipersiapkan lebih awal sehingga jumlah memadai dari item yang bagus tersedia untuk versi terakhir tes. Organisasi tes komersial, semacam Educational Testing Service mempekerjakan penulis item yang memiliki pemahaman pokok bahasan tes dan ketrampilan item tes. Seseorang yang ingin belajar mengenai cara menyusun item tes yang baik dapat mengambil keuntungan dengan meneliti sampel yang terdapat pada tes publikasi karena item tes ini tersedia dengan baik.

Berbagai metode pengelompokan item menurut respons yang diminta telah diungkapkan. Dua kategori utama berupa format respons-dipilih (selected-response format) dan format respons-disusun (constructed-response format), mengharuskan peserta tes menyeleksi respons mereka dari berbagai respons yang telah diberikan. Ini juga merujuk pada format forced-choice (pilihan terpaksa) dan meliputi item pilihan ganda dan benar-salah. Pada tes pencapaian prestasi (achievement test), peserta tes harus mengidentifikasi atau mengenali jawaban yang tepat. Pada tes kepribadian, peserta tes biasanya menjawab item menurut alternatif mana yang paling mendeskripsikan mereka.

Constructed-response item mengharuskan peserta tes untuk menciptakan dan mengorganisasi respons (juga disebut item bebas merespon/free-response). Dalam tes kepribadian yang meminta partisipan untuk bercerita mengenai gambar tertentu atau merespon noda karena terkena tinta. Dalam tes pencapaian prestasi kelas, perbedaan ini seringkali terjadi antara tes obyektif (item respons-terpilih) dan tes esai (item respons-tersusun). Salah satu perbedaannya ialah item obyektif dapat menjadi jenis dipilih atau disusun, tergantung pada apakah peserta ujian diminta untuk menyusun respons atau memilih jawaban paling benar dari daftar alternatif.

Sistem pemberian skor dapat dirancang untuk pertanyaan esai, jadi mengubah item obyektif bisa terjadi. Ini terjadi misalnya hanya dengan memberikan poin skor jika frase perancangan terjadi pada respons esai. Tes pencapaian prestasi biasanya menilai respons yang diberikan oleh peserta tes baik benar atau salah. Dalam beberapa kasus, poin bonus ditambahkan pada respons yang unggul. Hal ini kadangkala terjadi pada tes kecerdasan yang dikelola secara individu yang partisipan diberi poin tambahan karena merespons lebih cepat.

Sistem pemberian skor dapat dirancang untuk pertanyaan esai, jadi mengubah item obyektif bisa terjadi. Ini terjadi misalnya hanya dengan memberikan poin skor jika frase perancangan terjadi pada respons esai. Tes pencapaian prestasi biasanya menilai respons yang diberikan oleh peserta tes baik benar atau salah. Dalam beberapa kasus, poin bonus ditambahkan pada respons yang unggul. Hal ini kadangkala terjadi pada tes kecerdasan yang dikelola secara individu yang partisipan diberi poin tambahan karena merespons lebih cepat.

Tetapi tes kepribadian tidak memiliki jawaban benar atau salah tetapi pemberian skor tinggi akar diberikan pada sikap yang sangat kuat. Item objektif tidak terbatas pada empat format tradisional (benar-salah, mencocokkan, pilihan ganda dan Likert), tetapi format tersebut paling popular. Salah satu keunggulan dari pilihan ganda adalah bahwa format ini dapat diberi skor dengan mudah dan objektif. Karena setiap item mebutuhkan lebih sedikit waktu untuk menjawab daripada tes esai, sampel isi yang lebih luas termasuk dalam tes objektif.

Item Benar-Salah. Salah satu jenis item yang disusun paling sederhana tetapi paling banyak dikritik oleh tester professional adalah item benar-salah. Item ini seringkali berkaitan dengan informasi sepele atau disusun dengan menghilangkan pernyataan harfiah dari buku teks. Item ini sering ambigu dan tidak dapat digunakan untuk mengukur tujuan pengajaran yang lebih kompleks. Juga karena skor total pada tes benar-salah dapat dipengaruhi oleh kecenderungan peserta tes benar- salah dapat dipengaruhi oleh kecenderungan peserta tes menebak ketika merasa ragu-ragu atau setuju (atau tidak setuju) sehingga ketepatan skor dipertanyakan.

Dengan mengesampingkan kekurangan ini, item benar-salah tidak harus menjadi sepele atau ambigu dan konsekuensinya pembelajaran salah arah. Dalam mempertahankan item benar-salah, Ebel (1979) menyatakan bahwa “tingkat perintah siswa pada bidang pengetahuan tertentu ditunjukkan dengan kesuksesan mereka dalam menilai kebenaran atau kesalahan dalil yang berhubungan”, Ebel menganggap dalil (proposition) seperti itu menjadi ekspresi pengetahuan verbal yang dipandang sebagai intisari pencapaian prestasi pendidikan.

Apapun tujuan item benar-salah, dalam menyusun item jenis ini, disarankan untuk mengikuti anjuran berikut ini : Pastikan bahwa pertanyaan berhubungan dengan masalah penting (bukan sepele). Buatlah pertanyaan relatif pendek dan secara tidak memenuhi syarat benar atau salah. Hindari item yang dinyatakan secara negative, terutama yang mengandung dobel negatif. Hindari item ambigu dan menjebak.

Sebagai peraturan, hindari kata penentu (determiner) khusus Sebagai peraturan, hindari kata penentu (determiner) khusus. Jika determiner khusus digunakan untuk mengandung peserta tes yang harus tidak berpengetahuan tetapi layak ikut tes (testwise), determiners tersebut harus dimasukkan ke dalam pernyataan benar sesering pernyataan salah. Pada pernyataan pendapat, kutiplah sumber atau pihak berwenang. Buatlah pernyataan benar kira-kira setara dengan panjang yang sama dan buatlah jumlah pernyataan benar kira-kira setara dengan jumlah yang salah. Karena item salah cenderung lebih diskriminasi daripada item benar, dapat disarankan bahwa jumlah pernyataan salah seharusnya lebih banyak dari pada jumlah pernyataan benar. Namun, jika guru mengikuti praktik ini pada tes yang dilaksanakan berturut-turut, siswa menyadari jenis tes ini dan mulai menjawab salah ketika merasa ragu-ragu tentang jawaban.

Buatlah jawaban salah lebih menarik dengan membuat susunan kata dalam item dengan cara tertentu sehingga logika superficial, miskonsepsi popular atau determiner khusus menyatakan bahwa jawaban salah adalah benar. Pernyataan salah yang memiliki lingkaran kebenaran mungkin juga menyandung peserta tes yang tidak berpengetahuan.

Item mencocokkan. Item benar-salah maupun pilihan ganda merupakan variasi dari item mencocokkan. Pada ketiga jenis item ini, serangkaian opsi respons dicocokkan dengan serangkaian opsi stimulus (premis). Pada item mencocokkan memiliki premis majemuk dan opsi majemuk. Tugas peserta tes pada item mencocokkan ini memasangkan opsi respon dengan premis yang tepat. Mencocokkan biasanya satu ke satu (satu respons per premis) tetapi akan lebih baik satu ke banyak, banyak ke satu atau banyak ke banyak. Peserta tes tentu saja harus diberitahu prosedur mana yang diterapkan pada item tertentu.

Pedoman untuk menyusun item mencocokkan : Susun premis dan opsi respons ke dalam format kolom yang jelas dan logis, premis di kolom kiri dan opsi di kolom kanan. Gunakan 6-15 premis dengan 2 atau 3 lebih banyak opsi respons daripada premis. Urutkan nomor premis dari nomor kecil dan tempatkan huruf di depan opsi respons. Tentukan dengan jelas dasar untuk mencocokkan. Tempatkan seluruh item dalam satu halaman. Jenis item mencocokkan khusus berupa item menyusun kembali (rearrangement item) yang mengharuskan peserta tes menyusun kelompok opsi ke dalam urutan kategori yang sudah ditentukan sebelumnya.

Item Pilihan Ganda Tidak ada seorang pun yang tahu siapa penyusun item tes pilihan ganda yang pertama tetapi dari sudut pandang pemeriksaan psikologi, penyusunan ini merupakan peristiwa menguntungkan. Item pilihan ganda merupakan item tem obyektif yang paling serbaguna karena dapat digunakan untuk mengukur tujuan pembelajaran yang sederhana maupun kompleks pada setiap tingkat kelas dan semua pokok masalah. Skor pada item pilihan ganda juga kurang dipengaruhi menebak dan kumpulan respons lain daripada skor pada item objektif lain. Informasi diagnostik yang bermanfaat dapat diperoleh dari analisis opsi tidak benar (distracter) yang dipilih oleh peserta tes.

Kelemahan item pilihan ganda meliputi : Item yang baik sulit disusun, terutama item yang semua opsinya sama menariknya bagi para peserta tes yang tidak mengetahui jawaban benar. Item menekankan pada pengenalan (recognition) bukan pada daya ingat dan pengorganisasian informasi Item membutuhkan lebih banyak waktu menjawab dan item ini mengambil sampel domain pokok bahasan lebih sedikit daripada item benar-salah. Item juga mendukung pembelajaran hafalan yang mendetail, bukannya memahami materi dengan cara lebih bermakna dan mendalam. Para perancang tes biasanya lebih sulit menyusun item untuk mengukur pemahaman dan pemikiran daripada item yang mengukur langsung pengetahuan pokok masalah.

Cara lain yang membuat keputusan peserta lebih menuntut adalah : Meliputi item dengan berbagai jawaban yang jumlah opsi variabelnya benar dan peserta tes harus mengidentifikasi opsi mana (jika ada) benar atau salah Meminta peserta tes memilih jawaban dan mengembangkan atau menulis pembenaran jawaban itu Meminta peserta tes mengidentifikasi susunan yang tepat (seperti persamaan atau metode penyelesaian) pada tugas memecahkan masalah.

Format Likert Format Likert lazimnya terdiri dari item 5- poin berkisar pada rangkaian dari sangat setuju sampai sangat tidak setuju. Namun, format ini dapat pula memiliki tiga atau empat pilihan atau bahkan lebih dari 5 pilihan. Variasinya merupakan skala peringkat grafik atau analog visual (visual analogue or graphic rating scale) yakni bermusuhan ….. ramah). Format ini jelas lebih tepat untuk mengukur sikap dan kepribadian, bukan pencapaian.

Format Respons-disusun Fitur inti format respons adalah bahwa format ini mengharuskan peserta tes menciptakan atau mengkontraskan respons. Variasi yang relatif terstruktur berupa teknik mengisi titik-titik (fill in the blank) yang digunakan untuk item jawaban pendek. Metode yang jauh lebih pendek mengharuskan peserta tes memasukkan portofolio kerja seseorang atau meminta keluarga atau pelamar kerja memecahkan problem simulasi. Format respons-disusun paling umum berupa teknik item jawaban pendek, esai dan bercerita.

Item Jawaban-Pendek Peserta tes diminta untuk melengkapi atau mengisi satu atau lebih tempat kosong dengan kata frase yang benar atau jawaban singkat pada pertanyaan.   Meskipun format ini pasti bermanfaat untuk menilai pengetahuan atau terminology, item jawaban pendek memiliki keterbatasan serius; format ini tidak tepat untuk pengukuran tujuan pengajaran yang kompleks dan karena mungkin ada lebih dari satu jawaban benar, pemberian skor secara keseluruhan tidak selalu objektif.

Pedoman berikut ini harus diikuti dalam menyusun item jawaban-pendek : Pertanyaan langsung lebih disukai daripada pertanyaan tidak lengkap. Buatlah frase/susunan beberapa kata pada item dalam cara tertentu sehingga jawabannya pendek dan tidak ambigu. Jika pertanyaan tidak lengkap digunakan, tempatkan tempat kosong pada bagian akhir pernyataan. Buatlah semua bagian kosong sama panjang. Hindari banyak bagian kosong pada item sama, terutama jika bagian kosong tersebut membuat makna tugas menjadi tidak jelas. Tunjukkan unit yang harus diisi dengan jawaban angka.

Item Tes Esai Keunggulan terpenting item esai adalah bahwa item ini dapat mengukur kemampuan mengorganisasi, mengaitkan dan berkomunikasi. Perilaku ini tidak dapat dengan mudah dinilai dengan item objektif. Tes esai memiliki keunggulan tambahan yakni dengan hanya membutuhkan waktu lebih sedikit untuk menyusun dan dengan mengurangi kemungkinan bahwa peserta tes akan mendapatkan item benar hanya dengan menebak. Namun, pertanyaan esai begitu umum sehingga peserta tes yang berbeda akan menginterpretasikan pertanyaan dengan sangat berbeda. Pemberian skor jawaban juga mengakibatkan perbedaan interpretasi mengenai jawaban terbaik. Juga, hanya sekitar enam pertanyaan esai dapat dijawab dengan periode waktu di kelas 50 menit. Hal ini tidak cukup untuk menentukan semua cakupan pengetahuan seseorang tentang masalah pokok.

Kelemahan tes esai lainnya adalah bahwa tes ini peka terhadap tipuan peserta tes yang terampil bicara tetapi tidak diberitahu sebelumnya dan pemberian skor pada tes ini subjektif dan menghabiskan banyak waktu.

Dalam merancang pertanyaan esai, penulis item akan mencoba membuat pertanyaan seobyektif mungkin. Hal ini dapat dilakukan dengan : Mendefinisikan tugas dan menyusun kata dalam item dengan jelas, misalnya minta peserta tes untuk “mengkontraskan” dan “menjelaskan” bukan mendiskusikan. Menggunakan angka kecil untuk item, semua harus dicoba oleh semua peserta tes Menyusun item sehingga para ahli masalah pokok setuju bahwa satu jawaban dapat dibuktikan lebih baik dari yang lain Meminta para peserta tes menjawab setiap item pada lembar kertas terpisah.

Teknik Bercerita Salah satu metode yang diklaim mampu mendeteksi pola kepribadian ialah meminta orang untuk bercerita. Secara umum, peserta tes diperlihatkan pada gambar dan diminta mengatakan apa yang dilakukan orang dalam gambar, apa yang mereka piker dan rasakan, peristiwa apa yang menyebabkan gambar dan apa hasilnya.

Menggunakan Komputer dalam Penyusunan Tes Penerapan komputer paling umum dalam penyusunan tes terdiri dari program pemrosesan kata untuk membantu mengetik item, memformat, mengecek kesalahan ejaan dan sintaksis dan lain sebagainya. Para penulis item-tes berbasis komputer, algoritma spesifikasi domain untuk menghasilkan item tes dan pendekatan berbasis linguistic atau pembelajaran konsep untuk menulis item memberikan prosedur yang lebih efisien dan akurat dalam penyusunan item tes.

Merakit dan mereproduksi tes Setelah item tes dipersiapkan, disarankan untuk ditinjau ulang dan diedit oleh beberapa orang lain yang berpengetahuan. Bahkan upaya paling menyakitkan tidak selalu menghasilkan tes yang bagus. Di kelas, tes pencapaian prestasi (achievement test) yang dibuat sendiri dapat ditingkatkan oleh teman atau rekan yang sering mengetahui letak kesalahan dan memberikan saran berharga untuk meningkatkan item.

Dengan asumsi bahwa para perancang tes telah menyusun sejumlah item memuaskan, keputusan akhir berkaitan dengan beberapa masalah harus dibuat sebelum menerapkan tes. Apakah panjang tes sesuai dengan batas waktu ? Bagaimana cara item dikelompokkan atau disusun di halaman buklet tes ? Apakah jawaban ditandai pada buklet tes atau apa lembar jawaban khusus yang akan digunakan ? Bagaimana cara memproduksi buklet tes dan lembar jawaban ? Informasi apa yang harus dimasukkan pada petunjuk tes ?

Panjang Tes Berapa banyak item yang terdapat pada tes tergantung pada batas waktu, tingkat membaca peserta tes dan panjang serta kesulitan item. Item lebih pendek dan /atau item yang hanya membutuhkan memori hafalan fakta dapat dijawab dengan sedikit waktu daripada item panjang yang membutuhkan penghitungan yang menghabiskan energy dan/atau pemberian alas an abstrak. Tes pilihan ganda atau jawaban pendek 50 item dan tes benar salah 100 item biasanya sesuai untuk periode kelas 50 menit pada tingkat SMP atau SMA. Lima atau enam pertanyaan esai yang mengharuskan jawaban setengah halaman dapat dikerjakan dengan waktu yang sama. Kecuali jika itemnya sangat panjang dan sangat sulit, setidaknya 90% siswa di kelas pada sekolah menengah akan dapat menyelesaikan tes dengan waktu yang diberikan.

Susunan item Disarankan untuk menyusun pola item pilihan ganda dan item benar salah sehingga jawaban tidak mengikuti pola. Lembar Jawab Pada sebagian besar tes kelas, terutama kelas bawah disarankan agar para siswa menandai atau menulis jawaban di buklet tes. Ini mengurangi kesalahan dalam merespons. Pada tes obyektif, meminta peserta tes untuk menulis huruf atau jawaban yang tepat di bagian tepi yang kosong di sebelah kiri pertanyaan juga memudahkan pemberian skor.

Setiap institusi pendidikan memiliki fasilitas mereproduksi materi tertulis atau cetak untuk penggunaan di kelas. Mesin fotokopi dapat digunakan untuk menggandakan buklet tes dalam format cetak satu atau 2 sisi, kadang-kadang berwarna. Jika tipe lembar jawab sama digunakan untuk tes berbeda, jumlah yang sama banyak dapat dicetak pada sekali putar mesin dan disimpan untuk administrasi tes lain.

Petunjuk tes Petunjuk tes esai atau objektif yang dikelola secara serempak pada sekelompok orang ditempatkan di bagian depan tes dan petunjuk khusus untuk setiap bagian tes multibagian diletakkan sebelum masing-masing bagian. Biasanya cukup bijaksana untuk mengetik petunjuk dengan jenis huruf tebal sehingga para peserta tes tidak akan melompat atau mengabaikannya. Karena susunan kata untuk petunjuk itu berdampak pada skor perolehan maka petunjuk itu harus tepat bukannya umum.

Petunjuk dapat disampaikan secara lisan, bentuk cetak atau keduanya, petunjuk harus menginformasikan para peserta tes tentang tujuan tes (atau item), bagaimana respons harus diindikasikan, bantuan apa yang dapat diharapkan oleh para peserta tes jika mereka tidak mengerti sesuatu, lama waktu mereka mengerjakan tes, respon bagaimana yang akan diberi skor, apakah disarankan untuk menebak jawaban bila ragu-ragu dan bagaimana memperbaiki respons bila mereka melakukan kesalahan.

Pengetesan Lisan Tes lisan (oral tes) adalah situasi yang para peserta tes merespons dengan menjawab secara lisan : pertanyaan dapat disampaikan secara lisan , tulis atau keduanya. Tes pencapaian lisan lebih umum di institusi pendidikan Eropa daripada di Amerika Serikat di mana praktek tes lisan semakin menurun selama abad ke -20 dan tidak biasa di tingkat pendidikan tinggi dibandingkan dengan tingkat pendidikan rendah.

Banyak siswa tidak suka tes lisan dan merasa bahwa tes tersebut merupakan ukuran pengetahuan dan pemahaman yang tidak adil.   Tetapi guru pidato, seni drama, bahasa Inggris dan bahasa asing sering menyesalkan ketidakperhatian pengabaian seperti itu adalah orang-orang yang tidak dapat berbicara dengan benar, comprehension atau nyaman.

Keunggulan Tes Lisan Salah satu keunggulan berupa situasi sosial interaktif yang diberikan pada ujian lisan, memungkinkan evaluasi ciri pribadi seperti penampilan, gaya dan cara berbicara. Situasi bertatap muka ini juga membuat kecurangan dan barangkali sikap sombong berkurang. Keunggulan lain dari tes lisan adalah bahwa tes ini sering mengharuskan respon pada tingkat intelektual lebih tinggi lebih tinggi dari pada tes tertulis dan memberikan praktik komunikasi lisan dan interaksi sosial secara lisan.

Waktu yang diperlukan untuk menyiapkan dan mengevaluasi jawaban lisan lebih sedikit dibandingkan dengan tes tertulis. Interview struktural yang terdiri dari pertanyaan dan jawaban lisan sering diadakan terhadap para pelamar kerja untuk mendapatkan posisi pada organisasi pemerintah dan industri. Ujian Lisan versus Ujian Tertulis Fakta bahwa skor tes pencapaian lisan hanya memiliki korelasi moderat dengan skor pada tes tertulis yang diperbandingkan mengungkapkan bahwa tes tersebut mengukur aspek pencapaian yang berbeda.

Pengetesan Kinerja Tes kertas dan pensil merupakan tes paling efisien dan objektif dari semua jenis tes, tetapi tes ini hanya memberikan informasi tidak langsung mengenai kemampuan orang untuk mengerjakan atau berbuat sesuatu. Ada banyak contoh perilaku khusus-situasi yang banyak dipelajari oleh siswa untuk memberikan jawaban yang benar di kelas atau pada tes kertas-pensil tetapi meninggalkannya ketika berhadapan dengan situasi nyata di mana perilaku ini sebenarnya dapat diterapkan.

Karena kehidupan nyata lebih besar daripada tes tertulis, pengetesan pencapaian prestasi kadang-kadang merujuk pada pemeriksaan otentik (authentic assessment) atau menekankan bahwa ini merupakan opsi pengetesan tertulis, pemeriksaan alternative (alternative assessment). Tes kinerja tidak terstruktur mengamati dan mengevaluasi siswa secara rendah hati/obtrusively) selama di kelas, di aula atau di taman sekolah.

TERIMA KASIH