Penyusunan Maximal Performance Test (Tes Performansi Maksimal) Presented by: Eriyalita Ristaningtyas .P 832014014 Prisca Diantra Sampe 832014011
TES Kognitif : Non Kognitif : 1. Abilitas Potensial Aspek2 afektif 2. Abilitas Aktual & kepribadian. (Prestasi)
TES PERFORMANSI MAKSIMAL Tes yang bertujuan mengukur aneka atribut psikologis yang termasuk ke dalam ranah kognitif dan ranah psikomotor, dengan cara menentukan batas maksimal atau batas atas atribut yang dimakud yg tdpt dlm diri testi
(Tes inteligensi & Bakat) Dibedakan Menjadi 2 : APTITUDE TEST (Tes inteligensi & Bakat) ACHIEVEMENT TEST (Tes Prestasi)
PENYUSUNAN APTITUDE TEST Mendefinisikan Test Menetapkan behavioral Content Domain (Ranah Isi Perilaku) dr atribut psikologis yg mnjadi objek atau sasaran tes. Lima teknik untuk mengidentifikasi ranah isi perilaku a.l: Content Analysis / Analisis Isi Review of Research/ Telaah Hasil Pnelitian Tdhulu Critical Incident / Pengamatan thd Prsitwa Luar Biasa Direct Observation atau Observasi Langsung Expert Judgement atau Penilaian Sejumlah Pakar
ODD MAN OUT ATAU PILIH YANG BEDA 2. Menuliskan Item Ada 3 jenis format Item yg dipandang efektif & lazim diterapkan dlm penyusunan tes inteligensi : 3.Melakukan Analisis Item ITEM ANALOGI ODD MAN OUT ATAU PILIH YANG BEDA SEQUENCES ATAU DERET
PENYUSUNAN ACHIEVEMENT TEST Mendefinisikan Tes Salah satu kelaziman dlm pnyusunan tes prestasi mt pljaran yg dsusun oleh guru adalh pemanfaatan taksonomi tujuan pengajaran tertentu dlm mnyusun tabel spesifikasi tes. Sumber penting dlm mndefinisikan tes (menentkan ranah isi perilaku) untk kategori tes hasil belajar aadalah silabus mt pelajaran & buku ajar.
2. Menuliskan Item Ada 7 jenis-jenis item pilihan ganda mengikuti penggolongan Haladyna, Downing & Rodriguez (2002) a.l: Conventional Multiple Choice (Pilihan ganda Konvensional). Alternate Choice (Dua Pilihan). True False (Benar Salah). Multiple True False (Benar Salah Ganda). Matching (Menjodohkan). Context Dependent Item Set (Rangkaian Item Tergantung Konteks).
TAKSONOMI PILIHAN GANDA Pedoman penulisan item pilihan dikemukakan oleh Haladyna, Downing dan Rodriguez Ini disebabkan karena tiga alasan utama yaitu: ada pembatasan penulisan jenis item pilihan-ganda dengan aneka varians, penulisan ini sudah diuji efektivitasnya dan pedoman ini dipilih ke dalam sejumlah komponen dalam penulisan item meliputi anek aspek terkait isi, format, gaya bahasa, stem dan opsi.
Cara Penskoran Item Dikotomis Non dikotomis
Tes merupakan kumpulan item maka kualitas tes sebagai kesatuan ditentukan juga kualitas masing-masing item yang membentuknya Paramater digunakan sebagai dasar seleksi item, dengan memilih item-item dengan parameter yang memenuhi syarat untuk dimasukkan ke dalam bentuk final tes Analisis item merupakan salah satu metode untuk mendapatkan item-item yang memenuhi syarat dalam konstruksi atau penyusunan tes Analisis Item
Beberapa hal yang perlu diperhatikan dalam seleksi item Distribusi Jawaban Terhadap Item: Taraf Kesukaran Item Hubungan antara Jawaban Terhadap Item dan Skor Total Tes sebagai Kriteria Internal: Daya diskriminasi Item Variabilitas Skor Item serta Korelasi Skor Item dan Kriteria: Indeks Reliabilitas Item & Indeks Validitas Item Analisis Efektivitas Distraktor Melakukan Seleksi Item
Distribusi Jawaban Terhadap Item: Taraf Kesukaran Item salah satu parameter penting dalam menggambarkan distribusi jawaban testi terhadap sebuah item adalah mean skor item Pada item-item yang diskor dikotomis mean skor = proporsi testi yang menjawab item dengan benar Taraf kesukaran item adalah sesuatu yang mengukur abilitas atau hasil belajar (mean skor) Distribusi Jawaban Terhadap Item: Taraf Kesukaran Item
Item dengan pi yang ekstrem tinggi (pi) = 1 Item dengan pi yang ekstrem tinggi (pi) = 1.0 atau mampu menjawab item dengan benar atau Item dengan pi rendah (pi) = 0 atau tidak mampu menjawab item dengan benar Jika Korelasi yang diperoleh separuh testi 0 sementara yang separuh sempurna maka tes ini gagal karena tidak mampu mengukur perbedaan di kalangan testi terkait atribut yang diukur
Syarat yang tepat Untuk mendapatkan hasil tes yang baik, maka tergantung pada jenis tesnya Untuk tes bakat dan prestasi, skor dirancang sesuai acuan norma taraf kesukaran ideal (0.60-0.80) Jika untuk menyeleksi kelompok atas yang melampaui nilai lulus maka pi = 0.50 (mampu menjawab dengan benar oleh separuh testi yang memeroleh skor total setara nilai lulus Untuk mendapat diskriminasi maksimum, sebaiknya taraf kesukaran 0.30-0.70
Kebanyakan tes menunjukkan perbedaan di antara testi baik atribut yang diukur maupun kriteria internal Daya diskriminasi item: keefektivan sebuah item dalam membedakan testi yang secara relatif menempati posisi tinggi dan sebaliknya dalam hal kriterian internal atau atribut psikologis yang diukur Untuk menunjukan tinggih rendahnya posisi testi digunakan skor total tes → Kriteria Internal Hubungan antara Jawaban terhadap Item dan Skor Total Tes sebagai Kriteria Internal: Daya Diskriminasi Tes
6 parameter indikator daya diskriminasi tes Item discrimination indeks atau indeks diskriminasi item Korelasi Pearson Product Moment Korelasi Point Biserial Korelasi Biserial Korelasi Phi Korelasi Tetrakorik 6 parameter indikator daya diskriminasi tes
Item-discrimination indeks atau indeks diskriminasi Item Ada beberapa langkah yang digunakan untuk menghitung parameter ini yaitu: Menggunakan skor total sebagai kriteria internal Tetapkan salah satu atau dua nilai skor total sebagai cutting score atau cutting scores Item-discrimination indeks atau indeks diskriminasi Item
Korelasi Pearson Product Moment Cocok diterapkan untuk menghitung koefisien korelasi antara skor item dan skor total tes khususnya pada jenis item dengan kisaran skor 1-4 atau lebih Korelasi Pearson Product Moment
Korelasi Point-Biserial Cocok diterapkan untuk menghitung koefisien korelasi antara skor item dan skor total tes khususnya pada skor dikotomis Korelasi Point-Biserial
Cocok diterapkan untuk menghitung koefisien korelasi antara skor tes dan skor item khususnya pada asumsi-asumsi berikut: Skor total terdistribusi normal Regresi antara skor item dan skor total bersifat linear Korelasi biserial
Koefisien Phi Cocok diterapkan untuk menghitung koefisien korelasi antara skor item yang bersifat dikotomis dan skor total tes yang dikonversikan menjadi dikotomis atau dua kategori lain yang bersifat non-kontinyu Paling tepat digunakan untuk skor yang murni dikotomis
Korelasi Tetrakorik Cocok diterapkan untuk menghitung koefisien korelasi antara skor item dan skor total tes khususnya skor item dan skor total bersifat dikotomis yang merupakan hasil dikotomisasi dari distribusi skor yang sesungguhnya bersifat kontinyu Sering disetarakan dengan rumus phi karena perhitungan rumit dan kesalahan baku besar
Saran untuk menggunakan indeks diskriminasi item yang tepat dalam analisis item Item yang memiliki taraf kesukaran sedang, semua indeks diskriminasi itemnya sama baiknya untuk diterapkan Jika penyusun ingin memperoleh item dengan taraf kesukaran mudah atau sukar, maka menggunakan koefisien biserial Jika penyusun ingin memperkirakan sekolompok testi yang diberikan tes memiliki abilitas yang berbeda dari sampel testi yang dipakai analisis item, maka menerapkan korelasi biserial
Jika penyusun cukup yakin bahwa sekolompok testi yang dikenai tes memiliki abilitas yang setara dengan sampel testi yang dipakai untuk analisis item, sementara penyusun tes berharap memperoleh item dengan konsistensi internal yang maka menggunakan korelasi point-biserial Jika item maupun skor total tes diskor secara dikotomis dan distribusi keduanya normal, maka dapat digunakan koefisien phi atau tetratonik
Variabilitas Skor Item serta Korelasi Skor Item dan Kriteria: Indeks Reliabilitas Item & Indeks Validitas Item Kategori ketiga dalam seleksi item adalah indeks reliabilitas item & indeks validitas item yang merupakan fungsi gabungan antara variabilita dan korelasi antara skor item dengan sebuah kriteria Indeks reliabilitas item (sirix): kriteria internal yang berupa skor total Indeks validitas Item (siriy): kriteria internal berupa ukuran dari atribut psikologis tertentu yang hendak diprediksikan dengan tes yang bersangkutan Kedua indeks ini tidak dapat digunakan sekaligus. Penyusun tes harus memilih mana yang akan diutamakan terkait dengan kriteria dari tes yang hendak dihasilkan
Analisis efektivitas distraktor Parameter ini diperiksa lewat analisis efektifitas distaraktor atau analisis daya distraktor Kunci jawaban adalah jawaban benar atau paling benar Distraktor adalah jawaban yang kurang benar bahkan salah Distraktor yang efektif adalah ditraktor yang mampu menarik perhatian testi untuk memilihnya Daya evaluasi distraktor dievaluasi berdasarkan presentase testi memilih masing-masing opsi yang salah dalam menjawab item
Metode friedenberg adalah metode analisis yang didasarkan pada beberapa konsep yaitu item pilihan ganda berdasar konsep di atas analisis ini dibagi atas expected distractor power dan actual distractor power, adanya kriteria untuk menentukan efektivitas distraktor item dalam item ditraktor yang tidak dipilih testi atau yang dipilih testi dalam jumlah yang sangat kecil atau sangat besar dibanding jumlah testi yang diharapkan maka harus ditulis ulang
Melakukan Seleksi Item Seleksi item dilakukan berdasarkan aneka parameter khususnya taraf kesukaran item (pi) dan korelasi item-total (rit) sebagai indeks daya diskriminasi item Untuk memilih item yang sungguh-sungguh efektif maka perlu diketahui kriteria umum tes yang efisien dan efektif (panjang tes, content atau isi tes, korelasi item total, taraf kesukaran dan efektivitas distraktor item)
Cermati item-item yang tidak memenuhi salah satu dari du syarat. Langkah-langkah dalam melakukan seleksi item untuk menyusun bentuk final tes abilitas yaitu Pilih item yang dalam analisi item terpenuhi memenuhi syarat : memiliki rpbis dan p yang ideal serta distraktor yang cukup efektif Cermati item-item yang tidak memenuhi salah satu dari du syarat. Periksa content atau isi item yang lolos seleksi. Jika belum mencakup aspek dari atribut yang ingin diukur maka periksa item yang tidak lolos seleksi dan mendakati syarat statistis dapat dimasukkan dalam bentuk final tes. Jika tidak ada dan kekurangannya serius maka tulis lagi item yang baru dan diujicobakan lagi Hitung jumlah item yang berhasil lolos seleksi. Jika sudah memenuhi syarat dan memiliki cakupan content yang memuaskan, hitung koefisien reliabilitas tes (K-R20). Jika reliabilitas kurang tinggi, maka dapat menambahkan item baru diambil dari item terbaik secara statistik dari antara item yang tidak lolos seleksi Setelah itu periksa distribusi skor totalnya. Distribusi skor total harus bersifat simetrik dan normal. Selain itu periksa varians Hitung delta ferguson. Delta ferguson > 0,90 memiliki daya diskriminasi yang baik Lakukan validasi silang terhadap bentuk tes dengan menggunakan kelompok sampel baru . Jika semua item mencapai rpbis dan p yang memuaskan maka proses penyusunan tes dapat diakhiri