Diperbarui tanggal 4/Des/2022

Instrument Penilaian Tes dalam Pembelajaran

kategori Asesmen dan Evaluasi Pembelajaran / tanggal diterbitkan 2 Juni 2021 / dikunjungi: 22.07rb kali

Pengertian Instrumen Tes

Menurut arikunto (2003:40) instrument adalah alat yang digunakan untuk mengukur kemampuan ataupun keterampilan siswa yang akan dinilai atau dievaluasi. Maksudnya instrument adalah yang dapat digunkan untuk membantu proses evaluasi sehingga hasil yang diperoleh akan lebih baik. Menurut uno (2013:109) dalam tes hasil belajar instrument adalah alat yang dibunakan untuk mengukur hasil belajar. Menurut sugiyono (2010:95) menjelaskan bahwa instrument merupakan suatu alat yang digunakan untuk mengukur fenomena alam maupun social yang diamati. Menurut setyosari (2012:152) instrumen adalah alat ukur yang dipakai selama pelaksanaan perlakuan. Sedangkan riduwan (2012:78) mengungkapkan bahawa instrument merupakan alat untuk mengukur nilai variable yang akan diteliti. Maksudnya adalah jika seorang peneliti ingin melakukan peneliti terhadap nilai ujian siswa maka secara otomatis instrument yang digunakan oleh peneliti tersebut adalah sebuah tes. Jadi dapat disimpulkan bahwa salah satu jenis instrument itu ialah tes.

Menurut arifin (2012:3) tes adalah alat pengumpulan data yang dirancang secara khusus. Menurut nurjanah (2015:70) alat yang digunakan sebagai sarana untuk menentukan penilaian atau evaluasi adalah tes. Menurut sudaryono (2013:63) tes adalah himpunan pertanyaan yang hasrus dijawab. Ditanggapi atupun dilaksanakan oleh orang yang dites. Tes digunkan untuk mengukur sejauh mana seorang siswa telah menguasai pelajaran yang telah disampaikan selama proses pembelajaran. Menurut uno (2013:111) tes adalah seperangkat rangsangan (stimuli) yang diberikan kepada seseorang dengan maksud untuk mendaptkan jawaban-jawaban yang menjadi dasar bagi penetapan skor angka.

Sehingga dapat disimpulakan bahwa instrument tes adalah suatu alat yang terdiri dari himpunan pertanyaan yang digunkan untuk mengukur kemampuan siswa dalam memahami meteri pelajaran yang telah disampaikan.

Fungsi Instrumen Tes

Menurut arikunto (2013::165-167) fungsi dari tes 3 yaitu:

  1. Fungsi untuk kelas ada 7 yaitu:
    1. Mengadakan diagnosis tergadap kesulitan belajar siswa,
    2. Mengevaluasi celah antara bakat dengan pencapaian,
    3. Menaikkan tingkat prestasi,
    4. Mengelompokkan siswa dalam kelas pada waktu metode kelompok,
    5. Merencanakan kegiatan prose belajar-mengajar untuk siswa secara perorangan,
    6. Menentukan siswa mana yang memerlukan bimbingan khusus, dan
    7. Menentukan tingkat pencapaian untuk setiap anak.
  2. Fungsi untuk bimbingan ada 3 yaitu:
    1. Menentukan arah pembicaraan dengan orang tua tentang anak-anak mereka,
    2. membantu siswa dalam menentukan pilihan,
    3. Membantu siswa mencapai tujuan pendidikan dan jurusan.
  3. Fungsi untuk administrasi ada 6 yaitu:
    1. Memberi petunjuk dalam pengelompokan siswa,
    2. Penempatan siswa baru,
    3. Membantu siswa memilih kelompok,
    4. menilai kurikulum,
    5. Memperluas hubungan masyarakt (public relation),
    6. Menyediakan informasi untuk badan-badan lain diluar sekolah.

Komponen Instrumen Tes

Menurut arikunto (2013::173-174) fungsi dari tes 4 yaitu:

  1. Buku Tes, yakni lembaran atau buku yang memuat KD, indicator, kisi-kisi soal, ringkasan rumus dan butir-butir soal yang harus dikerjakan oleh siswa.
  2. Lembar Jawaban Tes, yakni lembaran yang disediakan oleh penilaian bagi testee untuk mengerjakan tes. Untuk lembaran jawaban pilihan ganda disediakan petunjuk pengerjaan apakah akan dilingkari atau disilang. Sedangkan untuk lembar jawaban essay akan diberikan satu lembar halaman kosong uuntuk siswa mengerjakan soal yang diberikan.
  3. Kunci Jawaban, berisi jawaban-jawaban yang dikehendaki. Kunci jawaban ini dapat diberupa huruf-huruf yang dikehendaki atau kata/kalimat. Untuk tes uraian yang dituliskan adalah kata-kata kunci ataupun kalimat singkat untuk memberikan ancar-ancar jawaban. Kunc jawab ini diperlukan agar: 1) Pemeriksaan tes dapat dilakukan oleh orang lain, 2) pemeriksaannya berul, 3) dilakukan dengan mudah, 4) Sesedikitnya mungkin masuknya unsur subjektif.
  4. Pedoman Penilaian atau pedoman skoring berisi keterangan perincian tentang skor atau angka yang diberikan kepada siswa bagi soal-soal yang telah dikerjakan.

Penyusunan Instrumen Tes

Menurut Djali dalam Sudaryono (2013:65) langkah-langkah dalam pengembangan instrument tes ada 12 yaitu:

  1. Menetetapkan tujuan tes. Sebelum mengembangkan insturmen tes terlebih dahulu tentukan tujuan untuk keprluan apa.
  2. Analisis kurikulum. Hal ini bertujuan untuk menentukan bobot setiap pokok bahasan.
  3. Analisis buku pelajaran. Hal ini juga bertujuan untuk menentukan bobot setiap pokok bahasan.
  4. Membuat kisi-kisi. Manfaat kisi-kisi adalah untuk menjamin sampel soal yang baik, dalam arti mencakup semua pokok bahasan secara proposional.
  5. Penulisan tujuan instruksional khusus. Penulisan TIK harus sesuai dengan ketentuan yang telah ditetapkan.
  6. Penulisan soal. Dalam penulisan soal hal perlu diperhatikan adalah:
    1. soal yang dibuat harus valid dalam arti dapat mengukur tercapai tidaknya tujuan pembelajaran,
    2. soal yang dibuat harus dapat dikerjakan dengan menggunkan satu kemampuan spesifik,
    3. soal yang dibuat harus terlebih dahulu dikerjakan dan diselesaikan dengan langkah-langkah lengkap sebelum digunakan pada tes yang sesungguhnya,
    4. menetapkan sejak awal aspek kemampuan yang hendak diukur untuk setiap soal matematika yang dibuat,
    5. dalam membuat soal matematika, hindari sejauh mungkin kesalahan-kesalahan ketik betapa kecilny, karena hak itu akan mempengaruhi validitas soal,
    6. memberikan petunjuk mengerjakan soal secara lengkap dan jelas untuk setiap bentuk soal matematika dalam suatu tes.
  7. Telaah soal. Soal-soal yang dibuat masih mungkin terjadi kekurangan atau kekeliruan yang menyangkut aspek kemampuan spesifik yang diukur, bahasa yang digunakan, kesalahan ketik dan sebagainya.
  8. Reproduksi tes terbatas. Tes yang sudah jadi diperbanyak dalam jumlah yang cukup menurut jumlah sampel uji coba.
  9. Uji-coba tes. Tes yang telah diperbanyak akan diuji-cobakan pada sejumlah sampel yang telah ditentukan.
  10. Analisis hasil uji-coba. Berdasarkan data hasil uji-coba dilakukan analisis, terutama analisis butir soal yang meliputi validitas, reliable, tingkat kesukaran dan daya beda.
  11. Revisi soal. Soal-soal yang valid berdasarkan kriterian empiric yang dikompirmasi dengan kisi-kisi.
  12. Merakit soal menjadi tes. Urutan soal dalam suatu tes dilakukan menurut tingkat kesukaran soal yaitu dari soal yang mudah sampai soal yang sulit.

Kriteria Instrumen Tes yang Baik

Menurut Arikunto (2013::200-220) suatu tes dapat dikatakan baik apabila memenuhi lima persyaratan, yaitu: validitas, reliabilitas, objektivitas, praktikabilitas dan ekonomis.

  1. Validitas merupakan syarat yang terpenting dalam suatu alat evaluasi. Suatu tes disebut valid apabila tes tersebut dapat mengukur apa yang hendak dan seharusnya diukur. Secara garis besar ada 2 (dua) macam validitas, yaitu validitas tes dan validitas butir soal.
    1. Validitas Tes terdiri dari dua macam validitas yaitu validitas isi dan validitas konstruksi seperti dibawah ini
      1. Validitas isi adalah validitas yang ditilik dari segi isi tes itu sendiri sebagai alat pengukur hasil belajar, yaitu: sejauh mana tes hasil belajar sebagai alat pengukur hasilbelajar peserta didik, isinya telah dapat mewakili secara representatif terhadap keseluruhan materi atau bahan pelajaran yang seharusnya diteskan (diujikan). Pengujian validitas isi yang dilakukan dengan menelaah butir (item review) dilakukan dengan mencermati kesesuaian isi butir yang ditulis dengan perencanaan yang dituangkan dalam kisi-kisi. Butir-butir tes dinyatakan valid (logically valid) apabila setelah mencermati isi butir-butir yang ditulis telah menunjukkan kesesuaian dengan kisikisi.
      2. Validitas konstruk adalah suatu tes di mana butir soal tersebut membangun setiap aspek berfikir seperti yang disebutkan dalam tujuan instruksional khusus.44 Menurut Benjamin S. Bloom bahwa taksonomi (pengelompokan) tujuan pendidikan harus senantiasa mengacu kepada tiga jenis ranah (domain) yang melekat pada diri peserta didik, yaitu: Ranah proses berpikir (cognitive domain), Ranah nilai atau sikap (affective domain), Ranah keterampilan (psychomotor domain). Setiap domain disusun menjadi beberapa jenjang kemampuan, mulai dari hal yang sederhana sampai dengan hal yang kompleks, mulai dari hal yang mudah sampai dengan hal yang sukar, dan mulai dari hal yang konkrit sampai dengan hal yang abstrak.
    2. Validitas Butir Soal (item) dari suatu tes adalah ketepatan mengukur yang dimiliki oleh sebuah item (yang merupakan bagian tak terpisahkan dari tes sebagai suatu totalitas), dalam mengukur apa yang seharusnya diukur lewat butir item tersebut. Setiap butir item yang ada dalam tes hasil belajar itu merupakan bagian tak terpisahkan dari tes hasil belajar tersebut sebagai suatu totalitas. Eratnya hubungan antara item dengan tes hasil belajar sebagai suatu totalitas itu kiranya dapat dipahami dari kenyataan, bahwa semakin banyak butir-butir item yang dapat dijawab dengan betul oleh testee, maka skor-skor total hasil tes tersebut akan semakin tinggi. Sebaliknya, semakin sedikit butir-butir item yang dapat dijawab dengan betul oleh testee, maka skor-skor total hasil tes itu akan semakin rendah atau semakin menurun.
  2. Reliabilitas adalah ketetapan atau ketelitian suatu alat evaluasi. Suatu tes atau alat evaluasi dikatakan andal jika ia dapat dipercaya, konsisten, atau stabil dan produktif. Tes dikatakan dapat dipercaya (reliable) jika memberikan hasil yang tetap atau ajeg (consistent) apabila diteskan berkali-kali. Jika kepada siswa diberikan tes yang sama pada waktu yang berlainan, maka setiap siswa akan tetap berada dalam urutan (rangking) yang sama atau ajek dalam kelompoknya.
  3. Obyektivitas atau Objektif berarti tidak adanya unsur pribadi yang mempengaruhinya. Lawan dari objektif adalah subjektif, artinya terdapat unsur pribadi yang masuk memengaruhinya. Sebuah tes dikatakan memiliki obyektivitas apabila dalam melaksanakan tes tidak ada faktor subjektif yang memengaruhinya, terutama dalam sistem skoringnya. Ada 2 faktor yang memengaruhi subjektivitas dari suatu tes, yaitu bentuk tes dan penilai. Bentuk tes uraian akan memberi banyak kemungkinan kepada penilai untuk memberikan penilaian menurut caranya sendiri. Dengan demikian maka hasil dari seorang siswa yang mengerjakan soal dari sebuah tes, akan memperoleh skor yang berbeda apabila dinilai oleh dua orang. Itulah sebabnya pada waktu sekarang ini ada kecenderungan penggunaan tes objektif di berbagai bidang. Untuk menghindari masuknya unsur subjektivitas dari penilai, maka sistem skoringnya dapat dilakukan dengan sebaik-baiknya, antara lain dengan membuat pedoman skoring terlebih dahulu.
  4. Praktikabilitas artinya praktis dan mudah pengadministrasiannya. Tes yang praktis adalah tes yang: a) Mudah dilaksanakan, artinya tidak menuntut peralatan yang banyak dan memberi kebebasan kepada siswa untuk mengerjakan terlebih dahulu bagian yang dianggap mudah oleh siswa. b) Mudah pemeriksaannya, artinya bahwa tes itu dilengkapi dengan kunci jawaban maupun pedoman skoringnya. Untuk soal bentuk obyektif, pemeriksaan akan lebih mudah dilakukan jika dikerjakan oleh siswa dalam lembar jawaban.c) Dilengkapi dengan petunjuk-petunjuk sehingga dapat diberikan oleh orang lain.
  5. Ekonomis berarti biaya dengan kata lain pelaksanaan tes tersebut tidak membutuhkan biaya yang mahal,tenaga yang banyak dan waktu yang lama.

Selain 5 kriteria yang disebutkan diatas ada 2 kriteria lagi. Akan tetapi 2 kriteria ini tidak terlalu berpengaruh dalam menentukan instrumen tes tersebut baik atau tidak. Adapun 2 kriteria tersebut adalah sebagai berikut

  1. Tingkat Kesukaran atau Analisis tingkat kesukaran soal artinya mengkaji soal-soal tes dari segi kesulitan sehingga dapat diperoleh soal-soal yang termasuk muda, sedang dan sukar. Tingkat kesukaran tes item pada umumnya ditunjukkan dengan persentase siswa yang memperoleh jawaban item benar. Menentukan proporsi jumlah soal kategori mudah, sedang dan sukar. Soal yang baik adalah soal yang tidak terlalu mudah atau tidak terlalu sukar. Soal yang terlalu mudah tidak merangsang siswa untuk mempertinggi usaha memecahkannya. Sebaliknya soal yang terlalu sukar akan menyebabkan siswa menjadi putus asa dan tidak mempunyai semangat Ada beberapa dasar pertimbangan dalam menentukan proporsi jumlah soal kategori mudah, sedang dan sukar. Pertimbangan pertama adalah keseimbangan, yakni jumlah soal sama untuk ketiga kategori tersebut. Artinya soal mudah, sedang dan sukar jumlahnya seimbang. Pertimbangan kedua proporsi jumlah soal untuk ketiga kategori tersebut didasarkan atas kurva normal. Artinya, sebagian besar soal berada dalam kategori sedang, sebagian lagi termasuk ke dalam kategori mudah dan sukar dengan proporsi yang seimbang. Perbandingan antara soal mudah-sedang-sukar bisa dibuat 3-4-3. Artinya, 30% soal kategori mudah, 40% soal kategori sedang, dan 30% lagi soal kategori sukar.
  2. Daya Pembeda soal adalah kemampuan suatu soal untuk membedakan antara peserta didik yang pandai (menguasai materi) dengan peserta didik yang kurang pandai (kurang atau tidak menguasai materi. Analisis daya pembeda mengkaji butir-butir soal dengan tujuan untuk mengetahui kesanggupan soal dalam membedakan siswa yang tergolong mampu (tinggiprestasinya) dengan siswa yang tergolong kurang atau lemah prestasinya. Artinya, bila soal tersebut diberikan kepada anak yang mampu, hasilnya menunjukkan prestasi yang tinggi, dan bila diberikan kepada siswa yang lemah, hasilnya rendah. Langkah-langkah Menghitung Daya pembeda item itu dapat diketahui melalui atau dengan melihat besar kecilnya angka indeks diskriminasi D (d besar). Daya pembeda pada dasarnya dihitung atas dasar pembagian testee ke dalam dua kelompok, yaitu kelompok pandai atau kelompok atas (upper group) dan kelompok bodoh atau kelompok bawah (lower group). Adapun cara menentukan dua kelompok itu bisa bervariasi, misalnya dapat menggunakan median sehingga pembagian menjadi dua kelompok itu terdiri atas 50% testee kelompok atas dan 50% testee kelompok bawah, dapat juga dengan hanya mengambil 20% dari testee yang termasuk dalam kelompok atas dan 20% lainnya diambil dari testee yang termasuk dalam kelompok bawah, dapat juga menggunakan angka persentase lainnya. Namun pada umumnya para pakar di bidang evaluasi pendidikan lebih banyak menggunakan persentase sebesar 27% dari testeeyang termasuk dalam kelompok atas dan 27% lainnya diambilkan dari testee yang termasuk dalam kelompok bawah. Hal ini disebabkan karena berdasarkan bukti-bukti empirik pengambilan subyek sebanyak 27% testee kelompok atas dan 27% testee kelompok bawah itu telah menunjukkan kesensitifannya, atau dengan kata lain cukup dapat diandalkan.