Tes, Pengukuran, Asesmen, dan Evaluasi merupakan istilah yang berbeda
namun saling berhubungan. Banyak orang tidak mengetahui secara jelas
perbedaan di antara istilah-istilah tersebut, sehingga penggunaannya sering
dipertukarkan secara tidak tepat. Agar jelas berikut ini akan diuraikan
perbedaan antara Tes, Pengukuran, Asesmen, dan Evaluasi
1. Instrumen/Tes
Instrumen adalah alat yang digunakan untuk memperoleh informasi
tentang individu atau objek. Terdapat berragam instrumen sesuai dengan
jenis informasi yang ingin dikumpulkan, dapat berupa tes maupun non-tes.
Instrumen yang baik harus memenuhi syarat kesahihan, kehandalan,
kekhususan.
Sebagai alat pengumpul informasi atau data, tes harus dirancang
secara khusus. Kekhususan tes terlihat dari bentuk soal tes yang digunakan,
jenis pertanyaan, rumusan pertanyaan yang diberikan, dan pola jawabannya
harus dirancang menurut kriteria yang telah ditetapkan. Demikian juga
waktu yang disediakan untuk menjawab pertanyaan serta pengadministrasian
tes juga dirancang secara khusus. Selain itu, aspek yang diteskan pun
terbatas. Biasanya meliputi ranah kognitif, afektif, dan psikomotor.
Kekhususan-kekhususan tersebut berbeda antara satu tes yang satu dan tes
yang lain.
2. Pengukuran
Pengukuran adalah proses pengumpulan data atau informasi yang
dilakukan secara objektif. Melalui kegiatan pengukuran segala program yang
menyangkut perkembangan dalam banyak bidang dapat dikontrol dan
dievaluasi. Hasil pengukuran berupa kuantifikasi dari jarak, waktu, jumlah,
Ismaryati 0818341963 [email protected] 1
dan ukuran dsb. Hasil dari pengukuran dinyatakan dalam bentuk angka yang
dapat diolah secara statistik.
Data hasil pengukuran dapat diperoleh melalui berbagai teknik tes dan
non tes. Teknik-teknik tersebut ada yang menghasilkan data numerik (angka)
yang bersifat kuantitatif yang dapat dianalisis secara statistik, ada pula yang
menghasilkan data kualitatif. Secara ringkas, teknik-teknik pengukuran
tersebut dapat dicermati pada gambar 1.1 dan 1.2
Ismaryati 0818341963 [email protected] 2
Gambar 1.2: Teknik-Teknik Non Tes
Teknik NonTes
Observasi Lang
-sung Tida
k langsung
Partisipa-si
Wawancara
Berstruk- tur
Tak Berstruk -tur
Kuisioner:
Terbuka
Tertut
Skala:
Sikap
Mi
Sosi
omet
ri
Stud
i Kas
us
Chec
kLlis
t
Riwa
yat
Hidu
p
Gambar 1: Teknik-Teknik Tes
Teknik Tes
Lisan
Individual Kelompok
Tertulis
Esai:
BerstrukturBebasTerbatas
Objektif:
Benar-SalahMenjodohkanIsian PendekPilihan Ganda
Tindakan
Individual Kelompok
Tes Tindakan atau Kinerja Motorik
Pada umumnya, tes tindakan atau kinerja motorik selalu disertai petunjuk
pelaksanaan tes. Pengguna tes harus benar-benar mengikuti petunjuk
pelaksanaan tes yang telah ada. Produk dari kinerja motorik misalnya
kemampuan gerak dasar, keterampilan basket, service tennis, vertical power
jump, dan lain-lain.
Skala Rating, Checklist
Skala, checklist digunakan untuk mengungkap minat, sikap, tingkah laku,
kebiasaan, perkembangan, atau kematangan tingkah laku.
Tes TulisTeknik pengukuran ini memerlukan jawaban tertulis dari testi. Terdapat dua jenis tes
tertulis, yakni tes objektif dan esai (uraian).
Tes objektif
Teknik pengetesan ini mengandung pertanyaan-pertanyaan yang sudah terstruktur
dengan sempurna. Peserta tes tidak perlu melahirkan ide, dan tidak dituntut adanya
kemampuan mengorganisasikan jawaban. Pada umumnya, tes bentuk objektif telah
menyiapkan jawaban-jawaban untuk dipilih. Peserta tes hanya perlu mengenal jawaban
yang dianggap benar.
Pada umumnya tes bentuk esai (uraian) berupa pertanyaan-pertanyaan yang
mengandung permasalahan, dan memerlukan pembahasan, uraian, atau penjelasan sebagai
jawabannya. Ciri khas tes ini adalah siswa bebas memberikan jawabannya. Siswa bebas
memilih pendekatan yang dianggap tepat dalam menyelesaikan permasalahan yang
ditanyakan, menyusun dan mengorganisasikan jawabannya sendiri, serta memberikan
penekanan-penekanan terhadap aspek jawaban. Oleh sebab itu, tes bentuk esai
memberikan peluang bagi peserta tes untuk menyatakan, melahirkan, dan
mengintegrasikan ide-idenya. Yang perlu diperhatikan dalam penyusunan butir-butir soal
Ismaryati 0818341963 [email protected] 3
bentuk ini adalah perumusan masalah yang dikemukakan. Rumusan tujuan hendaknya
sangat jelas sehingga setiap peserta tes dapat menangkap masalah yang dikemukakan tepat
seperti yang dimaksud oleh penyusun tes. Untuk maksud tersebut, dalam merumuskan
tujuan biasanya digunakan kalimat-kalimat yang dapat memperjelas masalah yang
dikemukakan.
Kuesioner dan Wawancara
Dengan alat ukur ini tester dapat memperoleh informasi atau data secara langsung
dari individu mengenai status saat ini perihal kelakuan, keyakinan, sikap, minat, dan lain-
lain. Kuisioner terdiri atas rangkaian pertanyaan dalam bentuk tertulis yang harus dijawab
oleh responden. Apabila rangkaian pertanyaan tersebut disampaikan secara lisan, dan
menuntut jawaban secara lisan, dinamakan wawancara.
3. AsesmenAsesmen adalah proses mengumpulkan, menginterpretasikan, dan mensintesiskan
informasi dengan tujuan untuk membuat keputusan. Assesmen sinonim dengan
pengukuran plus observasi
A. Prinsip-prinsip Pengukuran dan Evaluasi.
Prinsip di sini adalah panduan atau tuntunan dalam melakukan kegiatan
pengukuran dan evaluasi agar tercapai fungsi yang diharapkan. Agar
pelaksanaan suatu program evaluasi dapat berhasil, perlu dipahami beberapa
prinsip pengukuran dan evaluasi sebagai berikut:
1. Suatu program pengukuran dan evaluasi harus selaras dengan landasan
falsafah pendidikan dan kebijakan lembaga pendidikan yang bersangkutan.
Hal ini penting untuk mencegah terjdinya konflik dan bermanfaat untuk
Ismaryati 0818341963 [email protected] 4
memperlancar dukungan serta kerjasama baik di antara guru pendidikan
jasmani maupun antara guru dan pimpinan.
2. Pengukuran harus dilakukan sesuai dengan tujuan program dan dilaksanakan
dalam rangka pengembangan atau penyempurnaan tujuan. Dengan demikian,
tujuan yang ingin dicapai harus jelas, demikian juga penahapannya harus
sesuai dengan hukum pertumbuhan dan perkembangan anak. Evaluasi
merupakan alat untuk mengendalikan program agar tepat sasarannya.
3. Testing adalah bagian dari pengukuran, dan pengukuran merupakan bagian
dari evaluasi. Testing bertujuan untuk menyediakan informasi yang akan
digunakan untuk keperluan evaluasi.
4. Hasil testing harus ditafsirkan dalam konteks perkembangan individu secara
menyeluruh yang mencakup aspek fisik, intelektual, emosional, sosial, dan
moral. Prinsip ini berhubungan dengan pemilihan alat ukur atau tes yang
akan digunakan, pembatasan ruang lingkup untuk setiap tingkatan kelas atau
jenjang pendidikan.
5. Testing dalam pendidikan jasmani dan kesehatan berawal dari anggapan
dasar bahwa semua atribut pada seseorang dapat dites dan diukur. Selain
dimensi fisik atau keterampilan, kemampuan kognitif yang menyangkut
pengetahuan atau pemecahan masalah, dan dimensi afektif yang menyangkut
sifat kepribadian, semuanya pada dasarnya dapat diukur atau dites. Namun
atribut yang dites itu hanya berupa cuplikan atau sampel yang dianggap
dapat mewakili sifat yang dimaksud secara keseluruhan. Dalam pendidikan
jasmani dan kesehatan, tidak pernah diperoleh skor absolut karena selalu ada
galat atau penyimpangan dari skor yang sebenarnya. Dengan kata lain, skor
yang diperoleh adalah skor yang sebenarnya ditambah dengan
penyimpangannya.
6. Kemampuan awal siswa harus diketahui untuk selanjutnya dibandingkan
dengan hasil tes dalam kesempatan berikutnya. Selisih antara tes awal dan
Ismaryati 0818341963 [email protected] 5
tes akhir menunjukkan perubahan dalam bentuk skor perolehan, atau paparan
deskriptif.
7. Mutu tes atau alat ukur harus diperhatikan karena akan mempengaruhi mutu
data yang diperoleh. Mutu evaluasi bergantung pada mutu data, dan mutu
data bergantung pada mutu tes atau alat ukur. Oleh karenanya tes yang
dipilih harus valid, reliabel. Tentang kriteria memilih tes akan dipaparkan
pada bab 2.
Evaluasi selalu dilaksanakan dengan merujuk kepada tujuan yang ingin
dicapai dalam suatu kegiatan. Evaluasi merupakan proses pemberian
pertimbangan atau makna mengenai nilai dan arti dari sesuatu yang
dipertimbangkan. Sesuatu yang dipertimbangkan tersebut dapat berupa orang,
benda, kegiatan, keadaan, atau suatu kesatuan tertentu.
Dengan kata lain evaluasi adalah proses penentuan nilai atau harga dari data
yang terkumpul. Pemberian pertimbangan mengenai nilai dan arti tidak dapat
dilakukan secara sembarangan, oleh karenanya evaluasi harus dilakukan
berdasar prinsip-prinsip tertentu.
Setelah diketahui perbedaan antara tes, pengukuran, dan evaluasi, dapat
diketahui hubungan di antara ketiganya. Hubungan tersebut dengan jelas
digambarkan sebagai berikut:
Ismaryati 0818341963 [email protected] 6
Evaluasi
Tes
Pengukuran
Dari gambar di atas jelas bahwa tes adalah bagian integral dari
pengukuran. Dengan demikian,, tes dan pengukuran adalah sesuatu yang tidak
dapat dipisahkan, tetapi tidak demikian halnya antara pengukuran dan evaluasi.
Pengukuran menyediakan sarana yang dapat digunakan untuk mengumpulkan
informasi yang diperlukan. Tes adalah alat atau instrumen yang digunakan
untuk mengumpulkan informasi. Evaluasi adalah proses memberikan nilai atau
harga dari data yang terkumpul. Melalui pengukuran, data kuantitatif diproses
dan dinilai hingga menjadi nilai yang bersifat kualitatif. Data yang terkumpul
digunakan sebagai bahan informasi untuk mengambil keputusan (apakah tujuan
yang telah ditetapkan telah tercapai?, apakah anak didik memperoleh kemajuan
yang berarti?).
Evaluasi merupakan kegiatan yang harus dilakukan terus menerus pada
setiap program, karena tanpa evaluasi sulit untuk diketahui kapan, di mana, dan
bagaimana perubahan-perubahan akan dibuat.
Evaluasi tidak hanya terbatas dalam menggambarkan status seseorang
dibandingkan dengan anggota kelompok lainnya. Tetapi yang lebih penting,
evaluasi dilaksanakan dalam rangka menggambarkan kemajuan yang dicapai
oleh seseorang. Karena itu, evaluasi harus dipahami sebagai bagian yang
integral dari penyelenggaraan sebuah program, yang selalu berawal dari
pemahaman terhadap siswa. Gambar 1.3 menunjukkan kedudukan evaluasi
dalam perencanaan program.
Ismaryati 0818341963 [email protected] 7
Gambar 1.3: Kedudukan Evaluasi dalam Perencanaan Program
Siswa
Administrasi Tes
Program Penjas
Pengetesan berkala
Hasil Dianalisis oleh
Guru
PenentuanHasil Umpan Balik
Penyesuaian Program
B. Tujuan Pengukuran dan Evaluasi
Pengukuran dan evaluasi dalam bidang pendidikan pada umumnya dan
keolahragaan khususnya mempunyai peranan yang sangat penting. Pengukuran
dan evaluasi bertujuan untuk: (1) pengelompokkan, (2) penilaian (3) motivasi,
dan (4) penelitian. Penentuan ini dapat digunakan untuk menentukan tingkat,
membebaskan peserta dari suatu kesatuan pelajaran, menaikkan peserta dari
suatu tingkat ke tingkat yang lebih tinggi, memberikan umpan balik untuk
memperbaiki unjuk kerja, menempatkan individu-individu ke dalam kelompok-
kelompok tertentu atau menentukan suatu bentuk latihan yang khusus. Pada
pokoknya, penentuan status mencakup semua tujuan-tujuan lain pada
pengukuran dan evaluasi. Berikut ini diuraikan tujuan tujuan pengukuran dan
evaluasi sebagaimana tersebut di atas:
1. Pengelompokkan.Salah satu tujuan pengukuran dan evaluasi adalah untuk pengelompokan.
Pengelompokkan ini berdasarkan tingkat keterampilan, umur, jenis kelamin, kondisi kesehatan, minat. Sebagai upaya memperbaiki proses pembelajaran, guru dapat menempatkan siswanya ke dalam kelompok-kelompok tertentu, sesuai dengan tingkat kemampuannya. Siswa dengan kemampuan yang tinggi tidak harus dipaksa bertahan dengan teman sekelompoknya yang berkemampuan kurang. Demikian juga sebaliknya. Dengan dilakukannya pengukuran dan evaluasi, siswa dapat dikelompokkan pada kelompok yang tepat.
Jika siswa ditempatkan pada kelompok yang setara tingkat keterampilannya, guru dapat menyusun program pelajaran secara individual. Keuntungan lain yang diperoleh dari pengelompokkan ini adalah siswa dapat
Ismaryati 0818341963 [email protected] 8
berani, lebih lancar, lebih aktif ketika berlatih, karena mereka bersaing dengan siswa lain yang berkemampuan setara. Dengan kata lain, tujuan penempatan siswa ke dalam kelompok yang setara adalah untuk memperbaiki proses pembelajaran.
2. PenilaianTujuan utama penilaian adalah memberi informasi tentang kemajuan
yang dicapai dalam proses pembelajaran yang dikerjakan dan posisi siswa di dalam kelompoknya. Dengan mempertimbangkan seluruh faktor, penilaian harus dilakukan secara objektif sehingga dapat mencerminkan kemajuan yang diperoleh, dan perbaikan-perbaikan yang diperlukan.
3. MotivasiMotivasi merupakan kekuatan yang memandu seseorang untuk mencapai
hasil yang tertinggi. Apabila dilaksanakan secara tepat, evaluasi dapat merupakan proses memotivasi yang positif. Demikian pula sebaliknya, bila dilakukan secara sembarangan evaluasi dapat mengurangi motivasi.
Motivasi yang terbesar adalah keberhasilan. Agar siswa tetap memiliki motivasi, mereka harus mengetahui bahwa dirinya berkembang kemampuannya. Tes-tes keterampilan olahraga memungkinkan siswa untuk berkompetisi dengan dirinya sendiri sebagai cara untuk mengukur kemajuannya.
4. Penelitian.Penelitian adalah penyelidikan yang dilakukan secara sistematis untuk
meningkatkan ilmu pengetahuan. Mutu data yang dikumpulkan bergantung pada ketelitian dan ketepatan alat ukur, teknik pengukuran, dan kelayakan tes.
Dengan menggunakan tes yang mengukur unjuk kerja fisik dalam
penelitian, diharapkan dapat membantu guru/pelatih dalam menyusun
program pelatihan yang tepat, membantu memecahkan masalah-masalah
dalam proses pembelajaran, dan memperbaiki program latihan yang telah
dijalankan. Dengan demikian,, penelitian dapat dianggap sebagai sarana.
Informasi data yang dikumpulkan untuk tujuan-tujuan penelitian harus
dievaluasi keberartiannya. Jadi, tujuan penting pengukuran dan evaluasi
Ismaryati 0818341963 [email protected] 9
adalah menyediakan sarana-sarana yang diperlukan untuk mengadakan
penelitian.
C. Ranah (Domain) yang Diukur
Dalam pendidikan jasmani atau lingkup olahraga, pengukuran dilakukan
pada ranah:
1. Pengukuran ranah kognitf
Pengukuran ranah ini mengukur pengetahuan yang dimiliki sehubungan
dengan teknik, peraturan, dan stretegi-strategi olahraga, konsep sehubungan
dengan pengembangan dan cara mempertahankan kesegaran jasmani, cara
pencegahan cedera, dan lain-lain.
2. Pengukuran ranah afektif
Pengukuran ranah ini mengukur minat, perhatian, sikap, perasaan, dan nilai
dalam hubungannya dengan aktivitas fisik yang bermakna. Selain itu,
mengukur sifat agresif, ketagihan berlatih, dan kecemasan dalam
menghadapi kompetisi.
3. Pengukuran ranah psikomotor
Pengukuran ranah ini mengukur keterampilan motorik, perkembangan
motorik, dan kesegaran jasmani. Pada umumnya tes psikomotor meliputi dua
hal: (a) produk performa motorik mengukur kecepatan, kekuatan,
keajegan servis, dan lain-lain, dan (b) proses pelaksanaan performa
mengukur pola yang digunakan untuk melakukan servis badminton
misalnya.
D. Tipe-tipe Evaluasi
1. Evaluasi Formatif dan Sumatif
Ismaryati 0818341963 [email protected] 10
Berdasar saat pelaksanaan dan kegunannya, evaluasi dapat dibedakan
menjadi:evaluasi formatif dan evaluasi sumatif. Evaluasi formatif bertujuan
untuk menyempurnakan program dan memantau kemajuan siswa. Evaluasi
ini dilakukan di sela-sela program yang sedang berlangsung, dengan tujuan
agar hasilnya dapat digunakan untuk menyempurnakan program.
Pelaksanaan tes dilakukan secara periodik dan beberapa kali, seperti tes
mingguan, tes bulanan.
Evaluasi sumatif adalah evaluasi yang dilaksanakan pada akhir suatu
program, misalnya akhir catur wulan, akhir semester. Nilai yang diperoleh
pada evaluasi sumatif biasanya dilaporkan dalam bentuk rapor, sementara
hasilnya dinyatakan dalam bentuk nilai tertentu atau dalam bentuk laporan
secara deskriptif.
2. Evaluasi Produk dan Evaluasi ProsesBerdasarkan atas tujuan-tujuan khusus program, evaluasi dapat
ditekankan pada perhatian produk yang dihasilkan dari unjuk kerja fisik,
proses yang menghasilkan produk, atau keduanya. Misalnya, dalam evaluasi
produk, ditentukan urutan hasil akhir dalam perlombaan lari 10 Km hanya
memerlukan catatan waktu seorang pelari yang diperlukan untuk menempuh
jarak perlombaan. Apabila kita menaruh minat untuk memperbaiki gaya lari
para pelari, maka perlu dianalisis proses terjadinya gerak lari, termasuk
aspek-aspek seperti penempatan kaki pelari, ayunan lengan, panjang langkah,
kecondongan tubuh dan sebagainya. Hal ini merupakan evaluasi proses.
Sebagian besar aktivitas evaluasi diarahkan pada keduanya, baik evaluasi
produk maupun proses. Beberapa aktivitas misalnya senam, lebih banyak
memberi kemungkinan untuk evaluasi proses daripada evaluasi produk.
dipilihnya mengevaluasi produk atau proses atau keduanya dari suatu unjuk
kerja, sangat menentukan jenis tes yang akan dipilih atau disusun.
Ismaryati 0818341963 [email protected] 11
3. Evaluasi Acuan Patokan dan Acuan NormaGuru, merasa perlu untuk menafsirkan arti informasi atau data yang hasil
pengetesan. Misalnya pada sebuah kelas yang terdiri atas 40 orang siswa.
Siswa A dapat melakukan push-up sebanyak 25 kali dalam tes kesegaran
jasmani untuk butir tes. Apa arti nilai 25 tersebut?
Apabila diterapkan evaluasi acuan norma, maka yang digunakan sebagai
kriteria adalah norma kelompok. Misalnya kemampuan rata-rata 40 siswa
dalam push-up adalah 20 kali, maka berdasarkan rata-rata tersebut
kemampuan siswa A dapat ditafsirkan. Ini berarti, jika dibandingkan dengan
teman-teman sekelasnya, kemampuan siswa A berada di atas rata-rata.
Evaluasi acuan patokan menggunakan patokan baku sebagai rujukannya.
Misalnya seorang dosen menetapkan bahwa agar dapat lulus pada nomor lari
100 meter, seorang mahasiswa harus dapat menempuhnya dalam waktu tidak
lebih dari 13,5 detik. Penetapan Patokan sering menimbulkan masalah,
terutama tentang batas patokan. Untuk menetapkan batas patokan harus
dipertimbangkan derajad penguasaan dikaitkan dengan pertumbuhan dan
perkembangan siswa.
Kedua pendekatan di atas, masing-masing memiliki kelemahan dan
kelebihan. Penggunaan evaluasi acuan norma memberikan peluang kepada
siswa untuk berhasil, namun sebaliknya dapat menimbulkan dampak yang
negatif, karena siswa dipersaingkan di dalam kelompoknya. Siswa yang
memang lemah kemampuanyya, akan selalu berada di posisi yang rendah dan
tidak pernah mengalami sukses.
Evaluasi acuan patokan lebih unggul dalam hal pemaparan penguasaan
materi, karena siswa dituntut untuk dapat memiliki kemampuan dengan
tingkat tertentu. Kelemahannya adalah patokan yang digunakan bergantung
pada pertimbangan guru yang bersangkutan.
Ismaryati 0818341963 [email protected] 12
Tes
a. Lisan: Individual Kelompok
b. Tertulis: Esai
Berstruktur Bebas Terbatas
Objektif Benar – salah Menjodohkan Isian Pendek Pilihan Ganda
c. Tindakan Individual Kelompok
Ismaryati 0818341963 [email protected] 14
Teknik Evaluasi Karakteristik
Non Tes
a. Observasi: Langsung Tidak langsung Partisipasi
b. Wawancara: Berstruktur Tidak berstruktur
c. Kuesioner Berstruktur Tidak berstruktur
d. Skala Minat Sikap
e. Sosiometrif. Studi Kasusg. Checklisth. Riwayat Hidup
Ismaryati 0818341963 [email protected] 15
5. Manfaat Evaluasi
a. Bagi siswaDengan diadakan evaluasi, maka siswa dapat mengatahui tingkat keberhasilannya setelah menerima pengalaman belajar dari guru. Hasil yang diperoleh melalui evaluasi dapat memuaskan atau tidak memuaskan.
Apabila hasilnya memuaskan, maka siswa akan berusaha untuk memperolehnya pada kesempatan yang berikut, dengan demikian siswa akan termotivasi untuk belajar lebih giat. Sedangkan apabila hasilnya tidak memuaskan, siswa akan berusaha agar tidak terulang pada kesempatan yang berikut, sehingga ia akan berusaha memperbaikinya.
b. Bagi guruDengan mengadakan evaluasi, guru dapat mempeoleh manfaat yang
berupa:
Guru dapat mengetahui siswa yang sudah berhak melanjutkan pelajarannya dan yang belum menguasai materi pelajaran. Dengan petunjuk ini guru dapat lebih memusatkan perhatiannya kepada siswa yang belum berhasil. Apalagi jika guru mengetahui penyebabnya, maka bimbingan atau perlakuan yang lebih teliti dapat diberikan sehingga keberhasilan belajar yang selanjutnya dapat diharapkan.
Ismaryati 0818341963 [email protected] 16
Guru akan mengetahui apakah materi pelajaran yang diberikan kepada siswa sudah tepat atau belum, sehingga untuk yang selanjutnya guru akan menggunakan materi yang sudah tepat dan bagi materi yang belum tepat dapat dilakukan perbaikan seperlunya.
Guru akan mengetahui apakah metode dan alat evaluasi yang digunakan sudah tepat. Apabila banyak siswa yang mendapatkan nilai yang jelek, hal ini mungkin disebabkan karena metode atau alat evaluasi yang digunakan kurang tepat.
c. Bagi sekolah
Apabila guru-guru mengadakan evaluasi dan kemudian diketahui deskripsi
tentang hasil belajar para siswanya, maka dapat diketahui apakah kondisi
belajar yang diciptakan sudah sesuai dengan harapan atau belum. Hasil
belajar merupakan cerminan kualitas suatu sekolah.
Informasi dari guru tentang tepat tidaknya kurikulum untuk sekolah dapat merupakan bahan pertimbangan bagi perencanaan selanjutnya.
Informasi yang diperoleh dari tahun ke tahun dapat dijadikan pedoman bagi pengambilan kebijakan selanjutnya.
6. Prinsip-prinsip Evaluasi
Betapapun sempurnanya suatu alat evaluasi, namun apabila tidak
memperhatikan prinsip-prinsip evaluasi, maka hasil yang diperoleh tidak akan
seperti yang diharapkan. Prinsip-prinsip tersebut adalah:
a. Sesuai dengan norma masyarakat atau filosofi hidup
Prinsip ini berkaitan erat dengan filsafat dan tata nilai (norma) hidup yang
berlaku di masyarakat. Artinya setiap tahapan evaluasi yang dilakukan
jangan sampai bertentangan dengan filsafat hidup dan tata nilai yang
berlaku di masyarakat.
Ismaryati 0818341963 [email protected] 17
b. Keterpaduan
Evaluasi hendaknya merupakan bagian yang integral dari program
pembelajaran atau sistem pendidikan. Dengan demikian evaluasi merupakan
salah satu dimensi yang harus dipenuhi dalam program pembelajaran
disamping pemenuhan secara tepat terhadap tujuan pembelajaran, bahan,
metode, dan alat pembelajaran. Oleh karena itu, perencanaan evaluasi harus
sudah ditetapkan pada saat menyusun perencanaan pembelajaran, sehingga
antara evaluasi dengan tujuan pembelajaran dan alat pembelajaran tersusun
dalam satu pola keterpaduan yang harmonis.
c. Realistis
Pelaksanaan evaluasi harus didasarkan pada apakah sesuatu yang akan
diukur itu benar-benar dapat diukur?. Dengan kata lain, evaluasi yang akan
dilakukan harus memiliki batasan atau indikator-indikator yang jelas,
operasional, dan dapat diukur.
d. Tester yang terlatih (qualified)
Mengingat tidak semua orang dapat melakukan atau mengelola suatu
program evaluasi, maka sangat diperlukan orang yang mampu melakukan
evaluasi atau qualified. Hal ini harus benar-benar diperhatikan, karena
keputusan yang akan diambil merupakan hal yang sangat penting bagi
orang yang dievaluasi.
e. Keterlibatan siswa
Untuk dapat mengetahui sejauh mana siswa berhasil dalam proses
pembelajaran yang dijalaninya secara aktif, maka siswa memerlukan suatu
Ismaryati 0818341963 [email protected] 18
evaluasi. Dengan demikian, evaluasi bagi siswa merupakan tuntutan atau
kebutuhan. Pelaksanaan evaluasi oleh guru merupakan upaya dalam
memenuhi tuntutan atau kebutuhan siswa akan informasi tentang
kemajuannya dalam proses pembelajaran.
f. Padagogis
Disamping sebagai alat, evaluasi juga berperan sebagai upaya untuk
perbaikan sikap dan tingkah laku ditinjau dari sisi pedagogis. Evaluasi dan
hasil-hasilnya hendaknya dapat dipakai sebagai alat untuk memotivasi siswa
dalam kegiatan belajarnya. Hasil evaluasi hendaknya juga dirasakan sebagai
penghargaan bagi siswa yang berhasil dan berperan sebagai sangsi bagi
siswa yang gagal.
g. Akuntabilitas
Keberhasilan proses pembelajaran perlu disampaikan kepada pihak-pihak
yang terkait dengan pendidikan sebagai laporan pertanggungjawaban
(accountability). Pihak-pihak tersebut antaralain: orangtua siswa, masyarakat,
calon pemakai lulusan, sekolah, dan pemerintah. Pihak-pihak tersebut perlu
mengetahui keadaan atau tingkat kemajuan belajar siswa atau lulusan agar
dapat dipertimbangkan pemanfaatan atau tindak lanjutnya.
h. Teknik Evaluasi yang Bervariasi dan Komprehensip
Agar diperoleh hasil evaluasi yang objektif, dalam arti dapat menggambarkan
prestasi atau kemampuan siswa yang sebenarnya, maka evaluasi harus
menggunakan berbagai teknik dan sifatnya komprehensif. Dengan sifat
komprehensif, dimaksudkan agar kemampuan yang dievaluasi tidak hanya
ranah kognitif saja, tetapi juga ranah afektif dan psikomotor.
Ismaryati 0818341963 [email protected] 19
i. Tindaklanjut
Evaluasi hasil belajar hendaknya diikuti dengan tinddak lanjutnya. Data hasil
evaluasi sangat bermanfaat bagi guru, tetapi juga sangat bermanfaat bagi
siswa, dan sekolah. Oleh karenanya perlu dikelola dengan sistem administrasi
yang teratur mengenai kemajuan belajar siswa. Hasil evaluasi harus dapat
ditafsirkan sehingga guru dapat memahami kemampuan dan prestasi setiap
siswanya.
Tugas
1. Apakah yang harus saudara kerjakan bila akan mengajar renang, ternyata
murid saudara memiliki kemampuan awal yang berbeda? Langkah apa saja
yang akan saudara kerjakan?
2. Bagaimana saudara akan melakukan evaluasi untuk mengetahui kemajuan
kemampuan renang siswa saudara?
Ismaryati 0818341963 [email protected] 20
BAB II
KRITERIA TES
Pada kegiatan pengetesan, peneliti atau guru sering dihadapkan kepada persoalan untuk memilih salah satu dari dua atau lebih tes yang sejenis. Oleh karena itu, peneliti atau guru harus mengetahui kriteria atau persyaratan yang dapat dijadikan sebagai bahan pegangan dalam menentukan tes yang akan digunakan. Kriteria ini akan memberikan petunjuk pemilihan tes karena para ahli tes dan pengukuran telah mempunyai kesepakatan pendapat tentang kriteria tersebut.
Kriteria untuk memilih tes memberikan arah terhadap pemilihan tes yang akan digunakan untuk mengukur objek. Pada pemilihan tersebut pengetes harus mempertimbangkan secara seksama apakah tes yang akan digunakan memenuhi kriteria sebagai suatau alat ukur yang baik atau tidak. Dengan demikian, bahan pertimbangan yang dapat diajukan acuan dalam memilih tes harus diketahui dan dipahami secara jelas, agar tidak menimbulkan kekeliruan dalam menentukan alat ukur yang akan digunakan. Misalnya tes yang tidak memenuhi kriteria validitas akan memberikan hasil pengukuran yang tidak menggambarkan keadaan yang sesungguhnya dari objek yang diukur.
Supaya hasil pengetesan menggambarkan keadaan yang sesungguhnya dari objek yang diukur, maka tes yang digunakan haruslah tes yang baik. Tes dikatakan baik apabila dapat memberikan data yang sehubungan dengan tepat.
Ismaryati 0818341963 [email protected] 21
Disamping itu juga harus memenuhi persyaratan dalam teori tes dan pengukuran, yaitu: validitas, reliabilitas, objektivitas, diskriminitas, praktibilitas.
1. Validitas
Ada dua pertanyaan paling utama yang harus diajukan terhadap alat ukur
(dalam hal ini tes), bagaimanakah validitas dan objektivitasnya. Kedua
pertanyaan ini untuk memastikan bahwa alat ukur yang digunakan betul-
betul mengukur semua gatra (unsur) yang harus diukur.
Secara sederhana, validitas adalah ukuran yang menyatakan ketepatan
tujuan tes (alat ukur) dan memenuhi persyaratan pembuatan tes. Validitas
tes menunjukkan derajat kesesuaian tes dengan atribut yang ingin diukur.
Validitas menggambarkan kemampuan tes untuk mengukur apa yang ingin
diukur (Kirkendall, 1987). Alat ukur dapat dikatakan valid apabila alat ukur
tersebut mengukur objek dengan tepat dan sesuai dengan gejala yang
diukurnya. Contohnya,
Meteran tepat untuk mengukur panjang benda, tetapi tidak tepat untuk
mengukur berat dan isi benda.
Literan tepat untuk mengukur isi benda, tetapi tidak tepat untuk
mengukur berat dan panjang benda.
Kilogram tepat untuk mengukur berat benda, tetapi tidak tidak tepat
untuk mengukur panjang dan isi benda.
Perlu diingat bahwa pengertian valid mencakup ketepatan dan ketelitian.
Misalnya, timbangan dacin tepat untuk mengukur berat beras dalam karung,
tetapi tidak teliti untuk mengukur berat cincin emas yang hanya beberapa
gram saja. Oleh karena, itu agar hasil pengukuran tepat dan teliti, cincin emas
Ismaryati 0818341963 [email protected] 22
harus ditimbang dengan penimbang emas yang berskala milligram. Jadi
penimbang emas valid untuk mengukur berat cincin, sebab kecuali hasilnya
lebih tepat juga teliti. Demikian juga halnya dengan gelas atau pipa ukuran
yang berskala cc, sahih (valid) untuk mengukur bibit minyak wangi yang isinya
hanya beberapa cc.
Dari uraian dan contoh di atas dapat disimpulkan bahwa tes yang sahih (valid) adalah tes yang dapat mengukur dengan tepat dan teliti gejala yang hendak diukurnya. Dalam pengertian yang lebih luas, validitas tes adalah kebenaran dari penafsiran tes.
Jenis-jenis validitas
Kebenaran validitas sangat bergantung pada dasar pemikiran yang dipertimbangkan atau ditentukan. Dasar pemikiran konsep validitas menjadi rumit karena ada berbagai macam definisi dan penamaan yang digunakan untuk memerinci berbagai unsur validitas tes. Agar lebih jelas berikut ini akan diuraikan jenis-jenis validitas.
Validitas dibedakan menjadi dua, yaitu validitas langsung (validitas logis) dan validitas derivatif (validitas empiris) (Nasir, 1985). Validitas langsung atau logis didasarkan atas pengertian seberapa jauh tes dapat dikatakan sesuai dengan putusan profesi dan proses analisis logis yang dituntut oleh suatu tes. Validitas logis dibedakan menjadi dua macam, yaitu validitas isi (content validity) dan validitas konstruk (costruct validity).
Validitas derivatif atau validitas empiris didasarkan atas bukti empiris dan statistik yang berhubungan dengan kriteria tes. Validitas empiris ini juga dibedakan menjadi dua macam, yaitu validitas konkuren (concurrent validity) dan validitas prediktif (predictif validity).
Ismaryati 0818341963 [email protected] 23
a. Validitas isi (content validity)
Validitas isi adalah validitas yang dipertimbangkan berdasar isi alat ukur yang
digunakan. Artinya, seberapa jauh alat ukur yang digunakan dapat mencakup
keseluruhan isi bahan yang hendak diukurnya. Pada dasarnya, validitas isi
merupakan suatu pendapat, baik pendapat pribadi maupun pendapat orang
lain.
Salah satu cara untuk untuk memperoleh validitas isi adalah dengan
mempersiapkan butir-butir soal tes yang sesuai dengan bahan pelajaran.
Contohnya, seorang dosen akan memberi ujian tengah semester kepada
mahasiswanya tentang kecerdasan. Semua bahan pelajaran yang diajarkan
selama setengah semester telah ditentukan ke dalam bagian terkecil (unit)
pelajaran. Kemudian, dosen tersebut membuat butir-butir soal tes. Berkenaan
dengan validitas isi, butir-butir soal yang telah disusun perlu ditelaah secara
seksama dan dipertimbangkan apakah bagian-bagian terkecil bahan pelajaran
telah terwakili di dalam soal tes. Penelaahan tersebut bermaksud untuk
meninjau apakah isi soal ujian telah sesuai dengan isi bahan pelajaran. Untuk
menilai validitas alat ukur biasanya si Dosen mendiskusikannya dengan teman
sejawat, disamping menggunakan penilaiannya sendiri yang disesuaikan
dengan bagian terkecil (unit) pelajaran yang diajarkan. Dengan cara
mendiskusikan dan menggunakan penilaian khusus yang disesuaikan dengan
bagian terkecil bahan pelajaran yang diajarkan, maka diperoleh kepercayaan
yang lebih meyakinkan tentang validitas isi.
b. Validitas Kontruk (construct validity)
Ismaryati 0818341963 [email protected] 24
Validitas konstruk adalah abstraksi untuk memberlakukan suatu konsep yang direka secara khusus bagi kebutuhan penelitian atau pengetesan. Berkenaan dengan contoh tentang soal ujian kecerdasan di atas, untuk mengetahui validitas konstruknya ada tiga pertanyaan yang perlu dijawab: (1) apakah landasan teori yang digunakan telah merangkum ranah (domain) tentang kecerdasan? (2) ranah apa sajakah yang membentuk konsep kecerdasan yang hendak diukur? (3) bukti nyata apakah yang memperlihatkan ada tidaknya keterkaitan antara ranah-ranah di atas?. Tiga pertanyaan tersebut merupakan pertanyaan pokok yang mendasari analisis validitas konstruk. Dalam hal ini usaha ditujukan untuk mengetahui apakah hal-hal yang termasuk di dalam konsep yang ditanyakan itu merupakan bagian soal ujian yang disusun. Dalam validitas konstruk, validasi tidak hanya dilakukan terhadap teori yang mendasari alat ukur, tetapi juga terhadap bukti empiris.
Langkah pertama yang harus dilakukan untuk menilai validitas konstruk adalah menentukan ranah yang akan diukur dari kecerdasan, apakah kemampuan menghafal, menganalisis, mengevaluasi, mensintesis atau kemampuan menerapkan sesuatu. Langkah ke dua adalah menentukan kriteria yang secara umum dapat digunakan untuk membedakan antara orang yang mempunyai kecerdasan tinggi dan rendah. Misalnya, kriteria yang dipilih adalah “kemampuan menyelesaikan soal matematika dengan cepat dan tepat”, kemudian kepada subjek diberikan tes kecerdasan dan soal metematika. Subjek yang memperoleh niali tinggi dalam tes kecerdasan juga mampu menyelesaikan ujian matematika secara cepat dan tepat. Namun sebaliknya, subjek yang memperoleh nilai rendah dalam tes kecerdasan juga kurang mampu dalam menyelesaikan soal-soal matematika. Maka dapat disimpulkan bahwa konstruk kecerdasan dengan 5 ranah di atas mempunyai validitas konstruk yang tinggi. Pada kenyatannya, penelaahan terhadap validitas konstruk seringkali bersangkut-paut dengan validitas isi.
c. Validitas Konkuren (concurrent validity)
Validitas konkuren adalah validitas yang ditinjau dari segi hubungan antara
alat ukur dengan suatu kriteria. Kriteria yang dimaksud dalam validitas
konkuren adalah kriteria yang telah diketahui atau yang dapat dipercaya
Ismaryati 0818341963 [email protected] 25
untuk mengukur atribut tertentu. Contoh kriteria konkuren adalah tes
kecerdasan yang sudah dibakukan. Hasil korelasi tes kecerdasan yang baru
dengan keriteria tes kecerdasan yang sudah dibakukan merupakan validitas
konkuren. Dengan demikian, validitas konkuren diperoleh dari jawaban
pertanyaan “Seberapa jauh suatu alat ukur berkorelasi positif dengan tes
sejenis yang telah dinyatakan validitas dan objektivitas”. Konkuren di sini
diartikan sebagai derajat yang mempunyai nilai dan bobot yang sama dalam
hal isi maupun prakiraannya.
d. Validitas Prediktif (predictive validity)
Validitas prediktif atau validitas ramalan adalah validitas yang berkenaan dengan hubungan antara nilai kriteria umum yang akan ada di masa yang akan datang. Misalnya, seorang siswa yang ingin masuk ke perguruan tinggi harus terlebih dahulu mengikuti ujian masuk universitas. Soal ujian masuk atau alat ukur telah dibuat sedemikian rupa sehingga diperkirakan siswa yang nilainya baik dalam ujian masuk akan menjadi mahasiswa yang nilainya baik dalam setiap ujian. Untuk mengetahui derajat validitas prediktif suatu tes diperlukan penghitungan dengan rumus korelasi, yang hasilnya merupakan koefisien korelasi.
Koefisien korelasi merupakan suatu angka perkiraan terhadap faktor Y (peubah bergantung) berdasarkan informasi dari faktor X (peubah bebas). Misalnya, dari hasil pengukuran power tungkai dalam latihan pliometrik, diperoleh hasil rerata X (latihan pliometrik) sebesar 26 dengan simpangan baku 8 dan rerata Y (power tungkai) sebesar 34 dengan simpangan baku 5. Hasil penghitungannya adalah X berkorelasi positif dengan Y; dengan besaran r = 0.757. Karena keduanya berkorelasi positif, maka jika nilai X naik, nilai Y pun naik. Jika digunakan data baru, rumusnya menjadi: bila simpangan baku X naik 1, maka Y akan naik sebesar 75,7% x 5 = 3,785. Bila dengan berbagai usaha, nilai rerata yang semula 26 naik menjadi 34 (26 + 8), maka rerata Y naik menjadi 37,785 (34 + 3.785).
2. Reliabilitas
Ismaryati 0818341963 [email protected] 26
Reliabilitas menyangkut ketepatan hasil pengukuran. Pengertian reliabilitas akan lebih mudah dipahami dengan menjawab pertanyaan berikut: (1) jika objek yang sama diukur berkali-kali dengan alat ukur yang sama, apakah akan diperoleh hasil yang sama?, (2) apakah ukuran yang diperoleh dengan menggunakan alat ukur tertentu merupakan ukuran yang sebenarnya dari objek tersebut?, (3) berapa besar kesalahan yang diperoleh dengan menggunakan ukuran tersebut terhadap objek?. Jawaban dari ketiga pertanyaan tersebut merupakan tiga unsur pengertian reliabilitas.
Suatu alat ukur mempunyai kehandalan yang tinggi atau dapat dipercaya jika alat ukur itu mantap; Artinya, alat ukur itu stabil, dapat diandalkan, dan dapat diramalkan. Alat ukur dikatakan mantap apabila alat ukur tersebut dalam pengukuran yang berulangkali pada objek yang sama menghasilkan ukuran yang sama. Misalnya, benda yang beratnya 40 kg, bila ditimbang berulangkali dengan penimbang yang sama dan dalam waktu yang berlainan akan memberikan hasil yang sama, yaitu 40 kg. Dengan demikian dapat dikatakan bahwa penimbang berat tersebut mantap. Jawaban pertanyaan ke dua menunjukkan aspek ketepatan. Ukuran yang tepat adalah ukuran yang cocok dengan unsur yang ingin diukur. Jika aspek kemantapan dan ketepatan digabungkan, maka dapat disimpulkan bahwa alat ukur yang digunakan mantap, dapat mengukur secara ajeg dan tepat. Selanjutnya, jawaban pertanyaan ke tiga menyiratkan bahwa alat ukur yang digunakan harus sedemikian rupa sifatnya sehingga kesalahan yang terjadi dalam pengukuran dapat ditolelir.
Dari uraian di atas dapat disimpulkan bahwa tes yang reliabel adalah tes yang
dapat menghasilkan ukuran secara ajeg dan tepat sesuai dengan gejala yang
hendak diukur. Reliabilitas suatu tes menunjukkan derajat keajegan hasil yang
diperoleh dari beberapa kali pengetesan terhadap subjek yang sama, alat ukur
yang sama, dan prosedur yang sama.
Jenis-jenis reliabilitas
Pada bagian terdahulu, dijelaskan bahwa reliabilitas berkaitan dengan ketepatan tes sebagai alat ukur. Selanjutnya, pada bagian ini akan diuraikan tentang
Ismaryati 0818341963 [email protected] 27
reliabilitas yang berkaitan dengan ketepatan ukuran suatu tes. Secara nyata, reliabilitas selalu mensyaratkan proses pengetesan yang berulang.
Berdasarkan cara memperolehnya, koefisien reliabilitas dapat dibedakan menjadi: koefisien kemantapan (koefisien stabilitas), koefisien taksiran (koefisien estimasi), koefisien kesetaraan (koefisien ekuivalensi) dan koefisien ketaatasasan (koefisien konsistensi). Penamaan keempat istilah tersebut mencerminkan cara atau metode yang digunakan untuk memperoleh koefisien reliabilitasnya yaitu: metode tes ulang (test-retest method), metode belah dua (split half method), metode tes paralel (equivalent method), metode konsistensi internal (internal consistency method).
Koefisien reliabilitas diperoleh dengan cara yang sama dengan proses mencari validitas empiris yaitu dengan menghitung koefisien korelasi. Namun demikian proses pemerolehan koefisien reliabilitas tidak dapat digunakan untuk keperluanb validasi; karena apa yang reliabel belum tentu valid, tetapi apa yang valid akan selalu reliabel.
a. Koefisien stabilitas
Koefisien stabilitas diperoleh dengan cara tes ulang, yaitu suatu tes diberikan dua kali kepada kelompok yang sama, dengan alat ukur yang sama, dengan jeda waktu yang tidak lama. Kemudian, hasil pengukuran tersebut dihitung koefisien korelasinya dengan menggunakan rumus angka kasar. Hasil penghitungan ini disebut koefisien stabilitas. Cara menghitung koefisien stabilitas tersebut adalah sebagai berikut:
1) Buatlah tabel frekuensi yang berisi nomer, testi, hasil tes pertama (X),
hasil tes ke dua (Y), kuadrat hasil tes pertama (X2), kuadrat hasil tes ke
dua (Y2), perkalian antara hasil tes pertana dan ke dua (XY).
2) Jumlahkan X, Y, X2, Y2, XY.
3) Masukkan angka-angka yang diperoleh ke dalam rumus berikut:
Ismaryati 0818341963 [email protected] 28
r =N.XY – (X)(Y)
{ N.X2 – (X)2 } { N.Y2 – (Y)2 }
Contoh cara menghitung koefisien stabilitas adalah sepertidi bawah ini;
Tabel 2.1: Hasil test-retest Lari 100 meter terhadap 20 siswa
No Siswa Test (X) Retest (Y) X2 Y2 XY
1 A 14.09 13.89 198.5281 192.9321 195.7101
2 B 13.01 13.32 169.2601 177.4224 173.2932
3 C 12.89 12.73 166.1521 162.0529 164.0897
4 D 12.91 12.79 166.6681 163.5841 165.1189
5 E 14.22 14.15 202.2084 200.2225 201.2130
6 F 14.20 14.03 201.6400 196.8409 199.2260
7 G 13.57 13.72 184.1449 188.2384 186.1804
8 H 12.86 13.74 166.3796 188.7876 176.6964
9 I 13.48 13.26 181.7104 175.8276 178.7448
10 J 13.00 13.18 169.0000 173.7124 171.3400
11 K 13.04 13.00 170.0416 169.0000 169.5200
12 L 13.97 13.85 195.1609 191.8225 193.4845
13 M 13.91 14.73 193.4881 216.9729 204.8943
14 N 12.89 13.78 166.1521 189.8884 177.6242
15 O 14.16 14.21 200.5056 201.9241 201.2136
16 P 13.71 13.62 187.9641 185.5044 186.7302
17 Q 14.84 14.64 220.2256 214.3296 217.2576
18 R 14.85 14.79 220.5225 218.7441 219.6315
19 S 13.92 13.88 193.7664 192.6544 193.2096
Ismaryati 0818341963 [email protected] 29
20 T 14.15 13.92 200.2225 193.7664 196.9680
N=20 X = 273,67
Y = 275,23
X2 = 3752,7411
Y2 = 3794,227
XY = 3722,1460
r =N.XY – (X)(Y)
{ N.X2 – (X)2 } { N.Y2 – (Y)2
r =20 x 3772,1460 – (237,67)(275,23)
{(20 x 2752,7411) – (74895,2689)} {(20 x 3794,2277) – (75751,5529)}
= 0.8287436465 = 0.83 (dibulatkan)
Koefisien reliabilitasnya = 0.83 adalah sangat tinggi, dengan demikian dapat disimpulkan bahwa tes lari 100 meter terhadap 20 siswa tersebut adalah reliabel.
b. Koefisien estimasi
Koefisien taksiran diperoleh dengan metode belah dua. Di dalam metode belah dua, suatu tes diberikan satu kali kepada suatu kelompok, kemudian pemberian nilai dilakukan dengan cara membelah hasil tes tersebut menjadi dua, yaitu paruhan atas dan bawah atau paruhan gasal dan genap.
Pada cara yang pertama, seluruh hasil tes dibelah menjadi dua sama besar, paruh atas dan paruh bawah. Contohnya suatu tes berjumlah 10 butir. Jawaban dari kesepuluh butir soal tersebut diberi nilai, nilai jawaban soal ke 1 - 5 (paruh atas) dijumlahkan terpisah dengan nilai jawaban soal ke 6 - 10 (paruh bawah). Nilai dari paruhan atas dikorelasikan dengan nilai paruhan bawah.
Cara yang ke dua adalah dengan membelah hasil tes menjadi paruhan gasal dan genap. Nilai jawaban soal bernomer gasal dijumlahkan terpisah dengan jumlah nilai jawaban soal bernomer genap. Kemudian jumlah nilai kedua
Ismaryati 0818341963 [email protected] 30
paruhan tersebut dikorelasikan. Setelah diperoleh angka hasil penghitungannya, dikoreksi dengan rumus Spearman Brown. Angka hasil penghitungan setelah dikoreksi dengan rumus Spearman Brown inilah yang disebut koefisien taksiran. Berikut ini disajikan contoh cara menghitung koefisien estimasi dengan cara paruhan gasal-genap.
Hasil jawaban dari 20 siswa yang mengerjakan 10 butir soal sebagai berikut: (1
= adalah jawaban yang betul, 0 = adalah jawaban yang salah)
N0 Siswa Nilai Terhadap Butir Tes Jumlah Nilai1 2 3 4 5 6 7 8 9 10 Gasal Genap
1 A 1 1 0 0 1 0 1 1 0 1 3 32 B 0 1 0 0 1 0 0 1 0 0 2 13 C 1 1 0 0 1 1 1 1 0 1 3 44 D 0 1 0 0 1 1 0 1 0 0 2 25 E 1 0 0 0 1 0 1 1 0 1 3 36 F 0 0 0 1 1 1 0 1 0 0 2 27 G 1 0 0 1 0 0 1 1 0 1 2 38 H 0 0 0 1 0 0 1 1 0 0 1 29 I 1 1 1 1 1 0 1 1 0 0 5 310 J 0 1 1 1 1 0 1 1 0 0 4 211 K 1 1 0 0 0 0 1 1 0 1 2 312 L 0 0 1 0 0 1 0 0 0 0 1 113 M 1 0 0 0 1 0 1 1 1 1 2 414 N 0 1 1 0 1 1 1 1 0 1 3 415 O 1 1 0 0 1 0 1 0 1 1 3 316 P 0 1 0 1 1 1 1 0 0 0 3 217 Q 1 0 0 0 0 0 1 1 0 1 1 318 R 0 1 0 1 1 0 1 1 0 0 3 219 S 1 1 0 1 1 0 1 1 1 0 4 320 T 0 1 0 1 1 0 1 1 0 1 3 3
Berdasarkan jumlah sekor paruhan I dan II, kemudian dibuat tabel persiapan
untuk perhitungan berikutnya, yaitu sebagai berikut:
Ismaryati 0818341963 [email protected] 31
No Jumlah nilai gasal (Xi)
Jumlah nilai genap (Yi) X I 2 YI 2 XiYi
1 3 3 9 9 92 2 1 4 1 23 3 4 9 16 124 2 2 4 4 45 3 3 9 9 96 2 2 4 4 47 2 3 4 9 68 1 2 1 4 29 5 3 25 9 15
10 4 2 14 4 811 2 3 4 6 612 1 1 1 1 113 2 4 4 16 814 3 4 9 16 1215 3 3 9 9 916 3 2 9 4 617 1 3 1 9 318 3 2 9 4 619 4 3 16 9 1220 3 3 9 9 9N = 20 XI = 52 YI = 53 XI 2 = 156 YI 2 = 155 XI YI = 143
r ½½ =N.XY – (Xi)(Yi)
{ N.XI 2 – (XI )2 } { N.Yi2 – (Yi)2 }
r ½½ = 20 x 143 – (52) (53) = 0,2989 { 20 x 156 –2704 } { 20 x 155 – 2809 }
Setelah angka ini diperoleh, maka masih perlu dikoreksi dengan rumus Spearman Brown, menjadi sebagai berikut :
r 1 1 = 2 x (r½½)
Ismaryati 0818341963 [email protected] 32
1 + (r½½)
r 1 1 = 2 x 0,2989 = 0,46021 + 0,2989
Jadi kesimpulannya adalah bahwa butir-butir soal tes yang dianalisis memiliki reliabilitas “sedang”, karena koefisien estimasi 0,4602.
c. Koefisien ekuivalensi
Koefisien ekuivalensi diperoleh dengan metode tes paralel. Pada metode tes
paralel ini, dua buah tes yang paralel atau mempunyai bobot yang sama
diberikan kepada kelompok siswa yang sama dengan jeda waktu yang tidak
lama. Kedua tes tersebut dinyatakan paralel karena dibuat berdasarkan kisi-
kisi yang sama, akan tetapi butir-butir soalnya berbeda meskipun untuk
mengukur unsur yang sama. Kemudian hasil kedua tes tersebut dihitung
koefisien korelasinya. Angka korelasi yang diperoleh disebut koefisien
ekuivalensi.
Seorang peneliti bermaksud mengukur nilai ekonomi seseorang responden. Peneliti tersebut menggunakan
2 alat pengukur status ekonomi, yaitu pendapatan total dan kekayaan; yang telah dibuat dalam indeks
kekayaan. Nilai yang diperoleh kemudian diurutkan dari tinggi ke rendah, hasilnya adalah sebagai berikut :
No Responden
Urutan Status Menurut Pendapatan
Urutan Status Menurut Kekayaan
1 A 1 12 B 2 23 C 3 54 D 4 35 E 5 76 F 6 67 G 7 48 H 8 109 I 9 810 J 10 9
Ismaryati 0818341963 [email protected] 33
Untuk mencari reliabilitas pertama-tama dicari korelasi antara kedua hasil pengukuran tersebut dengan menghitung koefisien korelasi Spearman. Dari angka hasil penghitungannya dicari koefisien reliabilitasnya dengan rumus:
r 1 1 =2
1 +
Perlu diketahui bahwa: Koefisien korelasi Spearman dan r = koefisien reliabilitas.
Dengan menggunakan data di atas dicari terlebih dahulu koefisien korelasi Spearman.
Hasilnya adalah sebagai berikut:
No Responden Urutan I Urutan I D D2
1 A 1 1 0 02 B 2 2 0 03 C 3 5 -2 44 D 4 3 1 15 E 5 7 -2 46 F 6 6 0 07 G 7 4 3 98 H 8 10 -2 49 I 9 8 1 110 J 10 9 1 1
24
Koefisien korelasi Spearman adalah:
= 1 6 D2
N ( N2 - 1 )
= 1 6 x 24
10 ( 100 - 1 )
= 1 144
990
= 0,8545
Dan koefisien reliabilitasnya adalah:
Ismaryati 0818341963 [email protected] 34
r = 2
1 +
r = 2 x 0,8545
1 + 0,8545
r = 0,9215
Dari hasil penghitungan di atas (0,9215) dapat disimpulkan bahwa kedua alat pengukur
ekonomi tersebut adalah reliabel.
d. Koefisien konsistensi
1). Konsistensi internal tes kognitifDalam metode konsistensi internal, satu tes diberikan kepada satu
kelompok siswa. Kemudian dicari proporsi jawaban benar dan yang salah
untuk setiap butir soal. Cara mencari proporsi jawaban yang benar adalah
jumlah siswa yang menjawab benar pada suatu butir soal dibagi dengan
jumlah siswa yang mengerjakan butir soal tersebut. Demikian pula untuk
proporsi jawaban salah; jumlah siswa yang menjawab salah pada suatu
butir soal dibagi dengan jumlah siswa yang mengerjakan butir soal
tersebut. Proporsi jawaban yang benar disingkat p dan proporsi jawaban
yang salah disingkat q. Ini dapat dicari dengan rumus; q = 1 – p.
Ismaryati 0818341963 [email protected] 35
Setelah seluruh butir soal dicari p dan q nya, maka angka korelasinya
dihitung dengan rumus KR–21 atau KR–20 (KR adalah kependekan dari
nama penciptanya, yaitu Kuder dan Richardson). K-21 digunakan
apabila peserta tes adalah kelompok kecil, yaitu kurang dari 30 orang.
Sedangkan KR–20 digunakan untuk kelompok besar, yaitu apabila peserta
tes sama dengan atau lebih besar dari 30 orang. Berdasarkan
pengalaman, angka korelasi yang dihitung dengan KR–20 lebih besar
daripada angka korelasi yang dihitung dengan rumus KR-21, dan semakin
besar anggota kelompok semakin tinggi pula angka korelasi yang
diperoleh. Berikut ini disajikan contoh cara menghitung koefisien
konsistensi:
Hasil jawaban dari 10 orang siswa yang mengerjakan 10 butir soal sebagai
berikut: (1 adalah jawaban yang betul; 0 adalah jawaban yang salah)
No Siswa Nilai Terhadap Butir Tes Jumlah Nilai1 2 3 4 5 6 7 8 9 10 X X2
1 A 1 1 1 1 0 1 1 1 0 0 7 492 B 1 0 1 1 0 0 0 1 0 0 4 163 C 0 1 0 1 1 0 1 0 0 0 4 164 D 1 1 0 0 0 1 0 1 1 1 6 365 E 0 1 0 1 1 0 1 0 1 1 6 366 F 0 1 1 0 0 0 1 1 1 1 7 497 G 1 0 0 1 1 1 0 1 0 1 5 258 H 1 1 1 1 1 1 0 1 1 1 9 919 I 1 1 1 1 1 1 0 0 0 1 7 49
10 J 1 1 0 0 0 1 1 0 0 0 5 25 7 8 5 8 5 6 5 6 4 6 60 382p = 7 8 5 8 5 6 5 6 4 6 6q = 3 2 5 2 5 4 5 4 6 4 4
p.q = 21 16 25 16 25 24 25 24 24 24 2,24
Karena kelompok ini kecil, maka dihitung dengan Rumus KR-21
r = k x ( 1 k.p.q )
Ismaryati 0818341963 [email protected] 36
k – 1 s2
Perlu diketahui bahwa:
k = Jumlah butir soal p = rerata dari jumlah proporsi jawaban benar q = rerata dari jumlah proporsi jawaban salah s2 = varians, X X N = Jumlah peserta tes
Berdasarkan rumus di atas dapat dihitung bahwa:
k = 10
p = 6 : 10 = 0,6
q = 4 : 10 = 0,4
s2 = 382 – (602 : 10) = 382 – 360 = 22N = 10
r = 10 x (1 – 10 x 0,6 x 0,4 ) =
0,98989 22
Dari hasil penghitungan di atas diperoleh angka koefisien kehandalannya = 0,9898 (sangat tinggi), dengan demikian dapat disimpulkan bahwa tes tersebut adalah handal. Dan jika dihitung dengan KR-20, maka koefisien korelasinya adalah sebagai berikut:
r = k x {1 p.q } k – 1 s2
= 10 X (1 2,24 )9 22
= 10 X (1 0,1018181818 )9
= 0,9979
Dari hasil perhitungan dengan KR-20 ternyata tes ini adalah handal, dan angka hasil penghitungannya lebih tinggi daripada jika dihitung dengan KR-21.
Ismaryati 0818341963 [email protected] 37
2). Konsistensi internal tes kinerja motorik
Masalah-masalah khusus yang berkenaan dengan penentuan reliabilita tes kinerja motorik tidak terjadi di dalam tes tertulis, misalnya tes yang harus dilakukan berulang-ulang dan biasanya dilaksanakan pada hari yang berlainan. Salah satu contoh nyata yang biasa terjadi dalam tes kinerja motorik adalah: 5 orang siswa yang masing-masing melakukan 4 kali loncatan pada tes Vertical Jump. Setiap siswa mempunyai nilai yang berbeda pada setiap loncataannya. Pertanyaan yang harus dijawab adalah bagaimana menentukan koefisien reliabilitasnya? , sedangkan teknik penghitungan reliabilitas yang telah dijelaskan terdahulu tidak dapat digunakan untuk menentukan reliabilitas hasil tes pada tes yang dilakukan berulangkali.Sebuah alternatif untuk menentukan reliabilitas data hasil tes kinerja motorik adalah dengan teknik “koefisien korelasi interklas”. Koefisien ini mengukur keajegan (konsistensi) nilai pada trial yang dilakukan secara berulang-ulang. Berikut disajikan satu contoh untuk menghitung reliabilitas dengan menggunakan teknik korelasi interklas. 5 orang siswa yang melakukan tes Vertical Power Jump, masing-masing melakukan 4 kali trial, hasilnya adalah sebagai berikut:
Subyek Trial 1 Trial 2 Trial 3 Trial 4 Row (Row)2
(X1) (X2) (X3) (X4)
A 278 279 281 280 1118 1249924
B 298 297 296 275 1186 1406596
C 282 285 287 289 1143 1306449
D 269 273 272 275 1089 1185921
E 272 270 270 268 1080 1166400
X = 1399 1404 1406 1407 Grand X = 5616 6315290
X2 = ( 2782 +298 2 + 2822 + … + 2682 ) = 1578886
Urutan langkah yang harus dilakukan untuk menghitung koefisien korelasi interklas adalah:Langkah 1: menghitung jumlah kuadrat total (SST)
SST = (5616)2
Ismaryati 0818341963 [email protected] 38
= 158886 20
Langkah 2: menghitung jumlah kuadrat untuk trial (SSB)
SSB =
(1399)2 + (1404)2 + (1406)2 + (1407)2
1576972,8 5
= 1576980,4 - 1576972,8 = 7.6
Langkah 3: menghitung jumlah kuadrat untuk subjek (SSR)
SSR = 6315290 1576972,8 = 1578822,5 - 1576972,8 = 1849,74
Langkah 4: menghitung jumlah kuadrat interaksi (SSe)SSe = SST - SSB - SSR
= 1913,2 7,6 1849.7 = 55.9
Langkah 5: menghitung rata-rata kuadrat trial (MSB)
MSB = SSB = 7.6 = 2.53 k 1 4 1
Langkah 6: menghitung rata-rata kuadrat trial (MSR)
MSR = SSR = 1849,7 = 462,425R 1 5 1
Langkah 7: menghitung rata-rata kuadrat interaksi (MSE)
MSE = SSE = 55.9 = 4,66(k 1) (R 1) (3) (4)
Langkah 8: menghitung F tes trial
F trial = MSB = 2.53 = .54MSE 4.66
Langkah 9: menghitung R
R = MS(subjek) MS(error)
MS(subyek)
MS(subyek) = 462,425 MS(error) = SSB + SSE
dftrial + dfinteraksi
Ismaryati 0818341963 [email protected] 39
7.6 + 55.9 = 4,233 + 12
R = 462,425 4,23 = .9
9462,425
3. ObjektivitasPengertian objektivas hampir sama dengan reliabilitas. Reliabilitas
menunjukkan kesamaan hasil pengukuran untuk tes pertama maupun tes
ulangan terhadap objek dan subjek yang sama, sedangkan keobjektivan
menunjukkan kesamaan hasil yang diberikan oleh dua orang atau lebih
pengetes terhadap objek yang sama.
Dalam pengertian sehari-hari dapat diketahui bahwa objektif berarti tidak
ada unsur pribadi pengetes yang mempengaruhi hasil pengetesan. Lawan
objektif adalah subjektif, artinya terdapat unsur pribadi yang mempengaruhi
hasil tes.
Sebuah tes dikatakan objektif, bilamana dua orang pengetes atau lebih
memberikan nilai yang sama dan bebas dari faktor subjektif dalam sistem
penilaiannya. Sebagai gambaran yang lebih nyata adalah, pengetes
menyelenggarakan tes dan mencatat hasilnya. Seminggu kemudian pengetes
yang lain menyelenggarakan tes yang sama terhadap siswa yang sama pula.
Nilai yang diperoleh pengetes yang pertama dibandingkan dengan nilai yang
diperoleh pengetes ke dua. Jika hasil yang diperoleh masing-masing siswa
pada penyelenggaraan kedua tes tersebut relatif sama atau sama, maka hasil
tes tersebut adalah objektif. Hasil tes yang diperoleh pengetes yang satu
dikorelasikan dengan hasil tes yang diperoleh pengetes yang lainnya akan
menunjukkan derajat obyektivitas suatu tes.
Ismaryati 0818341963 [email protected] 40
Agar diperoleh keobjektivan yang tinggi di dalam pengukuran, maka perlu
diusahakan hal-hal sebagai berikut:
Petunjuk atau prosedur pengukuran harus dirumuskan dengan kata-kata
yang tepat dan terinci.
Prosedur pengukuran diusahakan agar mudah dikerjakan oleh pengetes
dan yang di tes.
Bila mungkin, digunakan alat pengukur mekanis.
Memilih pengetes yang berpengalaman.
Pengetes harus memelihara sikap ilmiah.
Hubungan dan pengaruh antara obyektivitas, reliabilitas, dan validitas
Secara umum hubungan antara objektivas, reliabilitas, dan validitas secara
umum dapat dikatakan bahwa tes yang reliabel pasti memiliki objektivas yang
tinggi, tetapi tes yang reliabel belum tentu valid. Reliabilitas yang rendah
mempunyai kecenderungan rendah pula validitasnya, tetapi reliabilitas yang
tinggi juga mungkin mempunyai validitas yang rendah.
Jadi suatu pengukuran yang valid pengukuran itu pasti raliabel, tetapi
pengukuran yang reliabel belum tentu valid. Gambar 2.1 berikut ini akan lebih
memperjelas uraian di atas.
Validitas
Ismaryati 0818341963 [email protected] 41
Relevansi Reliabilitas
Logis Statistik
Obyektivitas atau Reliabilitas Penilai
Konstruk Stabilitas Konsistensi internal Ekuivalensi
Isi Konkuren Prediktif
Tes ulang Belah dua Paralel
Gambar 2.1: Hubungan dan pengaruh antara obyektivitas, reliabilitas, dan validitas
Hal-hal yang perlu diperhatikan sehubungan dengan reliabilitas dan validitas tes
Biasanya angka koefisien reliabilitas lebih besar daripada angka koefisien validitas pada tes yang sama.
Tes dalam pendidikan jasmani yang diberikan kepada anak putri biasanya menghasilkan koefisien validitas yang sangat rendah daripada bila tes itu diberikan kepada anak putra.
Hasil prestasi keterampilan pemain yang kurang berpengalaman biasanya kurang reliabel jika dibandingkan dengan hasil pemain-pemain yang berprestasi tinggi.
Bila suatu tes dilaporkan mempunyai koefisien reliabilitas sebesar 0,85 misalnya, ini tidak berarti bahwa kelompok lain yang menggunakan tes itu akan menghasilkan koefisien reliabilitas yang sama; bila dihitung dari data kelompok itu sendiri. Reliabilitas suatu tes adalah khusus bagi kelompok yang dites dalam pembuatan tes itu. Koefisien reliabilitas yang sama dapat diharapkan akan diperoleh asalkan tes tersebut digunakan untuk kelompok yang serupa dan dalam kondisi yang serupa pula.
Jumlah subjek dapat mempengaruhi reliabilitas, oleh karena itu kepercayaan akan lebih diberikan kepada koefisien reliabilitas suatu tes yang dihitung dari jumlah subjek yang besar.
Untuk membuat penafsiran kualitatif dari angka-angka korelasi, keterangan ini dapat dijadikan untuk pedoman.1) koefisien validitas di atas 0,85 dianggap sangat baik.2) Koefisien validitas jarang sekali lebih dari 0,85.
Ismaryati 0818341963 [email protected] 42
3) Koefisien reliabilitas bahkan seringkali lebih dari 0,85.4) Koefisien reliabilitas dari 0,75 sampai 0,85 berarti bahwa tes itu sudah
dapat dianggap baik untuk berbagai tujuan.5) Bila koefisien reliabilitasnya lebih kecil dari 0,70 menunjukkan
ketidakajegan alat ukur itu. Koefisien validitas yang rendah menunjukkan adanya unsur ketidakajegan
dalam pengukuran itu. Untuk memperbaiki, disarankan supaya menyempurnakan petunjuk pelaksanaan tes agar situasi dalam pelaksanaannya menjadi lebih baik. Jalan lain yang dapat ditempuh ialah dengan menambah jumlah trial atau percobaannya, atau jika dalam tes tulis dengan menambah jumlah butir soalnya.
Koefisien validitas yang rendah menandakan bahwa tes itu tidak cukup bernilai bila digunakan untuk meramalkan kemampuan yang seharusnya diukur. Meskipun begitu, kalau secara subjektif tes tersebut masih dianggap berharga dan betul-betul handal, maka tes tersebut masih dapat dipakai sebagai alat latihan yang baik.
4. Diskriminitas (daya pembeda)
Soal di dalam ujian atau tes diberikan kepada siswa dengan tujuan terutama untuk membedakan antara mereka yang betul-betul berlatih dengan mereka yang memang tidak berlatih, antara mereka yang betul-betul belajar dengan mereka yang tidak belajar atau lebih tepat untuk membedakan mereka yang betul-betul menguasai bahan pelajaran dengan mereka yang memang tidak menguasai bahan pelajaran.Tes yang baik, harus dapat membedakan kemampuan siswa sesuai dengan tingkat keterampilan dan kepandaian mereka. Tes yang terlalu sukar, sehingga semua siswa tidak yang dapat mengerjakannya bukanlah tes yang baik, sebaliknya tes yang sangat mudah sehingga semua siswa dapat mengerjakan dengan benar juga bukan tes yang baik karena tes-tes yang demikian itu tidak memiliki kemampuan untuk membedakan antara mereka yang berkemampuan jelek, cukup, baik dan baik sekali.
5. Praktibilitas (kemudahan)
Meskipun kriteria validitas dan reliabilitas tes merupakan hal yang terpenting dari kriteria lainnya, namun sejumlah pertimbangan yang bersifat praktis dan
Ismaryati 0818341963 [email protected] 43
dapat mempengaruhi tes perlu dipertimbangkan pula. Pertimbangan-pertimbangan tersebut meliputi; waktu dan biaya, kemudahan pengadministrasian dan kemudahan dalam penafsiran pengukuran
a. Kemudahan Waktu dan biaya
Jumlah waktu yang diperlukan erat hubungannya dengan biaya yang dikeluarkan. Demikian pula alat-alat yang dipakai dan pelaksana yang terlibat di dalam pelaksanaan tes akan memberikan ketelitian hasil tes sehingga mempengaruhi pula derajat kehandalannya. Makin sedikit personal dan alat-alat yang digunakan di dalam tes tersebut, makin sedikit biaya yang dikeluarkan.
Setiap pemakaian alat pengukur selalu membutuhkan tuntunan cara penggunaannya. Adanya tuntunan pelaksanaan suatu tes akan memberikan kejelasan dan keseragaman dalam pelaksanaan suatu tes. Tuntunan pelaksanaan ini merupakan suatu hal yang sangat penting, karena tanpa petunjuk pelaksanaan akan menimbulkan perbedaan penafsiran di dalam melaksanakan pengukuran. Contohnya: untuk pelaksanaan tes passing selama 30 detik dalam permainan basket, tanpa petunjuk pelaksanaan maka terjadi berbagai cara penafsiran dalam pelaksanaan tes tersebut. Mungkin pengetes X menafsirkan dalam pelaksanaan tes passing dengan satu tangan dan pengetes Y menafsirkan tes tersebut dalam pelaksanannya dengan dua tangan. Dalam hal ini terjadi penafsiran yang berbeda dalam pelaksanannya. Perbedaan penafsiran untuk melaksanakan tes ini terjadi oleh karena tidak ada tuntunan petunjuk pelaksanaan tes yang jelas. Tetapi bila ada petunjuk pelaksanaan yang jelas, tidak akan terjadi penafsiran pelaksanaan yang berbeda.
Perbedaan pelaksanaan tes ini mempunyai pengaruh yang besar terhadap reliabilitas tes. Demikian pula semakin banyak alat yang digunakan, maka kemungkinan salah lebih besar sehingga akan berakibat semakin kurangnya reliabilitas tes itu.
2. Kemudahan dalam pengadministrasian
Ismaryati 0818341963 [email protected] 44
Sebuah tes dikatakan memiliki kemudahan administrasi bila:a. Mudah dilaksanakan.
Suatu tes yang dilengkapi dengan tuntunan atau petunjuk yang lengkap akan memberikan kejelasan bagi pengetes maupun testinya. Suatu tes yang mudah dalam pelaksanannya akan memberikan ketelitian hasil tes, sehingga derajat validitas tes lebih mungkin untuk dicapai.
b. Mudah pemeriksaannya
Suatu tes yang dilengkapi dengan kunci jawaban maupun pedoman penilaiannya akan memberikan kemudahan dalam pemeriksaannya, sehingga penghematan tenaga, kemudahan dan kemungkinan kesalahan dapat diperkecil.
c. Kemudahan dalam penafsiranTes yang dilengkapi dengan norma adalah lebih berguna daripada yang tidak ada normanya. Dengan adanya norma yang baku akan mempermudah untuk membandingkan nilai yang dicapai subjek dalam suatu tes. Norma yang jelas dan mudah dimengerti akan memberikan motivasi kepada siswa yang mengikuti tes, karena secara langsung siswa dapat mengetahui kedudukan hasil tes yang ia peroleh. Disamping itu dapat membandingkannya dengan teman lain dalam kelompoknya, dalam keadaan ukuran-ukuran yang sebanding. Jika terpaksa normanya belum ada, diharapkan para guru atau pengetes mampu mengerjakan perhitungan-perhitungan statistik yang diperlukan untuk mengolah nilai hasil tes menjadi norma yang baku. Kemudian hasil pengolahan ini selanjutnya diterapkan untuk penafsiran nilai ke dalam pendekatan nilai PAP (Penilaian Acuan Patokan). Untuk tes baku, biasanya si penyusun tes telah menyediakan berbagai keterangan dan bahan-bahan yang dipergunakan untuk menafsirkan hasil tes tersebut.
Dari uraian-uraian di atas dapat dikatakan bahwa tes yang baik akan
mencakup kriteria yang ada, yaitu valid, reliabel, objektif, diskriminitas,
dan praktibilitas. Akan tetapi dalam prakteknya sangat sulit untuk dicapai,
sehingga sangat jarang tes yang dapat memenuhi persyaratan tersebut
Ismaryati 0818341963 [email protected] 45
secara keseluruhan. Kiranya cukup memadai jika sebuat tes telah
memenuhi tiga buah syarat yang telah ditentukan yaitu: valid, reliabel, dan
objektif.
TugasKerjakan tugas berikut ini secara individu1. Bila saudara dihadapkan pada situasi untuk memilih satu alat ukur dari
banyak pilhan yang tersedia, pertimbangan apa yang saudara gunakan untuk memilihnya. Jelaskan alasannya
2. Jelaskan apa yang dimaksud dengan validitas, reliabilitas, dan objektivitas3. Jelaskan perbedaan validitas isi, validitas konstruk, validitas konkuren, dan
validitas empiris4. Metode apa yang digunakan untuk memperoleh koefisien stabilitas, koefisien
estimasi, koefisien ekuivalensi, koefisien konsistensi?5. Berikut ini adalah hasil pengukuran lompat jauh tanpa awalan pasa 10 0rang
siswa kelas IV SD. Hitunglah koefisien konsistensinya
No subjek Lompatan ke (cm)1 2 3
1 155 153 1572 139 137 1283 128 135 1404 167 135 1555 135 145 1406 154 155 1577 145 144 1468 134 133 1409 156 145 157
10 135 140 142
Subyek lompatan 1
Trial 2 Trial 3 Trial 4 Row (Row)2
(X1) (X2) (X3) (X4)
A 278 279 281 280 1118 1249924
B 298 297 296 275 1186 1406596
Ismaryati 0818341963 [email protected] 46
C 282 285 287 289 1143 1306449
D 269 273 272 275 1089 1185921
E 272 270 270 268 1080 1166400
BAB III
PROGRAM TESTING DAN PERUMUSAN TUJUAN
Setiap suatu kegiatan berlangsung, akhirnya selalu ingin diketahui hasilnya. Demikian pula jika suatu program pendidikan berakhir juga ingin diketahui seberapa jauh tujuan pendidikan yang telah ditetapkan dapat tercapai.
Untuk mengetahui hasil suatu kegiatan harus dilakukan pengukuran. Dalam kegiatan belajar mengajar, pengukuran hasil belajar bertujuan untuk mengetahui seberapa jauh perubahan tingkah laku siswa setelah mengikuti suatu program.
Ismaryati 0818341963 [email protected] 47
Pada umumnya pengukuran yang dilakukan oleh guru menggunakan tes sebagai alat ukurnya. Hasil pengukuran berwujud angka atau pernyataan yang mencerminkan tingkat penguasaan materi.
Kegiatan pengukuran dan evaluasi harus terprogram. Hal ini berarti kegiatan pengukuran dan evaluasi harus dilakukan dengan teratur, terrencana, dan menggunakan sistem tertentu.
1. Langkah-langkah pengukuran.Secara umum kegiatan pengukuran terdiri atas delapan langkah, yaitu:
Penentuan tujuan program Pemilihan tes atau alat ukur yang sesuai Pelaksanaan tes (testing) Penetapan skor Analisis dan penafsiran skor Penerapan hasil Pelaksanaan tes kembali untuk menentukan keberhasilan program Pembuatan catatan dan laporan
Ada tiga ciri utama program dalam pendidikan jasmani atau pembinaan olahraga, yaitu: dilaksanakan secara integratif dengan tujuan yang jelas dan dapat dipahami oleh semua orang yang terlibat di dalamnya. Program testing, sebagai kegiatan yang yang berkaitan erat dengan kegiatan lain di sekolah harus dirasakan oleh semua pihak, dalam hal ini siswa, guru, dan tenaga administratif.
Tujuan utama program testing adalah untuk memecahkan masalah-masalah praktis dalam pendidikan. Pengumpulan data atau informasi yang banyak tentunya akan sia-sia apabila tidak dimanfaatkan. Data atau informasi yang terkumpul dalam program testing dapat dimanfaatkan untuk pengelompokkan, pemilihan tim, pemberian bimbingan, penelitian, dan sebagainya.
Ismaryati 0818341963 [email protected] 48
Setelah menetapkan tujuan program testing, langkah berikutnya adalah memilih tes yang sesuai dengan tujuan. Ada tiga hal yang perlu dipertimbangkan dalam langkah ini. Pertama, siapakah yang berhak memilih tes. Ke dua, macam tes apakah yang akan digunakan, dan yang ke tiga prosedur yang manakah yang akan digunakan untuk memilih tes.
Tes hendaknya dipilih oleh orang yang berkompeten di bidangnya. Misalnya dalam memilih tes untuk mengukur tingkat kecerdasan, para psikologlah yang berhak menentukan tes yang akan digunakan. Hal ini sangat penting karena akan menentukan validitas isi suatu tes. Selanjutnya macam tes yang digunakan berkaitan erat dengan aspek yang ingin diukur, misalnya bentuk tes yang mengukur intelegensi umum, aspek bakat khusus, aspek kepribadian, dan lain-lain. Dengan memperhatikan tujuan testing, siapa yang memilih tes, penting juga diperhatikan prosedur yang sistematik dalam memilih tes. Untuk memutuskan berapa kali testing akan dilaksanakan bergantung pada tujuan tes diberikan. Sehubungan dengan pengetesan, pelaksana tes harus memiliki syarat tertentu sesuai dengan bidangnya.
Setelah tes dilaksanakan, langkah yang berikutnya adalah pemberian biji (scoring). Skoring harus dilaksanakan dengan cepat dan teliti. Sistem yang terbaik adalah yang hemat tenaga, waktu dan biaya. Setelah skoring, data yang diperoleh perlu diolah dan dianalisis. Analisis data mencakup pengolahan secara statistika dan pengungkapan secara visual (misalnya dengan grafik).
Hasil dari pengolahan data yang telah dilakukan kemudian ditafsirkan berdasarkan norma kelompok (PAN) atau norma yang sudah baku (PAP).
Penerapan hasil tes merupakan tahap yang paling kritis dalam program testing. Hal ini berkaitan dengan implikasi hasil tes. Penggunaan hasil tes juga bergantung pada tujuan program testing. Tujuan program testing juga berkaitan dengan tujuan intruksional dan tujuan kurikuler. Pengetesan pada tahap berikutnya harus dilakukan untuk mengecek apakah ada perbaikan yang perlu dilakukan.
Ismaryati 0818341963 [email protected] 49
Langkah terakhir adalah membuat catatan atau pelaporan. Hal ini penting dilakukan, karena menyangkut kepentingan banyak pihak: siswa, guru, tenaga administrasi, orang tua, dan masyarakat umum. Bentuk laporan disusun sesuai dengan kepentingan pihak yang akan menerima laporan.
2. Perumusan Tujuan Pengajaran
Evaluasi selalu bertolak dari perumusan tujuan, oleh karenanya perubahan perilaku yang diharapkan juga harus tercakup di dalam tujuan. Karena tujuan merupakan pegangan dalam melaksanakan pengukuran, maka antara tujuan dan evaluasi harus berkaitan. Kemampuan merumuskan tujuan secara jelas merupakan kompetensi utama dari seorang guru, juga guru pendidikan jasmani.
Tujuan pengajaran dibedakan menjadi dua, yakni tujuan jangka panjang (aim) dan tujuan jangka pendek (objective). Aim merupakan istilah yang menunjukkan tujuan pendidikan jangka panjang yang akan dicapai setelah ditempuh proses dan jangka waktu yang cukup lama (misalnya 15 – 20 tahun). Objective, merupakan istilah yang menunjukkan perumusan tujuan pendidikan yang lebih spesifik, operasional, dan tercapai dalam jangka waktu yang lebih pendek. Yang paling mungkin dicapai oleh guru bidang studi, misalkan pendidikan jasmani ialah tujuan jangka pendek. Contoh berikut akan memberikan gambaran yang lebih jelas tentang kedua tujuan tersebut. Aim: Untuk menciptakan warga negara yang bertanggung jawab, untuk memberantas buta huruf. Objective: Untuk meningkatkan kesegaran jasmani, untuk meningkatkan konsumsi oksigen maksimal.
Tujuan jangka panjang merupakan tujuan akhir atau arah dari program pendidikan. Kemajuan pendidikan jasmani hanya akan dapat dicapai hanya jika ada arah yang menentu. Tujuan jangka pendek menunjukkan tujuan yang lebih khusus. Karena itu, tujuan jangka pendek merupakan tujuan penentu yang lebih khas.
Ismaryati 0818341963 [email protected] 50
Selain sebagai pengarah kegiatan pendidikan, tujuan jangka panjang secara langsung mengandung nilai praktis, yaitu menentukan isi pengalaman belajar yang akan disampaikan atau disediakan kepada siswa. Berkaitan dengan hal ini, tugas guru adalah melakukan analisis isi mata pelajaran yang dibinanya. Hal ini dapat diperbarui atau direvisi pada setiap semester atau setiap tahun sesuai dengan perkembangan atau kebutuhan.
Tujuan, pengalaman belajar, metode, dan evaluasi mempunyai kaitan yang
sangat erat. Seorang guru harus menetapkan tujuan tentatif sebelum
menetapkan strategi pendidikan untuk mencapai tujuan itu (menetapkan
pengalaman belajar yang sesuai) dan kemudian mengukur pencapaian tujuan.
Dengan demikian perlu diketahui tingkat kemampuan sebelum dan sesudah
program berlangsung. Gambar 3.1 menunjukkan siklus tujuan dan evaluasi.
Tujuan
Substansi Metode
Ismaryati 0818341963 [email protected] 51
Evaluasi
Gambar 3.1: Siklus Tujuan – Evaluasi
Karena tujuan merupakan penentu arah bagi program pendidikan, bahkan
merupakan landasan bagi pembuatan keputusan, maka tujuan harus
dirumuskan secara baik.
Ciri ciri rumusan tujuan yang baik
Jelas, tidak mempunyai pengertian ganda Menunjukkan aspek perilaku yang dapat diamati dan
diukur Memberikan arah yang jelas dan dapat dicapai
Berikut ini merupakan contoh perumusan tujuan.
Contoh
1:
Setelah selesai mempelajari materi ini, mahasiswa diharapkan mengerti apa yang dimaksud dengan kapasitas erobik maksimal.
Rumusan tujuan seperti contoh 1 adalah kurang jelas. Kata-kata seperti mengerti, memahami, mengapresiasi merupakan kata-kata yang sulit untuk dijabarkan menjadi tujuan yang operasional, bagaimana kita mengamatinya?
Ismaryati 0818341963 [email protected] 52
bagaimana mengukurnya?. Oleh karenanya tujuan seperti pada contoh 1 harus dijabarkan menjadi:
Contoh
2:
mahasiswa dapat menjelaskan apa yang dimaksud dengan kapasitas erobik maksimal.
Elemen Kapasitas erobik maksimal dapat dijabarkan lagi menjadi:
Contoh
3:
- Mahasiswa dapat menyebutkan faktor-faktor yang menentukan kapasitas erobik maksimal.
- Mahasiswa dapat menjelaskan macam-macam latihan untuk meningkatkan kapasitas erobik maksimal
Contoh 4: Mahasiswa dapat melompat sejauh 3.0 meter dengan gaya jongkok
Rumusan tujuan seperti pada contoh 3 dan contoh 4, merupakan rumusan
yang sangat jelas, karena di dalam rumusan tersebut menggunakan kata-kata
yang dapat diamati dan diukur. Bahkan pada contoh yang terakhir sudah
disertai dengan keterampilan teknik tertentu.
3. Taksonomi Tujuan Pendidikan
Pada dasarnya, taksonomi tujuan pendidikan merupakan klasifikasi tujuan pendidikan. Tujuannya
adalah agar terdapat kesamaan persepsi antara perancang kurikulum dan pelaksana evaluasi.
Selain itu agar guru atau pelaksana kegiatan evaluasi dapat memahami tujuan yang ingin dicapai
secara lebih cermat dan tepat.
Ismaryati 0818341963 [email protected] 53
Maksud dirumuskannya Taksonomi Pendidikan
Mengurangi pengertian yang kabur dalam istilah yang sering digunakan, misalnya mengetahui, memahami, mengerti dsb
Mengurangi pengertian yang kabur dalam istilah yang sering digunakan, misalnya mengetahui, memahami, mengerti dsb
Sebagai alat untuk menjalin komunikasi yang cermat dalam bidang pendidikan
Untuk menciptakan kesepahaman yang sama tentang hierarkhi tujuan pendidikan
Sebagai alat untuk memahami rangkaian perkembangan anak didik Untuk membantu pelaksana kegiatan evaluasi dalam merumuskan dan
menilai mutu pendidikan, khususnya di lingkungan sekolah
Taksonomi tujuan pendidikan yang lazim dikenal meliputi ranah (domain)
kognitif (cognitive domain), afektif (affective domain) dan psikomotor
(psychomotor domain).
Ranah Kognitif
Secara sederhana ranah kognitif mencakup tujuan berupa kemampuan
berfikir, mengetahui, dan memecahkan masalah. Berdasar konsep yang
dikembangkan oleh Bloom (1956), ranah kognitif mencakup tujuan yang
berkenaan dengan kemampuan untuk mengingat atau mengutarakan
kembali pengetahuan dan perkembangan kemampuan dan keterampilan
intelektual.
Ranah kognitif terdiri atas 6 kelompok tujuan utama yang disusun secara
berjenjang berdasar ciri tugas mulai dari yang sederhana ke jenjang yang
Ismaryati 0818341963 [email protected] 54
kompleks dan dari perilaku yang nyata ke yang abstrak. Penjenjangan ranah
kognitif tersebut secara jelas dapat dilihat pada gambar 3.2.
Evaluasi
Sintesa
Analisa
Aplikasi
Pemahaman
Pengetahuan
Gambar 3.2: Jenjang Ranah Kognitif Menurut Bloom (1956)
Agar lebih mudah dipelajari, kemampuan yang menggambarkan jenjang-jenjang ranah kognitif disajikan dalam tabel 3.1
Tabel 3.1: Kemampuan yang Dimiliki dalam Ranah Kognitif
Jenjang Kemampuan yang dimiliki Kata-kata yg digunakan
Ismaryati 0818341963 [email protected] 55
Pengetahuan (knowledge)
Kemampuan mengingat tentang hal-hal yang bersifat khusus atau universal, metode dan proses, atau pola, struktur
Mendefinisikan, mengulang, menyebutkan, mendaftar, mengurutkan
Pemahaman (comprehen sion)
Kemampuan menerima komunikasi secara tepat, menempatkan hasil komunikasi dalam bentuk penyajian yang berbeda, me-reorganisasikannya secara singkat tanpa merubah pengertian
Menerjemahkan, menyatakan kembali, mendiskusikan, menggambarkan, menjelaskan, mengidentifikasi, menempatkan, menceritakan, memaparkan
Aplikasi Kemampuan menerapkan prinsip atau metode pada situasi yang baru
Interpretasikan, terapkan, gunakan, praktikkan.
Analisa Kemampuan memisah-misahkan meteri menjadi bagian-bagian yang membentuknya, mendeteksi hubungan di antara bagian-bagian tersebut dan cara materi itu diorganisir
Pisahkan, bedakan, hitunglah, cobakan, bandingkan, hubungkan,inventarisasikan
Sintesa Kemampuan untuk menempatkan bagian atau elemen menjadi dati/bersama sehingga membentuk sesuatu secara keseluruhan
Komposisikan, susunlah, organisasikan, rancanglah, sederhanakan, ciptakan, rakitlah
Evaluasi Kemampuan mengambil keputusan,memberi pertimbangan, menyatakan pendapat tentang sesuatu tujuan, pekerjaan, metoda, materi dll. Dalam mengambil keputusan atau menyatakan pendapat, termasuk juga kriteria yang digunakan
Putuskan, nilailah, bandingkan, revisilah, tentukan
Ismaryati 0818341963 [email protected] 56
Ranah Afektif
Ranah afektif berkenaan dengan sikap, nilai-nilai, minat, dan apresiasi.
Ranah afektif ini mencakup tujuan yang berkenaan dengan perubahan
minat, dan nilai serta perkembangan apresiasi dan penyesuaian (Krathwohl,
Bloom, dan Maria: 1964). Ranah afektif tersusun dalam 5 (lima) jenjang
seperti yang disajikan dalam gambar 3.3.
Karakterisasi
Mengorganisasikan
Penghargaan
Merespon
Penerimaan
Gambar 3.3: Jenjang Ranah Afektif
Agar lebih mudah dipelajari jenjang-jenjang ranah afektif disajikan dalam tabel 3.2
Tabel 3.2: Kemampuan yang Dimiliki dalam Ranah Afektif
Jenjang Kemampuan yang dimiliki Kata-kata yg digunakan
Ismaryati 0818341963 [email protected] 57
Menerima Kemampuan menerima dan rangsang yang terjadi di sekitarnya. Yang termasuk di dalamnya adalah kesadaran, kesediaan untuk menerima dan mengontrol atau memilih sikap tertentu
Dengar, lihat, pandang, raba, cium, rasa, pilih, kontrol, waspada, hindari
Merespon (responding)
Siswa dilibatkan tidak hanya sekedar memberikan reaksi, tetapi secara aktif terlibat dalam memberikan respon yang serasi.
Persetujuan, minat, reaksi, membantu, menolong, partisipasi, melibatkan diri, menyenangi, menyukai, gemar, cinta, puas, menikmati.
Penghargaan
Perilaku siswa pada tataran ini adalah konsisten dan stabil, tidak hanya persetujuan terhadap nilai tetapi juga pemilihan terhadapnya dan keterikatannya pada suatu pandangan atau ide tertentu.
Mengakui dengan tulus mengidentifikasikan diri, mempercayai, menyatukan diri, menginginkan, menghendaki, beriktikad, berambisi, disiplin, dedikasi diri, rela berkorban, tanggung jawab, yakin.
Mengorgani
sasikan
Pada tataran ini siswa membentuk suatu sistem nilai yang dapat menuntun perilaku. Yang termasuk di dalamnya adalah konseptualisasi dan mengorganisasi.
Menimbang-nimbang, menjalin, mengkristalisasikan, mengidentifikasikan, menyususun sistem, menyelaraskan, mengimbangkan.
Karakterisasi (mewatak)
Pada tataran ini sudah terjadi internalisasi, nilai-nilai yang dipelajari telah mendapat tempat pada diri individu, diorganisir ke dalam suatu sistem yang internal, memiliki kontrol perilaku.
Bersifat objektif, bijaksana, adil, teguh dalam pendirian, percaya diri, berkepribadian
Berikut ini merupakan contoh perntanyaan yang dapat diajukan jika guru ingin menilai pencapaian ranah afektif.
- Apakah siswa aktif dalam mengikuti pelajaran pendidikan jasmani?- Apakah siswa menaati peraturan yang telah ditetapkan?
Ismaryati 0818341963 [email protected] 58
- Apakah siswa selalu dapat menjaga kebugarannya? Ranah Psikomotor
Ranah psikomoror mencakup tujuan yang berkenaan dengan keterampilan motorik. Dave, mengembangkan ranah psikomotor ini ke dalam jenjang peniruan, manipulasi, kecermatan, artikulasi, naturalisasi.
Naturalisasi
Artikulasi
Kecermatan
Manipulasi
Peniruan
Gambar 3.4: Jenjang Ranah Psikomotor
Agar lebih mudah dipelajari jenjang-jenjang ranah psikomotor disajikan dalam tabel 3.3
Tabel 3.3: Kemampuan yang Dimiliki dalam Ranah Psikomotor
Jenjang Kemampuan yang dimiliki Kata-kata yg digunakan
Peniruan Merirukan gerakan yang diperagakan oleh guru
Menirukan pengulangan, coba lakukan, dll
Manipulasi Pada tataran ini siswa dapat menampilkan suatu gerakan yang diajarkan, dan tidak hanya seperti yang diamati. Siswa mulai dapat membedakan antara satu gerakan dengan gerakan yang lain,
Ikuti petunjuk, mencoba-coba, memperbaiki gerakan
Ismaryati 0818341963 [email protected] 59
mampu memulih gerakan yang diperlukan, memiliki keterampilan menerapkan gerakan
Kecermatan (precision)
Siswa lebih memiliki keterampilan yang lebih tinggi dalam melakukan gerakan tertentu
Lakukan kembali, kerjakan kembali, hasilkan, kontrol, teliti
Artikulasi Siswa telah dapat mengkoordinasikan serentetan gerakan dengan menetapkan urutan secara tepat di antara bagian-bagian gerakan-gerakan yang berbeda
Lakukan secara harmonis, lakukan secara urut
Naturalisasi
Siswa dapat melakukan suatu gerakan utuh secara alami tanpa memikirkannya lebih dahulu
Kegunaan Taksonomi dalam Evaluasi
Membantu kita dalam menganalisis dan mengklasifikasikan tujuan Memberikan ide tentang pencapaian manusia seutuhnya Membantu dalam membandingkan yang cermat tentang silabi atau
kurikulum Dengan topik yang sama kita dapat mengajar menggunakan
pendekatan yang berbeda Membantu dalam prosedur evaluasi Ranah afektif membantu kita dalam mendidik siswa agar memiliki
sifat-sifat yang dapat diterima oleh norma, nilai dan bahkan falsafah hidup bangsa
Proses belajar mengajar dapat mencakup ketiga ranah, sehingga pengalaman belajar menjadi seimbang dalam rangka mencapai keseimbangan jiwa dan raga
Membantu dalam meningkatkan validitas dan reliabilitas pengetesan
4. Pendekatan dalam Perumusan Tujuan
Berdasarkan landasannya prinsip penyusunan tujuan pendidikan dapat diklasifikasikan menjadi 4 (empat), yaitu: (a) kemampuan, (b) lamanya waktu, (c) prestasi dalam kelas, (d) perilaku yang teramati dan terukur.
Ismaryati 0818341963 [email protected] 60
a. Tujuan berdasar kemampuanPendekatan ini menekankan kemampuan tertentu pada setiap ranah. Misalnya pada ranah kognitif, perumusan tujuan dapat disusun sebagai berikut:
(1) siswa memiliki pengetahuan tentang konsumsi oksigen maksimal(2) siswa dapat menyebutkan pengertian tentang faktor-faktor yang
mempengaruhi konsumsi oksigen maksimal.Pada ranah afektif, tujuan yang dimaksud berkenaan dengan sikap, minat, nilai, dan perkembangan apresiasi dan penyesiauan diri. Misalnya:
(1) siswa memiliki sikap yang positif terhadap kesegaran jasmani(2) siswa mengembangkan minatnya dalam suatu cabang olahraga
Ranah psikomotor banyak berhubungan dengan pencapaian kemampuan yang membutuhkan pemahaman dan keterampilan. Misalnya:
(1) siswa mengembangkan keterampilan dasar bola voli(2) siswa mampu mengutarakan pendapatnya dengan tata bahasa yang benar
b. Klasifikasi berdasar waktuPencapaian tujuan memerlukan periode waktu tertentu. Setiap tujuan memerlukan waktu yang berbeda untuk mencapainya. Karena itu, perumusan tujuan dapat juga dilakukan berdasar jangka waktu pencapaiannya, ada tujuan jangka pendek dan jangka panjang atau tujuan antara dan akhir.
Pencapaian tujuan pada ranah kognitif dan psikomotor relatif membutuhkan waktu yang lebih singkat jika dibandingkan dengan pencapaian tujuan pada rasnah afektif. Peningkatan prestasi balajar atau atau keterampilan tertentu dapat dicapai dalam waktu yang relatif lebih singkat daripada proses perubahan sikap, minat, dan apresiasi dalam suatu bidang. Oleh karena itu tujuan dalam ranah kognitif dan psikomotor tergolong tujuan anjgka pendek. Contoh rumusannya adalah:
(1) Siswa memperoleh pengetahuan tentang …………….(2) Siswa dapat mengembangkan pengertian tentang …………….(3) Siswa dapat menerapkan prinsip-prinsip tentang ………………
Ismaryati 0818341963 [email protected] 61
Selanjutnya tujuan dalam lingkup ranah afektif tergolomg dalam tujuan jangka panjang. Contoh rumusan tujuannya adalah:
(1) Siswa mengembangkan sikap terhadap kegiatan olahraga(2) Siswa mengembangkan minat dalam kegiatan di alam terbuka.
c. Tujuan berdasar prestasi yang dicapaiTujuan pendidikan dapat dicapai melalui metode tertentu dan pendekatan yang diterapkan dalam situasi belajar baik di kelas maupun di luar kelas. Tujuan yang dirumuskan berdasarkan prestasi yang dicapai disebut sebagai tujuan instruksional. Tujuan dalam lingkup ranah kognitif dan psikomotor termasuk di dalamnya.
Tujuan yang bermanfaat untuk mencapai sasaran akhir dari pendidikan, yakni pengembangan kepribadian dinamakan tujuan kepribadian. Tujuan dalam lingkup ranah afektif termasuk di dalam tujuan kepribadian.
d. Tujuan berdasar perilakuPerumusan tujuan berdasar perilaku dikelompokkan menjadi dua macam, yakni tujuan umum atau non-behavioral dan tujuan khusus atau behavioral.
Pada tujuan umum, rumusan yang digunakan masih agak umum, sehingga masih agak kabur. Misalnya: (1) siswa dapat menyebutkan sedikitnya 2 syarat sebagai pelatih yang bermutu, (2) siswa dapat menunjukkan 3 macam kelemahan tes objektif.
Seharusnya tujuan pendidkan harus mencakup tiga ranah yaitu kognitif, afektif,
dan psikomotor. Ketiga ranah tersebut harus merupakan satu keseluruhan yang
tidak terpisahkan dalam rangka pencapaian kualitas manusia seutuhnya. Namun
pada kenyatannya kegiatan evaluasi saat ini banyak ditujukan hanya pada
perkembangan ranah kognitif dan psikomotor daripada afektif. Nampaknya hal
ini berkaitan dengan keterampilan guru dalam hal mengevaluasi ranah afektif,
karena penilaian ranah ini sukar untuk dilakukan. Beberapa kemungkinan yang
menyebabkan sukarnya pengukuran ranah afektif di antaranya adalah:
Ismaryati 0818341963 [email protected] 62
- Guru kurang memperhatikan perumusan tujuan dalam lingkup ranah afektif, perumusannya kurang operasional.
- Guru kurang berusaha untuk menilai apakah tujuan dalam ranah afektif tercapai atau tidak.
Ukuran keberhasilan di sekolah pada umumnya adalah kemampuan pada ranah kognitif dan psikomotor. Oleh karenanya berbagai bentuk tes yang dipakai misalnya untuk mempromosikan siswa ke tingkat kelas yang lebih tinggi selalu digunakan tes kognitif. Buku laporan (rapor) selalu dipenuhi dengan data kemampuan kognitif dan pada setiap akhir semester atau tahun kenaikan kelas siswa yang memperoleh penghargaan adalah siswa yang berprestasi dalam kemampuan intelektual. Hal ini dapat dilihat dari kebiasaab guru menyusun peringkat siswanya. Dengan demikian tidak mengherankan kalau laporan tentang kemajuan dalam ranah afektif jarang dibuat. Padahal, ranah afektif sangat penting dalam kehidupan bermasyarakat. Contohnya, guru tidak merangsang siswanya untuk menampilkan performa dalam berbagai aspek. Siswa yang tak pernah membolos atau yang berperangai baik seharusnya dapat memperoleh penghargaan. Demikian juga siswa yang sangat aktif dalam kegiatan ekstrakurikuler.
Untuk menyempurnakan penilaian ranah afektif, kepada guru-guru disarankan agar:
Menyempurnakan tujuan ranah afektif, karena akan terkait secara langsung dengan kejelasan aspek perilaku yang akan dievaluasi.
Pendekatan yang dapat diterapkan adalah seperti apa yang dianjurkan oleh Mager (1968) yaitu gejala “respon menjauhi” atau “mendekati” hal-hal yang seharusnya, misalnya sikap positif terhadap lingkungan bersih atau sikap negatif terhadap merokok. Selanjutnya berdasarkan perilaku yang nampak guru yang bersangkutan dapat menafsirkan sikap para siswanya.
Perlu disempurnakan teknik pencatatan data, seperti observasi, sosiogram dan inventori yang dilakukan. Hal ini sangat membantu dalam pengukuran ranah afektif yang objektif.
Agar terampil dalam menulis tujuan pendidikan, perlu diperhatikan beberapa syarat sebagai berikut:(a) Perumusannya mengungkapkan tujuan yang layak, rasional, atau bahkan
realistik. Contohnya:
Ismaryati 0818341963 [email protected] 63
Siswa mampu menguasai semua keterampilan dasar bola voli dengan koordinasi gerak yang baik.
Jika tujuan ini ditetapkan, misalnya untuk siswa SLTP, rumusan tujuan tersebut tidak realistik karena melebihi kemampuan siswa. Faktor kesiapan fisik dan psikis kurang mendukung. Tujuan di atas lebih tepat untuk mahasiswa jurusan olahraga.
(b) Perumusan tujuan harus berkaitan dengan kemampuan siswa yang dapat dicapai melalui proses belajar. Contohnya: Siswa dapat mengembangkan kemampuan mengutarakan pendapat secara lisan.
(c) Perumusan tujuan harus secara nyata mengungkapkan penguasan suatu bidang studi atau materi dari pengalaman yang akan disediakan. Contohnya:
Siswa dapat menyebutkan macam-macam vitamin yang larut di dalam lemak.
Siswa dapat menyatakan pendapatnya dengan menggunakan bahasa yang benar.
(d) Perumusan tujuan harus ditinjau dari sisi perubahan perilaku siswa. Contohnya:
Siswa mengembangkan sikap ilmiah dalam bidang olahraga
(e) Perumusan tujuan hanya mengutarakan satu kemampuan yang akan dicapai. Contoh salah:
Siswa dapat mengembangkan sikap, dan pengetahuan ilmiah serta dapat menerapkan prinsip-prinsip mekanika olahraga.
Contoh benar:
Siswa dapat menjelaskan proses perubahan karbohidrat menjadi glukosa
Siswa dapat memilih tes yang tepat untuk mengukur power siklik otot-otot tungkai
Ismaryati 0818341963 [email protected] 64
Tugas
Buatlah rumusan tujuan pada ranah kognitif, afektif, dan psikomotor, dengan
tiga jenjang kemampuan, pada materi aktivitas ritmik, permainan bola besar,
permainan bola kecil, ketangkasan, akuatik, beladiri (pilih tiga saja). Gunakan
rambu-rambu penyusunan tujuan yang telah saudara pelajari.
Ismaryati 0818341963 [email protected] 65
Rumusan tujuan yang baik
Jelas, tidak mempunyai pengertian ganda Menunjukkan aspek perilaku yang dapat
diamati dan diukur Memberikan arah yang jelas dan dapat
dicapai
RANAH KOGNITIF
Evaluasi
Ismaryati 0818341963 [email protected] 66
Sintesa
Analisa
Aplikasi
Pemahaman
Pengetahuan
RANAH AFEKTIF
Karakterisasi
Mengorganisasikan
Penghargaan
Merespon
Ismaryati 0818341963 [email protected] 67
Penerimaan
Ranah Psikomotor
Naturalisasi
Artikulasi
Kecermatan
Manipulasi
Peniruan
Ismaryati 0818341963 [email protected] 68
KEGIATAN
HASIL/PRODUK
? TES
ANGKA/PERNYATAAN
YG MENYATAKAN
TINGKAT PENGUASAAN MATERI
Ismaryati 0818341963 [email protected] 69
Alat ukur (tes) hasil belajar memegang peranan yang penting dalam proses belajar-
mengajar. Tes dapat memberikan informasi dalam pengambilan keputusan-keputusan
instruksional misalnya: kesiapan siswa dalam mengikuti pengalaman belajar yang disediakan
sangat mempengaruhi siswa secara langsung (misalnya meningkatkan motivasi siswa), dan
memberikan balikan sehubungan dengan efektivitas pengajaran. Oleh sebab itu, tes sebagai
alat ukur hasil belajar hendaknya disusun sebaik-baiknya agar mampu memberikan
informasi yang tepat. Berikut ini akan diuraikan dua macam jenis tes, yaitu tes objektif dan
esai (uraian).
1. Bentuk Tes Objektif
Tes objektif mengandung pertanyaan-pertanyaan yang sudah terstruktur dengan
sempurna. Peserta tes tidak perlu melahirkan ide, dan tidak dituntut adanya
kemampuan mengorganisasikan jawaban. Pada umumnya, tes bentuk objektif telah
menyiapkan jawaban-jawaban untuk dipilih. Peserta tes hanya perlu mengenal jawaban
yang dianggap benar. Tes bentuk objektif dibagi atas dua jenis, yakni (a) yang
menentukan pemberian jawaban atau butir tes dengan jawaban bebas, (b) yang
menuntut pemilihan jawaban tipe jawaban tetap.
a. Butir tes jawaban bebas
Tes yang tergolong tipe jawaban bebas merupakan suatu bentuk tes yang setiap
butirnya berupa pertanyaan langsung, namun tidak lengkap. Soal tipe ini terdiri atas 2
macam, yakni soal bentuk jawaban pendek dan bentuk melengkapi. Peserta tes
diharapkan mengemukakan jawaban yang sesuai dengan pertanyaan. Tipe tes ini
berbeda dengan tes esai terutama dalam hal panjang jawaban yang dibutuhkan.
Ismaryati 0818341963 [email protected] 70
BAB IV
PENYUSUNAN TES HASIL BELAJAR
Jawaban dapat berupa sebuat kata, kalimat pendek, bilangan atau simbol. Pada
dasarnya soal bentuk jawaban pendek dan bentuk melengkapi adalah sama,
perbedaannya terletak pada cara mengemukakan permasalahannya. Jika dikemukakan
dalam bentuk pertanyaan, maka soal itu adalah bentuk jawaban pendek. Tetapi jika
dikemukakan dalam bentuk pernyataan, maka soal tersebut adalah bentuk melengkapi.
Contoh soal bentuk jawaban pendek:
Bergerak pada sumbu apakah gerakan fleksi dan ekstensi sendi siku?
Contoh soal bentuk melengkapi:
Gerakan fleksi dan ekstensi sendi siku bergerak pada sumbu …………….
Keuntungan soal tipe jawaban bebas:
Mudah disusun, cocok untuk mengukur pengetahuan tentang istilah, fakta-fakta
yang spesifik, prinsip-prinsip, integrasi data, kemampuan menyelesaikan masalah
numerik, keterampilan memanipulasikan simbol-simbol matematik, dan kemampuan
menyelesaikan persamaan-persamaan reaksi kimia.
Menghindari kemungkinan faktor menebak. Karena peserta tes dituntut untuk
memberikan jawaban, maka kemungkinan jawaban benar hanya karena terkaan
dapat hindari.
Kelemahan soal tipe jawaban bebas:
Peserta tes digiring untuk mengungkapkan pengetahuan faktual atau sekumpulan
informasi yang amat terbatas.
Sulit untuk mengukur kemampuan aplikasi, mengorganisasi dan mengintegrasi.
Membutuhkan waktu yang cukup banyak dalam proses pemberian nilai dan tidak
selalu objektif.
b. Butir tes jawaban tetap
Keuntungan soal bentuk ini adalah mudah dalam pemberian skor, mencakup bahan yang
luas, dapat diuji dalam waktu yang singkat.
Ismaryati 0818341963 [email protected] 71
Soal bentuk Benar-Salah
Soal bentuk benar-salah terdiri atas kalimat berita atau pernyataan yang berisi dua
kemungkinan, yakni benar atau salah, setuju atau tidak setuju, fakta atau pendapat, dan
yang sejenis. Peserta tes diharuskan menentukan pendapatnya dengan cara memilih
salah satu alternatif jawaban.
Contoh:
Petunjuk: Lingkarilah “B” jika pernyataan benar dan “S” jika pernyataan salah
B S Salah satu faktor yang menentukan kualitas kekuatan seseorang adalah jenis otot yang dimilikinya.
B S Otot lambat memiliki eritrosit yang lebih banyak jika dibandingkan dengan otot cepat
Petunjuk: Lingkarilah “Y” jika jawabannya ya dan “T” bila jawabannya tidak.
Y T Apakah aktivitas mitochondrion pada otot putih dan otot merah sama?
Y T Apakah kebutuhan kalori pada atlet panahan sama besar dengan atlet bowling?
Kebaikan soal bentuk benar-salah adalah:
mudah disusun
mencakup materi yang luas
Kelemahannya adalah:
hanya dapat mengukur hasil belajar dalam bidang pengetahuan, kecuali soal
bentuk jawaban alternatif yang meminta membedakan antara fakta dan
pendapat
merangsang peserta tes untuk menerka jawaban.
Menurut para ahli, soal tipe ini tergolong rendah mutunya. Untuk meningkatkan mutunya,
didalam menyusun butir-butir soal perlu memperhatikan ketentuan-ketentuan berikut:
Ismaryati 0818341963 [email protected] 72
RAMBU-RAMBU untuk MENYUSUN SOAL BENAR – SALAH
Membuang kata-kata yang khas yang sifatnya menentukan, misalnya semua, selalu, tidak pernah, tidak ada. Contoh: orang yang memiliki ukuran potongan melintang otot yang luas pasti memiliki kekuatan yang besar.
Menghindari pertanyaan yang meragukan Menghindari kata-kata yang eksak, termasuk pernyataan yang sifatnya jebakan. Menghindari pernyataan negatif ganda. Misalnya: kelentukan tidak bertambah baik jika suhu
udara meningkat. Akan lebih baik jika dirumuskan demikian: kelentukan tidak bertambah baik walaupun suhu udara meningkat.
Menghindari pernyataan yang kabur, terlampau panjang, dan penggunaan bahasa kuantitatif seperti “banyak”, “sedikit”, “tua”, “muda”.
Jika pernyataan bermaksud untuk menguji alasan tentang kebenaran atau kesalahan sesuatu, maka bagian kalimat yang pertama harus menunjukkan segi benarnya dan bagian ke dua menunjukkan alasan benar atau salahnya. Contoh: Hemoglobin merupakan unsur yang
Soal bentuk pilihan ganda
Soal bentuk pilihan ganda terdiri atas sebuat permasalahan dan sejumlah pilihan
jawaban untuk dipilih. Permasalahan biasanya dinyatakan dalam bentuk kalimat tanya
atau pernyataan yang kurang sempurna, dan disebut batang tubuh soal. Pilihan jawaban
dapat berupa kata, bilangan, simbol, atau anak kalimat. Peserta tes diharuskan
membaca batang tubuh soal dan memilih satu pilihan jawaban yang benar atau paling
benar. Jawaban yang benar atau paling benar disebut sebagai jawaban, sedangkan yang
lainnya adalah distraktor atau pengecoh.
Kebaikan soal pilihan ganda ini adalah:
dapat digunakan untuk mengukur hasil belajar dalam bidang pengetahuan, seperti
pengetahuan tentang terminologi, tentang fakta-fakta tertentu, tentang prinsip-
prinsip, tentang metode dan prosedur
dapat digunakan untuk mengukur hasil belajar dalam bidang pemahanan dan
aplikasi, seperti kemampuan dalam mengaplikasikan fakta dan prinsip, kemampuan
menginterpretasikan hubungan kausal efek
mencakup materi yang luas
Ismaryati 0818341963 [email protected] 73
Kelemahan soal pilihan ganda adalah:
sukar di dalam penyusunannya dan memerlukan banyak waktu.
Agar butir soal pilihan ganda yang kita susun mempunyai mutu yang baik, di dalam
penyusunannya perlu memperhatikan rambu-rambu berikut:
RAMBU-RAMBU untuk MENYUSUN SOAL PILIHAN GANDA
Kalimat pengarah atau stem harus mengandung inti masalah Jangan menggunakan pilihan jawaban “bukan salah satu di antara yang di atas” Soal dibuat sesingkat-singkatnya Hindarkan memakai sistem negatif Arahkan peserta tes untuk mengemukakan jawaban yang paling tepat Gunakan bahasa yang mudah dipahami Penghilangan bagian pernyataan jangan pada bagian awal Gunakan urutan logis atau tata waktu, jika ada Pakailah pengecoh yang benar-benar menarik untuk mengetes penguasaan materi yang
sebenarnya Susunlah semua alternatif jawaban dengan bahasa yang ajeg, panjang, dan variasi yang tepat Alternatif jawaban sebaiknya seragam dalam hal bentuk dan struktur bahasa Alternatif jawaban antara 4 – 5 Jangan menggunakan kalimat puitis, mengulang alternatif jawaban butir lain, atau kata-kata yang
khas yang menentukan, misalnya “selalu”, “tidak pernah” Butir soal jangan disusun seperti tata urutan dalam buku sumber Jangan memasukkan sebanyak mungkin soal Butir soal diberi nomor dengan angka dan alternatif jawaban dengan huruf
Soal tipe menjodohkan
Pada umumnya soal bentuk menjodohkan terdiri atas dua kolom. Kolom yang pertama
berisi kata, bilangan, atau simbol. Kolom yang ke dua terdapat kata, kalimat, atau anak
kalimat. Butir-butir dalam kolom yang akan dicarikan pasangannya disebut premis, dan
butir-butir dalam kolom tempat mencari pasangan disebut respon. Peserta tes
diharuskan mencari pasangan pasangan yang sesuai antara butir-butir dalam premis
dengan butir-butir dalam respon.
Yang paling mudah mudah dalam menyusun adalah bila jumlah respon sama dengan
jumlah premis. Penyediaan jumlah respon yang lebih banyak daripada premis berguna
untuk mengurangi kemungkinan menebak jawaban.
Ismaryati 0818341963 [email protected] 74
Contoh soal menjodohkan:
Petunjuk: Tulislah huruf yang cocok dengan pernyataan pada kolom kanan
1. Dayatahan erobik A. Vertical Power Jump Test
2. Power Siklik B. Otot merah
3. Kekuatan C. Hemoglobin
D. Margaria – Kalamen Test
E. Potongan melintang otot
Kebaikan soal menjodohkan ini adalah:
Melatih siswa untuk menghubungkan sejumlah fakta dalam waktu yang singkat
Mudah menyusunnya
Kelemahan soal pilihan ganda adalah:
Seringkali hanya menekankan faktor ingatan
Kurang efektif untuk mengukur pengertian
Menyusun tes yang baik merupakan tugan yang tidak ringan bagi seorang guru.
Predikat baik tersebut mencakup banyak segi. Salah satu segi yang dapat membantu
pemberian predikat baik adalah representativitas hasil tes terhadap kemampuan hasil
belajar. Representativitas tersebut mencakup dua hal, yakni representativitas terhadap
keseluruhan materi yang dipelajari, dan terhadap proporsi jenjang kemampuan yang
diharapkan dicapai.
Ismaryati 0818341963 [email protected] 75
Perencanaan Butir Tes
Representativitas tersebut bukan ditekankan kepada teknik pengambilan sampel
materi yang dipelajari secara acak, melainkan pada daya prediksi sampel butir soal terhadap
penguasaan pengetahuan serta taraf kemampuan yang dapat ditampilkan. Materi yang
umumnya dapat digunakan untuk memprediksi adalah konsep-konsep tertentu yang siap
pakai. Kompetensi yang umumnya mempunyai daya prediksi yang lebih tinggi adalah
kompetensi-kompetensi yang komprehensif, lebih kompleks, kompetensi berlanjut yang
sangat sukar.
Kecuali dipilih berdasar pertimbangan tersebut di atas, proporsi jumlah butir soal
klaster materi, atau klaster kompetensi dapat pula mempertinggi atau menurunkan daya
prediksi tes hasil belajar. Proporsi jumlah butir hendaknya sesuai dengan kompetensi yang
hendak dicapai tujuan umum maupun khususnya.
Untuk maksud tersebut di atas, perlu perencanaan penyusunan tes, dan biasanya
dituangkan dalam suatu Tabel Spesifikasi yang mempunyai dua dimensi. Dimensi yang
pertama mengungkapkan klaster materi atau bahan yang dipelajari. Dimensi yang lain
mengungkapkan berbagai kompetensi, yang biasanya disajikan berdasar taksonomi dari
Bloom.
Yang pertama-tama dikembangkan dalam merencanakan butir soal adalah: (a)
menetapkan tujuan tes, (b) menyusun tabel spesifikasi atau kisi-kisi sebagai pegangan dalam
menyusun garis besar butir-butir tes.
Dalam menetapkan tujuan tes selalu dihubungkan dengan tujuan instruksional atau
sasaran belajar yang telah dirumuskan. Dengan mengacu kepada jenjang kognitif yang telah
dirumuskan oleh Bloom, maka tipe soal diselaraskan dengan masing-masing jenjang kognitif
sebagai berikut: pengetahuan, aplikasi, analisa, sintesa, evaluasi.
Setelah tujuan ditetapkan, buatlah tabel spesifikasiseperti tabel 4.1:
Tabel 4.1: Spesifikasi Soal Berdasar Materi dan Tingkat Kesulitan
Materi Persentase Butir Soal
Jenjang Kemampuan Kognitif
K 1 K 2 K 3 K 4 K 5 K 6 Jml
Ismaryati 0818341963 [email protected] 76
Kriteria Memilih Tes
Validitas 7/31 X100= 1 2 1 1 1 1 7
Reliabilitas 1 3 2 1 1 1 9
Objektivitas 2 2 2 1 1 8
Diskriminitas 1 1 1 3
Praktibilitas 1 1 2 4
Jumlah 6 9 8 3 3 2 31
Pembuatan kisi-kisi dimaksudkan untuk mengendalikan, sekaligus merencanakan
materi dan tipe soal guna menjamin terpenuhinya validitas isi. Validitas isi akan terpenuhi
sejauh dapat direncanakan, bahwa materi yang akan diuji benar-benar bersumber dari
cakupan materi yang harus dikuasi oleh siswa. Oleh karena itu, selain sumber yang
digunakan harus valid, proporsi jumlah butir soal juga harus mencerminkan keluasan dan
kedalaman materi yang akan diuji.
Berdasar rancangan yang telah dibuat di atas, mudah bagi kita untuk menetapkan
pembagian butir-butir soal sesuai dengan golongan dan jenjang kognitif yang akan diukur.
Tahap yang selanjutnya adalah menulis butir soal seperti yang telah direncanakan.
Penentuan Kualitas Tes
Untuk mengetahui apakah tujuan pengajaran yang telah kita tetapkan dapat
tercapai, perlu dijawab dua pertanyaan berikut: (1) apakah tujuan tes terwujud dalam
pengetesan? (2) apakah tes memberikan informasi yang cermat tentang perbedaan tingkat
kemampuan para siswa?. Kedua pertanyaan tersebut berkaitan secara langsung dengan
butir soal yang kita kembangkan. Dengan demikian tes tersebut perlu dianalisis validitas dan
reliabilitasnya.
Ismaryati 0818341963 [email protected] 77
Analisis item (analisis soal) adalah suatu prosedur yang sistematis, yang akan
memberikan informasi sangat khusus terhadap butir soal yang kita kembangkan atau kita
susun.
Fungsi Analisis Item
a. Membantu mengidentifikasikan butir-butir soal yang jelek
b. Memperoleh informasi yang akan dapat digunakan untuk menyempurnakan soal-soal,
untuk kepentingan lebih lanjut.
c. Memperoleh gambaran secara selintas tentang keadaan tes yang kita susun.
Tujuan dilakukannya analisis item adalah:
a. Untuk mengkategorikan soal sebagai soal yang baik, jelek, dan yang masih memerlukan
perbaikan.
b. Untuk membantu dalam memperbaiki soal-soal yang memerlukan penyempurnaan.
c. Untuk memilih soal-soal yang baik dalam penyusunan terakhir suatu ujian.
Analisis soal terutama dapat dilakukan untuk tes bentuk objektif. Hal ini tidak berarti
bahwa tes esai tidak dapat dianalisis, akan tetapi di dalam tes esai belum ada pedoman
baku. Informasi yang dapat diperoleh dari analisa item adalah: (1) indeks kesukaran butir
atau tingkat kesukaran item, (2) indeks daya beda, (3) keberfungsian alternatif jawaban.
1. Indeks kesukaran item
Soal yang baik adalah soal yang tidak terlalu mudah atau terlalu sukar. Soal yang
terlalu mudah tidak merangsang siswa untuk mempertinggi usaha memecahkannya.
Sebaliknya soal yang terlalu sukar akan menyebabkan siswa menjadi putus asa dan tidak
bersemangat untuk mencoba lagi karena diluar jangkauannya.
Bilangan yang menunjukkan mudah dan sukarnya suatu soal disebut Indeks
kesukaran (difficulty index). Indeks kesukaran item (butir soal) berkisar antara 0,0-1,0.
Ismaryati 0818341963 [email protected] 78
Indeks kesukaran item 0,0 menunjukkan bahwa soal tersebut terlalu sukar, sebaliknya
indeks 1,0 menunjukkan bahwa soal terlalu mudah. Jadi semakin mudah suatu soal, akan
semakin besar indeks kesukaran itemnya.
Tingkat kesulitan butir diperoleh dengan cara membagi jawaban yang benar bagi
suatu butir soal (B) dengan jumlah peserta tes (JS). Besarnya indeks kesukaran item
dinyatakan dengan P. Rumus yang digunakan adalah:
P = B JS
Langkah-langkah menghitung indeks kesukaran item adalah:
Misalnya: ada 10 orang siswa dengan nama kode A s/d J yang mengerjakan tes terdiri atas
10 soal. Hasil pekerjaan (jawaban) siswa dikoreksi dengan ketentuan setiap item yang dijawab
dengan benar diberi skor 1, dan jawaban yang salah 0. Cara mengerjakannya:
Langkah 1:
Setelah koreksi selesai, masukkan ke dalam tabel persiapan analisa indeks kesukaran (tabel: 4.2)
Tabel 4.2: Persiapan Analisis Indeks Kesukaran Item
No. SiswaNomer Item
Skor Siswa1 2 3 4 5 6 7 8 9 10
1 A 1 1 0 0 1 0 1 1 0 1 6
2 B 0 1 0 0 1 0 0 1 0 0 3
3 C 1 1 0 0 1 1 1 1 0 1 7
4 D 0 1 0 0 1 1 0 1 0 0 4
5 E 1 1 0 0 1 0 1 1 0 1 6
6 F 0 0 0 1 1 1 0 1 0 0 4
7 G 1 0 0 1 0 0 1 1 0 1 5
Ismaryati 0818341963 [email protected] 79
8 H 0 0 0 1 0 0 1 1 0 0 3
9 I 1 1 1 1 1 0 1 1 0 1 8
10 J 0 1 1 1 1 0 1 1 0 0 6
Jml Jawaban Benar
5 7 2 5 8 3 7 10 0 5 52
Cara memasukkan data ke dalam tabel:
1) Susunlah lembar jawaban peserta tes secara berurutan
2) Masukkan hasil scoring ke dalam tabel secara berurutan dari item nomer 1 sampai 10.
3) Masukkan data setiap peserta tes ke dalam tabel seperti pada langkah b
4) Hitunglah skor siswa dengan cara menghitung jumlah item yang dikerjakan dengan
benar, masukkan ke kolom skor siswa.
5) Hitunglah hasil pekerjaan yang benar untuk setiap item, masukkan ke baris jumlah
jawaban benar.
6) Jumlahkan skor siswa, juga jumlah jawaban benar. Koreksilah, jumlah jawaban benar
harus selalu sama dengan skor siswa.
Langkah 2:
Menganalisa indeks kesukaran setiap item
1) Item no. 1 Banyaknya siswa yang menjawab benar (B) = 5
Jumlah peserta tes (J) = 10
Indeks kesukaran Item (P)
P = B J S =
5 10 = 0.5
2) Item no. 2:Banyaknya siswa yang menjawab benar (B) = 7
Jumlah peserta tes (J) = 10
Indeks kesukaran Item (P)
Ismaryati 0818341963 [email protected] 80
P = B J S =
7 10 =
0.70
3) Item no. 3 P = 0.24) Item no. 4 P = 0.55) Item no. 5 P = 0.86) Item no. 6 P = 0.37) Item no. 7 P = 0.78) Item no. 8 P = 1.09) Item no. 9 P = 0.010) Item no. 10 P = 0.5
Langkah 3:
Menyimpulkan hasil penghitungan indeks kesukaran setiap item. Konsultasikan hasil penghitungan indeks kesukaran item dengan tabel klasifikasi indeks kesukaran. (tabel: 4.3)
Tabel 4.3: Klasifikasi Indeks Kesukaran Item
Indeks Kesukaran (P) Klasifikasi
0.00 – 0.30 Sukar
0.31 – 0.70 Sedang
0.71 – 1.00 Mudah
Kesimpulan yang diperoleh adalah:
Item no. 1 P = 0.50 Termasuk soal sedang
Item no. 2 P = 0.70 Termasuk soal sedang
Item no. 3 P = 0.20 Termasuk soal sukar
Item no. 4 P = 0.50 Termasuk soal sedang
Ismaryati 0818341963 [email protected] 81
Item no. 5 P = 0.80 Termasuk soal mudah
Item no. 6 P = 0.30 Termasuk soal sukar
Item no. 7 P = 0.70 Termasuk soal sedang
Item no. 8 P = 1.00 Termasuk soal mudah
Item no. 9 P = 0.00 Termasuk soal sukar
Item no. 10 P = 0.50 Termasuk soal sedang
Demikianlah langkah-langkah penghitungan untuk mengetahui indeks atau tingkat
kesukaran butir soal. Yang penting untuk diingat adalah bahwa soal yang terlalu sukar tidak
berarti tidak ada gunanya. Jika peserta tes banyak, maka sebaiknya dipilih item atau butir
soal yang sukar. Sebaliknya bila peserta tes hanya sedikit dipilih soal yang mudah. Soal yang
sukar, akan merangsang gairah belajar bagi siswa yang pandai dan soal yang mudah akan
membangkitkan semangat bagi siswa yang kurang pandai.
2. Indeks daya beda
Daya beda adalah kemampuan suatu soal untuk membedakan antara peserta tes
yang berkemampuan tinggi dan yang rendah. Angka yang menunjukkan besarnya daya
beda disebut indeks daya beda (indeks diskriminasi). Jadi indeks daya beda suatu soal
adalah angka yang menunjukkan keefektifan soal itu dalam membedakan antara peserta
tes yang berkemampuan tinggi dan rendah. Besarnya indeks daya beda berkisar antara –
1.00 sampai + 1.00.
Seluruh peserta tes dibagi menjadi 2 kelompok, yaitu kelompok yang
berkemampuan tinggi (upper group) dan berkemampuan rendah (lower group). Jika
seluruh peserte tes kelompok atas dapat menjawab suatu soal tes dengan benar,
sedangkan seluruh peserta tes kelompok bawah menjawab salah, maka soal tersebut
memiliki indeks daya beda paling besar yaitu +1.00. Namun jika seluruh peserta tes
Ismaryati 0818341963 [email protected] 82
kelompok atas menjawab salah, tetapi seluruh peserta tes kelompok bawah menjawab
benar, maka soal tersebut memiliki indeks daya beda terkecil, yaitu –1.00. Jika peserte
kelompok atas dan bawah sama-sama menjawab benar atau salah maka soal tersebut
memiliki indeks daya beda 0.00 karena tidak memiliki daya beda samasekali.
Jika suatu soal memiliki indeks daya beda negatif, soal tersebut sebaiknya dibuang. Angka
negatif menunjukkan bahwa soal tersebut memiliki daya beda yang terbalik. Artinya kelompok
atas tidak dapat mengerjakan soal tersebut, tetapi kelompok bawah dapat mengerjakannya
dengan benar. Rumus yang digunakan untuk menghitung indeks daya beda adalah:
D = BA - BB = PA - PB
JA JB
Keterangan:
J = Jumlah peserta tes
JA = Jumlah peserta kelompok atas
JB = Jumlah peserta kelompok bawah
BA = Jumlah peserta kelompok atas yang menjawab benar
BB = Jumlah peserta kelompok bawah yang menjawab benar
PA = Proporsi peserta kelompok atas yang menjawab benar
PB = Proporsi peserta kelompok bawah yang menjawab benar
Cara menentukan kelompok atas dan bawah:
Untuk sampel kecil (kurang dari 100 orang)
Seluruh peserta tes dibagi dua sama besar, 50% kelompok atas dan 50% kelompok bawah.
Seluruh peserta tes diurutkan mulai dari yang mendapat skor tertinggi sampai terrendah
kemudian dibagi menjadi dua sama besar.
Selain dengan cara di atas dapat juga dengan menggunakan rumus median (pelajari kembali
rumus median pada matakuliah statistik). Median adalah titik tengah, jadi skor yang ada
ditengah antara skor tertinggi dan terrendah. Median menjadi batas untuk membagi kelompok
peserta menjadi dua sama besar. Dengan demikian peserta tes yang mendapat skor di atas
Ismaryati 0818341963 [email protected] 83
median digolongkan sebagai kelompok atas dan yang di bawah median digolongkan sebagai
kelompok bawah.
Untuk sampel besar (lebih dari 100 orang)
Untuk menetapkan kelompok atas dan bawah pada sampel besar biasanya hanya
diambil 27% dari skor teratas untuk kelompok atas dan 27% skor terrendah untuk
kelompok bawah. Ambillah 27% dari skor tertinggi ke bawah untuk kelompok atas dan
27% skor terrendah ke atas untuk kelompok bawah. Cara ini dapat dilakukan bila peserta
tes tidak terlalu banyak. Namun bila peserta tes sangat banyak gunakanlah presentil
(pelajari kembali rumus presentil pada matakuliah statistik). Untuk menentukan
kelompok atas ambillah presentil ke 74 – 100 dan ke 1 – 27 untuk kelompok bawah.
Langkah untuk menghitung indeks daya beda
Sebagai contoh untuk menghitung indeks daya beda, gunakan data pada tabel 4.2.
Langkah 1:
menentukan kelompok atas dan bawah. Untuk keperluan ini lihatlah data pada tabel 1, halaman. Karena jumlah peserta hanya 10 orang, maka untuk menentukan kelompok atas dan bawah kita gunakan cara yang pertama. Urutkan dari siswa yang mendapat skor tertinggi ke terrendah. Hasilnya adalah sebagai berikut:
Tabel 4.4: Pengelompokkan Kelompok Atas dan Bawah
No. Siswa Skor Kelompok
1 I 8
2 C 7
3 A 6 50% Kelompok atas (JA = 5)
4 E 6
5 J 6
Ismaryati 0818341963 [email protected] 84
6 G 5
7 D 4
8 F 4 50% kelompok bawah (JB = 5)
9 B 3
10 H 3
Langkah 2:
membuat tabel persiapan analisis indeks daya beda. Caranya sama dengan membuat tabel persiapan analisis indeks kesukaran, namun urutan nomer peserta berdasarkan urutan skor tertinggi ke terrendah.
Tabel 4.5: Persiapan Analisa Indeks Daya Beda
No. Siswa Nomer Item Skor Siswa
Kel.
1 2 3 4 5 6 7 8 9 10
1 I 1 1 1 1 1 0 1 1 0 1 8
2 C 1 1 0 0 1 1 1 1 0 1 7
3 A 1 1 0 0 1 0 1 1 0 1 6 Kel.
4 E 1 1 0 0 1 0 1 1 0 1 6 atas
5 J 0 1 1 1 1 0 1 1 0 0 6
4 5 2 2 5 1 5 5 0 4 32
6 G 1 0 0 1 0 0 1 1 0 1 5
7 D 0 1 0 0 1 1 0 1 0 0 4
Ismaryati 0818341963 [email protected] 85
8 F 0 0 0 1 1 1 0 1 0 0 4 Kel.
9 B 0 1 0 0 1 0 0 1 0 0 3 bawah
10 H 0 0 0 1 0 0 1 1 0 0 3
1 2 0 3 3 2 2 5 0 1 20
Total 5 7 2 5 8 3 7 10 0 5 52
Langkah 3:
menentukan kelompok atas dan bawah. Untuk keperluan ini lihatlah data pada tabel 4.5, masukkan ke dalam rumus indeks daya beda
1) Item no. 1:Kelompok atas yang menjawab betul = 4
Kelompok bawah yang menjawab betul = 1
Jumlah kelompok atas dan bawah = 5
Indeks daya beda =
D =
BA - BB = PA - PB
JA JB
D =
4 - 1 = 0.8 – 0.2 = 0.60
5 5
2) Item no. 2:Kelompok atas yang menjawab betul = 5
Kelompok bawah yang menjawab betul = 2
Jumlah kelompok atas dan bawah = 7
Indeks daya beda =
D =
5 - 2 = 1.0 – 0.4 =0.60
5 5
Ismaryati 0818341963 [email protected] 86
3) Item no. 3 indeks daya bedanya = 0.404) Item no. 4 indeks daya bedanya = -0.205) Item no. 5 indeks daya bedanya = 0.406) Item no. 6 indeks daya bedanya = -0.207) Item no. 7 indeks daya bedanya = 0.808) Item no. 8 indeks daya bedanya = 0.009) Item no. 9 indeks daya bedanya = 0.0010) Item no. 10 indeks daya bedanya = 0.60
Langkah 4:
menyimpulkan hasil penghitungan. Konsultasikan hasil penghitungan indeks daya beda dengan tabel 4.6 berikut ini.
Tabel 4.6: Klasifikasi Indeks Daya Beda
Indeks Daya Beda (D) Klasifikasi
0.00 – 0.20 Jelek
0.21 – 0.40 Cukup
0.41 – 0.70 Baik
0.71 – 1.00 Baik sekali
Negatif Sangat jelek
Kesimpulan yang diperoleh adalah:
Item no. 1 D = 0.60 Termasuk item baik
Item no. 2 D = 0.60 Termasuk item baik
Item no. 3 D = 0.40 Termasuk item cukup
Item no. 4 D = -0.20 Termasuk item sangat jelek
Item no. 5 D = 0.40 Termasuk item cukup
Item no. 6 D = -0.20 Termasuk item sangat jelek
Item no. 7 D = 0.80 Termasuk item baik sekali
Item no. 8 D = 0.00 Termasuk item jelek
Item no. 9 D = 0.00 Termasuk item jelek
Item no. D = 0.60 Termasuk item baik
Ismaryati 0818341963 [email protected] 87
10
Hubungan antara indeks kesukaran item (P) dan indeks daya beda (D)
Untuk melihat hubungan antara P dan D, perlu kiranya kita meninjau kembali rumus-rumus yang digunakan untuk menghitungnya.
D =
BA-
BB= PA -
PB (1)
JA JB
P = BA – BB
=BA – BB
JA + JB 2 JA
=1 BA + BB
2 JA + JB
P = PA + PB
(2) 2
Hubungan antara P dan D dapat digambarkan sebagai berikut:
D Maks = 2 P (3)1.00
D maks Contoh:
Ismaryati 0818341963 [email protected] 88
0.80
Soal dengan P=0.20, D maksnya 0.40
0.60
Soal dengan P=0.80 D maksnya 0.40
0.400.200.00
P
0.20 0.50 0.80 1.00
Dari grafik di atas bahwa soal-soal dengan P = 0.50 memungkinkan mempunyai daya
beda tertinggi. Nilai P yang dianjurkan berkisar antara 0.30 – 0.70, meskipun begitu tidak
soal tersebut pasti mempunyai daya beda yang tinggi.
3. Keberfungsian alternatif jawaban
Selain indeks kesukaran item, indeks daya beda, yang juga perlu dianalisis adalah
keberfungsian alternatif jawaban. Keberfungsian alternatif jawaban diperoleh dengan
menghitung jumlah peserta tes yang memilih pilihan jawaban (alternatif) a, b, c, atau d
atau yang tidak memilih pilihan jawaban manapun (blangko). Peserta tes yang tidak
melilih pilihan jawaban manapun disebut Omiet (O). Omiet dikatakan baik apabila hanya
sebanyak-banyaknya 5% dari seluruh peserta tes yang blangko, dan pemilih dari
kelompok atas lebih sedikit yang blangko jika dibandingkan dengan kelompok bawah.
Dari keberfungsian alternatif jawaban, dapat ditentukan apakah alternatif jawaban
tersebut berfungsi sebagai pengecoh (distraktor) yang baik atau tidak. Alternatif
jawaban yang tidak dipilih oleh peserta tes berarti Alternatif jawaban tidak berfungsi
secara baik sebagai pengecoh. Alternatif jawaban dapat dikatakan sebagai pengecoh
yang baik apabila mempunyai daya tarik yang besar bagi peserta tes yang kurang
mengetahui konsep atau kurang menguasai materi, sehingga sedikitnya dipilih oleh 5%
dari seluruh peserta tes, pemilih dari kelompok atas lebih sedikit jika dibandingkan
dengan pemilih kelompok bawah.
Ismaryati 0818341963 [email protected] 89
Langkah untuk menghitung keberfungsian alternatif jawaban
Sebagai contoh untuk menghitung indeks keberfungsian alternatif jawaban, gunakan
data pada tabel 4.1, item nomer 1,2, dan 3. Data pada tabel tersebut adalah data dari suatu
tes bentuk pilihan ganda dengan 4 alternatif jawaban a,b,c, dan d
Langkah 1:
Membuat tabel persiapan analisa keberfungsian alternatif jawaban sebagai berikut:
Tabel 4.7: Persiapan Analisis Keberfungsian Alternatif Jawaban
No Siswa
Nomer ItemKelompok
1 2 3dst
a b c d 0 a b c d 0 a b c d 0
1 I - 1 - - - - 1 - - - 1 - - 1 -
2 C - 1 - 1 - - - - - - - - - - -
3 A - - - - 1 - - - - 1 - - 1 - Atas
4 E - 1 1 - - - - - - - 1 1 - 1 -
5 J - 1 1 - - 1 - - - - 1 1 1 - -
0 4 2 1 0 2 1 0 0 0 4 2 1 3 0
6 G 1 - - 1 - - - 1 - - 1 - - - -
7 D - 1 - - - 1 - - - - 1 - - 1 -
8 F - - - - - 1 - 1 - - - 1 - 1 - Bawah
9 B - - - - - - - - 1 - - 1 - - -
10 H 1 - - - - - - - - - - - 1 - -
2 1 0 1 0 2 0 2 1 0 2 2 1 2 0
Ismaryati 0818341963 [email protected] 90
Keterangan:
b a d = alternatif jawaban yang benar
O = adalah Omiet (peserta tes yang tidak memilih alternati jawaban manapun)
Dari tabel 4.7 diperoleh data sebagai berikut:
1) Item no. 1
Alternatif jawaban : a b c d O
Jml pemilih kelompok atas : 0 4 2 1 0
Jml pemilih kelompok bawah
: 2 1 0 1 0
2) Item no. 2
Alternatif jawaban : a b c d O
Jml pemilih kelompok atas : 2 1 0 0 0
Jml pemilih kelompok bawah
: 2 0 2 1 0
3) Item no. 3
Alternatif jawaban : a b c d O
Jml pemilih kelompok atas : 4 2 1 3 0
Jml pemilih kelompok bawah
: 2 2 1 2 0
Ismaryati 0818341963 [email protected] 91
Langkah 2:
Menghitung keberfungsian alternatif jawaban dengan cara menjumlahkan pemilih kelompok atas dan bawah, kemudian dibagi dengan jumlah kelompok atas dan bawah, hasilnya kalikan dengan 100% untuk setiap alternatif jawaban.
Kesimpulannya:
Jika hasilnya di atas 5%, maka alternatif jawaban tersebut berfungsi sebagai pengecoh yang baik, tetapi jika kurang dari 5% maka alternatif jawaban tersebut sebagai pengecoh yang jelek.
Jika pemilih kelompok atas lebih sedikit dari kelompok bawah, maka maka alternatif jawaban tersebut berfungsi sebagai pengecoh yang baik, sebaliknya jika pemilih kelompok atas lebih banyak daripada kelompok bawah, maka pengecoh tersebut jelek.
Cara menghitungnya adalah sebagai berikut:
1) Untuk item soal no. 1
Alternatif a
: 0 + 2 x 100% = 20%
5 + 5
Alternatif c
: 2 + 0 x 100% = 20%
5 + 5
Alternatif d
: 1 + 1 x 100% = 20%
5 + 5
Omiet : 0 + 0 x 100% = 0 %
5 + 5
Ismaryati 0818341963 [email protected] 92
Kesimpulan: Semua alternatif jawaban untuk item ini berfungsi sebagai pengecoh yang baik karena dipilih lebih dari 5% dan pemilih dari kelompok atas lebih sedikit dari kelompok bawah
Tidak lebih dari 5% dari peserta tes yang blangko, pemilih dari kelompok atas lebih sedikit dari kelompok bawah.
2) Untuk item soal no. 2
Alternatif b
: 1 + 0 x 100% = 10%
5 + 5
Alternatif c
: 0 + 2 x 100% = 20 %
5 + 5
Alternatif d : 0 + 1 x 100
%= 10%
5 + 5
Omiet : 0 + 0 x 100
%= 0%
5 + 5
Kesimpulan: Alternatif jawaban b masih jelek, karena walaupun dilipih lebih dari 5% dari peserta tes namun pemilih kelompok atas lebih banyak dari kelompok bawah.
Alternatif jawaban c dan d sudah baik Tidak lebih dari 5% dari peserta tes yang blangko, pemilih dari kelompok
atas lebih sedikit dari kelompok bawah.
3) Untuk item soal no. 3
Ismaryati 0818341963 [email protected] 93
Alternatif a : 4 + 2 x 100
%= 60%
5 + 5
Alternatif b : 2 + 2 x 100
%= 40%
5 + 5
Alternatif c : 1 + 1 x 100
%= 20%
5 + 5
Omiet : 0 + 0 x 100
%= 0%
5 + 5
Kesimpulan: Semua alternatif jawaban untuk item ini sudah berfungsi baik karena dipilih lebih dari 5% dan pemilih dari kelompok atas lebih sedikit dari kelompok bawah
Tidak lebih dari 5% dari peserta tes yang blangko, pemilih dari kelompok atas lebih sedikit dari kelompok bawah.
Dari ketiga item yang telah dianalisis, indeks kesukaran item, indeks daya beda, dan keberfungsian
alternatif jawabannya dapat dilihat pada tabel 4.8 berikut:
Tabel 4.8: Rangkuman Hasil Penghitungan tentang Indeks Kesukaran Item, Indeks Daya Beda, dan Keberfungsian Alternatif Jawaban
Alternatif Jawaban P D
Ismaryati 0818341963 [email protected] 94
Nomer Item Kelompo
k
Jml. Jawaban Benar
Proporsi Jawaban
Benar
a b c d
1 Atas 0 4 2 1 4 40% 0.50 0.60Bawah 2 1 0 1 1 10%
2 Atas 2 1 0 0 2 20% 0.70 0.60Bawah 2 0 2 1 2 20%
3 Atas 4 2 1 3 3 30% 0.20 0.40Bawah 2 2 1 2 2 20%
Dari tabel 4.8 di atas dapat dilihat bahwa:
1) Untuk item nomer 1 memiliki tingkat kesulitan sedang, daya beda baik, alternatif a, b, c, dan d
dapat berfungsi sebagai pengecoh yang baik.
2) Untuk item nomer 2 memiliki tingkat kesulitan sedang, daya beda baik, alternatif jawaban b
perlu dikoreksi.
3) Untuk item nomer 3 termasuk kategori soal sukar, sebaiknya tidak dipakai bila jumlah peserta
tes hanya sedikit dan dapat dipakai bila jumlah peserta tes banyak. Daya beda yang dimiliki item
ini adalah cukup dan semua alternatif jawaban dapat digunakan.
2. Bentuk Tes EsaiPada umumnya tes bentuk esai (uraian) berupa pertanyaan-pertanyaan yang mengandung
permasalahan, dan memerlukan pembahasan, uraian, atau penjelasan sebagai jawabannya. Ciri
khas tes ini adalah siswa bebas memberikan jawabannya. Siswa bebas memilih pendekatan yang
dianggap tepat dalam menyelesaikan permasalahan yang ditanyakan, menyusun dan
mengorganisasikan jawabannya sendiri, serta memberikan penekanan-penekanan terhadap
aspek jawaban. Oleh sebab itu tes bentuk esai memberikan peluang bagi peserta tes untuk
menyatakan, melahirkan, dan mengintegrasikan ide-idenya. Yang perlu diperhatikan dalam
penyusunan butir-butir soal bentuk ini adalah perumusan masalah yang dikemukakan. Rumusan
tujuan hendaknya sangat jelas sehingga setiap peserta tes dapat menangkap masalah yang
dikemukakan tepat seperti yang dimaksud oleh penyusun tes. Untuk maksud tersebut, dalam
merumuskan tujuan biasanya digunakan kalimat-kalimat yang dapat memperjelas masalah yang
dikemukakan.
Ismaryati 0818341963 [email protected] 95
Berdasarkan tingkat kebebasan jawaban yang dimungkinkan di dalam tes bentuk uraian,
butir-butir dalam tes ini dapat dibedakan atas (a) butir-butir yang menuntut jawaban terbatas,
dan (b) butir-butir yang menuntut jawaban tak terbatas. Butir dengan jawaban terbatas
cenderung membatasi baik isi maupun bentuk jawaban. Isi jawaban dibatasi oleh ruang lingkup
permasalahan, sedangkan bentuk jawaban dibatasi oleh pernyataan-pernyataan yang tercantum
pada butir tes.
Contoh:
Kemukakan alasan mengapa articulatio coxae mempunyai luas gerak yang lebih
terbatas jika dibandingkan dengan articulatio humeri
Jelaskan dalam bentuk daftar, perbedaan antara otot cepat dan otot lambat.
Butir tes dengan jawaban tak terbatas, memberi kebebasan bagi peserte tes untuk
mengemukakan jawaban berdasar hasil pemikiran dan pengalamannya sendiri. Kebebasan ini
memberi peluang untuk memperlihatkan kompetensinya dalam bidang-bidang tertentu, yakni
kemampuan dalam hal memilih, mengorganisasikan, mengintegrasikan, dan mengevaluasi ide-
ide.
Contoh:
Buatlah evaluasi mengapa hasil lompatan atlet A tidak bertambah jauh setelah menjalani
program latihan yang disusun oleh pelatihnya.
Keuntungan soal bentuk uraian
Mudah dibuat, tidak banyak memerlukan waktu
Cocok untuk mengukur kemampuan berfikir divergen
Melatih kemampuan siswa dalam mengorganisir jawaban yang diberikan
Hal ini jelas merupakan keunggulan tes berbentuk esai. Siswa dituntut untuk benar-benar
menghasilkan sesuatu lebih daripada hanya mengenal saja, yaitu menghasilkan jawaban. Dengan
demikian terhindarlah dari kemungkinan jawaban yang dibuat dengan menerka-nerka.
Keuntungan seperti ini dapat diperoleh kalau soal dipersiapkan dan ditulis dengan baik, sehingga
memungkinkan testi menggunakan kemampuan memilih fakta atau pengertian yang penting,
menghubungkan fakta dengan pengertian dan mengorganisasikannya menjadi satu jawaban
yang mantap. Untuk menghasilkan jawaban yang terintegrasi seperti ini siswa perlu memiliki
kebiasaan belajar yang baik.
Jawaban berdasarkan pada kata-kata dan tulisan sendiri. Dalam hai ini siswa yang memiliki
kelancaran verbal dan kecakapan mengekspresikan pendapat akan memperoleh hasil yang baik.
Ismaryati 0818341963 [email protected] 96
Siswa yang dapat menulis secara efektif seringkali memperoleh hasil yang lebih tinggi daripada
siswa yang yang kurang dapat menggunakan kata-kata atau kalimat yang baik, meskipun
misalnya pendapat atau ide-ide mereka sebenarnya sama. Juga kecakapan dan kerapihan tulisan
seringkali mempengaruhi si penilai.
Kelemahan soal bentuk uraian
Tes terbatas pada sejumlah kecil pertanyaan
Bentuk soal esai tidak memungkinkan disajikannya sejumlah pertanyaan yang mencakup bahan
yang luas. Panjangnya waktu yang digunakan untuk menjawab satu pertanyaan menyebabkan
seseluruhan soal tes esai menjadi terbatas. Soal bentuk ini tidak dapat mengungkapkan
keseluruhan bahan yang harus diketahui siswa. Apabila pertanyaan yang diajukan kebetulan
mengenai hal yang dikuasai siswa ia akan berhasil, tetapi bila soal yang diajukan mengenahi hal
yang kurang dikuasai atau kurang dipelajari, maka ia akan gagak. Dengan jumlah soal yang kecil,
faktor untung-untungan memainkan peranan yang lebih besar.
Penilaian subjektif
Penilaian terhadap hasil kerja peserta tes dipengaruhi oleh penilaian terhadap karakteristik
tertentu. Misalnya kebaikan tulisan, kecakapan mengekspresikan pendapat, kerapian, dll.
Penilaian tidak ajeg bahkan mungkin berbeda-beda antara seorang penilai dengan penilai
lainnya
Pemakaian Soal Bentuk Esai Secara Efektif
Berkaitan dengan kemudahan dalam menyusun soal bentu esai dan keuntungan-keuntungan
untuk menilai kemampuan untuk mengorganisasikan jawaban terhadap suatu pertanyaan, maka tes
bentuk ini tetap dipergunakan. Jika soal bentuk esai akan digunakan, maka guru harus mengenal
prinsip-prinsip tertentu sebagai pedoman.
Kapan soal bentuk Esai dipergunakan?
Soal bentuk esai akan sangat praktis bila kelasnya kecil dan bila waktu mempersiapkan soal
sangat terbatas. Pertimbangan yang lain adalah tersedianya kemudahan untuk memperbanyak soal.
Pertimbangan yang ke tiga, penyusunan soal kurang memerlukan kecakapan khusus penyusun.
Dasar teoritis yang perlu dipertiimbangkan menyangkut fungsi-fungsi yang akan diukur melalui soal
Ismaryati 0818341963 [email protected] 97
yang diajukan. Soal yang diajukan akan mengukur kemampuan memilih, menghubungkan,
mengorganisasikan, menciptakan pola-pola pokok yang baru, dan mengekspresikan ide-ide. Jika
yang akan diuji adalah penguasaan dan reproduksi fakta, maka soal bentuk esai tidak perlu
dipergunakan karena akan lebih efektif bila menggunakan soal bentuk objektif.
Variasi dalam soal bentuk esai
Siswa seringkali mengalami desakan waktu dalam menjawab soal bentuk esai. Dalam hal ini variasi
bentuk soal perlu digunakan. Variasi yang pertama adalah dengan ujian terbuka atau yang biasa
dikenal dengan istilah open book. Dalam ujian seperti inin siswa dapat menggunakan keterangan-
keterangan dalam bukunya. Dalam hal ini tuntutan terhadap ingatan fakta-fakta dapat dikurangi,
dan kemampuan dalam melokalisasikan, memilih, serta menggunakan fakta-fakta lebih diutamakan.
Variasi ke dua adalah dengan menyediakan waktu yang tidak terbatas. Hal ini mengurangi
kegelisahan siswa yang menyangkut dengan waktu sehingga ujian yang dilakukan merupakan ujian
kekuatan (power test) yang menguji baik di dalam mengorganisasikan maupun didalam
mengekspresikan ide-ide secara tertulis.
Menyusun soal bentuk esai
Kelemahan umum yang terdapat pada soal bentuk esai adalah bahwa soal itu terlalu samar, umum,
dan luas. Hal ini akan menimbulkan kekurangan-kekurangan tertentu, misalnya, waktu banyak
terpakai untuk menjawab satu pertanyaan saja, sehingga soal-soal yang dapat ditanyakan tidak
cukup banyak. Untuk mengatasi hal ini sebaiknya digunakan soal soal yang tidak menuntut jawaban
panjang.
Memeriksa jawaban soal bentuk esai
Beberapa langkah yang harus ditempuh untuk mengurangi subjektivitas dalam penilaian adalah:
a. Tetapkan dengan tepat faktor apa yang sebenarnya akan diukur. Jika ada dua hal yang
berbeda yang akan dinilai sebaiknya dinilai terpisah.
b. Sediakan terlebih dahulu contoh jawaban dan tunjuklah pokok-pokok yang diinginkan dan
berapa angka yang diberikan untuk masing-masing pokok tersebut. Hal ini akan memberikan
dasar umum dalam menilai setiap jawaban. Jika contoh jawaban telah disediakan, maka contoh
Ismaryati 0818341963 [email protected] 98
tersebut perlu dicek dahulu terhadap sejumlah jawaban siswa (sebagai sampel). Jika perlu
contoh yang dibuat dapat diubah searah dengan jawaban siswa pada umumnya. Setelah
disesuaikan dengan memuaskan barulah contoh ini dapat digunakan sebagai ukuran dalam
memberikan angka.
c. Bacalah seluruh jawaban (untuk semua siswa) untuk satu pertanyaan tertentu sebelum
melanjutkan membaca jawaban untuk pertanyaan yang lain. Hal ini akan mengurangi
pertimbangan yang meloncat-loncat yang akan terjadi jika penilai membaca jawaban nomor 1
sampai terakhir kemudian kembali lagi membaca jawaban nomor 1 dari siswa yang lain. Untuk
satu pertanyaan ada baiknya membandingkan jawaban seorang siswa dengan siswa yang lain,
sehingga kesan umum untuk seluruh jawaban tehadap suatu pertanyaan dapat terbentuk.
d. Sedapat mungkin nilailah jawaban tanpa mengingat siapa penjawabnya. Makin tidak
diketahui penjawabnya, makin objektif penilaian yang diberikan.
e. Reliabilita penilaian yang lebih besar dapat diperoleh dengan jalan merata-ratakan angka
yang diberikan oleh beberapa penilai yang bekerja secara terpisah.
Tugas
1. Sebutkan kebaikan dan kelemahan tes bentuk objektif. Jelaskan masing-masing kebaikan dan
kelemahan tersebut.
2. Buatlah 5 soal untuk tipe benar salah, 5 soal pilihan ganda dengan 4 pilihan jawaban, 5 soal
menjodohkan. Gunakan rambu rambu penyusunan masing-masing tipe soal. Buatlah kisi-kisinya
terlebih dahulu. Materi soal tentang Atletik.
3. Sebutkan kebaikan dan kelemahan tes bentuk esai. Jelaskan masing-masing kebaikan dan
kelemahan tersebut.
4. Langkah apa saja yang harus ditempuh untuk mengurangi subjektivitas hasil penilaian? Jelaskan
5. Analisislah soal yang saudara buat pada (no 2). Bagaimana indeks kesukaranny?, daya beda, dan
keberfungsian jawaban?
Ismaryati 0818341963 [email protected] 99
Untuk dapat melakukan evaluasi harus dilakukan terlebih dahulu pengukuran dengan
menggunakan alat yang biasa disebut dengan Tes. Hasil pengukuran dapat menggambarkan
derajat kualitas, kuantitas, dan eksistensi keadaan yang diukur. Namun demikian hasil
pengukuran ini belum memiliki makna sama sekali bila belum dibandingkan dengan suatu
acuan atau bahan pembanding. Proses pembandingan inilah yang biasa kita sebut proses
penilaian. Ada dua pendekatan penilaian yang akan dibahas dalam bab ini, yaitu Penilaian
Acuan Patokan dan Penilaian Acuan Norma.
1. Penilaian Acuan Norma (PAN)
Pada acuan ini hasil belajar setiap siswa dibandingkan dengan hasil belajar siswa
yang lain dalam kelompoknya. Pembanding yang dipakai adalah rata-rata dan simpangan
baku Oleh karena itu, PAN dapat dikatakan sebagai suatu pendekatan “apa adanya”,
maksudnya adalah bahwa acuan pembandingnya semata-mata diambil dari kenyataan
yang diperoleh (rata-rata dan simpangan baku) pada saat penilaian hasil pengukuran itu
dilakukan dan sama sekali tidak dikaitkan dengan hasil pengukuran lain atau diluar itu.
PAN menggunakan prinsip-prinsip yang berlaku pada kurve normal, hasil-hasil
penghitungannya dipakai sebagai acuan penilaian, memiliki sifat relatif sesuai dengan
naik-turunnya rata-rata dan simpangan baku saat itu.
Walaupun penggunaan sistem PAN membiarkan subjek didik berkembang seperti
adanya, namun demikian, guru harus tetap merumuskan Tujuan Khusus Pembelajaran
(TKP) sesuai dengan kompetensi yang dituntut. TKP yang berorientasi pada kompetensi
yang dituntut dipakai sebagai pedoman dalam Proses Belajar Mengajar (PBM) dan juga
sebagai tumpuan dalam menyususun evaluasi.
Ismaryati 0818341963 [email protected] 100
BAB V
PENDEKATAN PENILAIAN
Dalam penerapan PAN ada dua hal pokok yang harus ditetapkan terlebih dahulu.
Pertama, penerapan banyaknya siswa yang akan diluluskan. Ke dua, penetapan batas
lulus. Ada dua cara dalam menetapkan batas lulus, yaitu dengan menetapkan lebih dulu
jumlah yang diluluskan misalnya 75%, kemudian skor terrendah setelah diketemukan
75%. Dan yang ke dua ialah menggunakan rata-rata data statistik yang terdapat dalam
kurve normal dengan menemukan rata-rata dan simpang baku akan diketahui luas
daerah kurve normal atau jumlah anak yang akan diluluskan.
Contoh:
Rentangan Norma Nilai (Grade) Jumlah Teoritis (%)
X + 1.5 SD ke atas A atau 4 6.68
X + 0.5 SD - < X + 1.5 SD B atau 3 24.17
X – 0.5 SD - < X + 0.5 SD C atau 2 38.30
X – 1.5 SD - < X – 0.5 SD D atau 1 24.17
Kurang dari X – 1.5 SD E atau 0 6.68%
Catatan:
X = rata-rata hitung
SD = simpangan baku
2. Penilaian Acuan Patokan
Pada acuan ini, penilaian dilaksanakan harus ditetapkan lebih dahulu patokan yang
akan dipakai sebagai pembanding terhadap semua hasil pengukuran. Petokan di sini
tidak lagi merupakan hasil kelompok seperti pada PAN, tetapi merupakan patokan yang
ditetapkan sebelumnya untuk batas lulus atau dengan kata lain tingkat penguasaan
minimum. Patokan ini bersifat tetap dan dapat juga dipakai oleh kelompok lain.
Ismaryati 0818341963 [email protected] 101
Siswa yang telah melampaui atau sama dengan kriteria keberhasilan (batas lulus)
dinyatakan lulus atau memenuhi syarat. Apabila prestasi siswa telah diketahui, maka biji
atau skor dibandingkan dengan batas minimal dan akan memperoleh suatu nilai atau
grade. Contoh Bila siswa A memperoleh biji 83 dari soal objektif sejumlah 150, ia akan
mendapat nilai akhir D atau 1, sedangkan siswa B yang memperoleh biji 126 akan
mendapat nilai akhi 3 atau B, (126/150 x 100% = 84% = B atau 3. Cara ini lebih sederhana
jika dibandingkan dengan pendekatan PAN.
Guru tidak lagi menilai seperti apa adanya tetapi berdasar kriteria keberhasilan yang
telah ditetapkan sejak PBM dimulai. Guru yang menggunakan acuan patokan ini dituntut
selalu mengarahkan, membatu, dan membimbing siswanya ke arah penguasaan minimal
sejak dimulai, selama dan sampai PBM itu selesai. Kompetensi yang harus dimiliki
dirumuskan dalam TKP dan ini merupakan arah, petunjuk dan pusat kegiatan dalam
PBM. Tes formatif memiliki peranan yang sangat penting, karena guru akan mengetahui
hasil belajar siswanya. Hasil dari tes formatif ini nantinya tidak hanya menentukan mutu,
tetapi juga banyaknya siswa yang berhasil (lulus). Dalam PAP tidak memerlukan
penghitungan statistik, tetapi hanya didasarkan pada tingkat penguasaan kompetensi
minimal. Dengan menetapkan batas toleransi terhadap fluktuasi prestasi siswa dari kelas
ke kelas dari tahun ke tahun dengan pertimbangan profesionalnya seorang guru dapat
menetapkan batas bawah tingkat prestasi. Contoh:
Rentangan Norma Nilai Akhir
90% - 100% A atau 4
80% - 89% B atau 3
65% - 79% C atau 2
55% - 64% D atau 1
Kurang dari 55% E atau 0
Ismaryati 0818341963 [email protected] 102
DAFTAR PUSTAKA
Bloom, Benyamin S. et al. (1956). Taxonomy of Physical Educationnal Objective: Hand Book I.
Cognitive Domain. Toronto: DavidMcMay Company, Inc.
Gronlound, Norman E. (1974). Improving Marking and Reporting In Classroom Instruction.
New York: McMillan Publishing Co, Inc.
Kirkendall, Don R. el al (1987). Measurement and Evaluation for physycal Educator.
Champaig: Human Kinetisc
Masri Singarimbun, Sofyan Efefendi (editor). (1995). Metode Penelitian Survey. Jakarta:
LP3ES
Rusli Lutan, Adang Suherman. (2000). Pengukuran dan Evaluasi Penjas. Jakarta: Departemen
Pendidikan.
Ismaryati 0818341963 [email protected] 103
Suharsimi Arikunto. (2001). Dasar-Dasar Evaluasi.
Ismaryati 0818341963 [email protected] 104
Top Related