Post on 03-May-2019
EVALUASI PENDIDIKAN Halaman 1
BAB I
PENDAHULUAN
A. Latar Belakang
Undang-Undang Nomor 20 Tahun 2003 Tentang Sistem Pendidikan
Nasional (UUSPN) menegaskan bahwa evaluasi pendidikan adalah kegiatan
pengendalian, penjaminan, dan penetapan mutu pendidikan terhadap berbagai
komponen pendidikan pada setiap jalur, jenjang, dan jenis pendidikan sebagai
bentuk pertanggungjawaban penyelenggaraan pendidikan. Selanjutnya pasal 57
ayat (1), menyebutkan evaluasi dilakukan dalam rangka pengendalian mutu
pendidikan secara nasional sebagai bentuk akuntabilitas penyelenggara
pendidikan kepada pihak-pihak yang berkepentingan, dan ayat (2); evaluasi
dilakukan terhadap peserta didik, lembaga, dan program pendidikan pada jalur
formal dan nonformal untuk semua jenjang, satuan, dan jenis pendidikan.
Evaluasi pendidikan di tingkat satuan pendidikan merupakan bagian yang
melekat dengan kegiatan pembelajaran yang dilakukan pendidik untuk
mengetahui pencapaian standar kompetensi lulusan. Sesuai dengan penerapan
kurikulum yang berbasis kompetensi, penilaian yang dilakukan menggunakan
acuan kriteria, yaitu membandingkan hasil yang dicapai dengan kriteria atau
standar yang ditetapkan.
Ditinjau dari sudut profesionalisme tugas kependidikan, bahwa kegiatan
evaluasi merupakan tugas yang melekat pada pendidik profesional. Seorang
pendidik profesional selalu menginginkan umpan balik atas program
pendidikan yang telah dilakukannya. Melalui suatu evaluasi yang dilakukan
secara sistematis dapat ditentukan keputusan sampai sejauh mana tujuan
program telah tercapai. Evaluasi bukan hanya sekumpulan teknik semata,
tetapi evaluasi merupakan suatu proses berkelanjutan yang mendasari
keseluruhan kegiatan belajar mengajar untuk mewujudkan proses belajar
mengajar yang efektif.
EVALUASI PENDIDIKAN Halaman 2
Sesuai dengan prinsip belajar yang menyatakan bahwa belajar merupakan
proses terjadinya perubahan tingkah laku dalam diri peserta didik, dengan
sendirinya evaluasi pendidikan dapat dijadikan alat untuk mengetahui
perubahan tersebut. Ini berarti bahwa dalam proses belajar mengajar harus ada
kriteria tertentu yang dapat dijadikan patokan untuk pelaksanaan evaluasinya.
Materi penunjang pelatihan ini bermaksud membekali pengawas untuk
dapat membina para guru dalam melaksanakan evaluasi pendidikan dengan
baik dan benar.
B. Dimensi Kompetensi
Dimensi kompetensi yang dilatihkan pada pendidikan dan latihan ini adalah “
Kompetensi Evaluasi Pendidikan”
C. Kompetensi Capaian
Setelah menyelesaikan materi pelatihan ini, pengawas diharapkan dapat
membimbing guru dalam menentukan aspek-aspek penting yang harus dinilai
oleh guru dalam pembelajaran.
D. Indikator Capaian Kompetensi
Setelah mengikuti pelatihan ini pengawas diharapkan mampu:
1. Menjelaskan pengertian, fungsi, tujuan, kedudukan, prosedur dan danruang lingkup.
2. Menjelaskan aspek-aspek yang dievaluasi dalam pembelajaran.
3. Menjelaskan kriteria penilaian, jenis-jenis penilaian dan teknik penilaian disekolah, dan bentuk-bentuk soal tes penilaian hasil belajar.
4. Membuat soal tes hasil belajar berdasarkan langkah-langkah konstruksi tesyang benar.
5. Membuat pensekoran dan menggunaan hasil evaluasi untuk perbaikan
program pembelajaran.
EVALUASI PENDIDIKAN Halaman 3
E. Alokasi Waktu
No. Materi Diklat Alokasi
1.Pengertian, fungsi, tujuan, kedudukan, prosedur dan ruanglingkup evaluasi.
4 Jam
2. Aspek-aspek yang dievaluasi dalam pembelajaran
3. Kriteria penilaian, Jenis-jenis alat dan teknik penilaian di sekolah,dan Bentuk-bentuk soal tes hasil belajar
4. Penyusunan Tes Hasil Belajar
5. Pensekoran, Pemberian Nilai dan penggunaan hasil penilaianuntuk perbaikan kualitas pembelajaran
F. Skenario Dilkat
IInnttrroodduuccttiioonn (Pendahuluan)
Pada tahap pengalaman pembelajaran ini, para instruktur menanamkan
pemahaman tentang isi dari materi kepada para peserta. Bagian ini berisi
penjelasan tujuan pelajaran/sesi dan apa yang akan dicapai-hasil selama
pelajaran/sesi tersebut. Introduction (pendahuluan) harus singkat dan
sederhana.
CCoonnnneeccttiioonn (Menghubungkan)
Semua pengalaman pembelajaran yang baik perlu dimulai dari apa yang sudah
diketahui, dapat dilakukan oleh peserta, dan mengembangkannya. Pada tahap
connection dari pelajaran/sesi, instruktur berusaha menghubungkan bahan ajar
yang baru dengan sesuatu yang sudah dikenal para peserta dari pembelajaran
atau pengalaman sebelumnya. Anda dapat melakukan hal ini dengan
mengadakan latihan brainstorming yang sederhana untuk memahami apa yang
telah diketahui para peserta, dengan meminta mereka untuk memberitahu
anda apa yang mereka ingat dari pelajaran/sesi sebelumnya atau dengan
mengembangkan sebuah kegiatan yang dapat dilakukan peserta sendiri.
Sesudah itu, anda dapat menghubungkan para peserta dengan informasi baru.
Ini dapat dilakukan melalui presentasi atau penjelasan yang sederhana. Akan
tetapi, perlu diingat bahwa presentasi seharusnya tidak terlalu lama.
C
I
EVALUASI PENDIDIKAN Halaman 4
AApppplliiccaattiioonn (Penerapan)
Tahap ini adalah yang paling penting dari pelatihan. Setelah peserta
memperoleh informasi atau kecakapan baru melalui tahap connection, mereka
perlu diberi kesempatan untuk mempraktikkan dan menerapkan pengetahuan
dan kecakapan tersebut. Bagian application harus berlangsung paling lama dari
pelatihan di mana peserta bekerja sendiri, tidak dengan instruktur, secara
pasangan atau dalam kelompok untuk menyelesaikan kegiatan nyata atau
memecahkan masalah nyata menggunakan informasi dan kecakapan baru yang
telah mereka peroleh.
RReefflleeccttiioonn (Refleksi)
Bagian ini merupakan ringkasan dari materi/sesi, peserta diberi kesempatan
untuk merefleksikan apa yang telah mereka pelajari. Tugas intruktur adalah
menilai sejauh mana keberhasilan pembelajaran. Kegiatan refleksi atau
ringkasan dapat melibatkan diskusi kelompok dimana instruktur meminta
peserta untuk melakukan presentasi atau menjelaskan apa yang telah mereka
pelajari. Mereka juga dapat melakukan kegiatan penulisan mandiri dimana
peserta menulis sebuah ringkasan dari hasil pembelajaran. Refleksi ini juga
dapat berbentuk kuis singkat dimana instruktur memberi pertanyaan
berdasarkan isi materi/sesi. Poin penting untuk diingat dalam refleksi adalah
bahwa instruktur perlu menyediakan kesempatan bagi para peserta untuk
mengungkapkan apa yang telah mereka pelajari.
EExxtteenndd (Memperluas)
Extension adalah kegiatan dimana fasilitator menyediakan kegiatan yang dapat
dilakukan peserta setelah sesi berakhir untuk memperkuat dan memperluas
pembelajaran. Kegiatan Extension dapat meliputi penyediaan bahan bacaan
tambahan, atau latihan.
E
R
A
EVALUASI PENDIDIKAN Halaman 5
BAB II
EVALUASI DI BIDANG PENDIDIKAN
A. Pengertian, Fungsi, Tujuan, Kedudukan, Prosedur, dan Ruang Lingkup Evaluasi
1. Pengertian Evaluasi
Istilah evaluasi berasal dari bahasa Inggris, yaitu evaluation. Menurut
Gronlund (1985), evaluasi adalah suatu proses yang sistematis untuk menentukan
atau membuat keputusan, sampai sejauh mana tujuan program telah tercapai.
Evaluasi mencakup sejumlah teknik yang tidak dapat diabaikan oleh pelatih.
Evaluasi bukan sekumpulan teknik semata, tetapi evaluasi merupakan suatu proses
berkelanjutan yang mendasari keseluruhan kegiatan belajar mengajar untuk
mewujudkan proses belajar mengajar yang efektif.
Dalam rangka kegiatan belajar mengajar, selanjutnya Norman E. Gronlund
(1976 : 6) mendefinisikan evaluasi sebagai suatu proses sistematik dalam
menentukan tingkat pencapaian tujuan pembelajaran. Ada dua aspek penting dari
definisi tersebut. Pertama, evaluasi menunjuk pada proses yang sistematik. Kedua,
evaluasi mengasumsikan bahwa tujuan pembelajaran ditentukan terlebih dahulu
sebelum proses belajar mengajar berlangsung.
Edwind Wand dan Gerald W. Brown (1957 : 1) menyatakan bahwa evaluasi
berkenaan dengan kegiatan atau proses untuk menentukan nilai dari sesuatu.
Sesuai dengan pendapat tersebut, evaluasi pendidikan dapat diartikan sebagai
suatu kegiatan atau proses untuk menentukan nilai dari segala sesuatu yang
berkenaan dengan pendidikan. Witherington (1980 : 24) menyatakan bahwa
evaluasi adalah pernyataan bahwa sesuatu itu mempunyai nilai atau tidak. Jadi,
mengevaluasi diartikan sebagai memberikan pernyataan bahwa sesuatu hal, apakah
ia bernilai atau tidak. Yang dimaksud dengan nilai di sini dapat dalam bentuk
kuantitatif, kualitatif, atau pun keduanya.
Mechrens dan Lechman (1984 : 5) menyatakan bahwa evaluasi diartikan
sebagai penentuan kesesuaian antara tampilan dengan tujuan-tujuan. Dalam
EVALUASI PENDIDIKAN Halaman 6
hubungan ini, hal yang dievaluasi bukanlah orang secara fisik, tetapi karakteristik-
karakteristik dari orang itu dengan menggunakan suatu tolok ukur tertentu.
Karakteristik-karakteristik tersebut dalam ruang lingkup kegiatan proses belajar
mengajar adalah tampilan peserta didik dalam bidang kognitif (pengetahuan,
intelektual, akal), afektif (sikap, minat, motivasi, emosional), dan psikomotorik
(keterampilan, gerak, dan tindakan). Tampilan tersebut dapat dievaluasi melalui
lisan, tertulis, maupun perbuatan. Dengan demikian, mengevaluasi adalah
menentukan apakah tampilan peserta didik telah sesuai dengan tujuan instruksional
yang telah dirumuskan atau belum.
Sesuai dengan prinsip belajar yang menyatakan bahwa belajar merupakan
proses terjadinya perubahan tingkah laku dalam diri peserta didik, dengan
sendirinya evaluasi dapat dijadikan alat untuk mengetahui perubahan tersebut. Ini
berarti bahwa dalam proses belajar mengajar harus ada kriteria tertentu yang dapat
dijadikan patokan untuk pelaksanaan evaluasinya.
Dari beberapa pengertian evaluasi yang telah dikemukakan di atas
menunjukkan bahwa evaluasi sifatnya lebih luas dari pengukuran. Evaluasi meliputi
aspek kuantitatif dan kualitatif. Pengukuran hanya terbatas pada deskripsi
kuantitatif saja.
2. Fungsi Evaluasi
Untuk mengetahui perkembangan dan kemajuan prestasi belajar perlu
dilakukan evaluasi. Evaluasi tidak hanya memberikan gambaran tentang
kemampuan yang dimiliki peserta didik, tetapi dapat pula untuk memberikan
informasi lain. Misalnya tentang sikap, minat, bakat, dan kepribadian peserta didik
dalam kegiatan belajar mengajar atau sesudahnya. Selain daripada itu evaluasi
dapat pula bermanfaat untuk menentukan kebijakan dan balikan (feed back).
Peranan evaluasi begitu hakiki dalam situasi belajar mengajar. Data evaluasi
yang dikumpulkan secara hati-hati membantu pelatih dalam memahami peserta
didik, merencanakan pengalaman belajar bagi peserta didik, dan merumuskan
tujuan pembelajaran yang akan dicapai sehingga keputusan-keputusan instruksional
didasari oleh informasi yang akurat, relevan, dan komprehensif.
EVALUASI PENDIDIKAN Halaman 7
Pencapaian tujuan instruksional, diagnosa kesulitan belajar peserta didik,
penentuan kesiapan belajar untuk dapat mencerna pengetahuan dan pengalaman
baru, penempatan peserta didik dalam suatu kelompok atau kelas tertentu,
bantuan kepada peserta didik dalam menyelesaikan masalahnya, persiapan laporan
kemajuan belajar peserta didik, semuanya harus berdasarkan program evaluasi
yang cermat.
Efisiensi dan efektifitas suatu kegiatan akan terwujud jika terlebih dahulu
dilakukan evaluasi terhadap rencana kegiatan tersebut. Dalam bidang pendidikan,
evaluasi mempunyai makna bagi peserta didik dan guru maupun institusi
pendidikan karena evaluasi biasanya dilakukan sebelum, selama, dan setelah
kegiatan belajar mengajar berlangsung. Bagi peserta didik dapat diketahui apakah
ia telah berhasil atau belum dalam mengikuti kegiatan belajar mengajar. Jika ia
berhasil akan mendapat kepuasan. Hal ini akan mendorong peserta didik untuk
lebih termotivasi dalam meraih prestasi akademiknya. Sebaliknya, jika ia tidak
berhasil, ia tidak mendapat kepuasan. Dua kemungkinan yang dapat terjadi,
kesadaran yang mendorong motivasi belajarnya atau sebaliknya menjadi frustasi.
Makna bagi guru, ia akan mengetahui kualitas peserta didiknya, secara individual
maupun kelompok. Di samping itu ia dapat mengevaluasi diri mengenai kegiatan
belajar mengajar yang telah dilaksanakannya, kekurangan atau kelebihannya.
Dengan mengetahui makna evaluasi dalam sistem pendidikan seperti yang
diuraikan di atas, evaluasi (pendidikan) berfungsi selektif untuk menentukan input
(calon peserta didik), sebagai alat penempatan untuk pengelompokan peserta didik
sesuai dengan bakat dan kemampuannya. Selain itu, evaluasi dalam pendidikan
dapat pula berfungsi sebagai alat untuk mendiagnosa kesulitan belajar peserta didik
dan pengukur keberhasilan belajar dan sebagai balikan bagi lembaga pendidikan.
Secara terinci, fungsi evaluasi tersebut di atas adalah sebagai berikut:
1) Sebagai alat seleksi
Evaluasi dapat digunakan untuk melakukan penyaringan (seleksi) dalam
penerimaan peserta didik baru.. Dengan evaluasi ditentukan sejumlah peserta
EVALUASI PENDIDIKAN Halaman 8
didik tertentu yang memenuhi syarat dari sejumlah peserta didik pendaftar
sebagai calon peserta didik yang akan diterima.
2) Sebagai alat pengukur keberhasilan
Fungsi evaluasi sebagai alat ukur keberhasilan adalah untuk mengukur
seberapa jauh tujuan pembelajaran dapat dicapai setelah kegiatan belajar
mengajar dilaksanakan. Selain itu, melalui evaluasi dapat dilihat pula sampai
sejauh mana seorang pelatih telah berhasil dalam menerapkan metode dan
pendekatan, penguasaan materi, serta kebaikan dan kelemahan kurikulum
yang dipakai.
3) Sebagai alat penempatan
Untuk dapat mengetahui dengan baik termasuk kelompok mana seorang
peserta didik harus ditempatkan digunakan evaluasi. Penempatan yang cocok
dengan kondisi masing-masing peserta didik lebih memungkinkan untuk dapat
mengembangkan bakat dan kemampuannya secara optimal.
4) Sebagai alat diagnostik
Dengan melakukan evaluasi, guru dapat mendiagnosis kesulitan belajar peserta
didik, ia dapat mengetahui letak kelemahan dan kebaikan peserta didik dalam
penguasaan setiap konsep yang telah diajarkan. Dari hasil diagnosis ini guru
dapat mengambil langkah untuk memberikan upaya “penyembuhan” yang
tepat sesuai dengan jenis dan tingkat kesulitan yang dialami.
3. Tujuan Evaluasi
Sesuai dengan fungsi evaluasi yang telah dikemukakan, evaluasi mempunyai
tujuan seperti berikut ini.
1) Dalam fungsi evaluasi sebagai alat seleksi terkandung di dalamnya tujuan
evaluasi, yaitu untuk mendapatkan calon peserta didik pilihan yang cocok
dengan suatu program dan jenjang pendidikan tertentu. Hal ini dimaksudkan
EVALUASI PENDIDIKAN Halaman 9
agar peserta didik yang menempuh program pendidikan tersebut berjalan
lancar dan mencapai prestasi yang optimal.
2) Dalam fungsi evaluasi sebagai alat pengukur keberhasilan dan diagnostik
digunakan untuk mengetahui seberapa jauh hasil yang telah dicapai dalam
proses pendidikan dan pembelajaran yang telah dilaksanakan. Apakah hasil
yang dicapai sudah sesuai dengan yang diharapkan atau belum. Kalau belum
perlu dicari faktor penyebab yang menghambat tercapainya tujuan tersebut.
Selanjutnya dapat dicari jalan untuk mengatasinya.
3) Dalam fungsi evaluasi sebagai alat penempatan (replacement), evaluasi
bertujuan untuk menentukan pendidikan lanjut peserta didik agar sesuai
dengan minat, bakat, dan kemampuannya. Hal ini dimaksudkan agar
pendidikan yang ditempuhnya berjalan lancar dan mencapai prestasi yang
optimal.
4) Evaluasi dalam rangka kegiatan belajar mengajar dikenal dengan istilah tes
awal, yaitu evaluasi yang dilaksanakan sebelum kegiatan belajar mengajar
berlangsung. Evaluasi ini bertujuan untuk mengetahui taraf kesiapan peserta
didik dalam memahami konsep-konsep baru yang akan dipelajarinya.
5) Dalam rangka promosi, evaluasi bertujuan untuk mendapatkan bahan informasi
dalam menentukan peserta didik berhasil dalam suatu pogram pendidikan atau
mengulang pada program tersebut. Jika berdasarkan hasil evaluasi dari
sejumlah mata pelajaran yang ditempuh peserta didik tersebut telah
memenuhi kriteria minimal untuk lulus, maka peserta didik tersebut dapat
mengikuti program berikutnya. Jika tidak, dengan diberikan nasihat untuk
mengulang program tersebut.
6) Secara intuitif, seorang pelatih dalam mengajar telah berusaha untuk memilih
metode mengajar yang paling tepat sesuai dengan kondisi peserta didik,
lingkungan, atau pun sifat materi yang disajikan.
EVALUASI PENDIDIKAN Halaman 10
4. Kedudukan Evaluasi
Sesuai dengan fungsi dan tujuan evaluasi dalam pendidikan, kedudukan
evaluasi dalam kegiatan belajar mengajar sebelum, selama, dan sesudah kegiatan
belajar berlangsung. Kedudukan evaluasi selama kegiatan belajar mengajar
berlangsung dimaksudkan sebagai evaluasi yang dilakukan dalam interval waktu
pelajaran dimulai hingga saat berakhirnya kegiatan belajar mengajar.
Setelah kegiatan belajar mengajar berlangsung dapat melaksanakan
evaluasi terhadap pencapaian hasil belajar peserta didik, baik individual maupun
kelompok. Dari hasil evaluasi tersebut dapat diketahui pula kelemahan dan
kelebihan peserta didik dalam memahami konsep-konsep yang telah dipelajari. Jadi
kedudukan evaluasi ditinjau dari segi waktu pelaksanaannya terdiri dari tiga jenis,
yaitu sebelum, selama, dan sesudah kegiatan belajar berlangsung. Ditinjau dari
sudut transformasi pendidikan, kedudukan evaluasi berperan untuk mengevaluasi
input (calon peserta didik), proses (kegiatan belajar mengajar beserta komponen-
komponen penunjangnya seperti pelatih, metode dan pendekatan, materi, sumber,
alat pelajaran dan sarana lainnya, lingkungan), out put (lulusan), tujuan dan balikan
(feed back) dalam rangka perbaikan dan peningkatan mutu dalam kegiatan yang
akan datang. Balikan ini terutama ditujukan untuk peninjauan input maupun proses.
Balikan tersebut dapat diungkapkan berupa input yang kurang baik, seleksi yang
kurang tepat, pelatih dan personal yang kurang berkualitas dan kurang tepatnya
fungsi dan tugas, materi yang kurang cocok, metode dan sistem evaluasi yang
kurang memadai, kurangnya sarana penunjang, dan sistem administrasi yang
kurang baik.
5. Prosedur Evaluasi
Prosedur evaluasi dimaksudkan sebagai langkah-langkah terurut yang harus
ditempuh dalam melaksanakan evaluasi. Langkah-langkah tersebut merupakan
tahapan dari kegiatan permulaan sampai kegiatan akhir dalam rangka pelaksanaan
evaluasi pendidikan.
EVALUASI PENDIDIKAN Halaman 11
Muchtar Buchari (1972 : 24) menyebutkan bahwa langkah-langkah pokok
yang harus ditempuh sebagai prosedur evaluasi terdiri dari perencanaan (planning),
pengumpulan data (collecting), verifikasi data (verification), analisis data (analysis),
dan penafsiran (interpretation).
Tahap perencanaan meliputi kegiatan merumuskan tujuan evaluasi yang
akan dilaksanakan. Tujuan ini harus disesuaikan dengan tujuan yang hendak dicapai
dalam program pendidikan dan latihan tersebut. Tentunya tujuan evaluasi berbeda
satu sama lain, tergantung pembuatnya. Tujuan evaluasi yang dibuat oleh panitia
seleksi akan berbeda dengan tujuan evaluasi yang dibuat oleh pelatih.
Hal lain yang termasuk dalam tahap perencanaan adalah metode evaluasi
yang akan dipakai, seperti inventori, checklist, interview, observasi, atau tes;
menyusun alat evaluasi yang akan digunakan, misalnya pedoman observasi dan
wawancara, kisi-kisi tes hasil belajar; menentukan kriteria penilaian yang akan
digunakan, misalnya penilaian acuan patokan (PAP) atau penilaian acuan normatif
(PAN).
Selanjutnya tahap pengumpulan data, terdiri dari : pemeriksaan hasil dan
pemberian sekor. Setelah pemberian sekor selesai kemudian dikelompokkan
menurut tinggi rendahnya, jenis kelamin, atau hal lainnya sesuai dengan tujuan
pengelompokan tersebut. Langkah-langkah tersebut dinamakan langkah verifikasi
data. Setelah diverifikasi, data tersebut dianalisis atau diolah dengan menggunakan
teknik analisis statistik atau non-statistik.
Tahap akhir dalam prosedur evaluasi adalah interpretasi. Interpretasi
dimaksudkan sebagai pernyataan atau keputusan tentang hasil evaluasi. Data
interpretasi ini dilakukan atas dasar kriteria tertentu yang telah disusun secara
rasional atau telah dibakukan. Interpretasi hasil evaluasi tersebut dapat berupa
pernyataan atau keputusan yang diungkapkan dengan kata-kata baik-cukup-buruk,
tinggi-sedang-rendah, lulus-tidak lulus, dan lain-lain.
Julian C. Stanley (1964 : 299) mengemukakan hal yang hampir sama dengan
pendapat tersebut di atas mengenai prosedur evaluasi. Bedanya ia mengungkapkan
dengan cara lain. Langkah-langkah evaluasi menurut J.C. Stanley adalah
EVALUASI PENDIDIKAN Halaman 12
menetapkan tujuan program, memilih alat yang layak, pelaksanaan evaluasi,
pemberian sekor, menganalisis dan menginterpretasi sekor, membuat catatan, dan
menggunakan hasil evaluasi.
.
6. Ruang Lingkup Evaluasi
Sesuai dengan tujuan pendidikan, khususnya tujuan pembelajaran, ruang
lingkup evaluasi yang akan dibicarakan adalah mengenai obyek evaluasi, ciri-ciri
evaluasi dalam pendidikan, evaluasi program, evaluasi hasil belajar (tes), dan
evaluasi non hasil belajar (non tes).
1) Obyek evaluasi
Obyek atau sasaran evaluasi adalah segala sesuatu yang menjadi titik pusat
perhatian evaluasi. Obyek evaluasi terdiri dari tiga bagian, yaitu input, proses,
dan output.
a. Input atau Masukan
Karakteristik peserta didik sebagai input dalam proses belajar mengajar yang
dievaluasi mencakup empat hal, yaitu:
i) Kemampuan. Untuk dapat mengikuti program dalam suatu lembaga
pendidikan, calon peserta didik harus memiliki kemampuan dasar yang
cocok. Alat evaluasi yang digunakan untuk mengukur kemampuan ini
disebut tes kemampuan (aptitude test).
ii) Kepribadian. Kepribadian adalah sifat yang terdapat pada diri seorang
individu dan tampak dalam bentuk tingkah laku. Alat evaluasi untuk
mengetahui tentang kepribadian disebut tes kepribadian (personality
test).
iii) Sikap. Sikap lebih cenderung bersifat psikis daripada fisik. Tingkah laku
seseorang yang sifatnya fisik adalah manifestasi dari sikap yang dimiliki
seseorang yang bersumber pada kepribadiannya. Alat evaluasi untuk
EVALUASI PENDIDIKAN Halaman 13
mengetahui sikap seseorang terhadap sesuatu hal disebut dengan tes
sikap (attitude test). Sebenarnya istilah tes di sini kurang tepat,
seharusnya non tes karena berbentuk angket.
iv) Inteligensi. Inteligensi berkenaan dengan kemampuan berpikir.
Inteligensi seseorang disebut tinggi bila kemampuan berpikirnya tinggi
pula. Manifestasi dari inteligensi ini dapat berupa tingkat pemahaman
atau daya ingat terhadap rangsangan (stimulus) terhadap struktur
kognitif. Struktur kognitif yang dimiliki seseorang dapat dengan cepat
mengadaptasi dan tahan mengingat stimulus itu disebut inteligensinya
tinggi.
b. Proses
Unsur-unsur yang terlibat dalam proses kegiatan belajar mengajar adalah
kurikulum, materi pelajaran, pendekatan dan metode, cara menilai, sarana dan
media, sistem administrasi, guru dan personal lainnya. Unsur-unsur tersebut
saling berinteraksi secara fungsional satu sama lain dalam rangka kelancaran
kegiatan belajar mengajar. Jadi tidak berdiri sendiri.
Untuk mengevaluasi proses dapat dilakukan dengan menyajikan soal tertulis. Di
samping itu evaluasi proses dapat dilakukan melalui observasi .
c. Keluaran (output)
Output pendidikan dan latihan dalah lulusan suatu jenjang pendidikan tertentu.
Namun dalam hal kegiatan belajar mengajar, yang disebut output adalah kondisi
setelah kegiatan belajar mengajar (proses) dilaksanakan, baik untuk 1 kali
pertemuan, 1 semester, atau bahkan setelah lulus pada tingkat akhir. Evaluasi
terhadap output ini dilakukan untuk mengetahui seberapa jauh tingkat
pencapaian peserta didik setelah menjalani proses belajar mengajar.
2) Evaluasi Hasil Belajar
Evaluasi hasil belajar dapat dilakukan pada saat kegiatan belajar mengajar
berlangsung atau sesudahnya. Selama kegiatan belajar mengajar berlangsung,
EVALUASI PENDIDIKAN Halaman 14
peserta didik dapat dievaluasi melalui tanya jawab lisan sambil mengarahkannya
pada konsep atau materi baru. Evaluasi pada akhir kegiatan dapat dilaksanakan
pada setiap akhir pertemuan, pada setiap minggu, setiap akhir program.
Evaluasi hasil belajar sifatnya berupa tes kemampuan, yaitu mengukur
sampai sejauh mana tingkat penguasaan materi pelajaran yang telah disajikan
dalam kegiatan belajar mengajar.
B. Aspek-Aspek yang Dievaluasi Dalam Kurikulum
Kompetensi adalah seperangkat pengetahuan, sikap, keterampilan yang
harus dimiliki, dihayati, dan dikuasai oleh siswa dalam melaksanakan tugas
kehidupannya. Berdasarkan pengertian ini, maka secara garis besar aspek-aspek
yang dinilai dalam penilaian berbasis kompetensi meliputi aspek kognitif, afektif,
dan psikomotor atau kompetensi intelektual, emosional (ahlak dan moral), spritual,
dan keterampilan.
Sejalan dengan hal tersebut diatas, Benyamin S. Bloom dan (1956), telah
mengklasifikasi tujuan pendidikan yang dikenal dengan Taksonomi Bloom. Bloom
mengelompokkan kemampuan manusia ke dalam tiga ranah (domain), yaitu: (1)
Ranah kognitif (cognitive domain), (2) Ranah afektif (affective domain), dan (3)
Ranah psikomotor (psychomotorik domain). Baru-baru ini, taksonomi ini telah
direvisi oleh sekelompok siswa Bloom (Anderson et al., 2001) dan beri nama baru
taxonomy for learning, teaching, and assessing (taksonomi untuk belajar, mengajar,
dan menilai).
Seperti disiratkan oleh namanya, taksonomi yang telah direvisi ini
memberikan kerangka kerja dalam mengklasifikasikan tujuan belajar dan cara untuk
menilainya.
EVALUASI PENDIDIKAN Halaman 15
Tabel 1. Tabel Taksonomi
DimensiPengetahuan
Dimensi Proses KognitifC1
MengingatC2
MemahamiC3
MenerapkanC4
MenganalisisC5
MengevaluasiC6
MenciptakanA. Pengetahuan
FaktualB. Pengetahuan
KonseptualC. Pengetahuan
ProseduralD. Pengetahuan
MetakognitifSumber : Adrerson et al. (2001), hlm.28
Taksonomi Bloom yang telah direvisi itu bersifat dua dimensi. Salah satu
dimensinya, dimensi pengetahuan, mendeskripsikan berbagai tipe pengetahuan
mengorganisasikan pengetahuan menjadi pengetahuan kognitif. Kategori-kategori
tersebut terletak di sepanjang kontinum yang bergerak mulai dari pengetahuan
yang sangat konkret (faktual) sampai yang lebih abstrak (metakognitif). Dimensi
kedua, dimensi proses kognitif (cara berpikir) berisi enam kategori: remember
(mengingat), understand (memahami), apply (menerapkan), analyze
(mengaanaalisis), evaluate (mengevaluasi), dan create (menciptakan). Seperti
halnya dimensi pengetahuan, dimensi proses kognitif juga diasumsikan terletak di
sepanjang kontinum kompleksitas kognitif. Sebagai contoh, memahami sesuatu
lebih kompleks dibanding semata-mata meningatnya saja; menerapkan dan
menganalisis suatu ide lebih kompleks dari sekadar memahami ide itu. Tabel 1
menunjukkan kedua dimensi taksonomi itu dan hubungan antara dimensi
pengetahuan dan dimensi proses kognitif.
Kategori-Kategori Dimensi Pengetahuan. Taksonomi yang telah direvisi itu
membagi pengetahuan menjadi empat kategori: Pengetahuan faktual termasuk
elemen-elemen dasar yang perlu diketahui siswa yang akan dipelajari dengan
sebuah topik. Pengetahuan konseptual adalah pengetahuan tentang saling
keterkaitan di antara elemen-elemen dasar. Pengetahuan prosedural adalah
mengetahui cara mengerjakan "sesuatu". Pengetahuan metakognitif adalah
pengetahuan tentang kognisi siswa sendiri dan pengetahuan tentang kapan
EVALUASI PENDIDIKAN Halaman 16
menggunakan pengetahuan konseptual atau prosedural tertentu. Tabel 2
menjelaskan keempat tipe utama pengetahuan dan contohnya masing-masing.
Tabel 2. Tipe-Tipe Utama Pengetahuan daiam Dimensi Pengetahuan
BEBERAPA TIPE DAN SUB-TIPE UTAMA CONTOH
A PENGETAHUAN FAKTUAL elemen-elemen dasar yang harus diketahuisiswa, yang dipelajari dengan sebuah disiplinatau dengan menyetesaikan masalah yang adadi dalamnya.
Aa Pengetahuan tentang terminologi Perbendaharaan kata teknis, simbol-simbolmusik.
Ab Pengetahuan tentang detail-detaildan elemen-elemen yang spesifik
Sumber-sumber alam utama, sumber-sumber informasi yang dapat dipercaya.
B PENGETAHUAN KONSEPTUAL Saling keterkaitan di antara elemen-elemendasar dalam struktur yang lebih besar yangmemungkinkan mereka untuk berfungsibersama-sama.
Ba Pengetahuan tentang klasifikasi dankategori
Periode-periode waktu geologis, bentuk-bentuk kepemilikan usaha/ bisnis.
Bb Pengetahuan tentang prinsip dangeneralisasi
Dalil Pythagoras, hukum supply anddemand (penawaran dan permintaan),
Bc Pengetahuan tentang teori, model,dan struktur
Teorievolusi, struktur pemerintahan, Struktur DPR, dsb.
C PENGETAHUAN PROSEDURAL Bagaimana cara melakukan sesuatu, metodepenyelidikan, dan kriteria untuk menggunakanberbagai keterampilan, algoritma, teknik, danmetode.
Ca Pengetahuan tentang berbagaiketerampilan spesifik-subjek danalgoritma
Berbagai keterampilan yang digunakandalam menggambar dengan cat air
Algoritma pembagian bilangan bulat.Cb Pengetahuan tentang berbagai
teknik dan metode Spesifik-subjekTeknik-teknik wawancara, metode ilmiah.
Cc Pengetahuan tentang krtteria untukmenentukan kapan meng-gunakanprosedur yang tepat
Kriteria yang digunakan untukmenentukan kapan menerapkan proseduryang melibatkan hukum Kedua Newton
Kriteria yang digunakan untuk menilaifisibilitas penggunaan metode tertentuuntuk mengestimasikan biaya usaha.
D PENGETAHUAN METAKOGNITIF Pengetahuan tentang kognisi secara umummaupun kesadaran dan pengetahuan tenteng
EVALUASI PENDIDIKAN Halaman 17
kognisinya sendiri.Da Pengetahuan strategis Pengetahuan tentang membuat ikhtisar
sebagai cara menangkap struktur sebuahunit subjek dalam sebuah textbook
Pengetahuan tentang penggunaanheuristik
Db Pengetahuan tentang tugas-tugaskognitif, termasuk pengetahuankontekstual dan kondisional yangtepat
Pengetahuan tentang tipe-tipe tes yang diadministrasikan guru-guru tertentu
Pengetahuan tentang tuntutan kognitifberbagai tugas.
Dc Pengetahuan tentang diri-sendiri Pengetahuan bahwa mengkritik esaiadalah kekuatan personal, sedangkanmenulis esai adalah kelemahan personal;
Kesadaran tentang tingkat pengeta-huannya sendiri.
Sumber : Adrerson et al. (2001), hlm.29
Tabel 3. Dimensi Proses Kognitif dan Proses Kognitif yang Terkait
KATERGORI PROSES PROSES KOGNITIF DAN CONTOH
1. Remember (mengingat) MengambIl pengetahuan yang relevan dariingatan jangka panjang
1.1 Recognizing (mengenali) (misalnya, mengenali tanggal peristiwa-peristiwa penting dalam sejarah)
1.2 Recalling (mengingat kembali) (misalnya, mengingat kembali tanggalperistiwa-peristiwa penting dalam sejarah)
2 Understand (memahami) Mengonstruksikan makna dari pesan-pesaninstruksional, termasuk komunikasi lisan,tulisan, dan grafis
2.1 Interpreting (menginterpretasikan) (misalnya, menafsirkan pidato dan dokumenpenting)
2.2 Exemplifying (memberi contoh) (misalnya, memberikan contoh berbagai gayalukisan artistik)
2.3 Classifying (mengklasifikasikan) (misalnya, mengklasifikasikan kasus-kasusgangguan mental)
2.4 Summarizing (merangkum) (misalnya, menulis ringkasan pendek darirekaman peristiwa tertentu)
2.5 Inferring (menyimpulkan) (misalnya, dalam mempelajari bahasa asing,menyimpulkan prinsip gramatikal dari contoh-contoh)
2.6 Comparing (membandingkan) (misalnya, membandingkan peristiwabersejarah dengan situasi sekarang)
2.7 Explaining (menjelaskan) (misalnya, menjelaskan penyebab peristiwapenting abad kedelapan belas di Perancis)
3 Apply (menerapkan) Melaksanakan atau menggunakan prosedurdalam situasi tertentu
EVALUASI PENDIDIKAN Halaman 18
3.1 Executing (melaksanakan) (misalnya, membagi sebuah bilangan bulatdengan bilangan bulat lain, keduanya denganbanyak digit)
3.2 Implementing(menglmplementasikan)
(misalnya, menentukan dalam situasi manahukum Newton kedua dapat diterapkan)
4 Analyze (menganalisis) Memecah materi menjadi bagian-bagiankonstituen dan menentukan hubungan antarasatu bagian dengan bagian lain dan denganstruktur atau maksud keseluruhan
4.1 Differentiating (mendiferensiasikan) (misalnya, membedakan antara bilangan yangrelevan dan tidak relevan dalam soal kalimatmatematika)
4.2 Organizing (mengorganisasikan) (misalnya, bukti struktur dalam deskripsihistoris menjadi bukti-bukti yang mendukungdan yang bertentangan dengan penjelasanhistoris tertentu)
4.3 Attributing (mengatribusikan) (misalnya, menentukan sudut pandang penulissebuah esai dalam kaitannya denganperepektif politisnya
5 Evaluate (mengevaluasi) Membuat judgment berdasarkari kriteria ataustandar.
5.1 Checking (mengecek) (misalnya, menentukan apakah kesimpulanseorang ilmuwan sesuai dengan data yangterobservasi)
5.2 Critiquing (mengkritik) (misalnya, memutuskan mana di antara duametode yang merupakan cara terbaik untukmenyelesaikan masalah tertentu)
6 Menciptakan (Creating) Meletakkan unsur-unsur secara bersamauntuk membentuk sesuatu yang koheren ataufungsional
6.1 Reorganizing (mengorganisasikankembali)
Mereorganisasi unsur-unsur ke dalam polabaru atau struktur baru dengan caramembangun (generating), merencanakan(planning) atau memproduksi (producing).
Kategori-Kategori Dimensi Proses Kognitif. Dimensi kognitif memberikan
skema klasifikasi untuk berbagai proses kognitif yang mungkin termasuk dalam
sebuah tujuan instruksional. Proses-proses ini terletak di sepanjang kontinum yang
bergerak mulai dari yang agak sederhana (mengingat) ke yang lebih kompleks
(menriptakan). Seperti ditunjukkan dalam Tabel 3, mengingat, menurut para
kreator taksonomi, berarti mengambil informasi yang relevan dari ingatan jangka
parijang, sementara memahami berarti mengonstruksikan makna dari berbagai
pesan instruksional. Menerapkan berarti melaksanakan atau menggunakan suatu
prosedur; menganalisis berarti menguraikan materi menjadi bagian-bagian
EVALUASI PENDIDIKAN Halaman 19
konstituen dan menentukan bagaimana hubungan bagian yang satu dengan bagian
yang lain. Mengevaluasi dan menciptakan, dua kategori yang terletak dalam ujung
kontinum yang lebih kompleks, berarti membuat judgment berdasarkan kriteria
dan menyatukan berbagai elemen untuk membentuk sebuah pola atau struktur
baru. Perhatikan juga dalam Tabel 3 bahwa masing-masing kategori proses
dikaitkan dengan dua proses kognitif atau lebih. "Mengingat", misalnya, termasuk
proses kognitif mengenali dan mengingat kembali. "Mengevaluasi" termasuk proses
kognitif checking (memeriksa), dan critiquing (mengkritik).
RANAH AFEKTIF.
Taksonomi orisinal Bloom membagi tujuan dalam affective domain (ranah
afektif) menjadi limajkategori. Masing-masing kategori menyebutkan derajat
komitmen atau intensitas emosional yang dibutuhkan dari siswa:
Receiving (menerima)— Siswa menyadari atau memerhatikan sesuatu di
lingkungan.
Responding (merespons)—Siswa memperlihatkan perilaku baru tertentu sebagai
hasil pengalaman dan respons terhadap pengalaman.
Valuing (menghargai)— Siswa memperlihatkan keterlibatan mutlak atau
komitmen terhadap pengalaman tertentu.
Organization (organisasi)—Siswa telah mengintegrasikan sebuah nilai baru ke dalam
nilai-nilai umumnya dan memberinya tempat yang layak
dalam sistem prioritas.
Characterization by value (karakterisasi menurut nilai)— Siswa bertindak secara
konsisten menurut nilainya dan memiliki komitmen
yang kuat terhadap pengalaman itu.
EVALUASI PENDIDIKAN Halaman 20
RANAH PSIKOMOTOR.
Kita biasanya mengaitkan kegiatan psikomotorik paling dekat dengan
pendidikan jasmani dan atletik, meskipun pada kenyataannya banyak subjek lain
yang membutuhkan gerakan fisik tertentu. Jelas, menulis dengan tangan dan
worJrnut essitig berhubungan erat dengan semua subjek. Pekerjaan di laboratorium
untuk siswa sains membutuhkan penggunaan rumit berbagai peralatan yang
kompleks. Koordinasi mata dibutuhkan untuk melihat semua bentuk karya seni
rupa; koordinasi tangan dibutuhkan untuk menghasilkan karya seni tersebut Find ah
dari satu siswa ke siswa lain, menggunakan peralatan audiovisual, dan
mengomunikasikan berbagai maksud dengan gerakan wajah dan tangan adalah
contoh contoh keterampilan guru di ranah psikomotorik. Berikut ini adalah rentang
kategori mulai dari reaksi refleks sederhana sampai tindakan kompleks yang mengo-
munikasikan berbagai ide dan ernosi kepada orang lain:
Gerakan refleks— Tindakan siswa dapat terjadi di luar kehendak sebagai
respons terhadap stimulus tertentu.
Gerakan fundamental dasar—Siswa memiliki pola gerakan bawaan yang terbentuk
dari kombinasi berbagai gerakan refleks.
Kemampuan perseptual—Siswa dapat mentranslasikan stimuli yang diterima
melalui indra menjadi gerakan yang tepat seperti yang
diinginkan.
Gerakan yang terampil— Siswa telah mengembangkan gerakan-gerakan yang
lebih kompleks yang membutuhkan derajat efisiensi
tertentu.
Komunikasinon diskursif— Siswa memiliki kemampuan untuk berkomunikasi
melalui gerakan tubuh.
Taksonomi-taksonomi orisinal untuk tujuan afektif dan psikomotorik belum pernah
direvisi.
EVALUASI PENDIDIKAN Halaman 21
Taksonomi orisinal Bloom juga tidak terlepas dari kritik. Sebagian orang
keliru menginterpretasikannya dengan mengatakan bahwa tipe pengetahuan
tertentu yang tidak begitu kompleks tidak sepenting tipe pengetahuan yang lebih
kompleks. Hal ini bukan yang dimaksudkan oleh Bloom. Sebagian lainnya
menantang pengurutan hierarkis tujuan-tujuan instruksional itu. Kemungkinan
besar kritik yang sama akan terjadi pada taksonomi yang telah direvisi, terutama
terkait dengan kontinum kompleksitasnya yang baru. Terakhir, para pengkritik
mengatakan, dan memang benar demikianlah adanya, bahwa taksonomi dan
pengurutan kategori-kategori itu tidak selalu cocok dengan semua bidang
pengetahuan.
Terlepas dari kritik dan kelemahan yang diidentifikasi dalam taksonomi
orisinalnya, taksonomi itu masih tetap populer di antara para guru. Kemungkinan
besar versi yang direvisi dari taksonomi itu akan menemukan audiens pendidik yang
sama reseptifnya karena memberikan cara yang berharga untuk memikirkan
tentang maksud dan asesmen instruksional dan, oleh sebab itu, dipandang sebagai
alat perencanaan yang berharga. Taksonomi itu memberikan reminder yang baik
bahwa kita menginginkan siswa untuk mempelajari beragam pengetahuan dan
keterampilan dan mampu berpikir dan bertindak dengan cara-cara yang efektif-
praktis maupun kompleks.
C. Jenis-jenis Instrumen Evaluasi
Secara umum, yang dimaksud dengan instrumen adalah suatu alat yang
memenuhi persyaratan akademis, sehingga dapat dipergunakan sebagai alat untuk
mengukur suatu obyek ukur atau mengumpulkan data mengenai suatu variabel.
Pada dasarnya, instrumen dapat dibagi dua, yaitu tes dan non-tes. Termasuk dalam
kelompok tes adalah tes prestasi belajar, tes intelegensi, tes bakat, dan tes
kemampuan akademik, sedangkan yang termasuk dalam kelompok non-tes ialah
skala sikap, skala penilaian, pedoman observasi, pedoman wawancara, angket,
pemeriksaan dokumen, dan sebagainya. Instrumen yang berbentuk tes bersifat
performansi maksimum sedang instrumen non-tes bersifat performansi tipikal.
EVALUASI PENDIDIKAN Halaman 22
a. Tes
1) Pengertian
Secara umum tes diartikan sebagai alat ukur yang dipergunakan untuk
mengukur pengetahuan atau penguasaan obyek ukur terhadap seperangkat
konten dan materi tertentu. Menurut Sudijono (1996), tes adalah alat atau
prosedur yang dipergunakan dalam rangka pengukuran dan penilaian. Tes dapat
juga diartikan sebagai suatu prosedur yang sistematis untuk mengamati atau
mendeskripsikan satu atau lebih karakteristik seseorang dengan menggunakan
standar numerik atau sistem kategori (Cronbach , 1984).
Norman (1976) mengemukakan bahwa tes merupakan salah satu prosedur
evaluasi yang komprehensif, sistematik, dan obyektif yang hasilnya dapat
dijadikan sebagai dasar dalam pengambilan keputusan dalam proses pengajaran
yang dilakukan oleh pelatih. Dari beberapa pengertian di atas, maka dapat
disimpulkan bahwa tes memiliki peranan yang sangat penting dalam dunia
pendidikan.
2) Fungsi Tes
Secara umum, ada beberapa macam fungsi tes di dalam dunia pendidikan.
Pertama, tes dapat berfungsi sebagai alat untuk mengukur prestasi belajar
peserta didik. Kedua, tes dapat berfungsi sebagai motivator dalam
pembelajaran. Ketiga, tes dapat berfungsi untuk upaya perbaikan kualitas
pembelajaran. Keempat, tes yang dimaksudkan untuk menentukan berhasil
tidaknya peserta didik sebagai syarat untuk melanjutkan pendidikan pada
jenjang yang lebih tinggi.
Salah satu tes yang perlu dibahas untuk upaya perbaikan kualitas
pembelajaran adalah tes formatif. Tes formatif pada dasarnya adalah tes yang
bertujuan untuk mendapatkan umpan balik bagi usaha perbaikan kualitas
pembelajaran dalam konteks kelas. Tes formatif ini akan memberikan masukan
atau umpan balik yang dapat digunakan oleh guru sebagai pengelola kegiatan
pembelajaran dalam meningkatkan intensitas proses belajar dalam diri setiap
diri peserta didik melalui peningkatan kesesuaian antara tiga unsur, yaitu
EVALUASI PENDIDIKAN Halaman 23
struktur kognitif peserta didik, karakteristik konsep yang dipelajari, dan strategi
pembelajaran yang digunakan.
Selanjutnya, untuk keperluan menentukan berhasil tidaknya peserta didik
sebagai syarat untuk melanjutkan pendidikan pada jenjang yang lebih tinggi
dikenal dengan istilah tes sumatif. Tes sumatif (summative test) adalah tes hasil
belajar yang dilaksanakan setelah sekumpulan materi pelajaran atau satuan
program pengajaran selesai diberikan.
Di sekolah, tes sumatif ini dikenal dengan tes ulangan umum. Tes sumatif ini
dilaksanakan dengan tujuan untuk menentukan nilai yang menjadi lambang
keberhasilan peserta didik setelah mereka menempuh proses pembelajaran
dalam waktu tertentu. Hasil tes sumatif berguna untuk (a) menentukan
kedudukan atau ranking masing-masing peserta didik di kelompoknya; (b)
menentukan dapat atau tidaknya peserta didik melanjutkan program
pembelajaran berikutnya; dan (c) menginformasikan kemajuan peserta didik
untuk disampaikan kepada pihak lain.
3) Penggolongan Tes
Ditinjau dari fungsinya sebagai alat untuk mengukur hasil belajar peserta
didik sebagai efek atau pengaruh kegiatan pembelajaran, tes dibedakan menjadi
dua golongan. Pertama, tes awal (pre-test). Tes jenis ini dilaksanakan dengan
tujuan untuk mengetahui sejauhmana materi pelajaran yang akan diajarkan
telah diketahui oleh peserta didik. Kedua, tes akhir (post-test). Tes jenis ini
dilaksanakan dengan tujuan untuk mengetahui apakah semua materi pelajaran
yang penting telah dikuasai dengan baik oleh peserta didik atau belum.
Ditinjau dari aspek psikis yang akan diungkap, tes dibedakan menjadi lima
golongan. Pertama, tes inteligensi (intellegency test) yang dilaksanakan dengan
tujuan untuk mengungkap atau memprediksi tingkat kecerdasan seseorang.
Kedua, tes kemampuan (aptitude test) yang dilaksanakan dengan tujuan untuk
mengungkap kemampuan dasar atau bakat khusus yang dimiliki oleh peserta
tes. Ketiga, tes sikap (attitude test) yang dilaksanakan dengan tujuan untuk
mengungkap pre-disposisi atau kecenderungan seseorang untuk melakukan
EVALUASI PENDIDIKAN Halaman 24
sesuatu respon terhadap obyek yang disikapi. Keempat, tes kepribadian
(personality test) yaitu tes yang dilaksanakan dengan tujuan untuk mengungkap
ciri-ciri khas dari seseorang yang sedikit banyaknya bersifat lahiriah, seperti gaya
bicara, cara berpakaian, nada suara, hobi, bentuk tubuh, cara bergaul, cara
mengatasi masalah, dan lain sebagainya. Kelima, tes hasil belajar (achievement
test) yaitu tes yang dilaksanakan dengan tujuan untuk mengungkap tingkat
pencapaian terhadap tujuan pembelajaran atau prestasi belajar.
Ditinjau dari jumlah peserta yang mengikuti tes, maka tes dibedakan
menjadi dua golongan. Pertama, tes individual (individual test), yaitu tes
dimana pelaksana tes hanya berhadapan dengan satu orang peserta. Kedua, tes
kelompok (group test), yaitu tes dimana pelaksana tes berhadapan dengan lebih
dari satu orang peserta.
Ditinjau dari waktu yang disediakan bagi peserta, maka tes dibedakan
menjadi dua golongan, yaitu power test dan speed test. Ditinjau dari bentuk
respon, tes dibedakan menjadi dua golongan, yaitu tes verbal dan tes non
verbal. Ditinjau dari cara mengajukan pertanyaan, tes dibedakan menjadi tiga
golongan, yaitu tes tertulis (pencil and paper test), tes tidak tertulis (non-pencil
and paper test), dan tes perbuatan.
Ditinjau dari aspek yang hendak diukur, tes dibedakan atas tes tertulis, tes
lisan dan ter perbuatan atau tes praktek. Tes tertulis digunakan untuk mengukur
aspek kognitif, tes lisan digunakan untuk pendalaman terhadap aspek kognitif
yang belum terukur melalui tes tertulis, sedang tes perbuatan atau tes praktek
digunakan untuk mengukur aspek psikomotorik atau keterampilan.
b. Non Tes
1) Pedoman Observasi
Secara umum pengertian observasi adalah cara menghimpun bahan-
bahan/keterangan yang dilakukan dengan mengadakan pengamatan dan
pencatatan secara sistematis terhadap fenomena-fenomena yang dijadikan
obyek pengamatan.
EVALUASI PENDIDIKAN Halaman 25
Observasi sebagai alat evaluasi banyak digunakan untuk menilai tingkah laku
individu atau proses terjadinya suatu kegiatan yang dapat diamati. Observasi
dapat dilakukan baik secara partisipatif maupun non-partisipasi. Observasi
dapat pula berbentuk observasi eksperimental yaitu observasi yang dilakukan
dalam situasi yang dibuat dan observasi non-eksperimental yaitu observasi yang
dilakukan dalam situasi yang wajar.
Jika observasi digunakan sebagai alat evaluasi, maka pencatatan hasil
observasi lebih sukar daripada mencatat jawaban yang diberikan oleh peserta
tes terhadap pertanyaan yang diberikan dalam suatu tes karena respon
observasi adalah tingkah laku dimana proses kejadiannya berlangsung cepat.
Obervasi yang dilakukan dengan perencanaan yang matang disebut observasi
sistematis.
2) Pedoman Wawancara
Secara umum yang dimaksud dengan wawancara adalah cara menghimpun
bahan-bahan keterangan yang dilaksanakan dengan tanya jawab baik secara
lisan, sepihak, berhadapan muka, maupun dengan arah dan tujuan yang telah
ditentukan. Ada dua jenis wawancara yang dapat digunakan sebagai alat
evaluasi, yaitu:
(a) Wawancara terpimpin, yang juga dikenal dengan wawancara terstruktur
atau wawancara sistematis.
(b) Wawancara tidak terpimpin, yang dikenal dengan wawancara sederhana
atau wawancara bebas.
Salah satu kelebihan wawancara adalah pewawancara sebagai evaluator
dapat melakukan kontak langsung dengan peserta didik yang akan dinilai,
sehingga dapat diperoleh hasil penilaian yang lebih lengkap dan mendalam.
Jika wawancara dilakukan secara bebas, maka pewawancara tidak perlu
persiapan yang matang, tetapi jika wawancara dilakukan secara sistematis,
maka pewawancara perlu ada pedoman wawancara yang berisi pokok-pokok
pertanyaan yang akan ditanyakan kepada responden. Mencatat dan
EVALUASI PENDIDIKAN Halaman 26
mengolah hasil wawancara jauh lebih sulit dibandingkan dengan mencatat
dan mengolah hasil observasi atau hasil tes.
3) Angket (Kuesioner)
Angket dapat juga digunakan sebagai alat ukur untuk menilai hasil belajar.
Angket dapat diberikan langsung kepada responden, dapat juga diberikan
kepada orang lain yang mengenal berbagai karakteristik responden.
Data yang dihimpun melalui angket biasanya adalah data yang berkenaan
dengan kesulitan-kesulitan yang dihadapi oleh peserta didik dalam
mengikuti pelajaran. Angket pada umumnya dipergunakan untuk menilai
hasil belajar pada ranah afektif. Selain sebagai alat ukur untuk mengukur
hasil belajar peserta didik, angket juga berguna untuk mengungkapkan latar
belakang orangtua peserta didik maupun peserta didik itu sendiri.
4) Pemeriksaan Dokumen
Untuk mengukur kemajuan belajar peserta didik dapat juga dilakukan
dengan tanpa pengujian tetapi dengan cara melakukan pemeriksaan
dokumen-dokumen, misalnya dokumen yang memuat informasi kapan
peserta didik itu diterima di lembaga kursus tersebut, darimana lembaga
kursus asalnya, apakah peserta didik tersebut pernah tidak lulus dalam suatu
program, dan sebagainya.
Berbagai informasi yang direkam melalui angket, baik informasi pribadi
peserta didik dan lingkungannya akan bermanfaat pada saat-saat tertentu.
Dengan demikian, maka dalam pelaksanaan pengukuran hasil belajar tidak
semata-mata dilakukan dengan tes, tetapi dapat juga dilakukan dengan
menggunakan non-tes, terutama untuk masalah-masalah yang berhubungan
dengan masalah kejiwaan peserta didik, seperti persepsi terhadap mata
pelajaran tertentu, persepsi terhadap pelatih, minat, bakat, tingkah laku,
dan sikap yang tidak mungkin diukur dengan tes.
EVALUASI PENDIDIKAN Halaman 27
D. Kriteria Penilaian
Kriteria penilaian hasil belajar pada umumnya dibedakan ke dalam dua
standar, yakni kriteria penilaian acuan norma (PAN) dan penilaian acuan patokan
(PAP).
a. Penilaian Acuan Norma (PAN)
Penilaian Acuan Norma (PAN) adalah penilaian yang menggunakan acuan
pada rata-rata kelompok. Dengan demikian dapat diketahui posisi kemampuan
peserta didik dalam kelompoknya. Untuk itu norma atau kriteria yang di-
gunakan dalam menentukan derajat prestasi seorang peserta didik selalu
dibandingkan dengan nilai rata-rata kelasnya. Atas dasar itu akan diperoleh tiga
kategori prestasi peserta didik, yakni prestai peserta didik di atas rata-rata
kelas, berkisar pada rata-rata kelas, dan prestasi peserta didik yang berada di
bawah rata-rata kelas. Dengan kata lain, prestasi yang dicapai seseorang
posisinya sangat bergantung pada prestasi kelompoknya.
Keuntungan kriteria ini adalah dapat diketahui prestasi kelompok atau
kelas sekaligus dapat diketahui keberhasilan pembelajaran bagi semua peserta
didik. Kelemahannya adalah kurang meningkatkan kualitas hasil belajar. Jika
nilai rata-rata kelompok atau kelasnya rendah, misalnya sekor 40 dari seratus,
maka peserta didik yang memperoleh nilai 45 (di atas rata-rata) sudah
dikatakan baik, atau dinyatakan lulus, sebab berada di atas rata-rata kelas,
padahal sekor 45 dari maksimum sekor 100 termasuk rendah. Kelemahan yang
lain ialah kurang praktis sebab harus dihitung dahulu nilai rata-rata kelas,
apalagi jika jumlah peserta didik cukup banyak. Sistem ini kurang
menggambarkan tercapainya tujuan pembelajaran sehingga tidak dapat
dijadikan ukuran dalam menilai keberhasilan mutu pendidikan. Demikian juga
kriteria keberhasilan tidak tetap dan tidak pasti, bergantung pada rata-rata
kelas, makanya standar penilaian ini disebut standar relatif.
Dalam konteks yang lebih luas penggunaan standar penilaian ini tidak
dapat digunakan untuk menarik generalisasi prestasi peserta didik sebab rata--
EVALUASI PENDIDIKAN Halaman 28
rata kelompok untuk kelas yang satu berbeda dengan kelas yang lain, sekolah
yang satu akan berbeda dengan sekolah yang lain. Standar penilaian acuan
norma tepat jika digunakan untuk penilaian formatif.
b. Penilaian Acuan Patokan (PAP)
Penilaian Acuan Patokan (PAP) adalah penilaian yang menggunakan acuan pada
tujuan pembelajaran atau kompetensi yang harus dikuasai peserta didik. Derajat
keberhasilan peserta didik dibandingkan dengan tujuan atau kompetensi yang
seharusnya dicapai atau dikuasai peserta didik bukan dibandingkan dengan
prestasi kelompoknya. Dalam penilaian ini ditetapkan kriteria minimal harus
dicapai atau dikuasai peserta didik. Kriteria minimal yang biasa digunakan
adalah 80% dari tujuan atau kompetensi yang seharusnya dikuasai peserta didik.
Makin tinggi kriterianya makin baik mutu pendidikan yang dihasilkan. Standar
penilaian acuan patokan berbasis pada konsep belajar tuntas atau mastery
learning. Artinya setiap peserta didik harus mencapai ketuntasan belajar yang
diindikasikan oleh penguasaan materi ajar minimal mencapai kriteria yang telah
ditetapkan. Jika peserta didik belum mencapai kriteria tersebut peserta didik
belum dinyatakan berhasil dan harus menempuh ujian kembali. Karena itu
penilaian acuan patokan sering disebut standar mutlak. Dalam sistem ini
pendidik tidak perlu menghitung nilai rata-rata kelas sebab prestasi peserta
didik tidak dibandingkan dengan prestasi kelompoknya. Melalui sistem penilaian
acuan patokan sudah dapat dipastikan prestasi belajar peserta didik secara
bertahap akan lebih baik sebab setiap peserta didik harns mencapai kriteria
minimal yang telah ditentukan. Namun sistem ini menuntut pendidik bekerja
lebih keras sebab setiap pendidik harus menyediakan remedial bagi peserta
didik yang belum memenuhi standar yang telah ditentukan. Sistem penilaian ini
tepat digunakan baik untuk penilaian formatif maupun penilaian sumatif.
EVALUASI PENDIDIKAN Halaman 29
E. Penyusunan Tes Hasil Belajar
Untuk memperoleh gambaran yang lebih komprehensif mengenai evaluasi
hasil pembelajaran, maka uraian berikut ini akan membahas konstruksi dan
pengembangan tes. Konstruksi dan pengembangan tes dimaksudkan untuk
memperoleh tes yang valid sehingga hasil ukurnya dapat mencerminkan secara
tepat hasil belajar dicapai peserta didik setelah selesai mengikuti proses
pembelajaran.
Untuk itu maka langkah-langkah konstruksi tes yang ditempuh adalah
sebagai berikut:
1. Menetapkan tujuan tes
Tes hasil belajar dapat dibuat untuk bermacam-macam tujuan, seperti:
a. Evaluasi Belajar Tahap Akhir (EBTA) atau evaluasi belajar pada akhir program
Pendidikan.
b. Seleksi, misalnya untuk ujian saringan masuk lembaga pendidikan tertentu
(misalnya SPMB untuk masuk PT).
c. Diagnosis kesulitan belajar, yang dikenal dengan tes diagnosis.
Untuk evaluasi bersifat akhir diperlukan tes yang terdiri atas butir-butir yang
mudah sampai yang sukar, tes semacam ini merupakan Mastery Tes. Dengan
hasil tes ini dapat dilihat level mastery peserta tes, yaitu sejauh mana ia
menguasai materi yang diberikan. Untuk tujuan seleksi dibutuhkan tes
dengan butir-butir soal dengan tingkat kesukaran yang lebih tinggi (tingkat
kesukaran di atas rata-rata) terutama jika calon yang diseleksi cukup banyak.
Untuk ujian diagnosis, butir-butir soal harus dinilai menurut pokok bahasan
atau sub pokok bahasan. Pada tes diagnosis bukan nilai akhir yang
diperhatikan, melainkan nilai pada tiap pokok bahasan (pokok bahasan
mana belum dikuasai atau bermasalah).
2. Analisis kurikulum
Analisis kurikulum bertujuan untuk menentukan bobot setiap pokok bahasan
sebagai dasar dalam menentukan jumlah item atau butir soal baik soal obyektif
EVALUASI PENDIDIKAN Halaman 30
maupun soal bentuk uraian pada setiap pokok bahasan. Penentuan bobot
untuk setiap pokok bahasan dilakukan berdasarkan jumlah jam pertemuan yang
tercantum dalam silabus pembelajaran.
3. Analisis buku pelajaran dan sumber materi belajar lainnya
Analisis buku pelajaran dan sumber materi belajar lainnya mempunyai tujuan
sama dengan analisis kurikulum, yaitu menentukan bobot setiap pokok bahasan.
Akan tetapi analisis buku pelajaran menentukan bobot setiap pokok bahasan
berdasarkan kedalaman materi (jumlah halaman materi) yang termuat dalam
buku pelajaran atau sumber materi belajar lainnya. Tes yang akan disusun
merupakan sampel yang dapat mewakili populasi materi yang telah diajarkan.
Soal yang tidak di sampel akan menghasilkan beratus-ratus soal pada setiap
bidang studi untuk mewakili populasi materi yang pernah diajarkan. Hal ini
sangat sulit dilakukan mengingat waktu yang dibutuhkan peserta tes untuk
menyelesaikan tes dengan butir soal sebanyak itu terlalu lama. Untuk dapat
memilih sampel yang tepat diperlukan (a) analisis kurikulum, dan (b) analisis
buku pelajaran dan sumber materi lainnya. Kegiatan inilah yang dimaksudkan
dengan timbangan buku, sehingga tidak mengakibatkan kesimpulan dan
penilaian yang sesat.
4. Membuat Kisi-kisi
Kisi-kisi atau Blueprint atau Tabel of Spesification bermanfaat untuk menjamin
sampel soal yang baik, dalam arti mencakup semua pokok bahasan secara
proporsional. Agar butir-butir tes mencakup keseluruhan materi secara
proporsional maka sebelum menulis butir-butir tes terlebih dahulu harus dibuat
kisi-kisi sebagai pedoman. Sebuah kisi-kisi memuat jumlah butir yang harus
dibuat untuk setiap bentuk soal, untuk setiap pokok bahasan dan untuk setiap
aspek kemampuan yang akan diukur.
5. Penulisan Indikator (PI)
EVALUASI PENDIDIKAN Halaman 31
Penulisan PI harus sesuai dengan ketentuan yang telah ditetapkan. PI harus
mencerminkan tingkah laku peserta didik, oleh karena itu harus dirumuskan
secara operasional, dan secara teknis menggunakan kata-kata operasional.
6. Penulisan Soal
Berdasarkan kisi-kisi dalam bentuk tabel spesifikasi yang tersedia, maka dibuat
butir-butir soal atau item-item tes. Banyaknya butir yang harus dibuat untuk
setiap bentuk soal, untuk setiap kompetensi dasar, dan untuk setiap aspek
kemampuan yang hendak diukur harus disesuaikan dengan yan tercantum
dalam kisi-kisi.
7. Telaah Soal (Validasi konsep)
Setelah soal dibuat sesuai dengan indikator dan sudah mewakili KD, selanjutnya
ditelaah dari aspek isi dan bahasa.
8. Reproduksi Tes Terbatas
Tes yang sudah dibuat diperbanyak dalam jumlah yang cukup menurut jumlah
sampel uji-coba atau jumlah peserta yang akan mengerjakan tes tersebut dalam
suatu kegiatan uji-coba tes.
9. Uji-Coba Tes
Tes yang telah direproduksi atau diperbanyak itu diuji-cobakan pada sejumlah
sampel yang telah ditentukan. Sampel uji-coba harus mempunyai karakteristik
yang kurang lebih denga peserta tes yang sesungguhnya , untuk itu cara
penentuan sampel harus dilakukan dengan menggunakan metode yang tepat
dan disesuaikan dengan tujuan uji-coba.
10. Analisis hasil uji-coba
Berdasarkan data hasil uji-coba dilakukan analisis meliputi validitas butir, tingkat
kesukaran, dan fungsi pengecoh. Berdasarkan validitas butir soal tersebut
diadakan seleksi soal dengan menggunakan validitas tertentu. Soal-soal yang
tidak valid akan didrop dan soal-soal yang valid akan ditetapkan atau dirakit
menjadi suatu tes yang valid. Selanjutnya untuk memberikan gambaran kualitas
tes tersebut secara empirik dihitung reliabilitasnya.
EVALUASI PENDIDIKAN Halaman 32
11. Revisi soal
Soal-soal yang valid berdasarkan kriteria validitas empirik dikonfirmasikan
dengan kisi-kisi. Soal-soal yang sudah memenuhi syarat dan telah mewakili
semua materi yang akan diujikan, dirakit menjadi sebuah tes sedangkan soal-
soal valid belum memenuhi syarat berdasarkan konfirmasi dengan kisi-kisi dapat
diperbaiki atau direvisi sesuai keperluan.
12. Merakit soal menjadi tes
Soal-soal yang valid dan telah mencerminkan semua pokok bahasan serta aspek
kemampuan yang hendak diukur dapat dirakit menjadi sebuah tes yang valid.
Urutan soal dalam suatu tes pada umumnya dilakukan menurut tingkat
kesukaran soal, yaitu dari soal yang mudah sampai soal yang sulit.
Penulisan Butir Tes
Tipe Pilihan Ganda
1. Butir tes atau soal hendaklah menanyakan hal yang penting untuk diketahui,
2. Tulislah butir tes yang berisi pernyataan yang jelas.
3. Utamakan butir tes yang mengandung pernyataan urnum yang bertahan lama.
4. Buatlah butir tes yang berisi hanya satu gagasan saja.
5. Buatlah butir tes yang menyatakan inti pertanyaan dengan jelas. Gunakan
kalimat sederhana dan tidak berlebih-lebihan.
6. Sebaiknya butir tes tidak didasari oleh pemyataan negatif.
7. Gunakan bahasa yang jelas, kata yang sederhana, dan pernyataan yang
langsung.
8. Butir tes harus memberikan alternatif bagi isi pernyataan yang paling penting.
9. Berikan alternatif jawaban yang jelas berbeda.
10. Alternatif yang ditawarkan hendaknya mempunyai struktur dan arti yang
sejajar atau dalam satu kategori. Penggunaan alternatif yang semata-mata
meniadakan atau bertentangan dengan alternatif yang lain, haruslah dihindari.
EVALUASI PENDIDIKAN Halaman 33
11. Bilamana mungkin, susunlah alternatif jawaban dalam urutan besamya atau
urutan logisnya.
12. Penggunaan alternatif "bukan salah satu di atas" atau "semua yang di atas"
hanya baik apabila kebenaran bersifat mutlak dan bukan semata-mata masalah
lebih dan kurang baik atau masalah ; kebenaran relatif.
13. Jangan menjebak peserta tes dengan menanyakan hal yang tidak ada
jawabannya.
14. Hindari penggunaankata-kata yang dapat dijadikan petunjuk oleh siswa dalam
menjawab.
Tipe Benar-Salah
Kaidah atau petunjuk penulisan butir tes tipe benar salah telah dikemukakan oleh
Ebel (1979) sebagai berikut ini:
1. Butir tes haruslah mengungkap ide atau gagasan yang penting.
2. Butir tes tipe benar salah hendaknya menguji pemahaman, jangan hanya
mengungkap ingatan mengenai suatu fakta atau hafalan.
3. Kebenaran atau ketidakbenaran suatu butir tes haruslah bersifat mutlak.
4. Butir tes harus menguji pengetahuan yang spesifik dan jawabannya tidak jelas
bagi semua orang, kecuali bagi mereka yang menguasaipelajaran.
5. Butir tes harus dinyatakan secara jelas.
Tipe Jawaban Pendek
1. Pernyataan atau pertanyaan butir tes harus ditulis dengan hati-hati, sehingga
dapat dijawab dengan hanya satujawaban yang pasti.
2. Sebaiknya rumuskan jawabannya lebih dahuiu baru kemudian menulis
pertanyaannya.
3. Gunakan pertanyaan langsung, kecuali bilamana model kalimat tak selesai akan
memungkinkan jawaban yang lebih jelas.
EVALUASI PENDIDIKAN Halaman 34
4. Usahakan agar dalam pertanyaan tidak terdapat petunjuk yang mungkin
digunakan oleh subjek dalam menjawab butir tes.
5. Jangan menggunakan kata atau kalimat yang langsung dikutip dari buku.
Tipe Pasangan
1. Premis dan respon hendaknya dibuat dalam jumlah yang tidak sama.
2. Baik premis maupun respon haruslah berisi hal yang homogen, yaitu dari
sejenis kategori isi.
3. Usahakan agar premis dan responnya berisi kalimat-kalimat atau kata yang
pendek.
4. Buatlah petunjuk pernasangan yang jelas, sehingga penjawab soal atau
pertanyaan mengetahui dasar apakah yang harus digunakan dalam
memasangkan premis dan responnya.
5. Sedapat mungkin susunlah premis dan respon masing-masing secara alfabetik
atau menurut besarankuantitatifnya.
Tipe Karangan (Esai)
1. Berikan pertanyaan atau tugas yang mengarahkan penjawab pertanyaan
(siswa) agar dapat menunjukkan penguasaan pengetahuan yang penting.
2. Buatlah pertanyaan yang arah jawabannya jelas, sehingga para ahli dapat
setuju bahwa satu jawaban akan lebih baik dari pada yang lainnya.
3. Jangan menanyakan sikap ataupendapat.
4. Sebaiknya pertanyaan diawali oleh kata-kata seperti, "Bandingkan ...",
"Berikan alasan ...", "Jelaskan mengapa ..."", "Beri contoh ...", dan
semacamnya.
5. Jangan memberi kesempatan kepada penjawab soal untuk memilih dan
menjawab hanya sebagian di antara nomor pertanyaan yang disediakan.
6. Sebaiknya, tulis lebih dahulu satu jawaban ideal yang dikehendaki, baru
kemudian menyusun pertanyaannya.
EVALUASI PENDIDIKAN Halaman 35
BAB III
PENSEKORAN, PEMBERIAN NILAI DAN PELAPORAN HASIL EVALUASI
Tes yang telah disusun dengan sebaik-baiknya, dan dikembangkan menurut
prosedur yang benar, maka diharapkan bahwa hasil ukur tes tersebut akan dapat
mengungkapkan dengan tepat ciri atau keadaan sesungguhnya dari peserta tes.
Dengan kata lain, tes yang telah mempunyai validitas dan reliabilitas yang memadai,
misalnya untuk mengukur tingkat pencapaian atau penguasaan peserta didikt
terhadap materi pelajaran A diharapkan dapat mengungkapkan dengan tepat
penguasaan (kemampuan) siswa terhadap materi pelajaran A tersebut. Artinya
sekor yang diperoleh sebagai hasil ukur tes itu, betul-betul menggambarkan
kemampuan atau penguasaan terhadap materi A itu, sehingga hasil ukur itu tepat
digunakan untuk menentukan nilai atau kelulusan/keberhasilan peserta tes.
A. Pengertian Sekor dan Nilai
Selain penyusunan dan pengembangan tes, seperti telah dibahas seblumnya,
hal penting lain dalam penilaian hasil belajar dengan menggunakan tes, adalah
memberi nilai atau memberi sekor.
Sebelum dibahas tentang pengertian sekor, terlebih dahulu dibahas mengenai
bobot (weight). Bobot adalah bilangan atau angka yang dikenakan terhadap setiap
butir soal yang nilainya ditentukan berdasarkan usaha peserta tes dalam
menyelesaikan soal itu. Tinggi-rendahnya usaha itu dipengaruhi oleh derajat
kesukaran dan waktu yang diperlukan untuk menjawab soal tersebut dengan
benar. Jika derajat kesukaran suatu butir soal makin tinggi, maka makin besar pula
bobot untuk soal tersebut, karena memerlukan usaha (kognitif) yang derajatnya
lebih tinggi. Disamping itu waktu penyelesaian soal tersebut lebih lama dari soal
lainnya.
Bobot suatu butir soal disebut sekor untuk butir soal tersebut. Sekor untuk
keseluruhan butir soal dari perangkat tes yang diperoleh seseorang disebut sekor
tes dari orang tersebut. Sekor ini disebut sekor aktual, artinya sekor kenyataan
EVALUASI PENDIDIKAN Halaman 36
(empirik) atau sekor mentah yang diperoleh peserta tes. Jika seluruh soal dalam
perangkat tes dapat dijawab dengan benar sesuai harapan pembuat soal, sekor
untuk menyatakan kondisi ini disebut sekor maksimal ideal. Sebaliknya untuk
kondisi tidak ada satupun benar disebut sekor minimal ideal. Dengan demikian
sekor adalah bilangan yang merupakan data mentah dari hasil suatu penilaian,
belum diolah lebih lanjut. Jadi bersifat kuantitatif.
Sekor merupakan data mentah yang tidak dapat diinterpretasikan bila ia
masih berdiri sendiri tanpa informasi lain yang relevan. Misalnya sekor peserta
Diklat dalam suatu tes akhir adalah 80. Sekor tersebut tidak dapat diinterpretasikan
karena tidak ada pembanding sebagai kriteria (tolok ukur). Jika sekor maksimum
ideal (SMI) nya adalah 100, interpretasi dari sekor 80 dapat ditafsirkan tergolong
baik, karena tingkat penguasaanya sekitar 80%. Sedangkan jika SMI-nya 500 dapat
ditafsirkan tergolong jelek, karena tingkat penguasaanya hanya sekitar 16%. Begitu
pula jika diketahui dua buah sekor dari dua peserta diklat yang berbeda, tidak dapat
ditafsirkan mana yang lebih baik sebelum diketahui data lain sebagai kriteria.
Data mentah yang telah diolah lebih lanjut dengan menggunakan aturan dan
kriteria tertentu sehingga dapat diinterpretasikan dinamakan nilai. Nilai ini dapat
berupa bilangan (kuantitatif), misalnya nilai 9 dalam skala 1 sampai 10, atau berupa
kualitatif, misalnya B dalam skala penilaian A, B, C, D, dan E.
1. Penentuan Sekor dan Pemberian Nilai
Dalam kaitan dengan memberi sekor dan menilai terhadap hasil tes dapat
dibedakan atas dua macam berdasarkan jenis sekor yang diperoleh dari masing-
masing butir tes, yaitu (1) memberi sekor untuk tes bentuk uraian, dan (2)
memberi sekor untuk tes obyektif (pilihan ganda, benar-salah, menjodohkan,
dan sejenisnya).
(a) Pemberian Sekor untuk Tes Uraian
Untuk tes uraian (subyektif) setiap butir diberi sekor dari 0 sampai dengan 10
tergantung dari tingkat kebenaran jawabannya, yaitu diberi sekor 10 jika
jawabannya tepat sama dengan pendapat pemberi sekor, diberi sekor 5 jika
EVALUASI PENDIDIKAN Halaman 37
jawabannya setengah benar menurut pendapat pemberi sekor, diberi sekor 0
jika jawabannya salah sama sekali, dan seterusnya. Sekor setiap peserta tes
diperoleh dari jumlah sekor semua item atau buitr tes. Sekor yang diperoleh di
sini di sebut sekor mentah. Misalnya seorang peserta mendapat sekor 75
dengan SMI-nya 100 berarti peserta tersebut telah mencapai 75% tingkat
penguasaan dari tes uraian tersebut.
(b) Pemberian Sekor untuk Tes Obyektif
Tes obyektif seperti pilihan berganda, setiap butir tes hanya dapat dijawab
benar atau dijawab salah oleh peserta tes. Oleh karena itu maka setiap butir
hanya mempunyai sekor 0 atau 1. Jenis tes semacam ini juga disebut sebagai
tes dikotomus. Jika peserta tes menjawab benar diberi sekor 1, dan jika siswa
menjawab salah diberi sekor 0. Sekor setiap peserta tes diperoleh dari jumlah
sekor semua butir tes. Pendapat pemberi sekor tidak mempengaruhi sekor
peserta tes dalam tes obyektif. Dengan demikian maka sekor tes obyektif
ditentukan oleh banyaknya butir yang dijawab benar. Sekor yang diperoleh di
sini juga masih disebut sekor mentah.
Dalam suatu ujian dengan tes obyektif seorang peserta tes, misalnya dapat
menjawab 8 buah soal dari 10 soal bentuk B – S. Apakah tingkat penguasaan
peserta tes tersebut 80%? Menurut teori probabilitas option (pilihan) B dan S
masing-masing nilai kemungkinannya sama untuk terpilih jika ditebak, yaitu ½ .
Untuk menentukan tingkat penguasaan soal bentuk obyektif diperoleh
hubungan: Jumlah jawaban benar = banyaknya jawaban yang benar-benar
dikuasai + banyaknya jawaban tebakan. Jika kita misalkan banyaknya jawaban
yang benar-benar dikuasai peserta tes X, maka untuk contoh B – S di atas
diperoleh persamaan: 8 = X + (10 - X). ½ , diperoleh X = 6. Jadi tingkat
penguasaan sebenarnya dari peserta tes tersebut adalah 60%.
Jika soal tersebut berbentuk pilihan ganda dengan 4 pilihan, maka tingkat
penguasaan peserta tes dapat dicari melalui hubungan:
8 = X + (10 - X). 1/4 ,
EVALUASI PENDIDIKAN Halaman 38
diperoleh X = 7. Jadi tingkat penguasaan sebenarnya dari peserta tes tersebut
adalah 70%.
Misalkan disajikan 100 butir soal pilihan ganda dengan 5 pilihan. Seorang
peserta tes menjawab benar sebanyak 60 butir. Berapa butir soal yang benar-
benar dikuasai oleh peserta tes tersebut? Untuk menjawab pertanyaan ini, kita
misalkan banyak butir yang dikuasai dengan X. Sisanya, yaitu (10 – X) butir
dijawab dengan tebakan, sehingga diperoleh hubungan:
60 = X + (100 - X). 1/5 , diperoleh X = 50. Jadi banyaknya butir soal yang
benar-benar dikuasai sebanyak 50 butir atau 50% dari seluruh materi.
Pada contoh-contoh di atas, tampak bahwa tingkat penguasaan selalu relatif
lebih kecil dari jumlah jawaban yang benar. Untuk menanggulangi masalah
tersebut, maka pemberian sekor untuk soal tipe obyektif menggunakan rumus-
rumus seperti di bawah ini.
(a) Rumus sekor untuk soal bentuk B – S
S = (JB - JS) x b
dengan:
S = sekorJB = Jumlah jawaban benarJS = Jumlah jawaban salahb = bobot
(b) Rumus sekor untuk soal bentuk Pilihan Ganda (P–G)
S = bxn
JJ S
B
)1(
Dengan n = banyaknya pilihan yang disediakan setiap butir
(c) Rumus sekor untuk soal bentuk menjodohkan
S = bxnn
JJ S
B
)1)(1( 21
dengan n1 = banyaknya stem pada kolom sebelah kiri
EVALUASI PENDIDIKAN Halaman 39
n2 = banyaknya alternatif jawaban pada kolom sebelah kanan
(d) Rumus sekor untuk soal bentuk Isian
S = JB x b
Tanpa pengurangan (hukuman) sebab tidak ada pilihan.
Misalkan suatu tes sumatif terdiri dari 10 bentuk Benar-Salah, 20 butir
bentuk P-G dengan 4 option, 5 butir bentuk Memasangkan dengan 7
alternatif jawaban, dan 10 butir isian. Mengingat kadar kesulitan dan usaha
peserta Diklat dalam mengerjakan setiap bentuk soal tersebut berlainan
maka bobot untuk soal bentuk B-S ditentukan 1, bentuk P-G bobotnya 3,
bentuk Memasangkan bobotnya 1 ½, dan bentuk isian bobotnya 2. jika
seorang siswa dapat menjawab benar bentuk B-S 7 soal, bentuk P-G 15
soal, bentuk Memasangkan 2 soal, dan bentuk isian 8 soal, maka berapa
sekor yang diperoleh peserta Diklat tersebut? Berapa pula tingkat
penguasaannya? (Silahkan dikerjakan)
(c) Pemberian Nilai Berdasarkan Acuan Patokan
Pemberian nilai jenis ini berdasarkan atas tujuan instruksional yang telah
ditentukan. Artinya nilai diberikan kepada peserta tes menunjukkan tingkat
pencapaian tujuan instruksional atau tingkat penguasaan terhadap materi yang
telah ditentukan. Untuk keperluan tersebut, pertama-tama sekor mentah
diterjemahkan ke dalam sekor 1 sampai 100, yang menunjukkan prosentase
pencapaian tujuan instruksional yang dicapai. Untuk yang menggunakan nilai 1 –
10, maka sekor 1 – 100 yang ditransformasikan ke nilai 1- 10, sedang yang
menggunakan 0 – 4, maka sekor 1 – 100 ditransformasikan ke nilai 0 – 4
misanya dengan ketentuan berikut:
X < 56 diberi nilai 0
56 < X < 65 diberi nilai 1
65 < X < 80 diberi nilai 2
80 < X < 90 diberi nilai 3
EVALUASI PENDIDIKAN Halaman 40
X > 56 diberi nilai 4 (Djaali, 2004)
(d) Pemberian Nilai Berdasarkan Acuan Kelompok
Pemberian nilai sejenis ini menggunakan kelompok sebagai kriteria. Nilai
peserta tes ditentukan oleh posisinya dalam kelompok. Misalnya seorang
peserta Diklat mendapat sekor 75 (hanya 75% dari tujuan instruksional yang
dicapai) dapat diberi nilai 9 dalam penilaian acuan kelompok. Atau peserta
Diklat yang hanya mendapat sekor 35 dapat diberi nilai 6, sehingga dapat lulus
dalam tingkat penguasaan 35%. Tetapi dapat terjadi bahwa Peserta Diklat yang
mendapat sekor 75 tidak berhasil lulus karena peserta-peserta lain dalam
kelompoknya mendapat nilai di atas 75 (75% dari tujuan tercapai). Ada
beberapa cara yang dapat ditempuh dalam pemberian nilai dengan
menggunakan acuan kelompok, yang akan dibahas dengan menggunakan
beberapa skala penilaian.
B. Skala Penilaian
Untuk mengubah sekor menjadi nilai digunakan teknik analisis tertentu dan
skala penilaian sebgai berikut.
1. Skala Sebelas
Skala sebelas atau “standard Eleven” yang disingkat Stanel adalah cara
mengubah sekor mentah yang diperoleh peserta tes ke dalam 11 kelompok
nilai, yaitu 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, dan 10. Skala ini paling biasa, sering , dan
paling mudah proses perhitungannya.
Ada dua cara pengolahan dengan menggunakan skala 11, yaitu dengan (1)
menghitung prosesntase tingkat penguasaan, dan (2) pendekatan distribusi
normal sistem PAP dan PAN.
2. Skala Sepuluh
Dengan menggunakan skala 10, maka sekor mentah ditransfer ke dalam nilai 1,
2, 3, 4, 5, 6, 7, 8, 9, dan 10. Pembagian interval untuk skala 10 dilakukan dengan
cara selang kurva normal dibagi menjadi 10 selang bagian yang sama jaraknya,
yaitu 0,6 s. Cara lain yang lebih mudah dan banyak dipakai adalah dengan
EVALUASI PENDIDIKAN Halaman 41
menggunakan selang konversi untuk skala 11, dengan membuang satu selang
yang paling kiri pada kurva normal atau paling bawah pada tabel konversi.
3. Skala Sembilan
Skala sembilan atau “standard nine” yang disingkat Stanin. Dengan
menggunakan skala 9, maka sekor mentah ditransfer ke dalam nilai 1, 2, 3, 4, 5,
6, 7, 8, dan 9. Pembagian interval untuk skala 9 dilakukan dengan cara selang
kurva normal dibagi menjadi 9 selang bagian yang sama jaraknya, yaitu 0,67s.
Cara lain yang lebih mudah dan banyak dipakai adalah dengan menggunakan
selang konversi untuk skala 10, dengan membuang satu selang yang paling
kanan pada kurva normal atau paling atas pada tabel konversi.
4. Skala Lima
Skala lima disebut pula skala huruf karena nilai akhir biasanya tidak dinyatakan
dengan angka, melainkan dengan huruf A, B, C, D, dan E. Pembagian interval
untuk skala 5 dilakukan dengan cara selang kurva normal dibagi menjadi 5
selang bagian yang sama jaraknya, yaitu 1,20s atau 1s. Misalkan seorang
instruktur menentukan batas lulus dalam suatu tes, jika pesera tes telah
menguasai 40% atau lebih dari materi yang harus dikuasainya. Tabel konversi
yang dapat digunakan adalah:
90% A 100% istimewa, sangat baik
75% B < 90% baik
55% C < 75% sedang, cukup
40% D < 55% kurang
00% E < 40% jelek, buruk, tidak lulus
5. Skala Baku
Agar sekor mentah mempunyai arti kaitannya dengan posisi atau kedudukan
relatif secara keseluruhan, diperlukan adanya sekor yang dapat dibandingkan
satu sama lain yang disebut sekor baku. Sekor baku disebut juga skala baku atau
sekor Z.
EVALUASI PENDIDIKAN Halaman 42
Sekor baku adalah sekor mentah yang ditransformasikan secara linear ke dalam
bentuk lain berdasarkan rata-rata hitung dan deviasi standar distribusinya.
Konversi sekor mentah X menjadi sekor baku Z dilakukan dengan menggunakan
rumus konversi Z seperti berikut.
bakudeviasis
hitungratarataX
ikementahskorX
zskorZdenganS
XXZ
i
i
:
Misalnya Peserta Diklat memperoleh sekor 75 pada pelajaran A dan
memperoleh sekor 90 pada pelajaran B. Dari sekor ini belum dapat ditentukan
pada pelajaran mana Peserta Diklat tersebut lebih berprestasi. Apabila rata-rata
sekor pelajaran A (X) = 55 dan deviasi bakunya (S) = 10, sedangkan untuk
pelajaran B rata-ratanya (X) = 80 dan deviasi bakunya (S) = 12.
Untuk pelajaran A: Untuk pelajaran B:
210
5575
Z 83.0
12
8090
Z
melalui perhitungan sekor- Z dapat dibandingkan posisi relatif kedua sekor
peserta Diklat tersebut. Tampak bahwa prestasi pada pelajaran A relatif lebih
baik dibandingkan pada pelajaran B.
6. Skala Seratus
Nilai dengan menggunakan skala 100 disebut juga sekor T yang bergerak dari 10
sampai dengan 90. Sekor T mempunyai rata-rata 50 dan simpangan baku 10.
Rumus sekor T adalah:
T = 50 + 10Z atau T = 50 + 10
s
XX i
Jika nilai Z pada skala Z di atas ditransformasikan ke sekor T, maka diperoleh:
Untuk pelajaran A: Untuk pelajaran B:
EVALUASI PENDIDIKAN Halaman 43
T = 50 + 10(2) =70 T = 50 + 10(0.83) =58,3
Jadi prestasi peserta diklat tersebut pada pelajaran A relatif lebih baik
dibandingkan pada pelajaran B.
C. Sekor Komposit dan Nilai Akhir
Dalam kaitannya dengan penilaian, terkadang sekor harus diperoleh dari
beberapa kali pelaksanaan tes. Sekor yang dipakai dalam kasus seperti ini adalah
sekor akhir. Jika sekor akhir diperoleh dari beberapa komponen, misalnya dari
ujian formatif, kuis harian, tugas rumah, dan ujian akhir, maka sekor tunggal
diperoleh dengan melakukan penggabungan sekor dari berbagai komponen
disebut sekor komposit. Sekor komposit merupakan ukuran yang lebih reliabel
terhadap prestasi peserta tes daripada sekor yang diperoleh dari satu tes saja.
Penetapan sekor komposit dimaksudkan untuk memperoleh satu ukuran yang
mencerminkan secara proporsional berbagai sumber sekor dari berbagai
komponen yang diujikan secara terpisah. Salah satu rumusan sekor komposit
misalnya adalah:
Sekor komposit =
b
bz
dimana b = bobot komponen, z = sekor- z pada setiap komponen
Pembobotan komponen ditentukan dengan melihat urgensi komponen yang
bersangkutan dalam program pengajaran. Apabila tugas praktikum, misalnya
sangat penting dalam penguasaan suatu pelajaran, maka sekor pada tugas ini
harus diberi bobot lebih tinggi. Jika ujian formatif mencakup setengah dari
keseluruhan materi pelajaran, maka sekor pada ujian tersebut perlu diberi
bobot yang sama besar dengan ujian akhir.
EVALUASI PENDIDIKAN Halaman 44
Contoh menentukan sekor komposit.
Misalnya nilai akhir Diklat PSD diperoleh dari ujian teori dengan bobot 60% dan
ujian praktek laboratorium 40%. Ujian teori menggunakan tes pilihan ganda
dengan jumlah butir 50 sehingga sekor mentah ujian teori adalah (0 – 50),
sedang ujian praktikum diberi sekor mentah (0 – 10). Karena kedua sekor tidak
layak banding maka sebelum dibandingkan kedua sekor harus dibakukan dulu
menjadi sekor T, dengan rumus T = 50 + 10Z.
Hasil ujian teori dan ujian praktikum 15 orang siswa
Keterangan: (data fiktif)
No Sekor Teori (X1) Sekor Praktek(X2)
T1 T2 N
1 46 5 69,96 42,30 58,90
2 40 8 55,70 61,55 58,00
3 42 4 60,46 35,88 50,63
4 30 6 31,94 48,72 38,65
5 36 8 46,20 61,55 52,34
6 36 6 46,20 35,88 42,07
7 36 6 46,20 48,72 47,21
8 38 7 50,95 61,55 55,20
9 38 5 50,95 48,72 50,06
10 34 5 41,44 48,72 44,35
11 34 7 41,44 55,14 46,92
12 32 3 36,69 29,46 33,80
13 40 9 55,70 67,97 60,61
14 38 7 50,95 55,14 52,63
15 44 7 65,21 55,14 61,18
EVALUASI PENDIDIKAN Halaman 45
Penyelasaian:
558,1220,6210
46:208,416,371 21
SX
TTNRumusSX
61,6010
)97,67(4)70,55(6
MN 63,52
10
)14,55(4)95,50(6
NN
Nilai-nilai tersebut adalah nilai dalam bentuk sekor T, nilai akhit harus
disesuaikan dengan rentangan nilai sesuai kebutuhan.
Penentuan nilai akhir ini dilakukan terutama pada saat pendidik akan mengisi
nilai raport. Beberapa rumus yang mencerminkan sekor komposit yang dapat
digunakan antara lain sebagai berikut.
a) Penentuan nilai akhir dengan mempertimbangkan nilai tes formatif dan tes
sumatif
NA =3
2)........( 21 S
n
FFF n
Keterangan:
NA = Nilai Akhir
F = Nilai tes formatif
S = Nilai tes sumatif
b) Penentuan nilai akhir dengan mempertimbangkan nilai tugas, nilai formatif dan
nilai sumatif dengan bobot 2, 3, dan 5.
NA =10
532 SFT
Keterangan:
T = Nilai Tugas, F = Nilai tes formatif , S = Nilai tes sumatif
c) Penentuan nilai akhir dengan mempertimbangkan nilai formatif, nilai formatif
dan nilai praktek dengan bobot 2, 2, dan 1.
EVALUASI PENDIDIKAN Halaman 46
NA =5
22 PFT
Keterangan:
T = Nilai tes formatif
F = Nilai tes sumatif
P = Nilai tes praktek
D. Daya Serap
Dengan menentukan daya serap peserta tes, dapat diketahui materi mana
yang telah dikuasai dan mana yang belum dikuasai. Dalam ruang lingkup yang lebih
besar dapat diketahui keberhasilan belajar dalam berbagai mata pelajaran. Hal ini
berguna sebagai feed back untuk perbaikan pengajaran yang akan dilaksanakan
kemudian.
Pengertian daya serap itu sendiri adalah sebagai prosentase penguasaan peserta tes
terhadap bahan pelajaran yang telah dipelajarinya atau materi tes yang telah
disajikan. Ada beberapa daya serap, diantaranya daya serap pokok/sub pokok
bahasan, daya serap mata pelajaran, dan daya serap umum.
a.Daya serap Kompetensi Dasar
Daya serap Kompetensi Dasar ditentukan dengan cara menghitung rata-rata
prosentase jawaban benar dari semua soal yang disajikan dalam Kompetensi
Dasar.
Tabel. Daya Serap Kompetensi Dasar X
Nomor Soal Prosentase
1
2
3
4
5
90%
85%
70%
45%
15%
Rata-rata 61%
EVALUASI PENDIDIKAN Halaman 47
Misalkan untuk soal yang berkenaan dengan Kompetensi Dasar X, disajikan 5
butir soal dengan prosentase jawaban benar seperti pada tabel di atas. Tampak
pada tabel bahwa daya serap Kompetensi Dasar X adalah 61%.
b. Daya serap pokok bahasan
Daya serap mata pelajaran adalah rerata prosentase jawaban benar dari seluruh
pokok bahasan dalam mata pelajaran tertentu. Misalkan untuk pokok bahasan
berkenaan dengan mata pelajaran A, disajikan 6 pokok bahasan dengan daya
serap sebagai berikut.
Tabel Daya Serap pokok bahasan
No Pokok Bahasan Daya Serap
1
2
3
4
5
6
Persamaan Kuadrat
Suku Banyak dan Teorema Sisa
Fungsi Eksponen dan Logaritma
Vektor
Fungsi f(x) = a Cos x + b Sin x
Diferensial dan Integral
75%
85%
82%
65%
67%
40%
Rata-rata 69%
Keterangan: cantoh dan data fiktif
Tanpak pada tabel di atas bahwa daya serap Mata Pelajaran Matematika
adalah sebesar 69%.
c. Daya serap umum
Daya serap umum adalah rerata dari daya serap seluruh mata pelajaran. Pada
tabel di atas merupakan contoh dari daya serap salah satu mata pelajaran. Tabel
berikut merupakan contoh daya serap umum.
EVALUASI PENDIDIKAN Halaman 48
Tabel Daya Serap Mata Pelajaran
No Mata Pelajaran Daya Serap
1
2
3
4
5
6
PPKn
Pendidkan Agama
Bahasa Indonesia
Matemátika
IPA
IPS
69%
80%
65%
75%
87%
62%
Rata-rata 73%
Keterangan: data fiktif
Tampak pada tabel di atas bahwa daya serap seluruh Mata Pelajaran adalah
73%.
E. Penentuan Peringkat
Peringkat atau rank adalah suatu istilah untuk menyatakan kedudukan
seseorang peserta tes dalam kelompoknya menurut urutan tingkatan. Proses
penentuan rank disebut rangkin, yaitu dengan cara mengurutkan nilai-nilai peserta
mulai dari sekor paling tinggi menuju ke sekor paling rendah.
Ada beberapa macam cara untuk menentukan peringkat, diantaranya dengan
menggunakan:
1. Peringkat sederhana (Simple Rank)
Peringkat sederhana merupakan urutan yang dinyatakan dengan nomor
untuk menunjukkan letak kedudukan peserta tes dalam kelompoknya.
Misalkan dalam suatu pelatihan terdiri dari 20 orang peseta didik, dengan nilai
untuk setiap peserta adalah seperti di bawah ini.
Salman = 73 Rani = 63 Kajol = 86 Poeja = 56
Vijay = 48 Esha = 63 Ajay = 73 Kumar = 47
Fikran = 55 Rahul = 90 Taqur = 84 Juhi = 73
Dixit = 65 Rohan = 69 Liza = 56 Dian = 82
EVALUASI PENDIDIKAN Halaman 49
Anjani = 77 Mirza = 57 Desi = 56 Inul = 56
Untuk menentukan peringkat dari 20 peserta tersebut di atas, dilakukan
dengan langkah-langkah sebagai berikut.
(i) urutkan nilai-nilai tersebut dari yang tertinggi ke terendah;
(ii) beri nomor urut sesuai dengan urutan pada bagian (i);
(iii) untuk nomor urut yang menyatakan satu nilai, maka nomor urut tersebut
adalah nomor peringkat peserta yang bersangkutan;
(iv) untuk nomor urut yang menyatakan dua nilai, nomor peringkat untuk kedua
peserta yang bersangkutan adalah rerata dari dua nomor urut tersebut.
Begitupula untuk tiga nomor urut yang menyatakan tiga nilai sama, dan
seterusnya.
Tabel Peringkat Sederhana
Sekor Terurut Nomor Urut Peringkat Subyek
90
86
84
82
77
73
73
73
69
65
63
63
57
56
56
1
2
3
4
5
876
9
10
1211
13
1
2
3
4
5
7)876(3
1
9
10
2
111)1211(
2
1
13
Rahul
Kajol
Taqur
Dian
Anjani
JuhiAjaySalman
Rohan
Dixit
EshaRani
Mirza
EVALUASI PENDIDIKAN Halaman 50
56
56
55
48
47
17161514
18
19
20
2
115)17161514(
4
1
18
19
20
InulPoejaDesiLiza
Fikran
Vijay
Kumar
Keterangan: nama dan data fiktif
Tolok ukur untuk membandingkan peserta tes adalah jumlah seluruh peserta
dalam kelompoknya. Dengan demikian untuk menuliskan peringkat peserta
harus disertai dengan jumlah seluruh siswa dalam kelompoknya. Misalnya
peringkat untuk “Anjani” adalah 5 dari 20 atau biasa ditulis 5/20. Jadi Anjani
tergolong 5 orang pandai di kelompoknya. Peserta lainnya, yaitu sebanyak
15 orang prestasinya adalah di bawah Anjani.
Dalam praktek peserta yang nilainya sama kadang-kadang diberi peringkat
berbeda dengan meninjau aspek-aspek lain, misalnya kerajinan, gains,
disiplin, kesungguhan, kreativitas dan aktivitas lainnya.
2. Peringkat dengan Simpangan Baku
Peringkat dengan menggunakan simpangan baku menggolongkan peserta tes
dalam kelompok-kelompok kecil yang dibatasi oleh suatu simpangan baku
tertentu. Pengelompokan ini ada dua cara, yaitu pengelompokan menjadi tiga
peringkat dan pengelompokan menjadi beberapa peringkat.
Pengelompokan menjadi 3 peringkat menggunakan kurva normal standar, yaitu:
a. Kelompok atas sebanyak 15,87% yang berada pada interval lebih dari atau
sama dengan SX 1
b. Kelompok tengah sebanyak 68,26% yang berada pada interval dari
SX 1 sampai SX 1
EVALUASI PENDIDIKAN Halaman 51
c. Kelompok bawah sebanyak 15,87% yang berada pada interval lebih dari
atau sama dengan SX 1 .
Sebagai contoh dengan menggunakan data tabel 4.1 diperoleh X 66,45 dan
s = 13,52. Kemudian dihitung batas-batas kelompok: SX 1 = 78,97 dan
SX 1 = 53,93, sehingga pengelompokan itu adalah: Kelompok atas : X
78,97, sebanyak 4 orang;
Kelompok tengah : 53,93 X 78,97, sebanyak 14 orang;
Kelompok bawah : X 53,93, sebanyak 2 orang.
Pengelompokan yang lain adalah dengan pembagian ke dalam 5 kelompok, 9
kelompok, kelompok 10 dan 11 yang prinsipnyan sama dengan pembagian dalam 3
kelompok di atas.
PUSTAKA ACUAN
Bloom, Benyamin S (1979). Taxonomy of Educational Objective. London: Longman,1979.
Bloom, Benyamin S, et al.(1985) Evaluation to Improve Learning. New York:McGraw-Hill Book Company, 1981.
Djaali. (2004). Pengukuran Dalam Bidang Pendidikan. Jakarta: PPs UniversitasNegeri Jakarta
Nana Sudjana. 2006. Penilaian Hasil Proses Belajar Mengajar. Bandung:
Remaja Rosdakarya.
Nana Sudjana, R. Ibrahim. 2000. Penelitian dan Penilaian Guruan. Bandung: SinarBaru.
Suherman, Erman. (1990). Penilaian Pendidikan Matematika. Bandung:Wijayakusuma
Nitko, Anthony J. Educational Assessment of Students. Ohio: Merril, 1996.
Suryabrata, Sumadi. Pengembangan Alat Ukur Psikologis, Yogyakarta: PenerbitANDI, 2000.