DASAR-DASAR EVALUASI PENDIDIKAN(SUHARISMI ARIKUNTO.docx

271
TUGAS DASAR-DASAR EVALUASI PENDIDIKAN Dosen Pembimbing : Mastur Toyib, Drs, MM.MPd PENYUSUN : 1.Aidah 2. Alia Rosna Arlaeli 3. Dewi Purnama Sari 4. Dewi Maharani 5. Lilis Lisnawati 6. Santi Susanti DIV Kebidanan Bhakti Pertiwi Indonesia Tahun 2015

Transcript of DASAR-DASAR EVALUASI PENDIDIKAN(SUHARISMI ARIKUNTO.docx

Page 1: DASAR-DASAR EVALUASI PENDIDIKAN(SUHARISMI ARIKUNTO.docx

TUGAS

DASAR-DASAR EVALUASI PENDIDIKAN

Dosen Pembimbing : Mastur Toyib, Drs, MM.MPd

PENYUSUN :

1. Aidah2. Alia Rosna Arlaeli3. Dewi Purnama Sari4. Dewi Maharani5. Lilis Lisnawati6. Santi Susanti

DIV Kebidanan Bhakti Pertiwi Indonesia

Tahun 2015

Page 2: DASAR-DASAR EVALUASI PENDIDIKAN(SUHARISMI ARIKUNTO.docx

BAB I PENDAHULUAN

1. Pengertian Pengukuran, Penilaian dan Evaluasi

Memang tidak semua orang menyadari bahwa setiap saat kita selalu

melakukan pekerjaan evaluasi. Dalam beberapa kegiatan sehari-hari, kita

jelas-jelas mengadakan pengukuran dan penilaian.

Dari dua kalimat diatas kita sudah menemui tiga buah istilah, yaitu

evaluasi, pengukuran, dan penilaian. Sementara orang memang lebih

cenderung mengartikan ketiga kata tersebut sebagai suatu pengertian yang

sama sehingga dalam penggunaannya hanya tergantung dari kata mana

yang siap untuk diucapkan dan sementara orang yang lainnya

membedakan ketiga istilah tersebut. Dan untuk memahami apa persamaan,

perbedaan ataupun hubungan antara ketiganya, dapat dipahami melalui

contoh-contoh di bawah ini :

a. Apabila ada orang yang akan memberi sebatang pensil kepada kita

dan kita disuruh memilih antara dua pensil yang tidak sama

panjangnya maka tentu saja kita akan memilih yang “panjang” kita

tidak akan memilih yang “pendek” kecuali ada alasan yang sangat

khusus.

b. Pasar merupakan suatu tempat bertemunya orang-orang yang akan

menjual dan membeli. Sebelum menentukan barang yang akan

dibeli. Seorang pembeli akan memilih dahulu mana barang yang

lebih “baik” menurut ukurannya. Apabila ia ingin membeli jeruk,

dipilihnya jeruk yang besar, kuning dan kulitnya halus. Semuanya

itu dipertimbangkan karena menurut pengalaman sebelumnya, jenis

jeruk-jeruk yang demikian ini rasanya akan manis, sedangkan jeruk

yang masih kecil, hijau dan kulitnya agak kasar, biasanya masam

rasanya.

Dari contoh-contoh diatas ini dapat kita simpulkan bahwa sebelum

menentukan pilihan, kita melakukan penilaian terhadap benda-benda yang

akan kita pilih. Pada contoh pertama kita memilih nama pensil yang lebih

Page 3: DASAR-DASAR EVALUASI PENDIDIKAN(SUHARISMI ARIKUNTO.docx

panjang, sedangkan contoh kedua kita menentukan dengan pikiran kita

atas jeruk yang baik, yaitu rasanya yang manis.

Untuk dapat mengadakan penilaian, kita melakukan pengukuran

terlebih dahulu. Jika ada penggaris, maka sebelum menentukan mana

pensil yang lebih panjang, kita ukur dahulu kedua pensil tersebut, dan

setelah mengetahui berapa panjang masing-masing pensil itu, kita

melakukan penilaian dengan melihat bandingan panjang antara kedua

pensil tersebut. Dapatkah kita menyatakan “ini pensil panjang, dan ini

pensil “pendek”. Maka pensil yang panjang itulah yang kita ambil.

Untuk menentukan penilaian mana jeruk yang manis, kita tiidak

menggunakan “ukuran manis”, tetapi menggunakan ukuran besar, kuning

dan halus kulitnya. Ukuran ini tidak mempunya wujud seperti kayu

penggaris yang sudah ditera, tetapi diperoleh berdasarkan pengalaman.

Sebenarnya kita juga mengukur, yakni membandingkan jeruk-jeruk

yang ada dengan ukuran tertentu. Setelah itu kita menilai dan menentukan

pilihan, mana jeruk yang paling memenuhi ukuran itulah yang kita ambil.

Dengan demikian kita mengenal dua macam ukuran, yakni ukuran

yang terstandar (meter, kilogram, takaran dan sebagainya) dan ukuran

tidak standar (depa, jengkal, langkah dan sebaginya), dan ukuran perkiraan

berdasarkan hasil pengalaman (jeruk manis adalah yang kuning, besar dan

halus kulitnya)

Dua langkah kegiatan yang dilalui sebelum mengambil barang

untuk kita ituah yang disebut mengadakan evaluasi, yakni mengukur dan

menilai. Kita dapa mengadakan penilaian sebelum kita mengadakan

pengukuran.

Mengukur adalah membandingkan sesuatu dengan satu ukuran.

Pengukuran bersifat kuantitatif

Menilai adalah mengambil suatu keputusun terhadap suatu dengan

ukuran baik buruk. Penilaian bersifat kualitatif.

Mengadakan evaluasi meliputi kedua langkah diatas, yakni

mengukur dan menilai.

Page 4: DASAR-DASAR EVALUASI PENDIDIKAN(SUHARISMI ARIKUNTO.docx

Di dalam istilah asingnya, pengukuran adalah measurement,

sedangkan penilaian adalah evaluation. Dari kata evaluation inilah

diperoleh kata indonesia evaluasi yang berarti menilai (tetapi dilakukan

dengan mengukur terlebih dahulu). Dibuku ini ketiga istilah tersebut

digunakan bergantian tanpa mengubah makna.

2. Penilaian Pendidikan

Meskipun kini memiliki makna yang lebih luas, namun pada awalnya

pengertian evaluasi pendidikan selalu dikaitkan dengan prestasi belajar

siswa. Definisi yang pertama dikembangkan oleh Ralph Tyler (1950).

Ahli ini mengatakan bahwa evaluasi merupakan sebuah proses

pengumpulan data untuk menentukan sejauh mana, dalam hal apa, dan

bagian mana tujuan pendidikan sudah tercapai, jika belum, bagaimana

yang belum dan apa sebabnya. Definisi yang lebih luas dikemukakan oleh

dua orang ahli lain yakni Cronbach dan Stufflebeam. Tambahan definisi

tersebut adalah bahwa proses evaluasi bukan sekedar mengukur sejauh

mana tujuan tercapai, tetapi digunakan untuk membuat keputusan.

Yang dibahas dalam buku ini terutama adalah evaluasi pendidikan

dalam institusi pendidikan, tetapi mengkhususkan evaluasi hasil belajar.

Apabila disinggung sedikit tentang evaluasi hal-hal lain, tentu terkait

dengan prestasi atau hasil belajar, baik langsung maupun tidak.

Pembicaraan tentang evaluasi dalam lingkup yang lebih luas, disajikan

dalam buku lain, yaitu Evaluasi Program. Dalam buku tersebut dibahas

secara panjang lebar bagaimana gutu menelusuri terjadinya prestasi belajar

siswa melalui latar belakang serta faktor-faktor lain yang mungkin

memengaruhinya.

Dalam pembelajaran yang terjadi di sekolah atau khususnya di

kelas, guru adalah pihak yang paling bertanggung jawab atas hasilnya.

Dengan demikian guru patut dibekali dengan evaluasi sebagai ilmu yang

mendukung tugasnya, yakni mengevaluasi hasil belajar siswa. Dalam hal

ini guru bertugas mengukur apakah siswa sudah menguasai ilmu yang

Page 5: DASAR-DASAR EVALUASI PENDIDIKAN(SUHARISMI ARIKUNTO.docx

dipelajari oleh siswa atas bimbingan guru sesuai dengan tujuan yang

dirumuskan.

Menurut pengertian lama, pencapaian tujuan pembelajaran yang

berupa prestasi belajar, merupakan hasil dari kegiatan belajar-mengajar

semata. Dengan kata lain, kualitas kegiatan belajar-mengajar adalah satu-

satunya faktor penentu bagi hasilnya. Pendapat seperti itu kini sudah tidak

berlaku lagi. Pembelajaran bukanlah satu-satunya faktor yang menentukan

prestasi belajar. Karena prestasi merupakan hasil kerja (ibarat sebuah

mesin) yang keadaanya sangat kompleks.

Apabila sekolah diumpamakan sebagai tempat mengolah sesuatu

dan calon siswa diumpamakan sebagai bahan mentah maka lulusan dari

sekolah itu dapat disamakan dengan hasil olahan yang sudah siap

digunakan. Dalam istilah inovasi yang menggunakan teknologi maka

tempat pengolah ini disebut transformasi.

Jika digambarkan dalam bentuk diagram akan dilihat sebagai

berikut :

Input

Input adalah bahan mentah yang dimasukan ke dalam transformasi.

Dalam dunia sekolah maka yang dimaksud dengan bahan mentah

adalah calon siswa yang baru akan memasuki sekolah. Sebelum

memasuki suati tingkat sekolah (institusi), calon siswa itu dinilai

dahulu kemampuannya. Dengan penilaian itu ingin diketahui

apakah kelak ia akan mampu mengikuti pelajaran dan

melaksanakan tugas-tugas yang akan diberikan kepadanya.

Output

Yang dimaksud sebagai output atau keluaran adalah bahan jadi

yang dihasilkan oleh transformasi. Yang dimaksud dalam

pembicaraan ini adalah siswa lulusan sekolah yang bersangkutan.

Untuk dapat menentukan apakah seoarang siswa berhak lulus atau

Page 6: DASAR-DASAR EVALUASI PENDIDIKAN(SUHARISMI ARIKUNTO.docx

Input Transformasi Output

Umpan Balik

tidak, perlu diadakan kegiatan penilaian, sebagai alat penyaring

kualitas.

Transformasi

Transformasi dapat diibaratkan sebagai sebuah mesin yang

berproses mengubah bahan mentah menjadi susuatu agar berada

dalam keadaan matang. Menurut kamus inggir-indonesia, kata

transform terdiri dari dua kata, trans (terjemahan-perubahan) dan

form (bentuk). Jadi trasformasi dalam pembelajaran diartikan

sebagai proses pergantian atau perubahan bentuk atau pengolahan

sesuatu agar berubah menjadi bentuk lain. Transformasi yang

sedang kita bicarakan ini adalah transformasi dalam arti umum

sebagaimana yang dipahami oleh umum yaitu pergantian bentuk

antara sebelum dan sesudah mengikuti kegiatan di sebuah lembaga

pendidikan. Siswa yang sedang belajar diumpamakan sesuatu yang

dimasukan ke dalam pemrosesan untuk diubah dari “belum tahu

atau belum dapat” agar menjadi”sudah tahu atau sudah dapat”.

Ketika siswa pertama masuk sekolah, keadaanya masih

“mentah” yang diubah atau diproses agar menjadi matang. Dalam

istilah transformasi bahan mentah yang akan diolah tersebut

dikenal sebagai “masukan” yang dalam bahasa inggrisnya disubut

input. Oleh karena keadaanya masih mentah, disebut “masukan

mentah” bahasa inggrisnya raw input. Sesudah diolah dan berubah

bentuk menjadi matang, lalu dikeluarkan dari alat transformasi,

disebut keluaran dalam bahasa inggris adalah output. Dalam

Page 7: DASAR-DASAR EVALUASI PENDIDIKAN(SUHARISMI ARIKUNTO.docx

keseluruhan transformasi sebetulnya output saja belum

mencerminkan keluaran yang sesungguhnya. Ibarat dalam

kelulusan, nilai siswa baik semua, bahkan mungkin cumlaude

(lulus dengan pujian), tetapi masih diragukan, apakah nilai yang

bagus tersebut sudah mencerminkan kinerja yang bagus di

masyarakat atau tidak. Untuk contoh, nilai siswa lulusan sekolah

menengah kejuruan teknik otomotif semua 8 bahkan 9, tetapi

ketika diserahi sepeda motor rusak, tidak dapat menemukan apa

penyebabnya. Siswa ini outputnya baik, tetapi tidak dapat

menunjukan kemampuannya dalam praktek. Kemampuan

melaksanakan tugas di lapangan ini disebut keluaran nyata atau

outcome. Jadi harapan lembaga pendidikan, siswa bukan hanya

mempunyai output baik, tatapi outcomenya harus baik.

Dalam proses transformasi, selain siswa sebagai bahan yang

diolah, masih ada 2 (dua) masukan lain. Yang pertama berfungsi

membantu atau memperlancar terjadinya proses, sedangkan yang

kedua berupa lingkungan yang berpengaruh terhadap terjadinya

proses. Masukan-masukan lain tersebut juga disebut input, tetapi

berbeda peran,. Agar tidak kacau dalam mengartikan, karena

statusnya berbeda, namanya pun berbeda.

a. Siswa yang akan diubah dalam proses, yang akan diubah

dari mentah menjadi matang disebut “masukan mentah”

yang dalam bahasa inggris disebut “raw input”

b. Masukan pendukung terjadinya proses ini disebut masukan

instrumental. Faktor-faktor yang masuk dalam masukan

instrumental ada 4 (emapat) yaitu (1)guru, (2)materi,

(3)sarana pendidikan dan (4)pengelolaan manajemen atau

pengaturan. Keempat masukan tersebut karena fungsinya

membantu atau sebagai alat, disebutk” masukan

Page 8: DASAR-DASAR EVALUASI PENDIDIKAN(SUHARISMI ARIKUNTO.docx

Guru Materi Sarana Pengelolaan

Proses HasilSiswa

Proses

instrumental” atau masukan pembantu dalam bahasa inggris

disebut Instrumental input.

c. Masukan lain lagi adalah lingkungan, baik berupa benda,

alam, maupun manusia. Masukan lingkungan ini dalam

bahasa inggris disebut Environmental input.

Program Pemrosesan Pembelajaran

Pengertian riil dari transformasi sebenarnya bukan hanya

“pengolahan” peserta didik dari masuk sampai lulus, tetapi

meliputi semua bentuk proses, mulai dari proses yang paling

sempit dan singkat, yaitu proses pembelajaran di kelas, di

laboratorium atau di tempat praktik selama satu penggalan jam

pelajaran atau penggalan waktu tertentu. Di dalam proses

pembelajaran di kelas atau di tempat lain, guru, instruktur atau

apapun namanya. Bertugas membimbing peserta didik yang sedang

belajar. Mereka melakukan usaha mengubah bentuk subjek yang di

bimbing agar menjadi sebagaimana diinginkan, yaitu mencapai

tujuan pembelajaran. Setiap guru atau instruktur harus memahami

peranyang penting tersebut. Jika ilmu pengetahuan atau

kemampuan peserta didik sesudah keluar dari kelas attau

laboratorium masih sama dengan ketika masuk (sebelum memulai

kegiatan) ini artinya mutu peserta didik masih sama dengan

semula, tidak mengalami perubahan. Guru kelas atau guru

Page 9: DASAR-DASAR EVALUASI PENDIDIKAN(SUHARISMI ARIKUNTO.docx

pembimbing laboratorium harus merasa bersalah jika peserta didik

tidak mengalami perubahan, bahkan harus merasa berdosa karena

sudah menahan peserta didik berlama-lama di kelas atau di

laboratorium tetapi kemampuannya sama dengan ketika masuk.

Ketika lulus dari sekolah, siswa dipandang sudah “matang”

karena sudah memiliki pengetahuan, keterampilan dan sikap-sikap

tertentu yang diperoleh ketika mengikuti pelajaran di sekolah.

Dengan mengingat bahwa yang terlibat dalam proses transformasi,

yaitu pengubahan bentuk dari mentah menjadi matang, terdapat

banyak faktor yang mengetahui, maka mutu atau tingkat

kematangan aspek-aspek yang digarap dalam transformasi sangat

tergantung dari kinerja setiap faktor yang memengaruhi tersebut.

Sebagai pemikiran logis dari uraian tersebut, maka dalam

mengadakan penilaian terhadap tingkat keberhasilan pembelajaran,

guru atau instruktur harus selalu menyadari dan bermaksud

mencapai tujuan pembelajaran, yaitu mengubah mutu peserta didik

seperti yang diharapkan, mestinya, guru yang menyaksikan ketika

siswa keluar dari kelas tidak terjadi perubahan dibandingkan ketika

masuk merasa sedih, karena tidak berhasil mengubah masukan

mentah menjadi matang. Setiap guru yang sedang dan sudah

terlibat dalam proses transformasi harus menyadari, jika mutu

transformasi dalam satu pertemuan itu baik, ramgkaian proses

transformasi tentu juga baik, kemudian pada akhir pendidikan akan

terkumpul proses transformasi yang baik.

Untuk lebih jelasnya, perlu kita sepakati pengertian

penilaian pendidikan yaitu suatu upaya untuk mengetahui seberapa

tinggi tingkat keberhasilan kegiatan pendidikan, dengan maksud

untuk mengetahui peran masing-masing input. Oleh karena

masing-masing sudah ditentukan bagaimana kondisi harapanya,

maka dalam mengevaluasi diharapkan agar evaluasi dapat berperan

Page 10: DASAR-DASAR EVALUASI PENDIDIKAN(SUHARISMI ARIKUNTO.docx

aktif memperbaiki mutu pendidikan, marilah kita cermati masing-

masing.

a. Masukan Mentah (Raw Input)

Meskipun masukan instrumental penting sekali kedudukannya

sebagai penentu mutu keberhasilan keluaran, aka tetapi

masukan mentah itu sendiri berperan sangat penting dan

menentukan. Dalam kegiatan kegiatan penilaian ingin

mengetahui aoakah ketika mengikuti proses transformasi

mereka bersungguh-sungguh dan aktif berfikir sehingga setelah

selesai mengikuti proses transformasi, masukan tersebut sudah

berubah menjadi keluaran yang berbeda dari semula, dalam arti

kondisinya lebih baik dan sesuai dengan tujuan yang ditetakan.

b. Masukan instrumental (instrumental Input)

Dalam penilaian, penilaian ingin mengetahui apakah unsur-

unsur yang ada dalam masukan tersebut sudah berfungsi

sebagaimana yang seharusnya oleh karena ada beberapa unsur

dalam masukan instrumental, yaitu guru, meteri kurikulum,

sarana pendidikan, dan pengelolaan, maka dalam penilaian

perlu dicermati kinerja masing-masing unsur tersebut. Penilaian

harus dilakukanterhadap masing-masing faktor tersebut secara

rinci. Hasil dari penilaian rinci tersebut didasarkan atas kondisi

yang diharapkan, artinya yang baik untuk masing-masing

bagian dari faktor faktor itu. Untuk kondisi guru yang

diharapakan, sudah ada pedoman dari kementrian pendidikan

nasional yang dikenal dengan persyaratan guru profesional.

Ada sepuluh persyaratan guru profesional yaitu : (1) menguasai

materi yang diajarkan, (2) menguasai teori pendidikan, (3)

dapat menguasai pengelolaan kelas, (4) menguasai interaksi

belajar mengajar, (5) mampu memilih dan menggunakan

metode mengajar, (6) mampu memilih dan menggunakan alat

pelajaran, media pembelajaran, dan alat peraga. (7) mampu

Page 11: DASAR-DASAR EVALUASI PENDIDIKAN(SUHARISMI ARIKUNTO.docx

melaksanakan evaluasi hasil belajar, (8) mampu melaksanakan

bimbingan dan konseling, no 9 dan 10 belum ada.

1. Masukan Guru

Penilaian terhadap masukan guru dilakukan untuk

mengetahui apakah kinerja guru ketika menyajikan materi

di kelas atau di laboratorium sudah baik, artinya

menggunakan metode yang tepat, penjelasan yang diberikan

kepada siswa. Apakah guru dapat menguasai kelas dengan

baik, artinya, mana siswa yang memperhatikan dan mana

yang tidak, apakakah guru memberikan bimbingan ulang

kepada siswa yang belum mengerti, dan sebagainya.

Dengan kata lain. Dalam menilai masukan guru, penilai

ingin mengetahui apakah guru tersebut sudah berperan

dengan benar dalam membantu siswa yang sedang belajar,

yaitu mengubah dirinya dari masukan mentah menjadi suatu

yang sedang mengarah pada terjadinya keluaran yang

bermutu.

2. Masukan Materi Kurikulum

Dalam menilai masukan materi kurikulum, penilai

bermaksud mengetahui apakah materi kurikulum yang

diberikan kepada siswa cukup lengkap, sesuai dengan

tingkat kematangan siswa dan kebutuhan peserta didik

ketika hidup di masyarakat, apakah urutan materi kurikulum

sudah baik sehingga tidak loncat-loncat ketika disajikan dan

sebagainya.

3. Masukan Sarana dan Prasarana

Dalam menilai masukan sarana dan prasarana, penilai

bermaksud mengetahui apakah sarana dan prasarana yang

memang dibutuhkan untuk mendukung terselenggaranya

proses pembelajaran sudah tersedia dengan lengkap dan

sudah siap digunakan, apakah mutu atau kualitas sarana

Page 12: DASAR-DASAR EVALUASI PENDIDIKAN(SUHARISMI ARIKUNTO.docx

atau peralatan yang ada cukup memadai, dalam arti

meningkatkan mutu pembelajaran jika dibandingkan

dengan tanpa peralatan, apakah sarana atau peralatan yang

tersedia sudah dapat dimanfaatkan dengan baik, melibatkan

siswa sehingga siswa menjadi aktif, dan pertanyaan yang

relevan lainnya.

4. Masukan Pengelolaan

Dalam menilai masukan pengelolaan, penilai bermaksud

mengetahui apakah pengelolaan yang mendukung

pembelajaran sudah baik, misalnya jadwal pelajaran yang

disusun oleh pengelola sudah tepat, penugasan atau

penunnjukan guru yang bertugas sudah sesuai dengan

keahlian atau latar belakang pendidikan personil yang

bersangkutan dan sebagainya.

c. Masukan Lingkungan (Environmental Input)

Dalam kegiatan penilaian, penilai ingin mengetahui apakah hal-

hal yang merupakan unsur dalam lingkungan yang berpengaruh

terhadap proses pembelajaran sudah berfungsi dengan baik atau

belum. Berbicara tentang lingkungan yang berpengaruh

terhadap pembelajaran, kita dapat memisahkan atas tiga lingkup

lingkungan yang langsung mengarah pada siswa. Tiga lingkup

dimaksud dapat dipisahkan menjadi lingkungan fisik (non

manusia) dan beberapa manusia adalah sebagai berikut.

1) Lingkungan di dalam keluarga

Dalam melakukan penilaian, penilai bermaksud mengetahi

apakah siswa di rumah disediakan tempat belajar yang

nyaman, dengan keluasan ruang, penerangan dan ventilasi

yang cukup, apakah waktu belajar tidak terganggu dengan

kegiatan lain di rumah, apakah buku-buku yang diperlukan

oleh siswa disediakan oleh orang tua dan lain sebagainya.

Page 13: DASAR-DASAR EVALUASI PENDIDIKAN(SUHARISMI ARIKUNTO.docx

Yang berupa manusia, apakah ada ayah, ibu, kakak, paman

atau saudara yang dapat memberikan bantuan kepada siswa

ketika sedang belajar? Apakah lingkungan keluarga cukup

nyaman, keadaan tentram sehingga memungkinkan siswa

dapat belajar dengan tenang dan tenteram.

2) Lingkungan di sekolah

Dalam melakukan penilaian, penilai bermaksud mengetahui

apakah ruang-ruang kelas yang ada di sekolah tersedia

dengan baik untuk kepentingan belajar siswa, dalam arti

kondisi ruangan nyaman, tenang, bersih sehingga

memberikan suasana belajar yang menyenangkan. Yang

berbentuk manusia, apakah guru kelas (guru mata

pelajaran), atau guru lain, serta kepala sekolah, dapat

memberikan bantuan kepada siswa ketika mereka memang

memerlukan ? ketika siswa menjumpai kesulitan, apakah

ada orang membantu?

3) Lingkungan bermain dan bergaul di masyarakat

dalam melakukan penilaian, penilai bermaksud untuk

mengetahui apakah di sekitar rumah siswa, di tempat

bermainm di tempat bergaul dengan teman, atau di tempat

yang sering dikunjungi ada sarana yang dapat mendukung

keberhasilan belajar, misalnya air terjun, gunung gamping,

kebun bibit, jembatan timbang, jembatan baley, hutan, dan

lain-lain, baik bersifat alami maupun buatan manusia, yang

dapat membantu menambah wawasan siswa dalam belajar.

Disamping benda-benda atau alam yang mendukung

keberhasilan belajar, lingkungan di luar sekolah dan rumah

diharapkan ada juga lingkungan manusiam antara lain

pejabat setempat, teman belajar kelompok, teman aktif di

masjid atau gereja, teman kelompok seni, olahraga dan lain-

lain kegiatan.

Page 14: DASAR-DASAR EVALUASI PENDIDIKAN(SUHARISMI ARIKUNTO.docx

Apabila guru sudah selesai melakukan penilaian atau

evaluasi terhadap transformasi, dan memperoleh data yang

lengkap dari berbagai masukan, secara tidak langsung guru

yang bersangkutan tahu unsur mana dari masukan-masukan,

secara tidak langsung guru yang bersangkutan tahu unsur

mana dari masukan-masukan tersebut, yang belum

berfungsi sebagaimana yang telah direncanakan semula.

Harapannya, sesudah semua unsur dalam masukan

direncana dengan baik dan berjalan sesuai dengan rencana,

pasti proses pembelajaran dapat berjalan dengan baik, pasti

hasil belajar siswa pun akan baik. Dalam proses

transformasi, data yang terkumpul dari kegiatan evaluasi

atau penilaian tersebut dikenal dengan nama yang lebih

umum, yaitu balikan atau umpan balik. Yaitu suatu yang

berfungsi memberikan gambaran tentang hal-hal yang

sudah dan sedang dikerjakan. Dengan adanya balikan maka

guru dapat mengetahui dengan pasti, apa kelemahan dari

kegiatan yang telah dilakukan.

Cara-cara yang digunakan oleh guru dapat bermacam-

macam, antara lain yang sudah banyak diperoleh dari

pengalaman adalah melalui tes tertulis atau lisan. Dengan

hadirnya kebijakan kurikulum berbasis kompetensi (KBK)

yang mengarahkan pembelajaran pada kepemilikan

kompetensi yang lengkap pada diri siswa, maka guru dapat

melakukan bermacam-macam cara penilaian, karena

sasaran atau objek yang dinilai juga bemacam-macam.

Penjelasan lebih lanjut tentang hal ini disampaikan pada

bab-bab lain.

Umpan balik (feedback)

Yang dimaksud sebagai umpan balik atau balikan adalah

segala informasi baik yang menyangkut output maupun

Page 15: DASAR-DASAR EVALUASI PENDIDIKAN(SUHARISMI ARIKUNTO.docx

transformasi. Umpan balik ini diperlukan sekalu untuk

memperbaiki input maupun transformasi. Lulusan yang

kurang bermutu atau yang belum memenuhi harapan, akan

menggugah semua pihak untuk mengambil tindakan yang

berhubungan dengan penyebab kurang bermutunya

lulusan.

Penyebab-penyebab tersebut antara lain :

a. Input yang kurang baik kualitasnya

b. Guru dan personal yang kurang tepat

c. Materi tidak atau kurang cocok

d. Metode mengajar dan sistem evaluasi yang kurang

memadai

e. Kurangnya sarana penunnjang

f. Sistem administrasi yang kurang tepat.

Oleh karena itu, penilaian di sekolah meliputi

banyak segi, yang secara garis besar dilihat dari calon

siswa, lulusan dan proses pendidikan secara menyeluruh.

3. Mengapa Menilai

Jika seblum membeli jeruk kita tidak memilih dahulu mana jeruk yang

baik dibandingkan dengan yang kurang baik, maka akan memperoleh

jeruk seadanya.

Mungkin baik, tetapi juga kemungkinan tidak baik. Yang jelas kita belum tentu memperoleh jeruk yang berkualitas baik jika tidak didahului dengan kegiatan menilai.

Dalam dunia pendidikan, khususnya dunia persekolahan, penilaian mempunya makna ditinjau dari berbagai segi.

a. Makna bagi SiswaDengan diadakanya penilaian, maka siswa dapat mengetahui sejauh mana telah berhasil mengikuti pelajaran yang diberikan oleh guru.

Page 16: DASAR-DASAR EVALUASI PENDIDIKAN(SUHARISMI ARIKUNTO.docx

Hasil yang diperoleh siswa dari pekerjaan menilai ini ada 2 (dua) kemungkinan.1) Memuaskan

Jika siswa memperoleh hasil yang memuaskan dan hal itu menyenangkan, tentu kepuasan itu ingin diperolehnya lagi pada kesempatan lain waktu. Akibatnya, siswa akan mempunyai motivasi yang cukup besar untuk belajar lebih giat, agar lain kali mendapat hasil yang lebih memuaskan lagi. Keadaan sebaliknya dapat terjadi, yakni siswa sudah merasa puas dengan hasil yang diperoleh dan usahanya kurang gigih untuk lain kali.

2) Tidak MemuaskanJika siswa puas dengan hasil yang diperoleh, ia akan berusaha agar lain kali keadaan itu tidak terulang lagi. Maka ia akan belajar lebih giat. Namun demikian, keadaan sebaliknya dapat terjadi. Ada beberapa siswa yang lemah kemauannya, akan menjadi putus asa dengan hasil kurang memuaskan yang diterimanya.

b. Makna bagi guru1) Dengan hasil penilaian yang diperoleh, guru akan dapat

mengetahui siswa mana yang bisa melanjutkan pelajarannya karena sudah berhasil menguasai materi, maupun siswa-siswa yang belum berhasil menguasai mater. Dengan petunjuk ini guru dapat lebih memusatkan perhatiannya kepada siswa-siswa yang belum berhasil. Apalagi jika guru tahu akan sebab-sebabnya, ia akan memberikan perhatian yang memusat dan memberikan perlakuan yang lebih teliti sehingga keberhasilan selanjutnya dapat diharapkan.

2) Guru akan mengetahui apakah materi yang diajarkan sudah tepat bagi siswa sehingga untuk memberikan pelajaran di waktu yang akan datang tidak perlu diadakan perubahan.

3) Guru akan mengetahui apakah metode yang digunakan sudah tepat atau belum. Jia sebaian besar dari siswa memperoleh nilai jelek pada penilaian yang diadakan, mungkin hal ini disebabkan oleh pendekatan atau metode yang kurang tepat. Apabila demikian halnya, maka guru harus mawas diri dan mencoba mencari metode lain dalam belajar.

c. Makna bagi sekolah1) Apabila guru-guru mengadakan penilaian dan diketahui

bagaimana hasil belajar siswa-siswanya, dapat diketahui pula apakah kondisi belajr yang diciptakan oleh sekolah sudah

Page 17: DASAR-DASAR EVALUASI PENDIDIKAN(SUHARISMI ARIKUNTO.docx

sesuai dengan harapan atau belum. Hasil belajar merupakan cermin kualitas suatu sekolah.

2) Informasi dari guru tentang tepat tidaknya kurikulum untuk sekolah itu dapat menjadi bahan pertimbangan bagi perencanaan sekolah untuk masa-masa yang akan datang.

3) Informasi hasil penilaian yang diperoleh dari tahun ke tahun, dapat digunakan sebagai pedoman bagi sekolah. Apakah yang dilakukan oleh sekolah sudah memenuhi standar atau belum. Pemenuhan standar akan terlihat dari bagusnya angka-angka yang diperoleh siswa.

Secara rinci dan sesuai dengan urutan kejadiannya, dalam proses transformasi ini penilaian dibedakan atas tiga jenis, yakni sebelum, selama, dan sesudah terjadi proses dalam kegiatan sekolah. Dalam hal ini para pelaksana pendidikan selalu berorientasi pada tujuan yang akan dicapai dan tujuannya selalu diarahkan pada siswa secara perseorangan (individual) maupun secara kelompok (perkelas atau per angkatan).

Sehubungan dengan perincian ini, yang bisa dilakukan oleh pendidik adalah mengajukan pertanyaan-pertanyaan sebagai satu ungkapan penilaian yang akan dicari jawabannya.

Sebelum Kegiatan Belajar

Sebelum guru memulai dengan memberikan pelajaran di awal tahun,

pertanyaan yang dilontarkan adalah :

1. “apakah yang akan dicapai oleh siswa, melalui pelajaran saya ini”

2. “Untuk mengarah ke pencapaian tujuan, apakah siswa sudah

mempunya bekal berupa kemampuan ataupun sebagian dari yang akan

dicapai sehingga guru tidak perlu memberikan bahan seluruhnya?”

a. “Bagaimana kemampuan siswa secara individual dan siapa saja

yang sudah menguasai sebagian tujuan, serta seberapa?”

b. “Bagaiman kemampuan kelompok siswa yang diajar secara

umum?”(tinjauan kelompok).

Selama Kegiatan Belajar

yang dimaksud dengan “selama kegiatan belajar” adalah satu jarak waktu

mulai pengajaran berlangsung hingga saat berakhirnya pemberian

pengajaran oleh guru. Jarak waktu dapat dilihat dalam satu satuan waktu

pendek, yakni satu pertemuan atau satu satuan waktu panjang, seperti satu

Page 18: DASAR-DASAR EVALUASI PENDIDIKAN(SUHARISMI ARIKUNTO.docx

smester. Selama satu penggalan waktu tersebut guru harus secara terus-

menerus mengajukan beberapa pertanyaan :

1. “Apakah yang dicapai oleh siswa melalui pelajaran saya ini?”

(pertanyaan ini selalu harus diingat agar menjiwai setiap langkah

kegiatannya)

2. “Apakah langkah yang saya ambil sudah benar, tidak salah langkah?”

menyangkut semua orang (kelompok) atau hanya beberapa individu

saja?”

Sesudah Kegiatan Belajar

Jika guru sudah selesai memberikan pelajaran (satu pertemuan atau satu

smester) ia mengajukan pertanyaan-pertanyaan sebagai berikut :

1. “dengan selesainya pelajaran saya ini, apakah tujuan yang dicapai oleh

siswa sudah tercapai?”

a. “Seberapa jauh pencapaian tiap siswa?”

b. “Berapa orang kah yang sudah mencapai?”

2. “Seandainya belum tercapai, bagian yang mana saja yang belum

tercapai?? (baik oleh individu maupun oleh kelompok).

3. “Seandainya belum tercapai, faktor-faktor apakah yang

menyebabkan ?” (penghambat bagi individu maupun kelompok).

4. Tujuan dan Fungsi Penilai

Dengan mengetahi makna penilaian ditinjau dari berbagai segi dalam

sistem pendidikan. Maka dari itu beberapa tujuan atau fungsi penilaian,

yaitu :

a. Penilaian Berfungsi Selektif

1) Untuk memilih siswa yang dapat diterima di sekolah tertentu.

2) Untuk memilih siswa yang dapat naik kelas atau tingkat berikutnya.

3) Untuk memilih siswa yang seharusnya mendapat beasiswa.

4) Untuk memilih siswa yang sudah berhak meninggalkan sekolah,

dan sebagainya.

b. Penilaian Berfungsi Diagnostik

Page 19: DASAR-DASAR EVALUASI PENDIDIKAN(SUHARISMI ARIKUNTO.docx

Apabila alat yang digunakan dalam penilaian cuckup memenuhi

persyaratan, maka dengan melihat hasilnya, guru akan mengetahui

kelemahan siswa. Di samping itu, diketahui pula penyebabnya. Jadi

dengan mengadakan penilaian, sebenarnya guru melakukan diagnosis

kepada siswa tentang kebaikan dan kelemahannya. Dengan

diketahuinya sebab-sebab kelemahan ini, akan lebih mudah mencari

cara untuk mengatasinya.

c. Penilaian Berfungsi sebagai Penempatan

Sistem baru yang kini banyak dipopulerkan di negara barat. Adalah

sistem belajar sendiri. Belajar sendiri dapat dilakukan dengan cara

mempelajari sebuah paket belajar, baik itu berbentuk modul maupun

paket belajar yang lain. Sebagai alasan dari timbulnya sistem ini

adalah adanya pengakuan yang besar terhadap kemampuan individual.

Setiap siswa sejak lahirnya telah membawa bakat sendiri-sendiri

sehingga pelajaran akan lebih efektif apabila disesuaikan dengan

pembawaan yang ada. Akan tetapi disebabkan karena keterbatasan

sarana dan tenaga, pendidikan yang bersifat individual kadang-kadang

sukar sekali dilaksanakan. Pendekatan yang lebih bersifat melayani

perbedaan kemampuan, adalah pengajaran secara kelompok. Untuk

dapat menentukan dengan pasti di kelompok mana seorang siswa harus

ditempatkan, digunakan satu penilaian. Sekelompok siswa yang

mempunyai hasil penilaian yang sama, akan berbeda dalam kelompok

yang sama dalam belajar.

d. Penilaian/Berfungsi sebagai pengukur keberhasilan

Fungsi keempat dari penilaian ini dimaksudkan untuk mengetahui

sejauh mana satu program berhasil diterapkan. Telah disinggung pada

bagian sebelum ini, keberhasilan program ditentukan oleh beberapa

faktor, yaitu faktor guru, metode mengajar, kurikulum, sarana, dan

sistem administrasi.

5. Ciri-Ciri Penilaian dalam Pendidikan

Page 20: DASAR-DASAR EVALUASI PENDIDIKAN(SUHARISMI ARIKUNTO.docx

Apakah sebenarnya kepandaian itu? Seorang siswa yang pandai

matematika, tidak dapat dengan mudah dibedakan dari siswa lainnya,

hanya dengan melihat anak tersebut. Kita tidak dapat melihat siswa pandai

atau siswa bodoh. Kepandaian itu tidak dapat disaksikan dari luar.

Untuk dapat menentukan siswa mana yang lebih pandai dari yang

lain, maka bukan kepandaiannya yang diukur. Kita dapat mengukur

kepandaian dengan gejala yang tampak atau memancar dari kepandaianya,

salah satu contoh adalah bahwa anak yang pandai biasanya dapat

menyelesaikan soal-soal yang diberikan oleh guru.

Ciri-ciri penilaian dalam pendidikan, antara lain adalah sebagai

berikut.

a. Ciri Pertama dari penilaian dalam pendidikan, yaitu bahwa

penilaian dilakukan secara tidak langsung. Dalam contoh ini, akan

mengukur kepandaian melalui ukuran kemampuan menyelesaikan

soal-soal.

Sehubungan dengan tanda-tanda anak pandai atau intelegen,

seoarah ahli ilmu jiwa pendidikan bernama Carl Witherington,

mengememukakan pendapatnya sebagai berikut.

1) Kemapuan untuk bekerja dengan bilangan.

2) Kemampuan untuk mengunakan bahsa dengan baik.

3) Kemampuan untuk menangkap sesuatu yang baru (cepat

mengikuti pembicaraan orang lain)

4) Kemampuan untuk mengingat-ingat.

5) Kemampuan untuk memahami hubungan (termasuk menangkap

kelucuan)

6) Kemampuan untuk berfantasi

Dalam kenyataannya ada orang yang memiliki kemampuan umum

rata-rata tinggi, rata-rata rendah, dan ada yang memiliki

kemampuan khusus tinggi. Misalnya, kemampuan rata-rata rendah

tetapi kemampuan berfantasi tinggi dan menjadi seniman ulung.

Page 21: DASAR-DASAR EVALUASI PENDIDIKAN(SUHARISMI ARIKUNTO.docx

Meskipun aspek-aspek intelegensi yang dikembangkan oleh carl

witherington tersebut masih berlaku, dalam arti masih ada yang

mengakui kebenarannya, namun ada penemuan yang lebih mutahir

yang dikemukan oleh David Lazear dalam bukunya Seven Ways

Of Teaching tentang aspek-aspek yang menunjukan tingkat

kecerdasan seseoarang. Memang ketika kita memahami teori yang

dikemukakan oleh Whiterington, kita merasakan kurang

lengkapnya bukti bahwa seseoarang menunnjukan kelebihan dalam

kecerdasan.

Menurut David Lazear 7 (tujuh) indikator atau aspek yang

dikategorikan sebagai petunjuk tentang tinggi-rendahnya

intelegensi seseoarang, yaitu :

1. Kemampuan Verbal

2. Kemampuan mengamati dan rasa ruang

3. Kemampuan gerak kinetis-fisik

4. Kemampuan logika/matematika

5. Kemampuan dalam hubungan intra-personal

6. Kemampuan dalam hubungan inter-personal, dan

7. Kemampuan dalam musik/irama

Mengingat bahwa aspek-aspek tersebut perlu dikenal oleh semua

guru yang harus berperan mengembangkan pribadi siswa melalui

rincian aspek-aspek indikator tersebut dan sekaligus mengevaluasi.

Penulis berpendapat bahwa teori baru tersebut perlu juga diketahui

dan dipelajari oleh para guru sehingga disajikan dalam buku ini.

Adapun rincian dari aspek-aspek atau indikator intelegensi

dimaksud adalah sebagai berikut.

1) Kemampuan verbal (verbal linguistic), meliputi :

a) Analisis lingusistik

b) Mengenal kembali dan mengingat

c) Memahami dan menciptakan kelucuan atau humor

d) Menjelaskan sesuatu dalam proses belajar-mengajar

Page 22: DASAR-DASAR EVALUASI PENDIDIKAN(SUHARISMI ARIKUNTO.docx

e) Meyakinkan sesorang agar bersedia melakukan sesuatu

f) Memahami perintah dengan tepat

2) Kemampuan mengamati

a) Khayalan

b) Menyusun kerangka pikir

c) Menemukan jalam dalam konsep ruang

d) Memanipulasi imajinasi

e) Meninterprestasikan grafik/bagian/model

f) Mengenal hubungan objek dalam ruang

g) Memiliki persepsi yang cermat melalui bebagai sudut

pandangan

3) Kemampuan gerak kinetis fisik, melipui :

a) Mengatur/mengelola gerak refleks

b) Mengatur/mengelola gerak terencana

c) Memperluas kesadaran melalui tubuh

d) Peduli hubungan antar bagian

e) Meningkatkan fungsi tubuh

4) Kemampuan logika/matematika, meliputi:

a) Mengenali pola-pola abstraksi

b) Pertimbangan induktif

c) Pertimbangan deduktif

d) Cerdas dalam menangkap hubungan dan kaitan

e) Menyelesaikan kalkulasi kompleks

f) Pertimbangan ilmiah

5) Kemampuan dalam hubunganintra-personal, meliputi:

a) Konstrentasi dalam berfikir

b) Keberhati-hatian

c) Melakukan metakognisi

d) Kesadaran dan ekspresi berbagai perasaan

e) Kesadaran atas dirinya

f) Tingkat pemikiran-pnalaran

Page 23: DASAR-DASAR EVALUASI PENDIDIKAN(SUHARISMI ARIKUNTO.docx

6) Kemampuan dalam hubungan inter-personal, meliputi :

a) Mencipta dan mengelola sinergi

b) Daya melampaui perspektif orang lain

c) Bekerja sama dalam kelompok

d) Mengenal dan membuat sesuatu yang berbeda dengan

lainnya

e) Komunikasi verbal dan nonverbal

7) Kemampuan dalam musik/irama, meliputi :

a) Struktur musik

b) Skematis dan mendengarkan musik

c) Sensitif terhadap suara

d) Kreatif dalam melodi dan irama

e) Sensitif dalam nada

Selanjutnya tentang macam tingkat intelegnsi dibandingka dengan

kelompok besar umat manusia digambarkan sebagai berikut :

1% luar biasa, mempunyai IQ antara 30 hingga 70

5% dungu, mempunyai IQ antara 70 hingga 80

14% bodoh, mempunyai IQ antara 80 hingga 90

60% normal, mempunyai IQ antara 90 hingga 110

14% pandai, mempunyai IQ antara 110 hingga 120

5% sangat pandai, mempunyai IQ antara 120 hingga 130

1% genius, mempunyai IQ lebih dari 130

Yang dikatakan 1% luar biasa masih terbagi atas :

Idiot yang mempunyai IQ antara 0 sampai 25

Imbesil yang mempunyai IQ antara 26 sampai 50

Debil yang mempunyai IQ antara 51 sampai 70

Apabila digambarkan dengan kurva, maka akan tampak lebih jelas

seperti berikut :

Page 24: DASAR-DASAR EVALUASI PENDIDIKAN(SUHARISMI ARIKUNTO.docx

b. Ciri Kedua dari penilaian pendidikan, yaitu penggunaan ukuran

kuantitatif. Penilaian pendidikan bersifat kuantitaf artinya

menggunakan simbol bilangan sebagai hasil pertama pengukuran

setelah itu diiterprestasikan ke bentuk kualitatif.

Contoh :

Dari hasil pengukuran, Tiko mempunyai IQ 125, sedangkan Tini

105. Dengan demikian. Maka tiko digolongkan sebagai anak sangat

pandai sedangkan tini sebagai anak normal.

c. Ciri Ketiga dari penilaian pendidikan, yaitu bahwa penilaian

pendidikan menggunakan, unit-unit atau satuan-satuan yang tetap

karena IQ 105 termasuk anak normal. Anak lain yang hasil

pengukuran IQ-nya 80, menurut unit pengukurannya termasuk anak

dungu.

d. Ciri Keempat dari penilaian pendidikan adalah bersifat relatif,

artinya tidak sama atau tidak selalu tetap dari satu waktu ke waktu

lain.

Contoh:

Hasil ulangan matematika yang diperoleh miranti hari senin adalah

80. Hasil hari selasa 90. Tetapi hasil ulangan hari sabtu hanya 50.

Ketidak tepatan hasil penilaian miranti disebabkan karena banyak

faktor. Mungkin pada hari sabtu miranti sedang risau hatinya

menghadapi malam minggu.

e. Ciri Kelima dalam penilaian pendidikan adalah bahwa dalam

penilaian pendidikan itu sering terjadi kesalahan-kesalahan.

Adapun sumber kesalahan dapat ditinjau dari berbagai faktor,

yaitu:

1) Terletak pada alat ukurnya

Alat yang digunakan untuk mengukur haruslah baik. Sebagai

contoh, kita akan mengukur panjang meja tetapi menggunakan

pita ukuran yang terbuat dari bahan elastis, dan cara

mengukurnya ditarik-tarik. Tentu saka pita ukuran itu tidak

Page 25: DASAR-DASAR EVALUASI PENDIDIKAN(SUHARISMI ARIKUNTO.docx

dapat kita golongkan sebagai alat ukur yang baik karena

gambaran tentang panjangnya meja tidak dapat diketahui

dengan pasti. Tentang bagaiman syarat-syarat alat ukur yang

digunakan dalam pendidikan, akan dibicarakan di bagian lain

secara lebih lengkap.

2) Terletak pada orang yang melakukan penilaian

Hal ini dapat berupa:

a) Kesalahan pada waktu melakukan penilaian karena faktor

subjektif penilai telah memengaruhi hasil pengukuran

tulisan yang jelek dan tidak jelas, mau tidak mau sering

memengaruhi subjektivitas penilai. Jika pada waktu

mengerjakan koreksi, penilai sendiri sedang risau. Itulah

sebabnya pendidik harus sejauh mungkin dari hal ini.

b) Kecenderungan dari penilai untuk memberikan nilai secara

“murah” atau “mahal”. Ada guru yang memberikan nilai 2

(dua) untuk siswa yang menjawab salah dengan alasan

untuk menulis upah menulis. Tetapi ada yang memberikan

0 (nol) untuk jawaban serupa.

c) Adanya hallo-effect yakni adanya kesan penilai terhadap

siswa. Kesan-kesan itu dapat berasalah dari guru lain

maupun dari guru itu sendiri pada kesempatan memegang

mata pelajaran lain

d) Adanya pengaruh hasil yang telah diperooleh terdahulu.

Seorang siswa pada ulangan pertama mendapat angka 10

sebanyak 2 kali. Untuk ulangan ketiga dan seterusnya, guru

sudah terkena pengaruh ingin memberi angka lebih banyak

dair yang sebenarnya. Walaupun seandainya pada waktu

ulangan tersebut ia sedang mengalami nasib sial, yakni

salah mengerjakan.

e) Kesalahan yang disebabkan oleh kekeliruan menjumlah

angka-angka hasil penilaian.

Page 26: DASAR-DASAR EVALUASI PENDIDIKAN(SUHARISMI ARIKUNTO.docx

3) Terletak pada anak yang dinilai

a) Siswa adalah manusia yang berperasaan dan bersuasana

hati. Suasana hati seseoarang akan sangat berpengaruh

terhadap hasil penilaian. Misalnya, suasana hati yang kalut,

sedih atau tertekan akan memberika hasil kurang

memuaskan, sedang suasana hati gembira dan cerah, akan

memberikan hasil baik.

b) Keadaan fisik ketika siswa sedang dinilai. Kepala pusing,

perut mulas atau pipi sedang membengkak karena sakit

gigi, tentu saja memengaruhi cara siswa memecahkan

persoalan. Pikirannya sangat sukar untuk berkonsentrasi.

c) Nasib siswa kadang-kadang mempunyai peranan terhadap

hasil penilaian. Tanpa adanya suatu sebab fisik maupun

psikis, adakalanya seperti ada “gangguan” terhadap

kelancaran mengerjakan soal-soal.

4) Terletak pada situasi dimana penilaian berlangsung

a) Suasana yang gaduh, baik di dalam maupun di luar ruangan,

akan mengganggu konsentrasi siswa. Demikian pula

tingkah laku kawan-kawannya yang sedang mengerjakan

soal, apakah mereka bekerja dengan cukup serius atau

tampak seperti hanya main-main akan memengaruhi diri

siswa dalam mengerjakan soal.

b) Pengawasan dalam penilaian. Tidak menjadi rahasia lagi

bahwa pengawasan yang terlalu ketat tidak akan disenangi

oleh siswa yang suka melihat ke kanan dan ke kiri. Namun

adakalanya, keadaan sebaliknya. Yaitu pengawasan yang

longgar justru membuat jengkel bagi siswa yang mau

disiplin dan percaya pada diri sendiri.

Page 27: DASAR-DASAR EVALUASI PENDIDIKAN(SUHARISMI ARIKUNTO.docx

Evaluasi Bab 1

1. Seorang guru mengadakan ulangan harian kepada siswa-siswanya. Setelah

beberapa kali ulangan diperoleh nilai rapor. Apada waktu kenaikan kelas,

kepada siswa-siswa “pandai” diberi hadiah secara bertingkat menurut

urutan prestasinya sedangakan kepada siswa-siswa yang “tidak naik”

diberi nasihat.

a. Coba pisahkan, manakah pekerjaan mengukur dan manakan pekerjaan

menilai

b. Dapatkah kita mengategorikan anak yang “tidak naik” ini sebagai anak

“bodoh”? beri alasan!

2. Apabila masukan siswa yang diterima dalam suatu sekolah tergolong baik

karena dari tes intelegensi diketahui, dapatkah siswa tersebut pada akhir

tahun tidak naik kelas? Coba terangkan!

3. Berdasarkan makna penilaian ditinjau dari segi siswa, guru, dan sekolah,

baikkah kiranya jika guru memberikan ulangan tiap hari? Coba tinjaulah

dari berbagai segi tersebut, apa keuntungan dan kerugiannya!

4. Bandingkan antara aspek-aspek intelegensi menurut Witherington dengan

David Lazear!

5. Cobalah mengenali lingkungan anda untuk mendaftar orang-orang yang

memiliki intelegensi tinggi secara umum dan beberapa orang yang hanya

menonjol di aspek-aspek tertentu!

Page 28: DASAR-DASAR EVALUASI PENDIDIKAN(SUHARISMI ARIKUNTO.docx

BAB 2

SUBJEK DAN SASARAN EVALUASI

1. Subjek Evaluasi

Yang dimaksud dengan subjek evaluasi adalah orang yang melakukan

pekerjaan evaluasi. Siapa yang dapat disebut sebagai subjek evaluasi untuk

setiap tes, ditentukan oleh suatu antara pembagian tugas atau ketentuan yang

berlaku.

Contoh:

a. Untuk melaksanakan evaluasi tentang prestasi belajar atau pencapaian

maka sebagai subjek evaluasi adalah guru.

b. Untuk melaksanakan evaluasi sikap yang menggunakan sebuah skala maka

sebagai subjeknya dapat meminta petugas yang ditunjuk, dengan didahului

oleh suatu latiahan melaksanakan evaluasi tersebut.

c. Untuk melaksanakan evaluasi serhadap kepribadian dimana menggunakan

sebuah alat ukur yang sudah distandarisasikan maka subjeknya adalah ahli-

ahli psikologi. Disamping alatnya yang harus bersifat rahasia, maka subjek

evaluasi haruslah seorang yang betul-betul ahli karena jawaban dan tingkah

laku orang yang dites harus diiterprestasikan dengan cara tertentu.

Tidak setiap orang dapat menafsirkan jawaban tes kepribadian ini,

sehingga hanya orang yang telah mempelajari tes secara mendalam yang dapat

melakukannya. Demikian juga dengan tes intelegensi, subjek pelakunya harus

seorang ahli.

Dalam keterangan ini, penulis mengkategorikan pelaksanaan evaluasi

sebagai subjek evaluasi, ada pandangan lain yang disebut subjek evaluasi

adalah siswa, yakni orang dievaluasi. Dalam hal ini yang dipandang sebagai

objek misalnya : prestasi matematika, kemampuan membaca, kecepatan lari,

dan sebagainya. Pandangan lain lagi mengklasifikasikan siswa sebagai objek

evaluasi dan guru sebagai subjeknya.

2. Objek Evaluasi

Yang dimaksud dengan objek atau sasaran evaluasi adalah hal-hal yang

Page 29: DASAR-DASAR EVALUASI PENDIDIKAN(SUHARISMI ARIKUNTO.docx

menjadi pusat perhatian untuk dievaluasi. Apapun yang ditentukan oleh

evaluator atau penilai untuk dievaluasi, itulah yang disebut dengan objek

evaluasi. Pada waktu evaluator ingin menilai berat badan siswa, naja yang

menjadi objek evaluasi adalah berat badan siswa, sedang angka yang

menunnjukan beberapa berat badan siswa dimaksud, misalnya 34 kilogram, 40

kilogram dan sebagainya adalah hasil evaluasi. Jika evaluastor ingin menilai

keterampilan siswa dalam menggunakan termometer, maka yang menjadi

objek evaluasi adalah benar tidaknya gerakan tangan siswa ketika memegang

alat, kemampuan siswa untuk menentukan berapa lama termometer diletakan

di bagian badann, kemudian juga kemampuan siswa dalam membaca skala

yang ada pada termometer. Gambaran tentang benar salanya menggunakan

termometer adalah hasil evaluasi.

Dengan masih menggunakan diagram tentang transformasi yang ada di bab 1,

maka yang menjadi objek evaluasi adalah semua unsur atau komponen yang

ada dalam transformasi tersebut. Agar diperoleh gambaran yang menyeluruh

tentang mutu dan kebenaran kinerja transformasi, maka yang dijadikan objek

evaluasi adalah semua aspek yang terkait dengan kinerja transformasi, yaitu

(1) masukan mentah, (2) masukan instrumental, (3) masukan lingkungan (4)

proses transformasi itu sendiri dan (5) keluaran, yaitu hasil dari transformasi.

Masukan mentah sebagai objek evaluasi

Dalam transformasi pembelajaran, siswa berstatus sebagai objek didik. Ahli-

ahli pendidikan angkatan lama berpendapat bahwa siswa adalah objek

pendidikan, kini pendapat seperti itu ditentang oleh ahli-ahli pembaharuan.

Dalam kegiatan pendidikan siswa adalah subjek yang aktif, bukan sekedar

objek pasif yang dapat diperlakukan dan diarahkan menurut kehendak. Dalam

berbicara tentang objek evaluasi ini mungkin ada pembaca yang terkacaukan

pengertiannya. Siswa yang dalam proses pembelajaran berstatus sebagai

subjek, dalam evaluasi dia merupakan objek evalausi, karena dicermati untuk

diketahui kinerjanya ketika mengikuti pembelajaran. Sekali lagi jangan keliru.

Dalam proses pendidikan, siswa berstatus sebagai subjek didik-siswa

aktif belajar

Page 30: DASAR-DASAR EVALUASI PENDIDIKAN(SUHARISMI ARIKUNTO.docx

Dalam evaluasi, kinerja berstatus sebagai objek evaluasi-kinerja

siswa dicermati dan diperhatikan oleh evaluator.

Aspek-aspek yang menjadi objek evaluasi berkenaan dengan siswa sebagai

masukan mentah, masukan instrumental, dan masukan lingkungan dapat

dikembangkan dari apa yang sudah disampaiakn di bab1, apabila evaluatpr

merasa kurang tepat atau masing menginginkan hal-hal yang dievaluasi,

silahkan mendaftar lagi hal-hal lain menurut kebutuhan, beberapa hal yang

perlu dibicarakan dalam objek evaluasi adalah :a) Penilaian dalam KBK (b)

penilaian tiga ranah psikologis.

3. Sasaran Evaluasi

Apabila kita kembali kepada diagram di bab 1, kita akan ingat kembali apa

yang menjadi sasaran dari penilaian. Objek atau sasaran penilaian adalah

segala sesuatu yang menjadi titik pusat pengamatan karena penilaian

menginginkan informasi tentang sesuatu tersebut.

Dengan masih menggunakan diagram tentang transformasi maka sasaran

penilaian untuk unsur-unsurnya meliputi, input, transformasi dan output

a. Input

Calon siswa sebagai pribadi yang utuh dapat ditinjau dari beberapa segi

menghasilkan bermacam-macam bentuk tes yang digunakan sebagai alat

untuk mengugkur. Aspek yang bersifat rohani setidaknya mencakup

4(empat) hal.

1) Kemampuan

Untuk dapat mengikuti program dalam suatu lembaga/sekolah institusi

maka calon siswa harus memiliki kemampuan yang sepadan. Alat ukur

yang digunakan untuk mengukur kemampuan ini disebut tes

kemampuan atau attitude test.

2) Kepribadian

Kepribadian adalah suatu yang terdapat pada diri manusia dan

menampakan bentuknya dalam tingkah laku. Dalam hal-hal tertentu.

Informasi tentang kepribadian sangat diperlukan. Alat untuk

Page 31: DASAR-DASAR EVALUASI PENDIDIKAN(SUHARISMI ARIKUNTO.docx

mengetahui kepribadian seseorang disebut tes kepribadian atau

personality test.

3) Sikap-sikap

Sebenarnya sikap ini merupakan bagian dari tingkah laku manusia

sebagai gejala atau gambaran kepribadian yang memancar keluar.

Namun, karena sikap ini merupakan suatu yang paling menonjol dan

sangan dibutuhkan dalam pergaulan maka banyak orang yang

menginginkan informasi khusus tentangnya. Alat untuk mengetahui

keadaan sikap seseorang dinamakan tes sikap atau attitude tes. Oleh

karen tes ini berupa skala. Maka disebut sikap attitude scale.

4) Intelegensi

Untuk mengetahui tingkat intelegensi ini diguanakan tes intelegensi

yang sudah banyak diciptakan oleh para ahli. Dalam hal ini yang

terkenal adalah tes buatan binet dan simo yang dikenal dengan tes

Binet-Simon. Selain itu adalagi tes-tes lain misalnya SPM, Tintum, dan

sebagainya. Dari hasil tes akan diketahui IQ orang tersebut. IQ

bukanlan intelegensi. IQ berbeda dengan intelegensi karena IQ

hanyalah angka yang memberikan petunjuk tinggi rendahnya

intelegensi seseorang. Dengan pengertian ini maka kurang benarlah

jika ada orang mengatakan “IQ jongkok” karena IQ adalah berupa

angka. Mestinya IQ rendah diartikan bahwa angkanya rendah.

Berkenaan dengan hubungan antara sikap dan kepribadian,

A.N. Oppenheim dalam bukunya Questionnnaire Design and Attitude

Measurement mengahukan gambar seperti tertera pada halaman

selanjutnya. Dari gambar ini jelas bahwa kepribadian merupakan

sesuatu yang ada dalam diri manusia dan sangat dalam letaknya

sehingga sangat susah dilihat.

Page 32: DASAR-DASAR EVALUASI PENDIDIKAN(SUHARISMI ARIKUNTO.docx

b. Transformasi

telah dijelaskan bahwa banyak unsur yang terdapat dalam transformasi

yang semuanya dapat menjadi sasaran atau objek penilaian demi

diperolehnya hasil pendidikan yang diharapkan. Unsur-unsur dalam

transformasi yang menjadi objek penilaian antara lain :

a) Kurikulum/materi

b) Metode dan cara penilaian

c) Sarana pendidikan

d) Sistem administrasi

e) Guru dan personal lainnya.

c. Output

Penilaian terhadap lulusan suatu sekolah dilakukan untuk mengetahui

seberapa jauh tingkap pencapaian/prestasi belajar mereka selama

mengikuti program. Alat yang digunakan untuk mengukur pencapai ini

disebut tes pencapaian atau achievement test.

Kecenderungan yang ada sampai saat ini di sekolah adalah bahwa

guru hanya menilai prestasi belajar aspek kognitif atau kecerdasan saja.

Alatnya adalah tes tertulis. Aspek psikomotorik, apalagi efektif, sangat

langka dijamah oleh guru. Akibatnya, dapat kita saksikan, yakni para

lulusannya hanya menguasai teori tetapi tidak terampil melakukan

pekerjaan keterampialan. Juga tidak mampu mengaplikasikan pengetahuan

yang sudah mereka kuasai. Lemahnya pembelajaran dan evaluasi terhadap

aspek afektif ini, jika kita mau instrospeksi, telah berakitab merosotnya

ahklak para lulusan. Yang selanjutnya berdampak luas pada merosotnya

akhlah bangsa.

Page 33: DASAR-DASAR EVALUASI PENDIDIKAN(SUHARISMI ARIKUNTO.docx

Evaluasi Bab 2

1. Dari objek-objek evaluasi yang telah disebutkan, jenis tes manakah

ayang bisal dilakukan di sekolah? Bilamanakah jenis-jenis tes yang

lain dilaksanakan

2. Seorang gru telah menyerahkan soal tes dan diperbanyak oleh bagian

pengajaran, pada waktu pelaksanaan tes tersebut tidak sempat

menunggu, tetapi ditunggu oleh staf tata usaha.

Dalam keadaan demikian ini, siapakah yang disebut subjek evaluasi?

Jelaskan jawaban anda.

3. Bagaimanakah cara guru mengetahui dari tujuan yang belum dicapai

oleh siswa secara individual

4. Sebelum, selama dan setelah pengajaran selesai, guru selalu

mengajukan pertanyaan. “apakah yang akan dicapai oleh siswa melalui

pelajaran saya ini”? dalam pertanyaan tersebut, apakah tujuan yang

ingindicapai siswa itu sama? Jelaskan jawan anda!

Page 34: DASAR-DASAR EVALUASI PENDIDIKAN(SUHARISMI ARIKUNTO.docx

Tujuan

EvaluasiKBM

BAB 3

PRINSIP DAN ALAT EVALUASI

1. Prinsip Evaluasi

Ada satu prinsip umum dan penting dalam kegiatan evaluasi, yaitu adanaya

triangulasi atau hubungan erat tiga komponen, yaitu:

a. Tujuan pembelajaran

b. Kegiatan pembelajaran atau KBM, dan

c. Evaluasi.

Triangulasi tersebut dapat digambarkan dalam bagan sebagai berikut:

Penjelasan dari bagan triangulasi adalah demikian.

a. Hubungan antara tujuan dengan KBM

Kegiatan belajar mengajar yang dirancang dalam bentuk rencana mengajar

disusun oleh guru dengan mengacu pada tujuan yang hendak dicapai.

Dengan demikian anak panah yang menunnjukan hubungan antara

keduanya mengarah pada tujuan dengan makna bahwa kbm mengacu pada

tujuan, tetapi juga mengarah dari tujuan ke KBM menunjukan langkah dari

tujuan dilanjutkan pemikirannya ke KBM.

b. Hubungan antara tujuan dengan evaluasi

Evaluasi adalah pengumpulan data untuk mengukur mana tujuan sudah

tercapai. Dengan makna demikian maka anak panah berasal dari evaluasi

menuju ke tujuan. Dilain sisi, jika dilihat dari langkah dalam menyusun alat

evaluasi ia mengacu pada tujuan yang sudah dirumuskan.

c. Hubungan antara KBM dengan evaluasi

Page 35: DASAR-DASAR EVALUASI PENDIDIKAN(SUHARISMI ARIKUNTO.docx

Seperti yang sudah disebutkan dalam nomor 1, KBM dirancang dan

disusun dengan mengacu pada tujuan yang telah dirumuskan. Telah

disebutkan pula dalam nomor 2 bahwa alat evaluasi juga disusun dengan

mengacu pada tujuan. Selain mengacu pada tujuan, evaluasi juga mengacu

atau disesuaikan dengan KBM yang dilaksanakan. sebagai misal, jika

kegiatan belajar-mengajar dilakukan oleh guru dengan menitik beratkan

pada keterampilan, evaluasinya juga harus mengukur tingkat keterampilan

siswa. Bukannya aspek pengetahuan.

Kecenderungan yang terdapat dalam praktek sekarang ini adalah

bahwa hasil belajar hanya dilakukan dengan tes tertulis. Menekankan aspek

pengetahuan saja, hal-hal yang berkaitan dengan aspek-aspek lain, kurang

mendapatkan perhatian dalam evaluasi.

Secara garis besar, maka alat evaluasi yang digunakan dapat

digolongkan menjadi 2 (dua) macam, yaitu tes dan bukan tes (non tes).

Selanjutnya tes dan non tes ini juga disebut sebagai teknik evaluasi

berhubung oleh penjelasan-penjelasan yang lebih mendalam tentang tes itu

sendiri, maka disi akan diterangkan masalah nontes terlebih dahulu.

2. Alat Evaluasi

Dalam pengertian umum, alat adalah suatu yang dapat digunakan untuk

mempermudah seseoarang dalam melaksanakan tugas atau mencapai tujuan

serta lebih efektif dan efisien. Kata “alat” biasa disebut juga dengan istilah

“instrumen” dengan demikian alat evaluasi juga dikenal denga instrumen

evaluasi.

Untuk memperjelas pengertian alat atau instrumen, terapkan pada dua cara

mengupas kelapa, yangsatu menggunakan pisau parang, yang satunya lagi

tidak. Tentu saja dengan pisau parang hasilnya akan lebih baik dan lebih cepat

dilakukan dibandingkan dengan cara yang pertama. Dalam kegiatan evaluasi,

fungsi alat juga untuk memperoleh hasil yang lebih baik, sesuai dengan

kenyataan yang dievaluasi.

Contoh pertama:

Jika yang dievaluasi suatu keterampilan siswa dalam membaca, maka hasil

Page 36: DASAR-DASAR EVALUASI PENDIDIKAN(SUHARISMI ARIKUNTO.docx

4 5 6 7 8

evaluasinya berupa gambaran tentang tingkat keterampilan siswa dalam

membaca.

Dengan pengertian tersebut, alat evaluasi dikatakan baik apabila

mampu mengevaluasi sesuatu dengan hasil seperti keadaan yang dievaluasi.

Dalam menggukan alat tersebut evaluator menggukan cara atau teknik, maka

dikenal dengan teknik evaluasi. Seperti disebutkan diatas, ada dua teknik

evaluasi, yaitu teknik nontes dan teknik tes.

a. Teknik Nontes

Yang tergolong teknik nontes adalah

1) Skala bertingkat (rating scale);

2) Kuesioner (quisionair)

3) Daftar cocok (check list)

4) Wawancara (interview)

5) Pengamatan (observation)

6) Riwayat hidup

1) Skala bertingkat (rating scale);

Skala menggambarkan suatu nilai yang berbentuk angka terhadap

sesuatu hasil pertimbangan. Seperti Oppenheim mengatakan: Rating

gives a numerical value to some kind of judgement, maka suatu

skala selalu disajikan dalam bentuk angka.

Sebagai contoh, skor atau biji yang diberikan oleh guru di sekolah

untuk menggambarkan tingkat prestasi belajar siswa. Siswa yang

mendapat skor 8 digambarkan di tempat yang lebih kanan dalam

skala, dibandingkan penggambaran skor 5.

Biasanya angka-angka yang digunakan direapkan pada skala dengan

jarak yang sama. Meletakannya secara bertingkat dari yang rendah

ke yang tinggi. Dengan demikian, skala ini dinamakan skala

bertingkat. Kita dapat menilai hampir segala sesuatu dengan skala.

Page 37: DASAR-DASAR EVALUASI PENDIDIKAN(SUHARISMI ARIKUNTO.docx

1Sangat

tidak suka

2Tidak suka

3Biasa

4Suka

8Sangat suka

Dengan maksud agar pencatatannya dapat objektif, maka penilaian

terhadap penampilan atau penggambaran kepribadian seseorang

disajikan dalam bentuk skala.

Contoh:

Skala sikap yang pernah disinggung di bagian terdahulum pada

umumnya disajikan dalam bentuk bertingkat seperti dicontohkan di

atas.

2) Kuesioner (quisionair)

Kuesioner (quisionair) juga sering dikenal sebagai angket, pada

dasarnya kuesioner adalah sebuah daftar pertanyaan yang harus diisi

oleh orang yang akan diukur (responden). Dengan kuesioner ini

orang dapat diketahui tentang keadaan/data diri. Pengalaman,

pengetahuan sikap atau pendapatnya dan lain-lain.

Tentang macam kuesioner, dapat ditinjau dari beberapa segi.

a) Ditinjau dari segi siapa yang menjawabm maka ada:

(1) Kuesioner langsung adalah kuesioner yang dikirmkan dan

diisi langsung oleh responden

(2) Kuesioner tidak langsung adalah kuesioner yang dikirim dan

diisi bukan oleh responden. Kuesioner tidak langsung

biasaya digunakan untuk mencari informasi tentang

bawahan, anak, saudara, dan sebagainya.

b) Ditinjau dari segi cara menjawab, maka ada:

(1) Kuesioner tertutup adalah kuesioner yang disusun dengan

menyediakan pilihan jawaban lengkap sehingga responden

hanya tinggal memberi tanda pada jawaban yang dipilih.

Page 38: DASAR-DASAR EVALUASI PENDIDIKAN(SUHARISMI ARIKUNTO.docx

Contoh:

Tingkat pendidikan yang sekarang anada ikuti adalah :

SD SLTP SLTA

Perguruan Tinggi

(2) Kuesioner terbuka adalah kuesioner yang disusun

sedemikian rupa sehingga responden bebas mengemukakan

pendapatnya. Kuesioner terbuka disusun apabila jenis

jawaban akan beraneka ragam, misalnya, keterangan alamat

responden, tidak mungkin diberikan dengan cara memilih

pilihan jawaban yang disediakan. Kuesioner terbuka juga

digunakan meminta pendapat seseorang.

Contoh:

Untuk membimbing mahasiswa ke arah terbiasa membaca

buku-buku asing, maka sebaiknya setiap dosen menunjuk

buku asing sebagai salah satu buku wajib. Bagaimana

pendapat saudara? Jawab!

3) Daftar cocok (check list)

Yang dimaksud dengan daftar cocok (check list) adalah deretan

pernyataan (yang biasanya singkat-singkat) dimana responden yang

dievaluasi tinggal membubuhkan tanda cocok () di tempat yang

sudah disediakan.

Contoh:

Berilah tanda () pada kolom yang sesuai dengan pendapat saudara.

No Pernyataan Penting BiasaTidak

Penting1 Melihat pemandangan indah2 Olahraga tiap hari3 Melihat film4 Belajar menari5 Tulisan bagus

Page 39: DASAR-DASAR EVALUASI PENDIDIKAN(SUHARISMI ARIKUNTO.docx

Ada pendapat yang mengatakan bahwa sebenarnya skala bertingkat

dapat digolongkan ke dalam daftar cocok karena dalam skala

bertingkatm responden juga diminta untuk memberikan tanda cocok

pada pilihan yang tepat.

4) Wawancara (interview)

Wawancara atau interview adalah suatu metode atau cara yang

digunakan untuk mendapatkan jawaban dari responden dengan

tanya-jawab sepihak. Dikatakan sepihak karena dalam wawacara ini

responden tidak diberi kesembapan sama sekali untuk mengajukan

pertanyaan. Pertanyaan hanya diajukan oleh suubjek evaluasi.

Wawancara dapat dilakukan dengan 2 (dua) cara, yaitu:

a) Wawancara bebas, dimana responden mempunyai kebebasan

untuk mengutarakan pendapatnya tanpa dibatasi oelh patokan

yang telah dibuat oleh subjek evaluasi

b) Wawancara terpimpin, yaitu wawancara yang dilakukan oleh

subjek evaluasi dengan cara mengajukan pertanyaan pertanyaan

yang sudah disusun terlebih dahulu. Dalam hal ini, responden

tinggal memilih jawaban yang sudah dipersiapkan oleh penanya.

Jawaban itu kadang-kadang bersifat memimpin dan

mengarahkan, dan jawaban sudah dipimpin oleh sebuah daftar

cocok.

5) Pengamatan (observation)

Pengamatan atau observasi adalah suatu teknik yang dilakukan

dengan cara mengadakan pengamatan secara teliti srta pencatatan

secara sistematis.

Ada 3 macam observasi

a) Obeservasi partisipan, yaitu observasi yang dilakukan oleh

pengamat, dalam hal in pengamat memasuki dan mengikuti

kegiatan kelompok yang sedang diamati. Observasi partisipan

dilaksanakan sepenuhnya jika pengamat betul-betul mengikuti

kegiatan kelompok, bukan hanya pura-pura. Dengan demikian ia

Page 40: DASAR-DASAR EVALUASI PENDIDIKAN(SUHARISMI ARIKUNTO.docx

dapat menghayati dan merasakan seperti apa yang diraskan

orang-orang dalam kelompok yang diamati.

Contoh:

Untuk mengamati kehidupan mahasiswa penyewa kamar,

pengamat menjadi mahasiswa dan menyewa kamar.

b) Observasi sistematik, yaitu observasi dimana faktor faktor yang

diamati sudah didaftar secara sistematis dan sudah diatur

menurut kategorinya. Berbeda dengan observasi partisipanm,

maka dalam observasi sistematik ini pengamat berada diluar

kelompok, dengan demikianm pengamat tidak dibingungkan

oleh situasi yang melingkungi dirinya.

c) Observasi eksperimental terjadi jika pengamat tidak

berpartisipasi dalam kelompok, dalam hal ini, ia dapat

mengendalikan unsur-unsur penting dalam situasi sedemikian

rupa sehingga situasi itu dapat diatur sesuai denangan tujuan

evaluasi.

6) Riwayat hidup

Riwayat hidup adalah gambaran tentang keadaan seseorang selama

masa kehidupannya. Dengan mempelajari riwayat hidup. Maka

subjek evaluasi akan dapat menarik suatu kesimpulan tentang

kepribadian, kebiasaan, dan sikap dari objek yang dinilai.

b. Teknik Tes

Apakah sebenarnya tes itu? Ada bermacam-macam rumusan tentang

tes. Didalam bukunya yang berjudul evaluasi pendidikan, Amir Daien

Indrakusuma mengatakan demikian:

”tes adalah suatu alat atau prosedur yang sistematis dan objektif

untuk memperoleh data-data atau keterangan-keterangan yang

diinginkan tentang seseoarang, dengan cara yang boleh dikatakan

tepat dan cepat”

Selanjutnya, di dalam buku teknik-teknik evaluasi Muchtar Bukhori

mengatakan:

Page 41: DASAR-DASAR EVALUASI PENDIDIKAN(SUHARISMI ARIKUNTO.docx

“Tes ialah suatu percobaan yang diadakan untuk mengetahui ada

atau tidaknya hasil-hasil pelajaran tertentu pada seorang murid

atau kelompok murid.”

Definisi terakhir yang dikemukakan disini adalah definisi yang dikutif

Webster’s Collegiate.

“Test=any series of questions or exercieses or other means of

measurng the skill, knowledge, intelegence, capacities of aptitudes

or an individual or group”

Yang lebih kurang artinya:

“Tes adalah serentetan pertanyaan atau latihan atau alat lain yang

digunakan untuk mengukur keterampilan, pengetahuan,

intelegensi,kemampuan atau bakat yang dimiliki oleh individu atau

kelompok”

Kutipan ini disajikan dalam buku Encyclopedia of Educational

Evaluation. Yang di dalam buku tersebut diterangkan pula bahwa

pengertiannya dipersempit dengan menyederhanakan definisi menjadi

demikian:

“Tes is comprehensive assesment of an individual or to an entire

program evaluation effort”

Artinya:

“Tes adalah penilaian yang komprehensif terhadap seorang

individu atau keseluruhan usaha evaluasu program”

Dari beberapa kutipan dan uraian diatas, dapat disimpulkan bahwa tes

merupakan suatu alat pengumpul informasi, tetapi jika dibandingkan

dengan alat-alat yang lain. Tes bersifat lebih resmi karena penuh

dengan batasan-batasan. Mengingat betapa pentingnya tes ini, maka

uraian yang lebih terperinci akan disampaikan secara terpisah pada bab-

bab lain.

Apabila rumusan yang telah disebutkan di atas dikaitkan dengan

evaluasi yang dilakukan di sekolah, khususnya di suatu kelas, maka tes

mempunyai fungsi ganda, yaitu untuk mengukur siswa dan untuk

Page 42: DASAR-DASAR EVALUASI PENDIDIKAN(SUHARISMI ARIKUNTO.docx

mengukur keberhasilan program pengajaran, dalam bagian ini hanya

akan dibicarakan tes untuk mengukur keberhasilan siswa.

Ditinjau dari segi kegunaan untuk mengukur siswa, tes dibagi menjadi 3

yaitu”

1) tes diagnostik

2) tes formatif, dan

3) tes sumatif

keterangan masing-masing tes adalah sebagai berikut.

1) Tes diagnostik

Seorang guru yang baik, tentu akan merasa bahagia apabila dapat

membantu siswanya dapat mencapai kemajuan secara maksimal

sesuai dengan kemampuan yang dimiliki.

Untuk mengetahui apakah bantuan yang diberikan sudah memadai,

maka diadakan suatu penilaian. Namun, informasi hasil penilaian

ini tidak akan ada gunanya seandainya tidak digunakan untuk bahan

pertimbangan bagi tindakan selanjutnya

Seperti halnya seoarng dokter, sebelum menentukan obat apa yang

akan diberikan kepada pasien, dokter melakukan pemeriksaan

secara teliti dahulu. Misalnya, memeriksa denyut nadi, suara nafas,

reaksi lutut, urine, darah, dan sebagainya. Demikian juga seorang

guru terhadap siswa, guru harus mengadakan tes yang maksudnya

untuk mendiagnosis. Tes ini disebus tes diagnostik.

Tes diagnostik adalah tes yang digunkan untuk mengetahui

kelemahan-kelemahan siswa sehingga berdasarkan hal tersebut

dapat dilakaukan penganganan yang tepat. Dengan mengingat

bahwa sekolah sebagai sebuah transformasi, maka letak tes

diagnostik dapat dilihat pada gambar di bawah ini:

Input Output

Page 43: DASAR-DASAR EVALUASI PENDIDIKAN(SUHARISMI ARIKUNTO.docx

Tes diagnostik ke1 dilakukan terhadap calon siswa sebagai input,

untuk mengetahui apakah calon siswa sudah menguasai

pengetahuan yang merupakan dasar untuk menerima pengetahuan di

sekolah. Dalam pembicaraan tes secara umum, tes ini disebut tes

penjajakan masuk yang dalam istilah inggris disebut entering

behaviur test. Dalam penggalan kecil, tes diagnostik ke-1 dilakukan

untuk mengukur tingkat penguasaan pengetahuan dasar untuk dapat

menerima pengetahuan lanjutannya. Pengetahuan dasar ini biasa

disebut dengan pengetahuan bahan prasyarat (preruqisite) oleh

karena itu tes ini disebut juga tes prasayarat atau prereuisite test.

Test diagnostik ke-2 dilakukan terhadap calon siswa yang akan

mulai mengikuti program. Apabila cukup banyak calon siswa yang

diterima sehingga diperlukan lebih dari satu kelas, maka untuk

pembagian kelas diperlukan suatu pertimbangan khusus. Apakah

anak yang baik akan disatukan di satu kelas atau semua kelas akan

diisi dengan campuran anak baik, sedang atau semua kelas akan

diisi dengan campuran anak baik, sedan atau kurang. Ini semua

memerlukan informasi yang dapat diperoleh dengan cara

mengadakan tes diagnostik. Dengan demikian, tes diagnostik telah

berfungsi sebagai tes penempatan (placement Test).

Test diagnostik ke-3 dilakukan terhadap siswa yang sedang belajar

tidak semua siswa dapat menerima pelajaran yang diberikan oleh

guru dengan lancar. Sebagai guru yang bijaksana, sebaiknya

sesekali melakukan tes diagnostik. Untuk mengetahui bagian mana

dari materi pelajaran yang diberikan belum dikuasai oleh siswa

Test diagnostik ke-4 diadakan pada waktu siswa mengakhiri

pelajaran. Dengan tes ini guru akan dapat mengetahui tingkat

penguasaan siswa terhadap bahan yang ia berikan.

2) Tes formatif

Dari kata form yang merupakan dasar dari istilah formati, maka

evaluasi formatif dimaksudkan untuk mengetahui sejauh mana

Page 44: DASAR-DASAR EVALUASI PENDIDIKAN(SUHARISMI ARIKUNTO.docx

siswa telah terbentuk setelah mengikuti program tertenu. Dalam hal

ini, tes formatif dapat juga dipandadang sebagai tes diagnostik pada

akhir pelajaran.

Evaluasi formatif atau tes formatif diberikan pada akhir setiap

program. Tes ini merupakan post-test atau tes akhir proses.

Evaluasi formatif mempunyai manfaat bai bagi siswa, guru mapun

program itu sendiri:

a) Manfaat bagi siswa

Digunakan untuk mengetahui apakah siswa sudah menguasai

materi program secara menyeluruh

Merupakan penguatan (reinforcement) bagi siswa. Dengan

mengetahi bahwa tes yang dikerjakan sudah menghasilkan

skor tinggi sesuai yang diharapkan, maka siswa merasa

mendapat “anggukan kepala” dari guru, dan ini merupakan

suatu tanda bahwa apa yang sudah dimiliki merupakan

pengetahuan yang sudah benar. Dengan demikian, maka

pengetahuan itu akan bertambah membekas diingatan.

Disamping itu, tanda keberhasilan suatu pelajaran akan

memperbesar motivasi siswa untuk belajar giat, agar

mempertahankan atau memperoleh nilai yang lebih baik.

Usaha perbaiakanm dengan umpan balik (feed back) yang

diperoleh setelah melakukan tesm siswa mengetahui

kelemahan-kelemahanya. Bahkan dengan teliti siswa

mengetahui bab atau bagian mana yang belum dikuasainya.

Dengan demikian siswa akan termotivasi untuk

meningkatkan penguasaan materi.

Sebagai diagnosis. Bahan pelajaran yang sedang dipelajari

Page 45: DASAR-DASAR EVALUASI PENDIDIKAN(SUHARISMI ARIKUNTO.docx

oleh siswa merupakan serangkaian pengetahuan.

Keterampilan, atau konsep. Dengan mengetahui hasil tes

formatif, siswa dengan jelas dapat mengetahui bagian mana

dari materi pelajaran yang masih dirasakan sulit.

b) Manfaat bagi guru

Dengan telah mengetahui hasil tes formatif yang diadakan,

maka guru:

Mengetahui sampai sejauh mana materi yang diajarkan sudah

dapat diterima oleh siswa. Hal ini juga akan menentukan

apakah guru perlu mengganti metode pengajaran (strategi)

yang lama.

Mengetahui bagian-bagian mana dari materi pelajaran yang

belum dikuasai siswa. Apabila bagian yang belum dikuasai

merupakan materi dasar bagi pelajaran yang lain, maka

bagian itu harus diterangkan lagi dan barangkali memerlukan

cara atau media lain untuk memperjelas apabila tidak

diulangi, maka akan mengganggu kelancaran pemberian

materi pelajaran selanjutnya dan siswa akan semakin tidak

menguasainya.

Contoh:

Page 46: DASAR-DASAR EVALUASI PENDIDIKAN(SUHARISMI ARIKUNTO.docx

Dapat meramalkan sukses dan tidaknya seluruh program

yang akan diberikan.

c) Manfaat bagi program

Setelah diadakan tes formatif maka diperoleh hasil. Dari hasil

tersebut dapat diketahui:

Apakah program yang telah diberikan merupakan program

yang tepat, dalam arti sesuai dengan kecakapan anak.

Apakah program tersebut membutuhkan pengetahuan-

pengetahuan prasyarat yang belum diperhitungkan.

Apakah diperlukan alat, sarana dan prasarana untuk

mempertingggi hasil yang akan dicapai.

Apakah metode, pendekatan, dan alat evaluasi yang

digunakan sudah tepat.

3) Tes sumatif

Evaluasi sumatf atau tes sumatif dilaksanakan setelah berakhirnya

pemberian sekelompok atau sebuah program yang lebih besar.

Dalam pengalaman di sekolah tes formatif dapat disamakan dengan

ulangan harian, dengakan tes sumatif ini dapat disamakan dengan

ulangan umum yang biasanya dialakanakan pada tiap hari smester,

secara diagramis maka hubungan antara tes formatif dengan tes

sumatif ini tergambar sebagai berikut:

Program Program Program Program Program

S

Keterangan :F = tes formatifS = tes sumatif

F F F F F

Apabila dilihat dalam kaitannya dengan kurikulum tahun 1975 (baik

untuk SD, SMP maupun SMA) maka tes formatif adalah tes yang

Page 47: DASAR-DASAR EVALUASI PENDIDIKAN(SUHARISMI ARIKUNTO.docx

dilaksanakan sesudah berakhirnya proses belajar-mengajar tiap-tiap

sub pokok bahasan, sedangkan tes sumatif diadan pada :

- Akhir caturwulan : untuk SD

- Akhir smester : untuk SMP dan SMA

*) sekarang semua jenjang SD,SMP dan SMA tidak sama, yaitu

menggunakan jenjang smester.

Manfaat tes sumatif

Ada beberapa manfaat tes sumatif, dan 3 diantaranya yang terpenting

adalah :

a) Untuk menentukan nilai, apabila tes formatif digunakan terutama

untuk memberikan informasi demi perbaikan penyampaian dan

tidak untuk memberikan nilai atau penentuan kedudukan

seoarang anak di anatara teman-temannya (grading), maka nilai

dari tes sumatif ini digunakan untuk menentukan kedudukan

anak, dalam penentuan nilai ini setiap anak dibandingkan dengan

anak lain, asumsi yang mendasari pandangan ini adalah bahwa

prestasi belajar siswa-siswa dalam sebuah kelas akan tergambar

dalam sebuah kurva normal.

Sebagian besar dari anak-anak di kelas itu akan terletak di

tengah-tengah daerah kurva. Yaitu di daerah “sedang”.

Sebagaian kecil terletak di daerah “atas” dan sebagian lainnya

akan terletak di daerah “bawah”.

Kurva prestasi belajar kelompok siswa dalam satu kelas.

- Dari -3 SD sampai -1 SD adalah daerah “bawah” atau dengan

prestasi rendah

- Dari -1 SD samai +1 SD adalah daerah “sedang” atau siswa

dengan prestasi cukup.

- Dari +1 SD samapi +3 SD adalah daerah “atas” atau siswa

Page 48: DASAR-DASAR EVALUASI PENDIDIKAN(SUHARISMI ARIKUNTO.docx

dengan prestasi tinggi.

Catatan:

Daerah kurva yang diperhitungkan hanya sampai batas -3 SD dan

+3 SD walaupun masing-masing ekor dapat diperpanjang sampai

tidak terhingga.

b) Untuk menentukan seorang anak dapat atau tidaknya mengikuti

kelompok dalam menerima program berikutnya. Dalam hal ini,

tes sumatif berfungsi sebagai tes prediksi.

Contoh :

Pada saat kenaikan kelas, guru mempertimbangkan siapa saja

yang kira-kira mampu mengikuti program di kelas berikutnya.

Sebagai bahan pertimbangan adalah nilai-nilai yang diperoleh,

terutama dari tes sumatif. Siswa yang sekiranya tidak mampu

mengikuti program di kelas berikutnya dipersilahkan tinggal

kelas.

c) Untuk mengisi catatan kemajuan belajar siswa yang akan

berguna bagi:

1. Orang tua siswa

2. Pihak bimbingan dan penyuluhan di sekolah

3. Pihak-pihak lain apabila siswa tersebut akan pindah ke

sekolah lain, melanjutkan sekolah, atau memasuki lapangan

kerja.

Catatan:

Kemajuan belajar ini dikenal dengan nama rapor dan ijazah

(surat tanda tamat belajar, STTB). Tentang bagaimana bentuk

dan pengisiannya akan di bicarakan di bab lain.

4) Tes Formatf dan tes sumatif dalam praktek

Dalam pelaksanaanya di sekolah, tes formatif ini merupakan

ulangan harian, sedangkan tes sumatif biasa kita kenal sebagai

ulangan umum yang diadakan pada akhir caturwulan atau akhir

smester.

Page 49: DASAR-DASAR EVALUASI PENDIDIKAN(SUHARISMI ARIKUNTO.docx

Dalam buku seri III dari kurikulum 1975 tentang pedoman penilaian

dijelaskan bahwa tes formatif harus dilaksanakan oleh guru setiap

akhir satu sub pokok bahasan. Sedangkan tes sumatif dilaksanakan

setiap mengakhiri satu pokok bahsan (jadi dalam program yang

lebih besar).

Apabila pengertian ini dihubungkan dengan apa yang baru saja

dibicarakan beberapa halaman sebelumnya bahwa tes sumatif

dilaksanakan sebagai ulangan umum, maka tes yang dilaksanakan di

akhir pokok bahasan ini dapat dipandang sebagai tes sub sumatif

atau tes unit, sedangkan ulangan umum itulah yang disebut tes

sumatif. Dengan demikian maka keseluruhan rangkaian tes akan

terlihat dalam diagram berikut:

Sub-sub pokok bahasan

Sub pokok bahasan

S P B

S P B

S P B

= = = = = =

F F F F F F F F F F F

SS SS SS

KeteranganSS = sub sumatifSPB = sub pokok bahsanPB = pokok bahsanF = tes formatif

PB. IIPB.I PB. II

Unit

Dalam kurikulum baru, pokokbahsan dan sub pokok bahsan tidak

muncul lagi. Tetapi dengan istilah lain yang langsung menunnjuk ke

output siswa, yaitu standar kompetensi (SK) dan Kompetensi Dasar

(KD)

Memang pendapat tiap-tiap orang berbeda-beda tergantung dari luas

sempitnya pandangan. Sebagai contoh adalah keterangan di atas.

Page 50: DASAR-DASAR EVALUASI PENDIDIKAN(SUHARISMI ARIKUNTO.docx

Tes pada akhir pokok bahasan dapat dipandang sebagai tes sumatif

jika pada tiap sub pokok bahsan sudah diberikan tes formatif. Akan

tetapi, tes pada akhir pokok bahasan ini merupakan ter formatif jika

dibandingkan dengan tes akhir dari beberapa pokok bahsan (yaitu

pada akhir unit smester). Tugasnya, tes sub sumatif dapat dipandang

sebagai tes formatif maupun sumatif.

Apabila dilanjutkan lap menelusirinya. Maka tes akhri unit smester

ini merupakan tes formatif atau sumatif jika yang dianggap tes

sumatif adalah EBTA. Walupun ada kesimpang siuran mengenai

istilah ini. Namun yang diketahui oleh umum tes sumatif adalah tes

akhir caturwulan (SD) atau tes akhir smester (SMP dan SMA).

Dalam pelaksanaan tes sumatif di sekolah-sekolah ada yang

disamakan antara satu daerah atau wilayah administratif dan dikenal

sebagai THB (Tes Hasil Belajar), TPB (Tes Prestasi Belajar) atau

istilah lain lagi.

Atas dihapuskannya ujian negara menjadi ujian sekolah, maka tes

sumatif bersama (THB atau TPB) ini mempunyai kebaikan dan

kelebihan.

Kebaikan THB bersama:

a) Pihak atasan atau pengelola sekolah-sekolah (IPDA, Dinas P dan

K atau P dan K) yang dapat membandingkan kemajuan sekolah-

sekolah yang ada di wilayahnya.

b) Karena dibandingkan antara sekolah yang satu denga sekolah

yang lain, maka akan timbul persaingan sehat antara sekolah.

c) Standar pelajaran akan terpelihara dengan baik karena soal tes

yang diberikan disusun Dinas Pendidikan Atau Kanwil P dan K.

Keburukan THB bersama:

a) Ada kemungkinan akan terjadi pemberian pelajaran yang hanya

berorientasi pada “ujian” dengan cara memberikan latihan

mengerjakan soal yang sebanyak-banyaknya

b) Tidak menghiraukan jika terjadi beberapa bentuk kecurangan

Page 51: DASAR-DASAR EVALUASI PENDIDIKAN(SUHARISMI ARIKUNTO.docx

karena sekolah (sekolah-sekolah) yang ingin mendapat nama

baik.

Berhubungan dengan adanya bermacam-maam tes, dengan

sendirinya cara memberikan nilai dan perhitungannya sebagai

informasi prestasi siswa juga berbeda-beda. Tentang mengadakan

penilaian dan penggunaannya, akan dijelaskan di bab lain.

5) Perbandingan antara tes diagnostik, tes formatif dan tes sumatif

Untuk memperoleh gambaran mengenai tes diagnostik, tes formaif

dan tes sumatif secara lebih mendalam, berikut ini akan disajikan

perbandingan antra ketiganya, agar dapat diketahui persamaan dan

perbedaanya. Dalam membandingkan, akan ditinjau dari 9 aspek,

yaitu : fungsi, waktu, titik berat atau tekanannya, alat evaluasi, cara

memilih tujuan yang dievaluasi, tingkat kesulitan soal-soal tes, cara

menyekor tingkat pencapaian dan metode menuliskan hasil tes.

a) Ditinjau dari fungsinya

(1) Tes diagnostik

- Menentukan apakah bahan prasyarat telah dikuasai atau

belum

- Menentukan tingkat penguasaan siswa terhadap bahan

yang dikuasai.

- Memisah-misahkan (mengelompokan) siswa

berdasarkan kemampuan dalam menerima pelajaran

yang akan dipelajarai

- Menentukan kesulitan-kesulitan belajar yang dialami

untuk menentukan cara yang khusus untuk mengatasi

atau memberikan bimbingan.

(2) Tes formatif

Sebagai umpan balik bagi siswa, guru, maupun program

untuk menilai pelaksanaan satu unit program.

(3) Tes sumatif

Untuk memberikan tanda kepada siswa bahwa telah

Page 52: DASAR-DASAR EVALUASI PENDIDIKAN(SUHARISMI ARIKUNTO.docx

mengikuti satu program, serta menentukan posisi

kemampuan siswa dibandingkan dengan kawannya dalam

kelompok.

b) Ditinjau dari wa ktu

(1) Tes diagnostik

- Pada saat penyaringan calon siswa

- Pada saat pembagian kelas atau awal pemberian

pelajaran

- Selama pelajaran berlangsung bila guru akan

memberikan bantuan kepada siswa.

(2) Tes formatif

Selama pelajaran berlangsung untuk mengetahui

kekuarangan agar pelajaran dapat berlangsung sebaik-

baiknya.

(3) Tes sumatif

Pada akhir unit catur wulan, semester akhir tahun, atau

akhir pendidikan

c) Ditinjau dari titik berat penilaian

(1) Tes diagnostik

- Tingkah laku kognitif, afektif, dan psikomotor

- Faktor fisik, psikologis, dan lingkungan

(2) Tes Formatif

Menekankan pada tingkah laku kognitif

(3) Tes Sumatif

Pada umumnya menekankan pada tingkah laku kognitif

tetapi ada kalanya pada tingkah laku psikomotor dan

kadang-kadang pada afektif, akan tetapi walaupun

menekankan pada tingkah laku kognitif, yang diukur adalah

tingkatan yang lebih tinggi (bukan sekedar kegiatan atau

hafalan saja)

d) Ditinjau dari alat evaluasi

Page 53: DASAR-DASAR EVALUASI PENDIDIKAN(SUHARISMI ARIKUNTO.docx

(1) Tes diagnostik

- Tes prestasi belajar yang sudah distandarisasikan

- Tes diagnostik yang sudah distandarisasikan

- Tes buatan guru

- Pengamatan dan daftar cocok (check list)

(2) Tes Formatif

Tes prestasi belajar yang tersusun secara acak

(3) Tes Sumatif

Tes ujian akhir

e) Ditinjau dari cara memilih tujuan yang dievaluasi

(1) Tes diagnostik

- Memilih tiap-tiap keterampilan prasyarat.

- Memilih tujuan tiap program pelajaran secara

berimbang

- Memilih yang berhubungan dengan tingkah laku fisik,

mental dan perasaan.

(2) Tes Formatif

Mengukur semua tujuan instruksional khusus

(3) Tes Sumatif

Mengukur tujuan instruksional umum

f) Ditinjau dari tingkat kesulitan tes

(1) Tes diagnostik

Untuk mengukur keterampilan dasar, diambil soal tes yang

mudah, yang tingkat kesulitannya (indeks kesukaran) 0,65

atau lebih

(2) Tes Formatif

Belum dapat ditentukan

(3) Tes Sumatif

Rata-rata mempunyai tingkata kesulitan (indeks kesukaran)

antara 0,35 hingga 0,70 ditambah beberapa soal yang sangat

mudah dan beberapa lagi yang sangat sukar.

Page 54: DASAR-DASAR EVALUASI PENDIDIKAN(SUHARISMI ARIKUNTO.docx

g) Tinjau dari skoring (cara menyekor)

(1) Tes diagnostik

Menggunakan standar mutlak dan standar relatif (criterion

referenced dan norm referenced)

(2) Tes Formatif

Menggunakan standar mutlak (criterion reverenced)

(3) Tes Sumatif

Kebanyakan menggunakan standar relatif (norm referenced)

tetapi dapat pula dipakai standar mutlak (criterion

referenced)

h) Ditinjau dari tingkat pencapaian

Yang dimaksud dengan tingkat pencapaian adalah skor yang

harus dicapai siswa dalam setiap tes. Tingkat pencapaian ini

tidak lah sama. Tinggi rendahnya tuntutan terhadap tingkat

pencapaian tergantung dari funsi dan tujuan masing-masing.

(1) Tes diagnostik

Berhubung ada bermacam-macam tes diagnostik maka

tingkat pencapaian yang dituntut juga tidak sama. Untuk tes

diagnostik yang sifatnya memonitor kemajuan, tingkat

pencapaian yang diperoleh siswa merupakan informasi

tentang keberhhasilannya. Tindakan guru selanjutnya adalah

menyesuaikan dengan hasil tes diagnostik

Tes prasyaratnya adalah tes diagnostik yang sifatnya khusus.

Fungsinya adalah untuk mengetahui penguasaan bahan

prasyarat yang sangat penting untuk kelanjutan studi bahan

pelajaran berikutnya. Untuk itu, tingkat penguasaan dituntut

100%.

(2) Tes Formatif

Ditinjau dari tujuanm tes formatif digunakan untuk

mengetahui apakah siswa sudah mencpai tujuan

instruksional umum yang diuraikan menjadi tujuan

Page 55: DASAR-DASAR EVALUASI PENDIDIKAN(SUHARISMI ARIKUNTO.docx

instruksional khusus.

Dalam sistem pendidikan yang lama, tidak ada

tuntutan tehadap pencapaian TIK namun dalam tahun 1975,

dengan keluarnya kurikulum tahun 1975 dan modul, tingkat

pencapaian untuk tes formatif adalah 75% dari skor yang

diharapakan. Diwajibkan menempuh kegiatan perbaikan

(remedial program) hingga siswa yang bersangkutan lulus

dalam tes. Yang artinya siwa tersebut telah mencapai skor

75% dari skor maksimal yang diharapkan.

(3) Tes Sumatif

Sesuai dengan fungsi tes sumatif, yaitu memberikan tanda

kepada siswa bahwa mereka telah mengikuti suatu program

dan untuk menentukan posisi kemampuan siswa

dibandingkan dengan kawan dalam kelompoknya, maka

tidak diperlukan suatu tuntutan harus berapa tingkat

penguasaan yang dicapai. Namun demikian tidak berarti

bahwa tes sumatif tidak penting. Perlu diingat bahwa tes

sumatif ini dilaksanakan pada akhir program, berarti nilainya

digunakan untuk menentukan kenaikan kelas atau kelulusan.

Secara terpisah tidak ditentukan tingkat pencapaiannya,

tetapi secara keseluruhan akan dikenakan suatu norma

tertentu yaitu nora kenaikan kelas atau norma kelulusan.

i) Ditinjau dari cara pencatatan hasil

(1) Tes diagnostik

Dicatat dan dilaporkan dalam bentuk profil

(2) Tes formatif

Prestasi tiap siswa dilaporkan dalam bentuk catatan berhasil

atau gagal menguasai sesuatu tugas

(3) Tes sumatif

Keseluruahan skor atau sebagian skor dari tujuan-tujuan

yang dicapai.

Page 56: DASAR-DASAR EVALUASI PENDIDIKAN(SUHARISMI ARIKUNTO.docx

Scawia B Anderson membedakan tes menurut dimensi-

dimensi seperti tersebut di bawah ini.

1. Tes ditinja dari unsur suatu kegiatan dapat dibedakan atas tes

pengukur proses dan tes pengukur hasil

2. Tes ditinjau dari tujuan penggunaan hasil. Dibedakan ata tes

formatif tes sub sumatif dan tes sumatif (keterangan lebih

rinci terdapat di bagian lain).

3. Tes ditinjau dari konstruksi yang diukur, dibedakan atas tes

kepribadian, tes bakat, tes kemampuan tes minat, perhatian

dan sikap

4. Tes ditinjau dari isi atau bidang studi dibedakan atas: tes

matematika, sejarah IPA, olahraga, keterampilan dan

sebagainya

5. Tes ditinjau dari lingkup materi yang diungkap dibedakan

atas tes pencapaian dan tes penelusuran. Tes hasil belajar

mengungkap materi yang luas. Sedangkan tes penelusuran

dikenakan pada sebagian kecil bhan agar tester, dapat lebih

cermat mengamati sesuatu.

6. Tes ditinjau keragaman butri atau tugas dibedaka atas tes

homogen dan heterogen. Tes yang digunakan untuk

mengukur sesuai aspek misalnya faktor minat, maka tesnya

terdiri dai butir-butir yang seragam (homogen tester standar

biasnya terdiri dari butir-burit yang heterogen

7. Tes ditinjau dari cara tester memberikan respon, dibedakan

atas tes tertulis, tes lisan,tes keterampilan, tes pengenalan

8. Tes ditinjau dari cara skoring, dibedakan atas tes objektif

(dikenai dengan check point) dan tes subjektif (tes yang

memerlukan pertimbangan subjektivitas penilai).

9. Tes ditinjau dari standar dalam menentukan jawaban, yakni

tes yang menentukan adanya kebenaran mutlak (mengan

benar-salah) dan tes yang dimaksudkanuntuk sekedar

Page 57: DASAR-DASAR EVALUASI PENDIDIKAN(SUHARISMI ARIKUNTO.docx

mengetahui keaadaan seseorang, misalnya, tes untuk sikap

atau pendapat seseorang.

10. Tes ditinjau dari cara penadministrasian dibedan atas pre-test

(tes awal) yang dilakukan sebelum diberikannya perlakuan.

Dan post test (test akhir) yang dilakukan sesudah adanya

perlakuan.

11. Tes ditinjau dari tekanan aspek yang diukur, dibedakan atas

speed test, yang ni tes yang digunakan untuk mengukur

kecepatan testee bekerja dan power test, yakni tes yang

digunakan untuk mengukur kemampuan testee. Pembedaan

atas tesberdasarkan aspek ini dijumpai pada tes psikologi

seperti halnya mengukur tes kemampuan umum (TKU).

12. Tes ditinjau dari banyaknya testee yang di tes, dibedakan atas

individual dan tes kelompok. Tes pengukuran intelegensi

yang sifatnya klinis. Merupakan contoh tes individual

sedangkan tes-tes yang berhubungan dengan pencapaian di

lapangan pendidikan industri dan militer pada umumnya tes

kelompok

13. Tes ditinjau dari penyusunannya, dibedakan atas tes buatan

guru dan tes yang diperdagangkan, yang dikenal denga tes

terstandar.

Page 58: DASAR-DASAR EVALUASI PENDIDIKAN(SUHARISMI ARIKUNTO.docx

BAB 4

MASALAH TES

1. Pengertian

Istilah tes diambil dair kata testum, suatu pengertian dalam bahasa prancis

kuno yang berarti piring untuk menyisihkan logam-logam mulia. Ada pula

yang mengartikan sebagai sebuah piring yang dibuat dari tanah.

Seoarang ahli bernama James MC. Cattel, pada tahun 1890 telah

memperkenalkan pengertian tes ini kepada masyarakat melalui buku yang

berjudul Mental Test and Measurement. Selanjutnya, di Amerika Serikat tes

berkembang dengan cepat sehingga dalam tempo yang tidak begitu lama

masyarakat mulai menggunakannya.

Banyak ahi yang mulai mengembangkan tes ini untuk berbagai

bidang, namun yang terkenal adalah sebuah tes intelegensi yang disusunn

oleh seoarang prancis bernama Binet, yang kemudan dibantu tes BinetSimon

(1904). Dengan alat ini Binet dan Simon berusaha untuk membeda-bedakan

anak menurut tingkat intelegensinya. Dan pekerjaan Binet dan Simon inilah

kemudian kita kenal istilah-istilah umur kecerdasan (mental age), umur

kalender (chronological age) dan indeks kecerdasan, intelegensi kuesioner

atau inteligence quotient (IQ).

Sebagai perkembangannya, Yarkes di Amerika Serikat menyusun tes

kelompok (group test) yang digunakan untuk menyeleksi calon militer

sebanyak-banyaknya dalam waktu yang singkat. Diperlukan pada waktu

perang dunia 1, tes ini dikenal denga nama Army Alpha dan Army Betha.

Didorong oleh munculnya statistik dalam penganalisaan data dan

informasi, maka akhirnya tes ini digunakan dalam berbagai bidang seperti tes

kemampuan dasar, tes kesalahan perhatian, tes ingatan, tes minat, tes sikap.

Dan sebagainya. Yang dikenal penggunanya di sekolah hanyalah tes prestasi

belajar.

Sebelum sampai kepada uraian lebih jauh. Maka akan diterakan

dahulu arti dari beberapa istilah-istilah yang berhubungan dengan tes ini.

Page 59: DASAR-DASAR EVALUASI PENDIDIKAN(SUHARISMI ARIKUNTO.docx

- Tes

(sebelum adanya ejaan yang disempurnakan dalam bahasa indonesia

ditulis dengan test) adalah merupakan alat atau prosedur yang digunakan

untuk mengetahui atau mengukur suatu dalam suasana dengan cara dan

aturan-atuaran yang sudah ditentukan. Untuk mengerjakan tes ini

tergantung dari petunjuk yang diberikan. Misalnya, melingkari salah satu

huruf di depan pilihan jawaban, menerangkan, mencoret jawaban salahm

melakukan tugas atau suruhan, menajawab secara lisan dan sebagainya

- Testing

Testing merupakan saat pada waktu tes itu dilaksnakan. Dapat juga

dikatakan testing adalah saat pengambilan tes.

- Testee

(dalam istilah bahasa indonesia tercoba) adalah responden yang sedang

mengerjakan tes. Orang-orang inilah yang akan dinilai atau diukur, baik

mengenai kemampuan, minat, bakat, pencpaian, dan sebagainya.

- Tester

(dalam istilah indonesia:pencoba), adalah orang yang diserahi untuk

melaksnakan pengambilan tes terhadap para responden.

Dengan kata lain, tester adalah subjek evaluasi (tetapi adakalany hanya

orang yang ditunjuk oleh subjek evaluasi untuk melaksnakan tugasna)

tugas tester antara lain:

a. Mempersiapkan ruangan dan perlengkapan yang diperlukan

b. Membagikan lembaran tes dan alat-alat lain untuk mengerjakan

c. Menerangkan cara mengerjakan tes

d. Mengawasi responden mengerjakan tes

e. Memberikan tanda-tanda waktu

f. Mengumpulkan pekerjaan responden

g. Mengisi berita acara atau laporan yang diperlukan ( jika ada)

2. Persyaratan Tes

Page 60: DASAR-DASAR EVALUASI PENDIDIKAN(SUHARISMI ARIKUNTO.docx

pada bagian permulaan buku ini telah disinggung bahwa mengukur

panjang sisi mena dengan menggunakan karet ember yang diulur-ulur

sama halnya dengan tidak mengukur. Hasil ukurannya tidak akan

dipercapa. Akan tetapi bila keadaanya memang terpaksam yaitu apabila

kita harus melakukan pengukuran padahal yang ada distu hanyalah sehelai

tali karet ember. Maka dapat menggunkan tali itu asal menggunakannya

mengikuti aturan tertenu, yakni tidak ditarik-tarik.

Apbaila situasi ini kita pindahkan kepada pelaksanaan evaluai tes. Maka

dapat disajikan dalam situasi berikut ini:

a. Seorang guru yang belum berpengalaman menyusun tes, mengadakan

tes bahasa indonsesia. Kepada siswa diberikan sebuah bacaan panjang

dan beberapa pertanyaan yang dimaksudkan untuk mengukur

kemampuan siswa menangkap isi bacaan tersebut, tetapi hanya

meliputi sebagian awal dari bacaan saja. Di samping itu, siswa diminta

untuk mengambil beberapa kata sukar dari bacaan itu dan

menerangkan artinya. Pada waktu tes berlangsung. Guru mengguinya

dengan teliti dan tidak memberi kesempatan kepada siswa untuk saling

bekerja sama. Ter berjalan tertib.

b. Seorang guru yang sudah berpengalaman. Menyusum sebuah tes

dengan baik. Kebetulan guru ini juga mengajar Bahasa Indonesia.

Seperti hal nya guru pertama, ia memberikan sebuah bacaan dan

diikuti dengan pertanyaan-pertanyaan tentang isi bacaan. Setelah itu

diikuti oleh deretan kata-kata sukar yang harus diterangkan oleh siswa.

Pada waktu pelaksanaan tes, guru ini mendadak sakit dak pengawasan

terhadap pelaksanaan tes diserahkan kepada kawannya

Dari gambaran dua buah situasi tes di atas dapat dengan cepat

diambil kesimpulan bahwa keduanya merupakan dua contoh pelaksanaan

tes yang tidak diharapkan. Keduanya tidak akan menghasilkan informasi

yang baik tentang siswa.

Dari contoh pertama. Yang kurang baik adalah tesnya.

Pertanyaannya disusun dengan kurang cermat. Para siswa dibebaskan

Page 61: DASAR-DASAR EVALUASI PENDIDIKAN(SUHARISMI ARIKUNTO.docx

untuk memilih kata-kata yang sukar dan menerangkannya. Dengan

demikian akan terdapat banyak sekali variasi jawaban. Sehingga guru akan

menjumpai kesulitan pada waktu menilai. Guru tidak dapat memperoleh

gambaran tentang tingkat kemampuan siswanya. Nilai yang diperoleh

tidak dpat dimanfaatkan untuk mendiagnosis maupun untuk mengisi rapor.

Dari contoh kedua, tes yang disusun oleh guru sudah baik. Dengan

pengarahan dari guru. Yakni memberikan kata-kata sukar yang harus

diterangkan oleh siswa. Guru dapat memperoleh informasi siswa mana

yang sudah menguasai bahan dan siswa mana yang belum. Akan tetapi

kesalahannya terletak pada pelaksanaan/administrasi tes. Oleh karena

situasi memberikan peluang kepada siswa untuk saling menyeragamkan

jawaban. Maka guru tidak dapat memperoleh gambaran siapa sebenarnya

siswa yang sudah menguasai bahan pelajaran sehingga dapat menjadi

sumber informasi dan menjadi jasa kepada kawan-kawaannya.

Dari contoh dan keterangan ini semua dengan singkat dapat

dikatakan bahwa sumber persyaratan tes didasarkan atas dua hal:

Pertama : menyangkut mutu tes

Kedua : menyangkut pengadministrasian dalam pelaksanaan.

Walaupun dalam melaksanakan tes sudah diusahakan mengikuti

aturan tentang suasana. Cara dan prosedur yang telah ditentukan tes itu

mengandung kelemahan. Gilber Sax (1980,31-42) menyebutkan beberapa

kelemahan sebagai berikut:

1) Adakalanya tes (secara psikologis terpaksa) menyinggung pribadi

seseorang. (walaupun tidak disengaja demikian), misalnya dalam

rumusan soal, pelaksanaan. Maupun pengumuman hasi. Dalam

kompetisi tersebut merebut suatu kesempatan yang pemilihannya

melalui tes. Mau tidak mau tentu ada pihak-pihak yang dikalahkan dan

itu tentu merasa tersinggung pribadinya.

2) Tes menimbulkan kecemasan sehingga memengaruhi hasil belajar

yang murni. Tidak dapat dipungkiri bahwa tes akan menimpulkan

suasana khusus yang mengakibatkan hal-hal yang tidak sama antara

Page 62: DASAR-DASAR EVALUASI PENDIDIKAN(SUHARISMI ARIKUNTO.docx

orang yang satu denga yang lain. Di dalam penelitiannya, Kirkland

(1971) menyimpulkan bahwa

a) Besar kecilnya kecemasan mempengaruhi murni dan tidaknya hasil

belajar

b) Murid yang kurang pandai mempunyai kecemasan yang lebih besar

dibandingkan dengan anak yang berkemampuan tinggi.

c) Kebiasaan terhadap tipe tes dan pengadministrasian mengurangi

timbilnya kecemasan dalam tes.

d) Dalam kecemasan yang tinggi, murid akan mencapai hasil baik jika

soalnya bersifat ingatan, tetapi hasilnya tidak baik jika soalnya

pikiran.

e) Timbulnya kecemasan sejalan dengan tingkatan kelas

f) Meskipun pada tingkat sekolah dasar tidak terdapat perbedaaan

kecemasan. Anatara anak laki-laki dengan anak perempuan, tetapi

di tingkat sekolah menengah anak perempuan cenderung

mempunyai kecemasan yang lebih tinggi dibandingkan anak laki-

laki.

Banyak penelitian telah dilakukan oleh para ahli, tentan gkecemasan

ini. Secara umum dapat disimpulkan bahwa bagaimana pun bebasnya

suasana tes. Namun tampak bahwa penampilan testee akan berbeda

dengan jika pertanyaaan dilakukan bukan dalam suasana atau mengusir

kecemasan dengan cara menggigir tkuku, mengetuk meja, dan

sebagainya. Mengingat bahwa hasil tes dipergunakan untuk

menentukan nasib seseorang maka guru harus sangat berhati-hati dalam

memberikan pertimbangan.

3) Tes mengategorikan siswa secara tetap

Dengan mengikuti hasil tes pertama kadang-kadang orang lalu

membedakan cap kepada siswa menurut kelompok atau kategorinya,

misalnya A termasuk pandai, sedang atau kurang. Sangat sukar bagi

tester untuk mengubah predikat tersebut jika memang tidak sangat

Page 63: DASAR-DASAR EVALUASI PENDIDIKAN(SUHARISMI ARIKUNTO.docx

menyolok hasil dari tes berikutnya.

4) Tes tidak mendukung kecemerlangan dan daya kreasi siwsa

Dengan rumusan soal tes yang kompleks kadang-kadang siswa yang

kurang pandai hanya melihat pada kalimat secara sepintas. Cara seperti

ini boleh jadi menguntungkan karena waktu yang disediakan tidak

banyak habis terbuang. Siswa-siswa yang pandai, karena terlalu hati-

hati mempertimbangkan susunan kalimat. Dapat terjebak pada suatu

butiran tes dan mereka akan kehabisan waktu.

5) Tes hanya mengukur aspek tingkah laku yang sangat terbatas

Manusia mempunyai seperangkat sifat (traits) yang tidak semuanya

diukur melalui tes. Tingkah laku sebagai cermin dari sifat manusia

adakalanya lebih cocok diketahi pengalaman secara cermat. Beberapa

sifat yang lain mungkin perlu diukur dengan berbagai instrumen yang

bukan tes.

3. Ciri-ciri tes yang baik

Sebuah tes yang dapat dikatakan baik jika alat pengukur, harus memenuhi

persyaratan tes, yaitu memiliki:

a. Validitas

Sebelum mulai dengan penjelasan perlu kiranya dipahami terlebih dahulu

perbedaan arti istilah “validitas” dengan “valid”, validitas merupakan

sebuah kata benda, sedangkan valid merupakan kata sifat; dari

pengalaman sehari-hari tidak sedikit siswa atau guru mengatakan “Tes ini

baik karena sudah validitas” jelas kalimat tersebut tidak tepat, yang benar

adalah “tes ini sudah baik karena sudah valid atau tes ini baik karena

memiliki validitas tinggi.

Dalam pembicaraan evaluasi pada umumnya orang hanya menenal

istilah “valid” untuk alat evaluasi atau instrumen evaluasi, hingga saat ini

belum banyak buku yang menerapkan istilah valid untuk data. Dalam

buku ini dicoba menjelaskan asal kata pengertian valid untuk instrumen

dimulai dari pengartian valid untuk data.

Page 64: DASAR-DASAR EVALUASI PENDIDIKAN(SUHARISMI ARIKUNTO.docx

Sebuah data atau informasi dapat dikatakan valid apabila sesuai

dengan keadaan senyatanaya. Jika data yang dihasilkan dari sebuah

instrumen valid, maka dapat dikatakan bahwa instrumen tersebut valid.

Karena dapat memberikan gambaran tentang data secara benar sesuai

dengan kenyataan atau keadaan sesungguhnya. Dari sedikit uraian dan

contoh dapat disimpulkan bahwa.

Jika data yang dihasilkan oleh instrumen benar dan valid sesuai

kenyataan, maka instrumen yang digunakan tersebut juga valid.

Sebuah tes disebut valid apabila tes itu dapat mengukur apa yang

hendak diukur istilah “valid”, sangat sukar digantinya, ada istilah baru

yang mulai diperkenalkan yaitu sahih sehingga validitas diganti menjadi

kesahihan. Walaupun istilah tepat belum dapat mencakuup semua arti

yang tersirat dalam kata valid, dana kata tepat kadang-kadang digunakan

dalam koteks yang lain. Akan tetapi tambhan kata tepat dalam

menerangkan kata valid dapt memperjelas apa yang dimaksud.

Contoh:

Untuk mengukur besarnya partisipasi siswa dalam proses belajar-

mengajar, bukan diukur melalu nilai yang diperoleh pada waktu ulangan.

Tetapi dilihat melalui:

- Kehadiran

- Terpusatnya perhatian pada pelajaran

- Ketepatan menjawab pertanyaan-pertanyaaan yang diajukan oleh

guru dalam arti relevan pada permasalahannya

Nilai yang diperoleh pada waktu ulangan, bukan menggambarkan

partisipasi, tetapi menggambarkan prestasi belajar, ada beberapa macam

validitas, yaitu validitas logis (logical validity) validias ramalan (predicty

validity) dan validitas kesejajaran (concurrent validity) uraian secara

terperinci akan dibicarakan pada bab lain.

b. Reliabilitas

Kata reabilitas dalam bahasa indonesia diambil dari kata reliability dalam

Page 65: DASAR-DASAR EVALUASI PENDIDIKAN(SUHARISMI ARIKUNTO.docx

bahasa inggris, berasal dari kata reliable yang artinya dapat dipercaya.

Seperti halnya islilah validitas dan valid, kekacauan dalam penggunaan

istilah “reliabilitas” sering dikacaukan dengan istilah “reliable”. reliabel.

Reliabilitas merupakan kata benda sedangakan reliabilitas merupakan

kata sifat atau kata keadaaan.

Seoang dikatakan dapat dipercaya jika orang tersebut selalu bicara

ajeg. Tidak berubah-ubah pembicaraannya dari waktu ke waktu.

Contoh:

Demikian pula halnya sebuah tes. Tes tersebut dikatakan dapat

dipercaya jika memberikan hasil yang tepat apabila diteskan berkali-kali.

Sebuah teas dikatakan reliabel apabila hasil-hasil tes tersebut menjukan

ketetapan. Dengan kata lain, kjika kepada para siswa diberikan tes yang

sama pada waktu yang berlainan, maka setiap siswa akan berada dalam

urutan (rangking) yang sama dalam kelompok.

Walaupn tampaknya hasi tes pada pengetesan kedua lebih baik

akan tetapi karena kenaikannya dialami oleh semua siswa, maka tes yang

digunakan dpat dikatakan memiliki reliabilitas yang tinggi. Kenaikan

hasil tes kedua barangkali disebabkan oleh adanya “pengalaman” yang

diperoleh pada waktu mengerjakan tes pertama. Dalam keaan seperti ini

dikatakan bahwa ada carry-over effect atau practice-effect, yaitu

penjelasan tentang reliabitias secara lebih terperinci.

Jika dihubungkan dengan validitas maka:

a. Validitas adalah ketepatan

b. Reliabiltias adalah keteptapan.

Pengetesan Pertama Pengetesan KeduaAmin 6 7Badu 5,5 6,6Cahyani 8 9Didit 5 6Elvi 6 7Parida 7 8

Waktu Tes

TABEL NILAI TES PERTAMA DAN TES KEDUA

Nama Siswa

Page 66: DASAR-DASAR EVALUASI PENDIDIKAN(SUHARISMI ARIKUNTO.docx

c. Objektivitas

Dalam pengertian sehari-hari dengan cepat diketahui bahwa objektif

berarti tidak adanya unsur pribadi yang mempengaruhi. Lawan dari

objektif adalah subjektif, artinya terdapat unsur pribadi yang masuk

memengaruhi. Sebuah tes dikatakan memiliki objektivitas apabila dalam

melaksanakan tes itu tidak ada faktor subjektif yang memengaruhi. Hal ini

terutama terjadi pada sistem skoringnya.

Apabila dikaitkan dengan reliabilitas maka objektivitas menekankan

ketetapan (consistency) pada sistem skoring, sedangkan reliabilitas

menekankan ketetapan dalam hasil tes.

Ada 2 (dua) faktor yang memengaruhi subjektivitas dari suatu tes, yaitu

bentuk tes dan penilai.

1) Bentuk tes

Tes yang berbentuk uraian, akan memberi banyak kemungkinan

kepada si penilai untuk memberikan penilaian menrut caranya sendiri.

Dengan demikian maka hasil dari seoarang siswa yang mengerjakan

soal-soal dari sebuah tes akan dapat berbeda apabila dinilai oleh dua

orang penilai. Itulah sebabnya pada waktu ini ada kecenderungan

penggunaan tes objektif di berbagai bidang. Untuk menghindari

masuknya unsur subjektivitas dari penilai. Maka sistem skoringnya

dapat dilakukkan dengan cara sebaik-baiknya, antara lain dengan

membuat pedoman skoring terlebih dahulu.

2) Penilai

Subjektivias dari penilai akan dapat masuk secara agak leluasa.

Terutama dalam tes bentuk uraian. Faktor-faktor yang memengaruhi

subjektifitas. Anatara lain. Kesan penilai terhadap siswa. Tulisan

bahasa. Waktu mengadakan penilaian, kelelahan dan sebagainya.

Untuk menghindari atau mengurangi masuknya unsur subjektifitas

dalam pekerjaan penilaian, maka penilaian atau evaluasi ini harus

dilaksanakan dengan mengingat pedoman. Pedoman yang dimaksud

terutama menyangkut masalah pengadministrasian, yaitu kontinuitas

Page 67: DASAR-DASAR EVALUASI PENDIDIKAN(SUHARISMI ARIKUNTO.docx

dan komprehensivitas

a) Evaluasi harus dilakukan secara kontinu (terus –menerus), dengan

evaluasi yang berkali-kali dilakukan maka guru akan memperoleh

gambaran yang lebih jelas tentang keadaan siswa. Tes yang

diadakan secara on the spot dan hanya satu atau dua kali. Tidak

akan dpat memberikan hasil yang objektif tentang keadaan

seorang siswa. Faktor kebetulan. Akan sangat mengganggu

hasilnya. Kalau misalnya ada orang anak yang sebetulnya pandai,

tetapi pada waktu mengadakan tes dia sedang dalam kondisi yang

jelek karena semalaman merawat ibunya yang sedang sakit, maka

sada kemungkinan nilai tesnya jelek pula.

b) Evaluai harus dilakukan secara komprehensif (menyeluruh) yang

dimaksud dengan evaluasi yang komprehensif disini adalah atas

berbagai segi peninjauan yaitu:

(1) Mencakup keseluruhan materi.

(2) Mencakup berbagai aspek berfikir (ingatan, pemahaman

aplikasi dan sebagainya)

(3) Melalui berbagai cara aitu tes tertulis, tes lisan tes pembuatan

pengamatan insidental dan sebagainya.

d. Praktikabilitas

Sebuah tes dikatakan meiliki praktikabilitas yaitu tinggi apabila tes

tersebut bersifat praktis, mudah pengadministrasiannya.

Tes yang praktis adalah tes yang:

1) Mudah dilaknakanak misalnya tidak menuntut peralatan yang banyak

dan memberi kebebasan kepada siswa untuk mengerjakan terlebih

dahulu bagian yang dianggap mudah oleh siswa.

2) Mudah pemeriksaanya, artinya bahwa tes itu dilengkapi dengan kunci

jawaban maupun pedoman skoringnya. Untuk soal bentuk objektif.

Pemeriksaan akan lebih mudah dilakukan jika dikerjakan oleh siswa

dalam lembar jawaban.

Page 68: DASAR-DASAR EVALUASI PENDIDIKAN(SUHARISMI ARIKUNTO.docx

3) Dilengkapi dengan petunjuk-petunjuk yang jelas sehingga dapat

diberikan/diawali oleh orang lain.

e. Ekonomis.

Yang dimaksud dengan ekonomis disini ialah bahwa pelaksanaan tes

tersebut tidak membutuhkan ongkos/biaya yang mahal, tenaga yang

banyak dan waktu yang lama.

Page 69: DASAR-DASAR EVALUASI PENDIDIKAN(SUHARISMI ARIKUNTO.docx

BAB 5

VALIDITAS

Seperti sudah disinggung di depan bahwa ketentuan penting dalam evaluasi

adalah bahwa hasilnya harus sesuai dengan keadaan yang dievaluasi.

Mengevaluasi dapat diumpamakan sebagai pekerjaan memotret. Gambar potret

atau foto dikatakan baik apabila sesuai dengan aslinya (bukan lebih baik dari

aslinya seperti dikatakan oleh iklan foto). Gambar pemotretan hasil evalauasi

tersebut di dalam kegiatan evaluasi dikenal dengan data evaluasi. Data evaluasi

yang baik sesuai dengan kenyataan disebut data valid. Agar dapat diperoleh data

yang valid, instrumen atau alat untuk mengevaluasinya harus valid. Jika

pernyataan tesebut dibalik. Instrumen evaluasi dituntut untuk valid karena

diinginkan dapat diperoleh data yang valid. Dengan kata lain, instrumen evaluasi

dipersyarakan valid agar hasil yang diperoleh dari kegiatan evaluasi valid.

Dalam pembicaraaan ini akan dikemukakan adanya dua jenis validitas. Validitas

pertama menyangkut soal cara keseluruhan yang akan di bahas pada bagian awala

bab ini. Sesudah selesai, disusul pembahasan validitas kedua. Yaktni validitas

menyangkut butir soal atau item dan validitas faktor yang menyangkut bagian

materi.

1. Macam-Macam Validitas

Di dalam buku Encyclopedia Of Educational Evaluation, yang ditulis oleh

Scarvia B. Anderson dan kawan-kawan disebutkan:

A test is valid if it measures what it purpose to measure. Atau jika

diartikan lebih kurang demikian: sebuah tes dikatakan valid apabila tes

tersebut mengukur apa yang hendak diukur. Dalam bahasa indonesia “Valid”

disebut sebagai istilah “Sahih”

Sebenarnya pembicaraan validitas ini bukan ditekankan pada tes itu

sendiri tetapi pada hasil pengetesan skornya.

Contoh:

Skor yang diperoleh dari hasil mengukur kemampuan mekanik akan

menunjukkan kemampuan seseorang dalam memegang dan memperbaiki

Page 70: DASAR-DASAR EVALUASI PENDIDIKAN(SUHARISMI ARIKUNTO.docx

mobil, bukan pengetahuan tersebut dalam hal yang berkaitan dengan mobil.

Tes yang mengukur pengetahuan tentang mobiil bukanlah tes yang sahih

untuk mekanik.

Validitas sebuah tes dapat diketahui dari hasil pemikiran dan dari hasil

pengalaman, hal yang pertama dakan diperoleh validitas logis (logical

validity) dan hal yang kedua diperoleh validitas empiris (empirical validity)

dua hal inilah yang dijadikan dasar pengelompokan validitas tes

Secara gari besar ada dua macam validitas, yaitu validitas logis dan

validitas empiris

a. Validitas Logis

Istiliah validitas logis mengandung kata logis yang berasal dari kata

logika yang berarti penalaran. Dengan makna demikian maka validitas

logis untuk sebuah instrumen evaluasi menunjuk pada kondisi bagi

sebuah instrumen yang memenuhi persyaratan valid berdasarkan hasil

penalaran. Kondisi valid tersebut dipandang terpenuhi karena instrumen

yang bersangkutan sudah dirancang secara baik. Mengikuti teori dan

ketentuan yang ada. Sebagaimana pelaksanaan tugas lain misalnya

membuat sebuah karangan. Jika penulis mengikuti aturan mengarang.

Tentu secara logis karanganya sudah baik. Berdasarkan penjelasan

tersebut maka instrumen yang sudah disusun berdasarkan teori

penyusunan instrumen, secara logis sudah valid, dari penjelasan tersebut

kita dapat memahami bahwa validitas logis dapat dicapai apabila

isntrumen disusun mengikuti ketentuan yang ada, dengan demikian

disimpulkan bahwa validitas logis tidak perlu diuji kondisinya. Tetapi

langsung diperoleh sesudah instrumen tersebut selesai disusun.

Ada dua macam validitas logis yang dapat dicapai oleh sebuah

instrumen yaitu validitas isi dan validitas konstrak (Construct Validity).

Validitas isi bagi sebuah instrumen menunjuk suatu kondisi sebuah

instrumen yang disusun berdasarkan isi materi pelajran yang dievaluasi.

Selanjutnya validitas konstrak sebuah instrumen menunjuk suatu kondisi

sebuah instrumen yang disusun berdasarkan konstrak askpek-aspek

Page 71: DASAR-DASAR EVALUASI PENDIDIKAN(SUHARISMI ARIKUNTO.docx

kejiawaan yang seharunya dievaluasi. Penjelasan lebih jauh tentang kedua

jenis validitas logis ini akan diberikan berturut-turut dalam membahas

jenis validitas instrumen nanti

b. Validitias Empiris

Istilah validitas empiris menurut kata empiris yang artinya pengalaman.

Sebuah instrumen dapat dikatakan memiliki validitas empiris apabila

sudah diuji dari pengalaman. Sebagai contoh sehari-hari, sehorang dapat

diakui jujur oleh masyarakat apabila dalam pengalaman membuktikan

bahwa orang tersebut memang jujur. Contoh lain, seorang dapat dikatakan

keratif apabila dari pengalaman dibuktikan bahwa orang tesebut sudah

banyak menghasilkan ide-ide baru yang diakui berbeda dari hal-hal yang

sudah ada. Dari penjelasan dan contoh tersebut diketahui bahwa validitas

empiris tidak dapat diperoleh hanya dengan menyusun instrumen

berdasarkan ketentuan seperti halnya validitas logis, tetapi harus

dibuktikan melalui pengalaman.

Ada dua macamvaliditas empiris, yakni ada dua cara yang dapat

dilakukan untuk menguji bahwa sebuah instrumen memang valid.

Pengujian tersebut dilakukan dengan membandingkan kondisi instumen

yang bersangkutan dengan kriterium atau sebuah ukuran. Kriteria yang

digunakan sebagai skor pembanding kondisi instrumen. Dimaksud ada

dua yaitu yang sudah tersedia dan yang belum tersedia tetapi akan terjadi

diwaktu yang akan datang. Bagi instrumen yang kondisinya sesuai dengan

kriterium yang sudah tersedia, yang sudah ada, disebut memiliki validitas

“ada sekarang” yang dalam istilah bahasa inggris disebut memiliki

concurrent validity. Selanjutnya instumen yang kondisinya sesuai dengan

kriterium yang diramalkan akan terjadi, disebut memili validitas ramalan

atau validitas prediksi. Yang dalam istilah bahasa inggris disebut

memiliki predictive validity.

Dari uraian ada dua jenis validitas logis yang ada dua macam dan

validitas empiris juga, yang juga ada dua macama, maka secara

keseluruhan kita mengenal adanyaempat validitas yaitu 1) validitas isi 2)

Page 72: DASAR-DASAR EVALUASI PENDIDIKAN(SUHARISMI ARIKUNTO.docx

validitas konstrak, 3) validitas “ada sekarang” dan 4)validitas predictive.

Dua yang pertama yakni (1) dan (2) dicapai melalui penyusunan

berdasarkan ketentuan atau teori, sedangkan teori berikutnya yakni (3)

dan (4) dicapai atau diketahui sesudah dibuktikan melalui pengalaman.

Adapun penjelasan masing-masing validita adalah sebagai berikut:

1) Validitas isi (content validity)

Sebuah tes dikatakan memiliki validitas isi apabila mengukur tujuan

khusus tertentu yang sejajar dengan materi atau isi pelajaran yang

diberikan. Oleh karena materi yang diajarkan tertera dalam kurikulum

maka validitas isi ini sering juga disebut validitas kurikuler.

Validitas isi dapat diusahakan tercapainya sejak saat penyusunnan

dengan cara memerinci materi kurikulum atau meter, buku pelajaran

bagaimana cara merinci materi untuk kepentingan diperlukan validitas

isi sebuah tes akan dibicarakan secara lebih mendalam pada waktu

menjelaskan cara penyusunan tes.

2) Validitas konstruksi (contruct validity)

Sebuah tes dikatakan memiliki validitas konstruksi apabila butir-butir

soal yang membangun tes tersebut mengukur setiap aspek berpikir

seperti yang disebutkan dalam tujuan instruktusional khusus. Dengan

kata lain jika butir-butir soal mengukur aspek berpikir tersebut sudah

sesuai dengan aspek berpikir yang menjadi tujuan instruksional.

Sebagai contoh jika rumusan tujuan instruksional khusus (TIK)

psikologis maka butir soal pada tes merupakan perintah agar siswa

membedakan antara dua efek tersebut, sekarang TIK dikenal dengan

indikator.

“konstruksi” dalam pengertian ini bukanlah susunan seperti yang

sering dijumpai dalam teknik. Tetapi merupakan rekaan psikologis,

yaitu suatu rekaan yang dibuat oleh para ahli ilmu jiwa yang dengan

suatu cara tertentu merinci isi jiwa atas bebrapa aspek seperti: ingatan,

pemahaman, aplikasi dan seterusnya. Dalam hal ini mereka

menganggap seolah-olah jiwa dapat dibagi-bagi, tetapi sebenarnya

Page 73: DASAR-DASAR EVALUASI PENDIDIKAN(SUHARISMI ARIKUNTO.docx

tidak demikian. Pembagian ini hanya merupakan tindakan sementara

untuk mempermudah mempelajari.

Seperti halnya validitas isi. Validitas konstruksi dapat diketahu

dengan cara memerinci dan memasangkan setiap butir soal dengan

setiap aspek dalam TIK. Pekerjaan dilakukan berdasarkan logika,

bukan pengalaman. Dalam pembicaraan mengenai penyusunan tes hal

ini akan disinggung lagi.

3) Validitas “ada sekarang” (concurrent validity)

Validitas ini lebih umum dikienal dengan validitas empiris, sebuah tes

dikatakan memiliki validitas empiris jika hasilnya sesuai dengan

pengalaman. Jika ada istilah sesuai tentu ada dua hal yang

dipasangkan. Dalam hal ini hasil tes dipasangkan dengan hasil

pengalaman. Pengalaman selalu mengenai hal yang telah lampau

sehingga data pengalaman tersebut sekarang sudah ada (ada sekarang

concurrent)

Misalnya seorang guru ingin mengetahu apakah tes yang disusun

sudah valid atau belum. Untuk diperlukan sebuah kriterium masa lalu

yang sekarang datanya dimiliki. Misalnya nilai ulangan harian atau

nilai ulangan sumatif yang lalu.

4) Validitas preksi (Predictive validity)

Memprekdiksi artinya meramal, dengan meramal selalu mengenal hal

yang akan datang jadi sekarang belum terjadi, sebuah tes dikatakan

memiliki validitas prediksi atau validitas ramalan. Apabila

mempunyai kemampuan untuk meramalkan apa yang akan terjadi

pada masa saya yang akan datang

Sebagai alat pembanding validitas prediksi adalah nilai-nilai yang

diperoleh setelah tes mengikuti pelajaran di perguruan tinggi. Jika

ternya siapa yang memiliki nilai tes lebih tinggi gagal dalam ujiam

semester 1 dibandingkan dengan yang dahulu nilai tesnya muda maka

tes masuk yang dimaksud memiliki nilai tes lebih tinggi gagal dalam

ujian smester 1 dibandingkan dengan dahulu nilai tesnya lebih rencah,

Page 74: DASAR-DASAR EVALUASI PENDIDIKAN(SUHARISMI ARIKUNTO.docx

maka tes masuk yang dimaksud tidak memiliki validitas prediksi.

2. Cara Mengetahui Validitas Alat Ukur

Sekali lagi diulang bahwa sebuah tes dikatakan memiliki validitas jika

hasilnya sesuai dengan kriterium, dalam arti memiliki kesejajaran antra hasil

tes tersebut dengan kriterium. Teknik yang digunakan untuk mengetahui

kesejajaran adalah teknik korelasi product moment yang dikemukakan oleh

pearson.

Rumus korelasi product ada 2(dua) macam yaitu

a. Korelasi product moment dengan simpangan dan

b. Korelasi product moment dengan angka kasar.

Rumus korelasi product moment dengan simpangan:

Dimana:

rxy = koefisien korelasi antra variabel X dan variabel Y, dua variabel

yang dikorelasikan (x = X –X dan y=Y – Y)

xy= jumlah perkalian x dengan y

x2 = kuadrat dari x

x2 = kuadrat dari y

Contoh perhitungan:

Misal akan menghitung validitas tes prestasi belajar matematika, sebagai

kriterium diambil rata-rata ulangan yang akan dicari validitasnya diberi x dan

rata-rata nilai harian diberi kodeY. Kemudian dibuat tabel persiapan sebagai

berikut.

Page 75: DASAR-DASAR EVALUASI PENDIDIKAN(SUHARISMI ARIKUNTO.docx

TABEL PERSIAPAN UNTUK MENCARI VALIDITAS TES PRESTASI

MATEMATIKA

No Nama X Y x y x2 y2 XY

1 Nadia 6,5 6,3 0 - 0,1 0 0,01 02 Susi 7 6,8 + 0,5 + 0,4 0,25 0,16 + 0,23 Cecep 7,5 7,2 + 1,0 + 0,8 1 0,64 + 0,84 Erna 7 6,8 + 0,5 + 0,4 0,25 0,16 + 0,25 Dian 6 7 - 0,5 + 0,6 0,25 0,36 - 0,36 Asmara 6 6,2 - 0,6 - 0,2 0,25 0,04 + 0,17 Siswoyo 5,5 5,1 - 0,7 - 1,3 1 1,69 + 1,38 Jihad 6,5 6 0 - 0,4 0 0,16 0,09 Yana 7 6,5 + 0,5 + 0,1 0,25 0,01 + 0,05

10 Lina 6 5,9 - 0,5 - 0,6 0,25 0,36 + 0,3Jumlah 65 63 3,5 3,59 2,65

X = X -

Y = Y -

Dimasukan ke rumus

Indeks korelasi antara X dan Y inilah indeks validitas soal yang dicari.

Rumus korelasi product moment dengan angka kasar:

r xy=N XY−(X )(Y )

√ {N X2 ( X )2 } {N Y 2−(Y )2 }

Dimana:

rxy = koefisien korelasi antara variabel X dan variabel Y, dan variabel yang

dikorelasikan

Y

X

r xy=❑xy

√(❑x2 ) (❑y

2 )

= 2,65

√3,5 x 3,59 =

2,65

√12,565

= 2,65

3,545

Page 76: DASAR-DASAR EVALUASI PENDIDIKAN(SUHARISMI ARIKUNTO.docx

dengan menggunakan data hasil tes prestasi matematika di atas kini

dihitung dengan rumus korelasi product moment dengan angka kasar yang

tabel persiapannya sebagai berikut:

No Nama X Y x2 y2 XY1 Nadia 6,2 6,3 42,25 39,69 40,952 Susi 7 6,8 49 46,24 47,63 Cecep 7,5 7,2 56,25 51,84 544 Erna 7 6,8 49 46,24 47,65 Dian 6 7 36 49 426 Asmara 6 6,2 36 38,44 37,27 Siswoyo 5,5 5,1 30,25 26,01 28,058 Jihad 6,5 6 42,25 45,5 399 Yana 7 6,5 49 36 45,5

10 Lina 6 5,9 36 34,81 35,4Jumlah 65 63,8 426 410,5 417,3

Dimasukan ke dalam rumus:

r xy=N XY−(X )(Y )

√ {N X2 ( X )2 } {N Y 2−(Y )2 }

rxy=10 x417,2=(65 x63,8 )

√(10 x 426−4225 ) (10 x410,52−4070,44 )

¿ 4173−4147

√( 4260−4225 ) (410,2−4070,44 )

¿ 26

√35 x 34,76= 26

√1216,6

¿ 2634,8797

=0745

Jika dibandingkan dengan validitas soal yang dihitung dengan rumus

simpangan, ternyata terdapat perbedaan sebesar 0,003 lebih besar yang

dihitung dengan rumus simpanganan. Hal ini wajar karena dalam

mengerjakan perkalian atau penjumlahan jika diperoleh 3 atau angka di

belakang koma dilakukan pembulatan keatas. Perbedaan ini sangat kecil

sehingga dapat diabaikan.

Page 77: DASAR-DASAR EVALUASI PENDIDIKAN(SUHARISMI ARIKUNTO.docx

Untuk memperjelas pengertian tersebut dapat disampaikan keterangan

sebagai berikut.

- Korelasi fositif menunjukan adanya hubungan sejajar antara dua hal

misalnya hal pertama nilanya naik, hal kedua ikut naik sebaliknya jika

hal pertama turun, yang kedua ikut turun.

Contoh korelasi positif antara nilai IPA dan Matematika

IPA : 2, 3, 5, 7, 4, 3, 2

Matematika : 4, 5, 6, 8, 5, 4, 2

Kondisi nilai matematika sejajar dengan IPA karena naik dan turunnya

nilai matematika mengikuti naik dan turunnya nilai IPA, Coba

Perhatikan!

- Korelasi negatif menunjukan adanya hubungan kebalikan antara dua hal.

Misalnya, hal pertama nilai naik, justru yang kedua turun sebaliknya jika

yang pertama turun yang kedua naik.

Contoh korelasi negatif antara nilai bahasa indonesia dengan matematika

Bahasa Indonesia : 5, 6, 8, 4, 3, 2,

Matematika : 8, 7, 5, 1, 2, 3

Keadaan hubungan antara dua hal yang kita jumpai dalam

kehidupan sehari-hari tidak selalu hanya positif atau negatif saja, tetapi

mungkin 0. Biasanya korelasi pun tidak menentu. Coba cermatilah

bagaimana hubungan antara dua nilai mata pelajaran A dan B berikut ini.

Contoh korelasi tidak tertentu.

Nilai A : 5, 6, 4, 7, 3, 8, 7

Nilai B : 4, 4, 3, 7, 4, 9, 4

Koefisien korelasi terdapat antara -1,00 samapai +1,00 namun

karena dalam menghitung sering dilakukan pembulatan angka=angka

sangat mungkin diperoleh koefisien lebih dari 1,00 koefisien negatif.

Menununjukan adanya kesejajaran untuk mengadakan interprestasi

mengenai besarnya koefisien korelasi adalah sebagai berikut:

- Antara 0,800 sampai dengan 1,00 : sangat tinggi

- Antara 0,600 sampai dengan 0,800 : tinggi

Page 78: DASAR-DASAR EVALUASI PENDIDIKAN(SUHARISMI ARIKUNTO.docx

- Antara 0,400 sampai dengan 0,600 : cukup

- Antara 0,200 sampai dengan 0,400 : rendah

- Antara 0,000 sampai dengan 0,200 : sangat rendah

Penafsiran harga koefisien korelasi ada 2 (dua) cara yaitu:

1. Dengan melihat harga r dan diinterprestasikan misalnya korelasi

tinggi, cukup dan sebagainya.

2. Dengan berkonsultasi ke tabel harga kritik product moment sehingga

dapat diketahui signifikan tidak korelasi tersebut. Jika harga r lebih

kecil dari harga kritik dalam tabel. Maka korelasi tersebut tidak

signifikan begitu juga arti sebaliknya.

3. Validitas butiran soal atau validitas item

Apa yang sudah dibicarakan di atas adalah validitas soal secara keseluruhan

tes. Disamping mencari validitas soal perlu juga dicari validitas item. Jika

seorang peneliti atau guru yang mengetahui bahwa validitas soal tes misalnya

terlalu rendah atau rendah saja, maka selanjutnya ingin mengetahi butir-butir

tes manakah yang menyebabkan soal secara keseluruhan tersebut jelek karena

memiliki validitas rendah untuk keperluan inilah dicari validitas butir soal.

Pengertian umum untuk validitas item adalah demikian sebuah item

dikatakan valid apabila mempunyai dukungan yang besar terhadap skor total.

Skor pada item menyebabkan skor total menjadi tinggi atau rendah. Dengan

kata lain dapat dikemukakan disini bahwa sebuah item memiliki validitas

yang tinggi jika skor pada item mempunyai kesejajaran dengan skor total.

Kesejajaran ini dapat diartikan dengan korelasi sehingga untuk mengetahui

validitas item digunakan rumus korelasi seperti sudah diterangkan di atas.

Untuk soal-soal bentuk objektif skor untuk item biasa diberikan

dengan 1 (bagi item yang di jawab benar) dan 0 (item yang di jawab salah)

sedangkan skor total selanjutnya merupakan jumlah dari skor untuk semua

item yang membangun soal tersebut.

Contoh perhitungan :

Tabel Analisis Item Untuk Perhitungan Validitas Item

Page 79: DASAR-DASAR EVALUASI PENDIDIKAN(SUHARISMI ARIKUNTO.docx

No NamaButir soal/Item skor

total1 2 3 4 5 6 7 8 9 101 Hartati 1 0 1 0 1 1 1 1 1 1 82 Yoyok 0 0 1 0 1 0 0 1 1 1 53 Oktaf 0 1 0 0 0 1 0 1 0 1 44 Wendi 1 1 0 0 1 1 0 0 1 0 55 Diana 1 1 1 1 1 1 0 0 0 0 66 Paul 1 0 1 0 1 0 1 0 0 0 47 Susana 1 1 1 1 1 1 1 0 0 0 78 Helen 0 1 0 1 1 1 1 1 1 1 8

Misalnya akan dihitung validatis item nomor 6, maka skor item

tesebyt variabel x dan skor total tersebut variabel y. Selanjutnya perhitungan

dilakukan dengan menggunakan rumus korelasi product moment. Baik

dengan rumus simpangan maupun rumus angka kasar.

Penggunaan kedua rumus tersebut masing-masing ada keuntungannya

menggunkan rumus simpangan angkanya kecil-kecil. Tetapi kadang-kadang

pecahanya cenderung banyak pecahan. Mengalikan pecahan persepuluhan

ditambah dengan tanda-tanda plus (+) dan minus (-) kadang-kadang bisa

menyesatkan. Penggunaan rumus angka kasar bilangannya besar-besar tetapi

bulat. Jika ada kalkulator statistik disarankan menggunakan rumus angka

kasar saja. Yang dibutuhkan hanya :X, Y, X2, Y2 dan XY, tidak perlu

membuat tabel seutuhnya.

Contoh perhitungan mencari validitas item

Untuk menghitung validitas item nomor 6, dibuat terlebih dahulu tabel

persiapannya sebagai berikut.

Tabel Persiapan Untuk menghitung Validitas

Page 80: DASAR-DASAR EVALUASI PENDIDIKAN(SUHARISMI ARIKUNTO.docx

Item Nomor 6

No Nama X Y1 Hartati 1 82 Yoyok 0 53 Oktaf 1 34 Wendi 1 55 Diana 1 66 Paul 0 47 Susana 1 78 Helen 1 8

Ketrangan:

X = skor item nomor 6

Y = Skor total

Dari perhitungan kalkulator diperoleh data sebagai berikut:

X=6

y=46

XY =37

Xt = 5,57 X

Y = 6,17 Y

Sesudah diketahui X, x2, Y2, dan XY tinggal memasukan

bilangan-bilangan tersebut ke dalam rumus korelasi product moment dengan

rumus angka kasar.

Data diatas dimasukan ke dalam rumus korelasi product moment

dengan angka kasar

r xy=N XY−( X )(Y )

√ {N X2−(X )2 } {N Y 2−(Y )2 }

r xy=8 x37−6 x 46

√ (8 x6−62 ) (8 x 288−462 )

¿ 296−276

√( 48−36 ) x (2304−2116 )

¿ 20

√12 x188= 20

√2256

Page 81: DASAR-DASAR EVALUASI PENDIDIKAN(SUHARISMI ARIKUNTO.docx

¿ 2047,497

=0,421

Koefisien validasi item nomor 6 adalah 0,421 dilihat sepintas bilangan

ini memang sesuai dengan kenyataannya. Hal ini dapat diketahui dari skor-

skor yang tertera baik pada item maupun skor total oktaf yang hanya

memiliki skor total 3 dapat memperoleh skor 1 pada item, sengakan yoyok

dan wendi yang mempunyai skor total sama, yaitu 5 skor pada item tidak

sama. Validitas item tersebut kurang meyakinkan tentu saja validitasnya tidak

tinggi.

Masih ada cara-cara lain untuk menghitung validitas item. Salah satu

car yang dikenal adalah menggunkan rumu ypbl; yang rumus lengkapnya

adalah sebagai berikut:

y pbl=M p−M 1

St √ pq

Keterangan:

ypbi = koefisien korelasi biserial

Mp = rata skor subjek yang menjawab betul bagi item yang dicari

validitasnya

Mt = rerata skor

St = standar deviasi dari skor total proporsi

p = proporsi siswa yang menjawab benar

p=banyaknya siswa yang benarjumlah seluruh siswa

q = proporsi siswa yang menjawab salah (q=1 - p)

Apabila item 6 tersebut dicari validitasnya dengan rumus ini maka

perhitungannya melalui langkah sebagai berikut:

1. Mencari M p=8+3+5+6+7+8

6=37

6=6,17

2. Mencari M t=8+5+3+5+6+4+7+8

8=46

8=5,75

Page 82: DASAR-DASAR EVALUASI PENDIDIKAN(SUHARISMI ARIKUNTO.docx

3. Dari kalkulator diperoleh harga standar deviasi, yaitu n =1,7139 atau

n-1 = 1,8323. Untk n kecil diambil standar deviasi yang n=1,7139

4. Menentukan harga p1 yaitu68=0,17

5. Menentukan harga q1 yaitu28

atau1−0,75=0,25

6. Memasukan ke rumus y pbi

y pbi=M p−M t

S1 √ pq

¿ 6,17=5,751,7139 √ 0,75

0,25

¿ 0,421,7139

=1,7321

¿0,4244

Dari perhitungan validitas item 6 dengan dua cara ternyata hasilnya

berbeda tetapi sangat kecil yaitu 0,0034. Mungkin hal ini disebabkan karena

adanaya pembulatan angka.

4. Tes terstandar sebagai kriterium dalam menentukan validasi.

Tes terstamdar adalah tes yang telah dicobakan berkali-kali sehingga dapat

dijamin kebaikannya. Di negara-negara berkembang biasa tersedia tes

semacam ini. Dan dikenal nama standardized test. Sebuah tes terstandar

biasanya memiliki identitas antara lain, sudah dicobakan berapa kali dan

dimana berapa koefisien validitas, reliabilitas taraf kesukaran daya pembeda

dan lain-lain keterangan yang dianggap perlu. Cara menentukan validitas soal

yang menggunakan tes standar sebagai kriterium dilakukan dengan

mengalikan koefisien validitas yang diperoleh dengan koefisien tes terstandar

tersebut.

Page 83: DASAR-DASAR EVALUASI PENDIDIKAN(SUHARISMI ARIKUNTO.docx

Contoh perhitungan:

Tebel Persiapan Perhitungan Validitas Tes Matematika

Dengan Kriterium Tes Terstandar Matematika

No Nama X Y x2 y2 XY keterangan1 Nining 5 7 25 49 35

X = hasil tes matematika yang dicari validtasnya

2 Maruti 6 6 36 36 363 Bambang 5 6 25 36 304 Seno 6 7 36 49 42

Y= hasil tes standar5 Hartini 7 7 49 49 496 Heru 6 5 36 25 30

Dimasukan ke dalam rumus korelasi product moment dengan

angka kasar sebagai berikut:

r xy=N XY−( X ) (Y )

√ {N X2−( X )2 } {N Y 2−(Y )2 }

r xy=6 x22−35 x 38

√¿¿¿

¿ 1332−1330

√(1242−1225 ) (1464−1444 )

¿ 218,439

=0,108

Jika dari tes terstandar diketahui bahwa validitas 0,89 naja bukagab

0,108 ini belum merupakan validitas soal matematika yang dicar. Validitas

tersebut harus dikalikan dengan 0,89 yang hasilnya 0,108 x 0,89=0,096

5. Validitas Faktor

Selain validtitas soal secara keseluruhan dan validitas buti yang masih ada

lagi yang perlu diketahui validitasnya. Yaitu faktor-faktor atau bagian

keseluruhan materi. Setiap keseluruhan materi pelajaran terdiri dari pokok-

pokok bahasan atau mungkin sekelompok bahasan yang merupakan satu

kesatuan

Contoh:

guru akan mengevaluasi penguasaan siswa untuk tiga pokok bahan yaitu:

Page 84: DASAR-DASAR EVALUASI PENDIDIKAN(SUHARISMI ARIKUNTO.docx

bunyi, cahaya, dan listrik untuk keperluan ini guru tersebut membuat 30 butir

soal, untuk bunyi 8 butir, untuk 12 butir dan untuk listrik 10 butir.

Apabila guru ingin mengetahi validitas faktor, maka ada 3 faktor

dalam soal ini. Seperti halnya pengertian validtias butir, pengertian validtias

faktor adalah sebagai berikut: butir-butir soal dalam faktor dikatakan valid

apabila mempunyai dukungan yang besar terhadap soal secara keseluruhan.

Sebagai tanda bahwa butir-butir faktor tersebut mempunyai dukungan yang

besar terhadap seluruh soal, yakni apabila jumlah skor untuk butir-butir faktor

tersebut jumlah skor untuk butir-butir faktor tesebut menunjukan adanya

kesejajaran dengan skor total. Agar uraian ini lebih jelas, pada halaman

selanjutnya disajikan contoh tabel analisis butirnya.

Page 85: DASAR-DASAR EVALUASI PENDIDIKAN(SUHARISMI ARIKUNTO.docx

CONTOH TABEL ANALISIS BUTIR UNTUK MENGHITUNG VALIDITTAS BUTIR DAN

VALIDITAS FAKTOR

Subjek Butir 1 2 3 4 5 6 7 8Skor

Faktor 1

9 10 11 12 13 14 15 16 17 18 19 20

Skor Faktor

221 22 23 24 25 26 27 2

8 29 30Skor

Faktor 3

Amir 1 0 1 1 1 1 0 1 6 1 0 1 0 1 0 1 0 1 0 1 0 6 1 0 1 1 1 0 1 1 1 0 7 19Hasan 1 1 1 1 1 1 1 0 7 1 1 1 1 0 1 1 1 1 0 0 1 9 1 1 1 1 1 1 1 1 1 0 9 25Ninda 1 0 1 0 1 0 1 0 4 1 1 0 0 0 0 1 1 0 1 1 0 6 1 0 1 1 0 1 1 0 1 1 7 17Warih 0 1 1 0 0 0 0 1 3 0 0 0 1 1 0 1 0 1 0 0 0 4 1 0 0 0 1 0 0 1 1 1 5 12Irzal 1 1 1 1 1 1 1 1 8 1 1 1 1 1 1 1 1 1 0 1 1 11 1 1 1 1 1 1 1 1 1 1 10 29Gandi 1 1 0 1 1 0 1 1 6 1 0 1 1 1 1 1 1 0 1 1 0 9 1 1 1 1 1 0 0 1 1 1 8 23Santo 1 0 1 0 1 1 0 1 5 1 0 0 0 1 1 1 0 1 1 1 0 7 1 1 1 1 0 0 0 1 1 1 7 19Tini 1 1 1 1 1 0 1 1 7 1 1 1 1 1 0 0 1 1 1 0 1 9 1 1 1 1 1 1 1 1 1 0 9 25Yanti 1 1 1 0 0 0 1 1 5 1 0 1 1 0 0 0 0 1 1 1 0 6 1 1 0 1 1 0 0 1 0 0 5 16Hamid 1 0 1 0 1 0 1 0 4 1 0 0 0 0 0 0 1 1 1 0 1 5 1 1 0 1 1 0 0 0 1 1 6 15Dedi 1 1 1 1 1 1 1 0 7 1 1 1 1 1 1 1 1 1 1 0 0 10 1 1 1 1 1 1 1 0 1 1 9 26Desi 1 1 1 1 1 1 1 1 8 1 1 1 1 1 1 1 1 1 1 1 1 12 1 1 1 1 1 1 1 1 1 1 10 30Wahyu 1 0 0 0 1 1 1 1 5 1 1 0 1 1 0 1 1 0 1 1 0 8 1 1 0 0 0 1 1 1 1 1 7 20

Page 86: DASAR-DASAR EVALUASI PENDIDIKAN(SUHARISMI ARIKUNTO.docx

Sudah jelas bahwa butir-butir soal dikatakan apabila menunjukan

kesejajaran skor dengan skor total. Cara mengetahui kesejajaran tersebut

digunakan juga rumus korelasi product moment, misalnya kita akan mengetahui

validitas faktor 1, yakni soal-soal materi bunyi, kita membuat daftar

menyejajarkan kedua skor tersebut sebagai berikut:

Tabel untuk menghitung kesejajaran skor faktor 1

dengan skor total

Nama SubjekSkor Faktor

1 (x)Skor Total

(y) X2 Y2 XY

Amir 6 19 36 361 114Hasan 7 25 49 625 175Ninda 4 17 16 289 68Warih 3 12 9 144 36Irzal 8 29 64 841 232

Gandi 6 23 36 529 138Santo 5 19 2 361 95Tini 7 26 49 676 182

Yanti 5 16 25 256 80Hamid 4 15 16 25 60Dedi 7 26 49 676 182Desi 8 30 64 900 240

Wahyu 5 20 25 400 100Jumlah ..... ..... ..... ..... .....

Data yang tertera di dalam tabel tersebut diguanakan untuk menentukan

besarnya validitas faktor 1, langkah selanjutnya adalah menjumlakan setiap

kolom. Kemudian memasukan ke dalam rumus korelasi product moment. Harga r

yang diperoleh menunjukan indeks validitas faktor1. Untuk faktor 2 dan 3 caranya

sama, hanya faktornya saja yang diganti.

Page 87: DASAR-DASAR EVALUASI PENDIDIKAN(SUHARISMI ARIKUNTO.docx

BAB 6

RALIABILITAS

1. Arti Reliabilitas Bagi Sebuah Tes

Sudah diterangkan dalam persyaratan tes, bahwa reliabilitas berhubungan

dengan masalah kepercayaan. Suatu tes dapat dikatakan mempunyai taraf

kepercayaan yang tinggi jika tes tersebut dapat memberikan hasil yang tetap.

Maka penertian reliabilitas tes, berhubungan dengan masalah ketetapan hasil

tes. Atau seandainya hasilnya berubah-ubah, perubahan yang terjadi dapat

dikatakan tidak berarti.

Konsep tentang reliabilitas ini tidak akan sulit dimengerti apabila

pembaca telah memahami konsep validitas. Tuntutan bahwa instrumen

evaluasi harus valid menyangkut harapan diperolehnya data yang valid sesuai

dengan kenyataan. Dalam hal reliabilitas ini tuntutannya tidak jauh berbeda.

Jika validitas terkait dengan ketepatan objek yang tidak lain adalah tidak

menyimpangnya data dari kenyataan, artinya bahwa data tersebut benar, maka

konsep reliabilitas terkait dengan pemotretan berkali-kali. Instrumen yang baik

adalah instumen yang dapat dengan ajeg memberikan data yang sesuai dengan

kenyataan.

Yang sering ditangkap kurang tepat bagi pembaca adalah pendapat

bahwa “ajeg” atau “tetap” diartikan sebagai “sama” dalam pembicaraan

evaluasi ini tidak demikian. Ajeg atau tetap tidak selalu harus sama. Tetapi

mengikuti perubahan secara ajeg. Jika keadaan si A mula-mula berada lebih

rendah dibandingkan dengan B, maka jika diadakan pengukuran ulang si A

juga berada lebih rendah dari B. Itulahh yang diakatakan ajeg atau tetap. Yaitu

sama dealam kedudukan siswa diantara anggota keloompok yang lain. Tentu

tidak dituntut semuanya tetap. Besarnya ketetapan itulah menunjukan tingginya

reliabilitas instrumen.

Sehubungan dengan reliabilitas ini, scarvia B anderson dan kawan-

kawan menyatakan bahwa persyaratan bagi tes, yaitu validitas dan reliabilitas

ini penting. Dalam hal ini, validitas lebih penting dan reliabilitas ini perlu,

Page 88: DASAR-DASAR EVALUASI PENDIDIKAN(SUHARISMI ARIKUNTO.docx

karena menyokong terbentuknya validitas. Sebuah tes mungkin reliabel tetapi

tidak valid. Sebaliknya, sebuah tes yang valid biasanya reliabel.

A reliable measure in one that provide consistent and stable indication of

the characteristic being investigates.

Untuk dapat memperoleh gambaran yang ajegm memang sulit karena

unsur kejiaan manusia itu sendiri tidak aje. Misalnya, kemampuan, kecakapan,

sikap, dan sebagainya berubah-ubah dari waktu ke waktu.

Beberapa hal yang sedikit banyak memengaruhi hasil tes banyak sekali.

Namun secara garis besar dapat dikelompokan menjadi 3 (tiga) hal berikut.

a. Hal yang Berhubungan dengan Tes itu sendiri, yaitu panjang tes dan

kualitas Butir-Butir soalnya

Tes yang terdiri dari banyak butirm tentu saja lebih valid dibandingkan

dengan tes yang hanya terdi dari beberapa butir soal. Tinggi rendahnya

validitas menunjukkan tinggi rendanya reliabilitas tes. Dengan demikian

maka semakin panjang tes, maka reliabilitasnya semakin tinggi. Dalam

menghitung besarnya reliabilitas berhubung dengann penambahan

banyaknya butir soal dalam tes ini ada sebuah rumus yang diberikan oleh

Spearman dan Brown sehingga terkenal dengan rumus Spearman-Brown.

rnm nr

1+( n−1) r

Dimana:

rnm : besarnya koefisien, reliabilitas sesudah tes tersebut ditambah butir

soal baru

n : berapa kali butir-butir soal itu ditambah

r : besarnya koefisien reliabilitas sebelum butir-butir soalnya di

tambah

contoh:

suatu tes terdiri atas 40 butir soal, mempunyai koefisien reliabiltias 0,70.

Kemudian butir-butir soal itu ditambah menjadi 60 butir soal.

Maka koefisien reliabilitas baru adalah:

rnm=nr

1+(n−1 ) r

Page 89: DASAR-DASAR EVALUASI PENDIDIKAN(SUHARISMI ARIKUNTO.docx

¿ 1,5 x0,701+ (1,5−1 ) x0,70

¿ 1,051,35

= 0,79

Demikian maka penambahan sebanyak 20 butir soal dari 40 butir

memperbesarkan koefisien reliabilitas sebesar 0,09. Akan tetapi

penambahan butir-butir soal tes adalakanya tidak berarti. Bahkan

merugikan. Hal ini disebabkan karena:

1) Sampai pada suatu batas tertentu, penambahan banyaknya butir soal

sudah menambah tinggi reliabiltas tes.

Ramers dan Gage menggambarkan hbungunan antra penambahan butir

soal reliabiltiias sebagai berikut:

2) Penambahan tingginya reliabitias tes tidak sebanding nilai dengan

waktu, biaya dan tenaga yang dikeluarkan untuk itu. Misalnya guru

sudah cukup membuat 100 soal bentuk objektif dan 10 soal bentuk esai

sudah cukup mempunyai validitas isi dan tingkah laku 200 dan 20

dengan menambahkan soal-soal yang paralel. Tentu saja hal ini hanya

akan menambah waktu, biaya dan tenaga saja tanpa ada keuntungan

apa-apa. Kualitas butir-butir soal ditentukan oleh:

a) Jelas tidaknya rumusan soal

b) Baik-tidaknya pengarahan soal kepada jawaban sehingga tidak

menimbulkan salah jawab

c) Petunjuknya jelas sehingga mudah dan cepat dikerjakan

b. Hal yang behubungan dengan tercoba (testee)

Suatu tes yang dicobakan kepada kelompok yang terdiri dari banyak siswa

Page 90: DASAR-DASAR EVALUASI PENDIDIKAN(SUHARISMI ARIKUNTO.docx

akan mencerminkan keragaman hasil yang menggambarkan besar-kecilnya

reliabilitas tes. Tes yang dicobakan kepa bukan kelompok terpilih akan

menunjukan reliabilitas yang lebih besar dair pda yang dicobakan pada

kelompok tertenu yang diambil secar terpilih.

c. Hal yang berhubungan dengan penyelenggaraan tes

Sudah sebutkan bahwa faktor penyelenggaraan tes yang bersifat

administratif, sangat menentukan hasil tes.

Contoh:

1) Petunjuk yang diberikan sebelum tes dimulai, akan memberi

ketenangan kepada tes-tes dalam mengerjakan tes, dan dalam

penyelenggaraan tidak akan banyak terdapat pertanyaan ketenganan ini

tentu saja akan berpengaruh terhadap hasil tes.

2) pengawas yang tertib akan mempengaruhi hasil yang diberikan oleh

siswa terhadap tes. Bagis siswa-siswa tertentu adanya pengawasan

yang terlalu ketat menyebabkan rasa jengkel dan tidak dapat dengan

leluasa mengerjakan tes.

3) Suasana lingkungan dan tempat tes (duduk tidak teratur, suasana di

sekeleingnya ramai dan sebagainya) akan memengaruhi hasil tes

Adanya hal-hal yang memengaruhi hasil tes ini semua, secara tidak

langsung akan memengaruhi reliabilitas soal tes.

2. Cara-cara mencari besarnya Reabilitas

Sekali lagi reliabilitas adalah ketetapan suatu tes apabila diteskan kepada

subjek yang sama. Untuk mengetahui ketetapan ini pada dsarnya dilihat

kesejajaran hasil. Seperti hal nya beberapa teknik juga menggunakan rumus

korelasi moment untuk mengetahui validitas, kesejajaran hasil dalam

reliabilitas tes.

Kriterium yang digunakan untuk mengetahui ketetapan ada yang berada

di luar tes (consistency external) dan pada tes itu sendiri (consitency internal)

a. Metode Bentuk Paralel (equivalent)

Tes paralel atau tes ekuivalen adalah dua buah tes yang mempunyai

kesamaan tujuan, tingkat kesukaran, dan susunan, tetapi butir-butir

Page 91: DASAR-DASAR EVALUASI PENDIDIKAN(SUHARISMI ARIKUNTO.docx

soalnya berbeda. Dalam istilah bahasa inggris disebut alternate form

method (parallel forms).

Dengan metode bentuk parelel ini, dua buah tes yang paralel. Misalnya tes

matematika seri A yang akan dicari reliabilitasnya dan tes seri B diteskan

kepada sekelompok siswa yang sama, kemdian hasilnya dikoreksikan

koefisien korelasi dari kedua hasil tes inilah yang menunjukan koefisien

reliabilitas tes. Seri A. Jika koefisiennya tinggi maka tes tersebut sudah

reliabel dan dapat digunakan sebagai alat pengetes yang terandalkan.

Dalam menggunakan metode tes paralel ini pengetes harus menyiapkan

dua buah tes, dan masing-masing dicobakan pada kelompok siswa yang

sama. Oleh karena itu. Ada orang menyebutkan sebagai double tes-double

trial method. Penggunaan metode ini baik karena siswa dihadapkan kepada

dua macam tes sehingga tidak ada faktor “masih ingat soalnya” yang

dalam evaluasi disebut adanya pratice-effect dan carry over effect artinya

ada faktor yang dibawa oleh pengikut tes karena sudah mengerjakan soal

tersebut.

Kelemahan dari metode ini adalah bahwa pengetes pekerjaaanya berat

karena harus menyusun dua seri tes. Lagi pula harus tersedia waktu yang

lama untuk mencobakan dua kali tes.

b. Metode Tes Ulang (Test-Retest Method)

Metode tes ulang dilakukan orang untuk menhindari penyusunan dua seri

tes. Dalam menggunakan teknik atau metodi ini pengetes hanya memili

satu seri tes, tetapi dicobakan dua kali. Oleh karena tesnya hanya satu dan

dicobakan dua kali. Maka metode ini dapat disebut dengan singgle tes

double trial method. Kemudian hasilnya dari keduakali tes tersebut

dihitung korelasinya.

Untuk tes yang banyak mengungkap pengetahuan (ingatan) dan

pemahaman, cara ini kurang mengena tercoba akan masih ingat akan butir-

butir soalnya. Oleh karena itu. Tenggang waktu antara pemberian tes

pertama dengan kedua menjadi permasalahan tersendiri. Jika tenggang

waktu terlalu sempit, siswa masih banyak ingat materi. Sebaliknya kalu

Page 92: DASAR-DASAR EVALUASI PENDIDIKAN(SUHARISMI ARIKUNTO.docx

tenggang waktu terlalu lama, maka faktor-faktor atau kondisi tes sudah

akan berbeda dan siswa sendiri barangkali sudah mempelajari sesuatu.

Tentu saja faktor-faktor ini akan mempengaruhi terhadap reliabilitas.

Pada umumnya hasil tes kedua cenderung lebih baik dari pada hasil tes

pertama. Hal ini tidak mengapa karena pengetes harus sada akan adanya

practice effect dan carry over effect. Yang penting adalah adanya

kesejajaran hasil atau ketetapan hasil yang ditunjukan oleh koefisien

korelasi yang tinggi.

Contoh:

SiswaTes Pertama Tes Kedua

Skor Ranking Skor RankingA 15 3 20 3B 20 1 25 1C 9 5 15 5D 18 2 23 2E 12 4 18 4

Walaupun tampak skornya naik, akan tetapi kenaikannya dialimi

oleh siswa

Metode ini juga disebut korelasi diri sendiri (self-correlation

method) larena mengkorelasikan hasil dari tes yang sama.

c. Metode belah dua atau split-half method

Kelemahan penggunaan metodedua tes dua kali percobaan dan satu –tes

duali percobaan diatasi dengan metode ketiga ini, yaitu metode belah dua.

Dalam menggunakan metode ini pengetes hanya menggunakan sebuah tes

dan dicobakan satu kali. Oleh karena itu, disebut juga singel test single

tiral method.

Berbeda dengan metode pertama dan kedua yang setelah

ditemukannya koefisien korelasi langsung ditafsikan itulah koefisien

reliabilitas. Maka dengan metode ketika ini tidak dapat demikian. Pada

waktu membelah dua dan mengkorelasikan dua belahan, baru diketahui

reliabilitas separo tes. Untuk mengetahui reliabiltias seluruh tes harus

digunakan rumus Spearman-brown sebagai berikut:

Page 93: DASAR-DASAR EVALUASI PENDIDIKAN(SUHARISMI ARIKUNTO.docx

Banyak pemakai metode ini salah memelah hasil tes pada waktu

menganalisis. Yang mereka lakukan adalah mengelompokan hasil

kelompok ini dikorelasikan. Yang benar adalah membelah item atau butir

soal. Tidak akan keliru kiranya bagi pemakai metode ini harus ingat bahwa

banyaknya butir soal harus genap agar dapat dibelah.

Ada dua cara membelah butir soal ini, yaitu:

1) Membelah atas item-item genap dan item-item ganjil yang selanjutnya

disebut belahan ganjil-genap.

2) Membelah atas item-item awal dan ite-item akhir separo jumlah pada

nomor-nomor awal dan separo pada nomor-nomor akhir yang

selanjutnya disebut belahan awal-akhir.

Contoh perhitungan reliabilitas dengan metode belah dua

Langkah pertama yang harus dilakukan adalah mengadakan butir soal

yang lebih terkenal dengan nama analisis item. Item yang dijawab dengan

benar diberi skor dan bagi yang salah diberi skor 0. Skor-skor untuk

seluruh subjek dan seluruh ini diterakan dalam tabel analisis sebagai

berikut:

Tabel Analisis Item Tes Matematika

1,3,5,7,9

2,4,6,8,10

1,2,3,4,5

6,7,8,9,10

1 2 3 4 5 6 7 8 9 10 Ganjil Genap Awal Akhir

1 Hartati 1 0 1 0 1 1 1 1 1 1 8 5 3 3 52 Yoyok 0 0 1 0 1 0 0 1 1 1 5 3 2 2 33 Oktaf 0 1 0 0 0 1 0 1 0 1 4 0 4 1 34 Wendi 1 1 0 0 1 1 0 0 1 0 5 3 2 3 25 Diana 1 1 1 1 1 1 0 0 0 0 6 3 3 5 16 Paul 1 0 1 0 1 0 1 0 0 0 4 4 0 3 17 Susana 1 1 1 1 1 1 1 0 0 0 7 4 3 5 28 Helen 0 1 0 1 1 1 1 1 1 1 8 3 5 3 5

Skor TotalNomor Item

No Nama

Page 94: DASAR-DASAR EVALUASI PENDIDIKAN(SUHARISMI ARIKUNTO.docx

kertas yang digunting bergigi seperti di

sebelah ini daoat digunakan sebagai alat bantu

dalam menentukan jumlah skor pada item ganjil

dan jumlah skor pada item genap. Bagian berlekuk

dapat dipaskan pada item-item genap ataupun

item-item ganjil. Jika sudah diketahui jumlah skor

pada item ganjil, otomatis diketahui jumlah skor

pada item genap karena skor nya sudah diketahui terlebih dahulu. Kertas bergigi

tempatkan tepat mulai skor siswa pertama. Kemudian diges ke bawah hingga

siswa terakhir.

Penyajian contoh membelah di atas berarti bahwa perhitungan reliabiilitas

dilakukan dengan membelah dengan dua cara. Pembelahannya hanya memilih

salah satu saja. Untuk selanjtnya dihitung dengan korelasi product moment.

1) Pembelahan ganjil-genap

Tabel persiapan perhitungan reliabilitas denagn belah dua ganjil-genap

sebagai berikut

No Nama

Item Ganjil

(1,3,5,7,9) (X)

Item Genap

(2,4,6,8,10) (Y)

1 Hartati 5 32 Yoyok 3 23 Oktaf 0 44 Wendi 3 25 Diana 3 36 Paul 4 07 Susana 4 38 Helen 3 5

Kelanjutan dari tabel ini adalah menghitung dengan rumus korelasi

product moment

Dengan menggunakan kalkulator diketahui bahwa:

X=25 X2 = 93

Y=22 Y2 = 76

Page 95: DASAR-DASAR EVALUASI PENDIDIKAN(SUHARISMI ARIKUNTO.docx

XY=63

Setelah dihitung dengan rumus korelasi product moment dengan anka

kasar diketahui bahwa rxy = -0,3786. Harga tersebut baru menunjukan

reliabilitas separo tes. Oleh karena itu, rxy untuk belahan ini disebut istilah

r1/21/2 atau r99. Untuk mencari reliabilitas seluruh tes digunakan rumus

spearman-brown yang rumusnya telah dikemukakan didepan. Jika

koefisien reliabilitas separo tes ini dimasukan ke dalam rumus hitungannya

demkian.:

r11=2 r 1

212

(1+r 12

12)

¿ 2 x−0,37861+ (−0,3786 )

¿ −0,75721,3786

=−0,5493

*) pengurangan merupakan bilangan dengan harga mutlak, jadi tidak mengenal negatif.

2) Pembelahan awal akhir

Dengan data yang tertera pada tabel analisis item tes matematika diketahui

jumlah sekor belahan awal-akhir sebagai berikut:

No Nama

Item Ganjil

(1,3,5,7,9) (X)

Item Genap

(2,4,6,8,10) (Y)

1 Hartati 3 52 Yoyok 2 33 Oktaf 1 34 Wendi 3 25 Diana 5 16 Paul 3 17 Susana 5 28 Helen 3 5

Seperti halnya pad wakhtu menghitung dengan belahan ganjil genap maka

kelanjutannya adalah menghitung dengan rumus korelasi product moment.

Dengan menggunakan kalkulator diketahui

Page 96: DASAR-DASAR EVALUASI PENDIDIKAN(SUHARISMI ARIKUNTO.docx

X=25 X2 = 91

Y=22 Y2 = 78

XY=63

Setelah dimasukan ke dalam rumus korelasi product momen dengan angka

kasar diperoleh r 12

12=−0,3831demgam rumus spearman-brown diperoleh

r11=0,5538.

Selain menggunakan rumus korelasi product momen, dua orang ahli

mengajukan rumus lain. Seorang bernama Flanagan menemukan rumus

yang perhitunganya menggunakan belah dua ganjil-genap, dan seoarang

benama rulon yang dumusnya diterapkan pad data belahan awal-akhir.

3) Penggunaan rumus Flanagan

Rumus

r11=2(1− S12+S2

2

st2 )

Dimana :

r11= Reliabiiltas

S12= vairans belahan pertama (1) yang dalam hal ini varian skor item ganjil

S22= varian belahan kedua (2) yaitu varians skor item genap

St2=varians total yaitu varians skor total

Secara sederhana dapat dipahami bahwa varians adalah standar deviasi

kuadrat. Dengan demikian bagi peminat yang menghitung kalkulator

statistik varian ini diperoleh dengan menguadratkan standar deviasi. Untuk

mereka yang tidak menggunakan kalkulator statistik maka varians dapat

dicari denagn rumus sebagai berikut

X2−¿¿

S− NN

Standar devviasi (SD) dapat dengan istilah simbpangan baku (SB) namun

husuf S (B bear) juga dapat dikatakan sudah menyebut standar deviasi

Page 97: DASAR-DASAR EVALUASI PENDIDIKAN(SUHARISMI ARIKUNTO.docx

dalam kalkulator dengan simbol bagi yang berminat mencari S untuk

mencari varian, dapat menggunakan rumus S.

S=√ X2

N

Dimana

S = standart deviasi

X = Simpangan X dan x yang dicari dari x – Y

S2 = barian 2 subjek pengikut tes,

Berdasarlam dat atabe; be;ajam gamko; genap perhitungannya esebagi

berikut:

93− 252

S21 88

¿93−78,1258

=1.859

76− 222

S12 88

=76−60,58

=1,937

S22=

295−472

88

=❑❑ 295−276,13

8=2,36

Dimasukan ke dalam rumus diperoleh demikian

r11=2(1 1,859+4,9372,359 )

=−2¿

=-1,218

Page 98: DASAR-DASAR EVALUASI PENDIDIKAN(SUHARISMI ARIKUNTO.docx

4) Penggunaan rumus Rulon

Rumus

r11=1−Sd

2

St2

Dimana :

Sd2=¿varian bed (varian Diferent)

D=¿diferece adalah [ebedaan atara belahan jiwa (awal_dengan skor

belahan ke dua (akhir

Untuk memperjelas keterangan, maka tabel tahun awal-akhir

Dikutip disini lagi

No Nama Awal Akhir d1 Hartati 3 5 -22 Yoyok 2 3 -13 Oktaf 1 3 -24 Wendi 3 2 15 Diana 5 1 46 Paul 3 1 27 Susana 5 2 38 Helen 3 5 -2

Dengan kalkulator atau hitungan biasa diketahui

d=3

d2=43

Dari perhitungana terdahulu diketahui varians total=2,75

Sd2=

d2 (d )2

NN

¿43−32

88

=43−1,1258

¿ 41,8758

=5,234

Page 99: DASAR-DASAR EVALUASI PENDIDIKAN(SUHARISMI ARIKUNTO.docx

Dimasukan ke dalam rumus rulon

r11=1−5,2342,36

=1-2,218

=1,218

Dari perhitungan degnan rumus flanagan maupun rulon ternya hasilnya

sama, keudanya lebih besar dari 1,00. Secara eoeretik koefisien ini salah

karena pembulatan dalam perhitungan, seperti didepan. Hasil seperti ini

dapat saja terjadi

Untuk mengatasi kesulitan memenuhi persyaratan ini maka reliabilitas

dapat dicari dengan rumus ketemukan oleh karer dan Richardson. Kedua

orang ahli menentukan banak-rumus yang diberi nomor. Rumus yang

digunakan mencari reliabilitas adan banyak digunakan orang ada rumus,

yaitu rumus J-4,20 dan rumus K-R 21

5) Penggunaan rumus K-R 20

Rumus

r11=( nn−1 ) ( S2−pq )

S2

dimana

r1 = reliabititas tes secara keseluruhan

p - proposi subjek yang menjawab item dengan benar

q =proporsi subjek yang menjawab item dengan salah (q=1-p)

n = Banyaknya item

S = Standar deviasi dari tes (standar deviasi adlah akar varians)

Dalam buku-buku n(nilai kecil)ini sering diganti degnan huruf K (K Keci)

yang juga melambangkan banyaknya item. Demikian juga huruf S sebagai

lambang standar deviasi, ditliskan SB sebagai singkatan dari simpangan

baku maka rumus K-R 20 menjadi

r11=( kk−1 ) ( SB2−pq )

SB2

Page 100: DASAR-DASAR EVALUASI PENDIDIKAN(SUHARISMI ARIKUNTO.docx

Penggunaan hrufk ini uga berlaku bagi rumah-rumah dalam tes, misalnya

K-R 21 dan rumus alpha. Untuk memberikan contoh perhitungan mencari

reliabilitas yang menggunakan rumus K-R 20. Ini akan dibuatkan tabel

analisis item lain.

Tabel Perhitungan Mencari Reabilitas Tes dengan rumus KR 21

No NamaNomor item

skor total1 2 3 4 5 6 7

1 wardoyo 1 0 1 1 1 1 0 5

2 benny 0 1 1 0 1 1 1 5

3 Hanafi 0 0 0 0 1 0 1 2

4 Rahmad 0 1 1 1 1 1 1 6

5 Tanti 1 0 0 0 1 0 0 2

6 Nadia 0 1 1 1 1 0 0 4

7 Tini 0 0 0 1 1 1 0 3

8 Budi 0 1 0 1 1 0 0 3

9 Daron 0 1 0 1 1 0 0 3

10 Yakob 0 0 0 1 1 0 0 2

NP 2 5 4 7 10 4 3 35

p 0,2 0,5 0,4 0,7 1 0,4 0,3

q 0,8 0,5 0,6 0,3 0 0,5 0,7

pq 1,31(åpq)

Dimasukan ke dalam rumus K-R 20

r11=( nn−1 )( S 2−pq

S2 )¿ 7

6x

1,362−1,311,36

S=1,56 (dicaridengankalkulator )

¿1,17 x1,85=1,31

1,85S dapat dicari denganmenarik akar varians

¿1,17 x1,85−1,31

1,85S=1,36 (dicaridengan kalkulator)

=1,17 x0,29 = 0,3415 dibulatkan 0,342

6) Penggunaan rumus K-R 21

Rumus K-R 21:

Page 101: DASAR-DASAR EVALUASI PENDIDIKAN(SUHARISMI ARIKUNTO.docx

r11=( nn−1 )(1−

m−(n−M )n S2 )

Keterangan:

M=Mean atau rerata skor total

r11=( 77−1 )(1−

3,5−(7−3,5 )7 x1,85 )

1,17 x (1−3,5 x3,512,95 )

1,17 x (1−12,2512,95 )

1,17 x (1−0,946 )

1,17 x 0,0541

= 0,06329 dibulatkan 0,0633

Jika dibandingkan reliabilitas yang dihitung dengan K-R 20 dan K-R 21

lebih besar yang pertama. Memang menggunakan rumus K-R 20

cenderung memberikan hasil yang lebih tinggi, tetapi pekerjaanya lebih

rumit.

7) Penggunaan Rumus Hoyt

Rumus : r11=1−VsVr

atau r11=Vr−Vr

Vr

Keterangan :

r11 = Reliabilitas seluruh soal

Vr = Varians Responden

Vs = Varians Sisa

Untuk mencari reliabilitas suatu soal dilakukan dengan langkah-langkah

sebagai berikut:

Langkah 1. Mencari jumlah kuadrat responden dengan rumus

jk i=B2

N¿¿

Keterangan:

Jk(r) = jumlah kuadrat responden

Xt = skor total tiap responden

Page 102: DASAR-DASAR EVALUASI PENDIDIKAN(SUHARISMI ARIKUNTO.docx

K = Banyaknya item

N = banyaknya responden atau subjek

Langkah 2. Mencari jumlah kuadrat item dengan rumus;

Langkah 3. Mencari jumlah kuadrat total dengan rumus;

Page 103: DASAR-DASAR EVALUASI PENDIDIKAN(SUHARISMI ARIKUNTO.docx

BAB 7

TAKSONOMI

1. Arti dan letak Taksonomi dalam Pendidikan

Sejak lahirnya kurikulum PPSP (proyek perintis sekolah pmbangunan)

yang kemudian disusul oleh lahirnya kurikulum tahun 1975, telah dimulai

tertaman kesadaran pada para guru bahwa tujuan pelajaran harus

dirumuskan sebelum proses belajar-mengajar berlangsung. Tujuan

dirumuskan sebelum proses belajar-mengajar berlangsung. Tujuan tersebut

harus diberitahukan kepada para siswa. Jadi, tujuan tersebut bukanlah

sesuatu yang perlu dirahasiakan. Apabila dalam pengajaran tidak

disebutkan tujuannya, siswa tidak akan tahu mana pelajaran yang penting

dan mana yang tidak.

Kesadaran seperti diharapkan dapat mendarah daging. Seperti

halnya jika orang mau pergi ke suatu tempat sudah mempunyai bayangan

letak tempat tersebut sehingga dengan mudah menentukan jalan

perumusan tujuan ini maka mereka dapat mengusahakan kegiatan

mengajar secara efektif.

Kepentingan hubungan antara kegiatan belajar-mengajar dengan

tujuan, oleh seorang ahli bernama sriven (1967) dikemukakan bahwa harus

ada hubungan erat antara:

a. Tujuan kurikulum dengan bahan pelajaran

b. Bahan pelajaran dengan alat-alat evalusi

c. Tujuan kurikulum denan alat-alat evaluasi

Tujuan kurikulum yang dimaksud adalah tujuan yang dapat diukur

Ebel (1963) berpendapat bahwa jika hasil pendidikan merupakan sesuatu

yang penting tetapi tidak dapat diukur maka tujuan itu harus diubah. Jika

tujuan telah dirumuskan secara operasional maka hasilnya akan dapat

diukur. Suatu tanda bahwa seseoarang telah mencapai tujuannya, akan

terlihat pada perubahan tingkah lakunya.

Tujuan pendidikan dapat dirumuskan pada tiga tingkatan. Pertama

Page 104: DASAR-DASAR EVALUASI PENDIDIKAN(SUHARISMI ARIKUNTO.docx

tujuan umum pendidikan. Tujuan ini memnentukan perlu dan tidaknya

sesuatu program diadakan. Di dalam praktek sehari-hari di sekolah.

Tujuan ini, banyak usaha telah dilakukan untuk mencari metode yang

dapat digunakan untuk menganalisis atau mengklasifikasikan sebuah

pandangan yang berhubungan dengan kegiatan pendidikan sehari-hari.

Yang dimaksud adalah berhasilnya pendidikan dalam bentuk tingkah laku.

Inilah yang dimaksud engan taksnomomi (taxonomy). Ada 3 macam

tingkah aku yang dikenal umum, yaitu kognitif, afektif, dan psikomotor

(yang dalam hal ini penulis gunakan istilah keterampilan) yang lebih jelas

yang dirumuskan secara operasional kaum behavior (kaum mengutamakan

tingkah laku) berpendapat bahwa taksonomi yang dikemukaakan oleh

bloom dan kawan-kawan adalah sangat bersifat mental. Mereka tidak

menjelaskan kepada para pendidik secara konkret dan dapat diamati.

Dalam pelaksanaan pendidikan di sekolah, ketiga tujuan ini harus

ada. Tetapi praktenya memang sulit karena dalam beberapa hal.

Penafsirannya lalu menjadi subjektif. Kesulitan lain adalah bahwa sulit

untuk menjabarkan tujuan umum ini menjadi tujuan lyang lebih penting

Beberapa ahli mencoba memberikan car bagaimana menyebut

tingkatan tujuan ini, yang akhrinya oleh Vivien de Landshere disimpulkan

bahwa ada 3 tingakt tujuan (termasuk taksonomi), yaitu:

a. Tujuan akhir atau tujuan umum pendidikan

b. Taksonomi

c. Tujuan yang operasional

2. Taksonomi Bloom

Bloom dan Krathwohl telah memberikan banyak inspirasi kepada orang

yang melahirkan taksonomi lain. Prinsip-prinsip dasdar yang digunakan

oleh 2 orang ini ada 4 buah, yaitu:

a. Prinsip metodologis

Perbedaan yang besar telah merefleksi kepada cara-cara guru dalam

mengajar

Page 105: DASAR-DASAR EVALUASI PENDIDIKAN(SUHARISMI ARIKUNTO.docx

b. Prinsip psikologis

Taksonomi hendaknya konsisten dengan fenomena kejiaan yang ada

sekarang.

c. Prinsip logis

Taksonomi hendaknya dikembangkan secara logis dan konsisten

d. Prinsip tujuan

Tingaktan-tingaktan tujuan tidak selaras dengan tingkatan-tingakatan

nilai-nilai. Tiap-tiap jenis tujuan pendidikan hendaknya

menggambarkan corak yang netral.

Atas dasar prinsip ini maka taksonomi disusun menjadi uatu

tingkatan yang menunjukan tingkat kesulitan sebagai contoh, menginat

fakta lebih mudah dari pada menarik kesimpulan. Atau menghafal, lebih

mudah daripada memberikan pertimbangan. Tingaktan kesulitan ini juga

merefleksi kepada kesulitan dalam proses belajar dan mengajar.

Sudah banyak diketahui bahwa mula-mula taksonomi bloom terdiri

dari dua bagian yaitu kognitif domain dan afektif domain (cognitive

domain and affective domain). Pencipta dar kedua taksonomi ini merasa

tidak tertarik pada psikomotor domain karena melihat hanya ada sedikit

kegunaannya di sekolah menengah atau universitas ( Bloom, 1956),

akhirnya simpson melengkapi dua domain yang ada dengan psikomotor

domain (1966). Namun sebenarnya pemisahan antara ketiga domain ini

merupakan pemisahan yang dibuat-buat, karena manusia merupakan suatu

kebetulan yang tidak dapat dipec-pecah sehingga tindakanya merupakan

suatu kebetulan.

Saat ini sudah banyak diketahui oleh umum bahwa apa yang

dikenal sebagai taksonomi bloom (1956) sebenarnya merupakan hasil

kelompok penilai di universitas yang terdiri dari B.S Bloom Editor MD

Engelhart, E Furs, W.H dan D.R Krathwohl yang kemudian didukung pula

oleh Ralp W. Tyler.

Secara garis besar, blooom bersama kawan-kawan merumuskan

tujuan-tujuan pendidikan pada 3(tiga) tingkatan:

Page 106: DASAR-DASAR EVALUASI PENDIDIKAN(SUHARISMI ARIKUNTO.docx

a. Kategori tingkah laku yang masih verbal

b. Perluasan kategori menjadi sederatan tujuan

c. Tingkah laku konkret yang terdiri dari tugas-tugas (task) dalam

pertnyataan-penyataan sebagai ujian dan butir-butir soal

Ada 3 (tiga) ranah domain besar, yang terletak pada tingkatan ke -2

yang selanjutnya disebut taksonomi yaitu:

a. Ranah kognitif (cognitive domain)

1) Mengenal (recognition)

Dalam pengenalan siswa diminta untuk memilih satu dari

dua atau lebih jawaban

Contoh:

Hasil bumu yang terkenal dari daerah temanggung adalah:

a) Padi

b) Tebu

c) Tembakau

Mengungkap / mengingat kembali (recall)

Berbeda dengan mengenal maka dalam mengingat kembali

ini siswa diminta mengingat kembali satu atau lebih fakta-

fakta yang lebih sederhana.

Contoh:

Tempat keluarnya air dari dalam tanah disebut//

Mengenal dan mengungkap kembali, pada umumnya

dikategoraikan menjadi satu jenis, yakni ingatan. Kategori

ini merupakan yang paling rendah tingkatanya karena tidak

terlalu banyak meminta energi.

2) Pemahaman (comprehension)

Dengan pemahaman, siswa diminta untuk membuktikan

bahwa meamhami hubungan yang sederhana di antara

fakta-fakta atau konsep

Contoh:

Diantara gambar-gambar di bawah ini yang dapat disebut

Page 107: DASAR-DASAR EVALUASI PENDIDIKAN(SUHARISMI ARIKUNTO.docx

sebagai segitiga siku-siku adalah:

a) .

b) .

c) .

Untuk dapat menentukan gambar mana yang dapat

dinamaklan segitiga siku-siku maka ia harus

menghubungkan konsep segitiga dan konsep siku-siku.

3) Penerapan Aplikasi (aplication)

Untuk menerpkan aplikasi ini siswa dituntut memili

kemampuan untuk menyeleksi atau memilih suatu abstrasi

tertentu ( konsep, hukum, dalil, aturan, gagasan cara) secara

tepat untuk diterapkan dalam suatu situasi baru dan

menerapkannya secara benar.

Contoh:

Untuk menyelesaikan hitungan 51x40= n, maka paling

tepat kita gunakan

a. Hukum asosiatif

b. Hukum komutatif

c. Hukum distributif

4) Analisis (analysis)

Dalam tugas analisisini siswa diminta untuk menganalisis

suatu hubungan atau situasi yang kompleks atas konsep-

konsep dasar.

Contoh:

Siswa disuruh menerangkan apa sebab pada waktu

Page 108: DASAR-DASAR EVALUASI PENDIDIKAN(SUHARISMI ARIKUNTO.docx

mendung dan ada angin kencang tidak segera turun hujan.

5) Sintesis (synthesis)

Apabila penyusun soal tes bermaksud meminta siswa

melakkan sintesis maka pertanyaan-pertanyaan disusum

sedemikian rupa sehingga meminta siswa. Untuk

menggabungkan atau menyusun kembali (reorganize) hal-

hal yang spesifik aga dapat dikatakan bahwa dengan soal

sintesis ini siswa diminta untuk melakukan generalisasi.

Contoh:

“dengan mengetahui situasi daerah dan milik dalam hal

kekayanan bahan mentah serta semangat penduduk di suatu

daerah yang kini dapat berkembang pesat menjadi kota

pelabuhan yang besar maka kota-kota kecil di tepi pantai

mana yang mempunyai potensi untuk menjadi sebuah kota

pelabuhan yang besar?

6) Evaluasi (evaluation)

Apabila menyusun soal bermaksud untuk mengetahui

sejauh mana siswa mampu menerangkan pengetahuan dan

kemampuan yang telah dimiliki untuk menilai sesuatu kasus

yang diajukan oleh penyusun soal.

Mengadakan evaluasi dalam mengukur aspef kognitif ini

tidak sama dengan mengevaluasi dalam mengukur aspek

afektif. Mengevaluasi dalam kognitif ini menyangkut

masalah “benar/salah” yang didasarkan atas dalil. Hukum

prinsip pengetahuan, sedangkan mengevaluasi dalam aspek

afektif menyangkut masalah “baik/buruk” berdasarkan niali

atau norma yang diakui oleh subjek yang bersangkutan.

Sejak tahun 1983 istilah “aspek” ini lebih populier dengan

istilah baru yakni “ranah” untuk ranah kognitif, bloom

menemukan adanya tingkatan-tingkatan ranah, tersusun

dalam urutan meningkat (hierarki) yang sifatnya linear.

Page 109: DASAR-DASAR EVALUASI PENDIDIKAN(SUHARISMI ARIKUNTO.docx

Namun dan beberapa studi lanjutan yang dilakukan oleh

ahli-ahli lain antara lain Mardaus diketemukan bahwa

ranah-ranah tersebut tidak seluruhnya dalam urutan linear.

Untuk arah yang leibh tinggi, yakni analisis, sintesi dan

evaluasi teletak pada satu garis horizontal dan terlihat

sebagai cabang.

Apabila dibandingkan akan tergambar sebagai berikut ini:

Struktur Hipotesis Struktur yang ditemukanoleh Bloom oleh Mardaus dkk.

Evaluasi Evaluasi

Sutesis Analisis Sintesis

Analisis

Aplikasi Aplikasi

Pemahaman Pemahaman

Ingatan Ingatan

Beberapa aspek kejiaan yang telah disebutkan, sebagian

hanya cocok diterapkan di Sekolah Dasar (Ingatan,

Pemahaman dan Aplikasi) sedangkan analisis dan sintesis

baru dapat dilatihkan di SLTP, SMU dan Perguruan Tinggi

secara bertahap. Dengan urutan yang ada, memang

menunjukan usaha yang semakin kebawah semakin berat.

Sebagai contoh, untuk mengilakukkan pemahaman, siswa

harus terlebih dahulu dapat mengingat atau mengenal

kembali. Dan untuk pemahaman, memang dibutuhkan unsur

mengenal atau mengingat kembali.

Page 110: DASAR-DASAR EVALUASI PENDIDIKAN(SUHARISMI ARIKUNTO.docx

b. Ranah afektif (afective domain)

1) Pandangan atau pendapat (opinion)

Apabila guru mengukur aspek afektif yang berhubungan

dengan pandangan siswa maka pertanyaan yang disusun

menhendaki respons yang melibatkan ekspresi, perasaan

atau pendapat pribadi siswa terhadap hal-hal yang relatif

sederhana tetapi bukan fakta

Contoh:

“bagaimanakah pendapat anda tentang keputusan yang

diambil oleh bapak lurah dalam situasi diatas? Bamana

tindakan anda jika seandainya yang menjadi lurah itu anda?

2) Sikap atau nilai (attitude, value)

Dalam penilaian afektif tentang sikap ini, siswa ditanya

mengenai responsya yang melibatkan sikap atau nilai telah

mendalam di sanubarnya dan guru meninta dia untuk

mempertahankan pendapatnya

Contoh:

“bagaimankah pendapat anda seandainya semua penjahat

merugiakan masyarakat dan negara. Baik yang proletar

maupun yang elite diberi hukuman mai saja? Menga

pendapat anda demikian?

c. Ranah psikomotor (psychomotor domain)

Perkataan psikomotor berhubungan dengan kata “motor sensory

motor atau perceptual motor” jadi psikomotor behubungan erat

dengan kerja otot sehingga menyebbkan geraknya tubuh atau

bagian-bagiannya. Yang termasuk ke dalam klasifikasi gerak di

sini mulai dari suku cadang televisi serta komputer. Secara

mendasar perlu dibedakan antra dua hal. Yaitu keterampila

(skills) dan kemampuan (abilities)

Contoh:

“seberaoa teramil para siswa dalma menyiapkan alat-

Page 111: DASAR-DASAR EVALUASI PENDIDIKAN(SUHARISMI ARIKUNTO.docx

alat””seberapa terampil para siswa mengunakan alat-alat”

Taksonomi untuk ranah psikomotorik antara lain

dikemukakan oleh Anita Harrow (1972). Menurut harrow

kebanyakan para guru tidak dapat menuntut pencapaian 100

dari tujuan yang dirumukan kesuali hanya berharap bahwa

keterampilan yang dicapai oleh siswa-siswanya akan sangat

mendudkung mempelajari keterampilan lanjutan atau gerakan-

gerakan yang lebih kompleks sifatnya. Selain yang telah

dikemukakan tersebut. Harrow juga memberikan saran

mengenai bagaiman melakukan pengukuran terhadap ranah

psikomotor ini. Menurutnya penentuan kriteria untuk mengukur

ketrampilan siswa dilaksanakan dalam jangka waktu sekurang-

kurangnya 30 menit. Kurang dari waktu tersebut diperkirakan

para penilai belum dapat menangkap gambaran tentang pola

keterampilan yang mencerminkan kemampuan siswa.

Gris besar taksno,o yang dikemukakan oleh Harrow

adalah sebagai berikut:

Tingkat Uraian dan contoh1. Gerakan Refleks

(reflex movement)

1.1. Segmental reflexes1.2. Itersegmental reflexes1.3. Surasegmental reflexes

Respons grakan yang tidak disadari dimiliki sejak lahir

Kesemuanya berhubungan dengan grakan-gerakan yang dikoordinasikan oleh otak dan baigan sum-sum tulang belakang

2 Dasar Gerakan-Gerakan(basic fundamental movement)

2.1. Locomotor movemen

2.2. Non locomotor movements

Gerakan-gerakan, yang menuntun kepada keterampilan yang sifatnya kompleks

Gerakan-gerakan yang mendahului kemampuan bejalan (tengkurap, merangkak, tertatih-tatih, berjalan, lari melompat, menggelinding, memanjat)

Gerakan-gerakan yang dinamis di dalam suatu ruangan yang bertumpu pada sesuatu sumbu tetentu

Page 112: DASAR-DASAR EVALUASI PENDIDIKAN(SUHARISMI ARIKUNTO.docx

2.3. Manipulative movements Gerakan-gerakan yang terkoornissaikan seperti dalam kegiatan bermain piano, menggambar, naik sepeda, mengetik dan sebagainya

3. Perceptual abilites

3.1. Khinetic discrimination

3.1.1. Body awarebess

3.1.2. Body image

3.1.3. Body relationship to surrounding objet in space

3.2. Visual discrimination

3.3. Auditory discrimination

3.4. Tactile discrimination3.5. Coordinated activites

Kombinasi dari kemampuan kognitif dan gerakan

Menyadari akan gerak-grakan tubuh seseorangMenyadari gerakan pada dua sisi tubuh pada satu sisi. Keberatan-keberatan dan keseimbangan.Perasaan-perasaan tentang adanya gerakan berhubungan dengan badannya sendiri.Konsep tentang arah dan kesadaran badan dalam hbubungan dengan lingkungan ruang sekitarVisual acuity(kemampuan membedakan bentuk dan bagian). Visual tracking (kemampuan mengikuti objek), visual memori (mengingat kembali pengalaman visual), figure ground differentiation (membedakan figure yang dominan di antara latar belakang yang kabur), dan consistency (pengalaman konsep visual)Meliputi auditory acuity, auditory trancking, auditory memoryKemampuan untuk membedakan dengan sentuhanKoordinasi antara mata dengan tangan dan mata dengan kaki

4. Physical abilities

4.1. Ketahanan (endurance)

4.2. Kekuatan (strenght)

4.3. Flexybility4.4. Kecerdasan otak (agility)

Kemampuan yang dipeulkan untuk mengembangkan gerakan-gerakan keterampilan tingkat tinggi.Kemampuan untuk melanjutkan aktivitas, termasuk ketahanan otot dan denyut jantung.Kemampuan menggunakan otot untuk mengadakan perlawananRentangan gerakan dan sandiKemampuan untuk bergerak

Page 113: DASAR-DASAR EVALUASI PENDIDIKAN(SUHARISMI ARIKUNTO.docx

cepat termasuk kemapuan untuk mengubah arah, memulai atu berhenti, mengurangi waktu tenggang antara reaksi dan respons (tampak dalam kecekatan) dan meningkatkan dextery (meningkatkan ketangkasan=deftnes)

5 Skiled movements

5.1. Simple adaptive skils

5.2. Compund adaptive skills

5.3. Complex adaptive skils

Setiap gerkan yang memerlukan belajar misal keterampilan dalam menari, olah raga dan reaksi.]Setiap adaptasi berhubungan dengan dsar gerakan dasar nomor 22Gerakan kombinasi untuk menggunakan alat-alat seperti raket, parang dan sebaginyaMenguasai mekanisme seluruh tubuh seperti dalam senam (gymnastic)

6 Nondiscoursive communication

6.1. Expressibe movents

6.2. Interpretive movements

Kemampuan untuk berkomunikasi dengan menggunakan gerakan misalnya ekspresi wajah(mimik) postur, dan sebagainya.Gerakan-gerakan yang digunakan dalam kehidupan sehari-hari seperti sikap dan gerak tubuh, isyarat ekspresi wajah.Gerak-gerakan sebagai bagian dari bentuk seni ternasuk gerkan estetism gerak-gerakan reatif (improvisasi) dan sebagainya.

3. Lain-Lain Taksonomi

Banyak kritik telah dilemparkan kepada Bloom Cs, tentang pembagian

taksonomi ini, sehingga timbul teori-teori sebagai adaptasi modifikasi atau

kategori baru.

a. McGuire (1963), Klicman (1963) telah menyusun taksnonomi untuk

bidang biologi,wood (1968) untuk matematika, Leuis (1965) untuk

Ilmu pengetahuan alam. Sebagai contoh, dihasilkan oleh The National

Longitudinal Study of Mathematical Ablities (NLSMA)

1) Knowledge of facts

Page 114: DASAR-DASAR EVALUASI PENDIDIKAN(SUHARISMI ARIKUNTO.docx

Operation/proscess(bidang mendatar)

Product (bidang belakang)

Content(bidang tegak)

2) Coputation

3) Compreension

4) Application

5) Analysis

Alasanya adalah:

1) Computation (komputasi, perhitungan) merupakan satu

ketrampilan khusus yang tidak mempunyai tempat dalam

taksonomi Bloom. Padahal aspek ini perlu dinilai pula

2) Syntehsis an evaluation (sintesis dan evaluasi) hanya sedikit

mempunyai peranan di dalam kurikulum matematika.

b. Guilford telah menciptkan pola yang menggambarkan struktur intelek

dalam bentuk kubus.

c. Gagne dan Merreli juga mengemukakan taksonomi lain. Di dalam

bukunya The Conditions of Learning (1965) Gagne menyebutkan

adanya 8 buah kategori, yang oleh Merril (1971) ditambah 2 (dua)

kategori lagi.

1) Signal learning

2) Stimulus response learning

3) Chaining

4) Verbal associoation

5) Discrimination learning

6) Concept learnign.

Page 115: DASAR-DASAR EVALUASI PENDIDIKAN(SUHARISMI ARIKUNTO.docx

7) Rule learning

8) Problem solving

d. Garlach dan sulivan beranggapan bahwa taksonomi Bloom

mempunyai kegunaan yang terbatas sebagai alat untuk perencanaan

dan pengembangan kurikulum. Mereka mencoba mengganti gambaran

tentang proses dalam rumusan yang umum menjadi tingkah laku siswa

yang dapat diamati.

Kategori yang diajukan adalah:

1) Identy

2) Name

3) Describe

4) Construct

5) Order

6) demonstrate

e. De Block mengatakan bahwa taksonomi Bloom diilhami oelh masalah

evaluasi. Jika Gagne dan Merril tolak pada kondisi belajar maka De

Block (1972) mengemukakan model yang didasarkan pada tujuan-

tujuan mengajar.

ia mengajukan 3 (tiga) arah dalam kegiatan mengajar.

1) From tartial to more integral learning

2) From limited to fundamental learning

3) From special to general learning.

Page 116: DASAR-DASAR EVALUASI PENDIDIKAN(SUHARISMI ARIKUNTO.docx

BAB 8

TUJUAN INSTRUKSIONAL

1. Bermacam-macam Tujuan Pendidikan

Setiap negara tentu mempunayi cita-cita tentang warga negaranya

diarahkan. Cita-cita tersebut dimanisfestasikan dalam bentuk tujuan

pendidikannya. Sebagai contoh, negara sparta ingin mengarahkan warga

negaranya menjadi manusia yang sehat jasmani dan rohaninya maka

tujuan pendidikannya telah disejajarkan dengan cita-cita tersebut

Cita-cita bangsa Indonesia adalah terbentukna manusia Pancasila

bagi seluruh warga negaranya. Tujuan pendidikannya telah disejajarkan

dengan cita-cita tersebut. Semua institusi atau lembaga pendidikan harus

mengarakan segala kegiatan di sekolahnya bagi pencpaian tujuan itu.

Inilah yang disebut dengan tujuan umum pendidikan yang secara eksplisit

tertera di dalam Garis-garis Besar Haluan Negara.

Dengan demikian maka tujuan pendidikan nasional memiliki

sebagai frame of reference untuk selanjutnya dijabrkan menjadi tujuan

instruksional. Sebagai perdalaman berikut ini adalah kutipan rumusan

tujuan umum tersebut;

“pengembangan di bidang pendidikan didasarkan atas falsafah

negara Pancasila dan diarahkan untuk membentuk manusia-manusia

Indonesia yang sehat jasmani dan rohaninya memiliki pengetahuan dan

mengembangkan kecerdasan yang tinggi dan disertai budi pekerti yang

luhur. Mencintai bangsanya dan mencintai sesama manusia sesuai dengan

ketentuan termaktub dalam UUD 1945.

Kegiatan-kegiatan yang muncul dalam pola kesamaan pendidikan.

Didasarkan pada rumusan tujuan pendidikan nasional ini. Sedangkan

materinya perlu diisi dari hasil sturdi empiris tentang harpan-harapan

masyarakat mengenai kemampuan pengetahuan dan sikap yang harus

dimli oleh para lulusan.

Selanjutnya sebagai tindak lanjut dari penjabaran tujuan umum

Page 117: DASAR-DASAR EVALUASI PENDIDIKAN(SUHARISMI ARIKUNTO.docx

menjadi tujuan institusional adalah perumusan lain telah disiapkan oleh

para ahli bidang strudi, sebgai penganggung jawab program kurikuler.

Untuk dapat memenuhi harapan dicapinya penguasaan terhadap

program kurikuler ini, dirumuskanlah suatu tujuan yang disebut tujuan

masing-masing bidang studi. Segitu jauh pembicaraan tentang tujuan ini,

apabila digambarkan dalam bentuk skema akan terlihat seperti berikut ini:

TIPend. Agama

Pend. Moral Pancas

ila

Pend. Olah raga

Bahasa Indone

sia

Matematika

Ilm peng, alam

ilmu Peng. Sosial

Bahasa Inggris

dst

TIPend. Agama

Pend. Moral Pancas

ila

Pend. Olah raga

Bahasa Indone

sia

Matematika

Ilm peng, alam

ilmu Peng. Sosial

Bahasa Inggris

dst

TIPend. Agama

Pend. Moral Pancas

ila

Pend. Olah raga

Bahasa Indone

sia

Matematika

Ilm peng, alam

ilmu Peng. Sosial

Bahasa Inggris

dst

TIPend. Agama

Pend. Moral Pancas

ila

Pend. Olah raga

Bahasa Indone

sia

Matematika

Ilm peng, alam

ilmu Peng. Sosial

Bahasa Inggris

dst

Tkur. Tkur. Tkur. Tkur. Tkur. Tkur. Tkur. Tkur. Tkur.

TI = Tujuan InstitusionalTkur. = Tujuan Kurikuler

Tujuan Umum Pendidikan Nasioal

Page 118: DASAR-DASAR EVALUASI PENDIDIKAN(SUHARISMI ARIKUNTO.docx

Dari skema tersebut akan mudah dipahami bahwa:

a. Tujuan institusional adala tujuan dari masing-masing institusi

lembaga misalnya.

1) Tujuan Sekolah Dasar

2) Tujuan Sekolah Mengengah Pertama

3) Tujuan Sekolah Pendidikan Guru, dan sebagainya yang

masing-masing dicanangkan sesuai dengan harapan lulusan

b. Tujuan kurikuler adalah tujuan dari masing-masing bidang

studi misalnya:

1) Tujuan pelajaran Pendidikan Agama

2) Tujuan Pelajaran Matematika

3) Tujuan Pelajaran Ilmu Pengetahuan Sosial

Dan sebagainya yang akan berbeda dari satu bidang studi ke

bidang studi lain dan juga dari tingkat institusi yang satu ke

tingakt institusi yang lain. Akan tetapi antrara tujuan kurikuler

sesuatu insttitusi ada hubungan dengan tujuan kurikuler

institusi yang lain.

c. Tiap-tiap tujuan baik institusional maupun tujuan kurikuler

selalu merupakan sumbangan bagi tercapainya tujuan umum,

yakni tujuan pendidikan nasional.

Page 119: DASAR-DASAR EVALUASI PENDIDIKAN(SUHARISMI ARIKUNTO.docx

2. Tujuan Instruksional (instructional Objectives)

Materi sesuatu bidang studi tidak menjadi milik kita, tanpa dipelajari

telebih dahulu, baik dipelajari sendiri maupun diajarkan oleh guru. Proses

atau kegiatan mempelajari materi ini terjadi dalam saat terjadinya situasi

belajar –mengajar atau pengajaran (instruksional). Dari perkataan

pengajaran atau instruksional inilah maka timbul istilah tujuan

instruksional, yaitu tujuan yang menggambarkan pengetahuan,

kemampuan, keterampilan dan sikap yang harus dimiliki oleh siswa

sebagai akibat dari hasil pengajran yang dinyatakan dalam bentuk tingkah

laku (behavior) yang dapat diamati dan diukur.

Ada 2 (dua) macam tujuan instruksional yaitu:

a. Tujuan instruksional Umum (TIU)

b. Tujuan instruksional Khusu (TIK)

Pembedaan atas 2 (dua) macam ini didasarkan atas luasnya tujuan

yang akan dicapai sehingga apabila dibagankan akan terlihat seperti di

bawah ini:

Didalam merumuskan tujuan instruksional harus diusahakan agar

tampak bahwa setelah tercapainya tujuan itu, terjadi adanya perubahan

pada diri anak yang meliputi kemampuan intelektual, sikap/minat maupun

keterampilan oleh Bloom dan kawan-kawan dikenal sebagai aspek

kognitif, aspek afektif dan aspek psikomotor seperti telah diterangkan

terdahulu.

Apakah tujuan instruksional itu memang perlu?

Bekerja tanpa diketahui arahnya sama halnya dengan berlayar tanpa

TIK

1

TIK

2

TIK

6

TIK

3

TIK

4

TIK

5

Tujuan Instruksonal Umum (TIU)

Page 120: DASAR-DASAR EVALUASI PENDIDIKAN(SUHARISMI ARIKUNTO.docx

diketahui mau ke pulai mana kapal akan dilarikan. Kapal itu akan

berputar-putar saja di tengah lautan luas, kadang-kadang menghadap ke

barat, kadang-kadang menghadap ke timur dan sebagainya dan akhirnya

tidak mengajar. Guru yang tidak mengetahui apa tujuan mengajarnya tidak

akan jelas setiap kegiatan yang dilakukan.

Dahulu ada kecenderungan bagi guru untuk menentukan tujuan

pelajarannyapada masalah penyelesaian bahan. Dalam satu jam mengajar

guru menargetkan berapa bab atau berapa bagian bahan akan diselesaikan

dalam jam pelajaran. Akibatnya guru tersebut akan terpaku pada bahan

dan apabila dilihat waktunya hampir habis, ia menerangkan dengan cepat

agar target yang telah ditetapkan tercapai, tanpa memperhatikan apakah

siswanaya dapat memahami pelajarannya atau tidak.

Dalam pembaruan sistem pendidikan yang berlaku di indonesia

sekarang ini, setiap guru dituntut untuk menyadari tujuan dari kegiatan

mengajarnya dengan titik tolak kebutuhan siswa. Oleh karena itu. Dalam

merancang sistem belajar yang akan dilakukannya, langkah pertama yang

ia lakuakan adalah membuat tujuan instruksional. Dengan tujuan

instruksional:

a. Guru mempunyai arah untuk

b. Siswa mengetahui arah belajarnya

c. Setiap guru mengetahui batas-batas tugas dan wewenangnya

mengajakn suatu materi sehingga diperkecil kemungkinan timbulnya

celah (gap) atau saling menutup (overlap) antara guru.

d. Guru mempunyai patokan dalam mengadakan penilaian kemajuan

belajar siswa

e. Guru sebagai pelaksana dan petugas-petugas pemegang kebijaksaan

(decision maker) mempunyai kriteria untuk mengevaluasi kualitas

maupun efisiensi pengajaran.

3. Merumuskan Tujuan Instruksional

Telah disebutkan bahwa tujuan instruksional adlah tujuan yang

menyatakan adanya suatu yang dapat dikerjakan atau dilakukan oleh siswa

Page 121: DASAR-DASAR EVALUASI PENDIDIKAN(SUHARISMI ARIKUNTO.docx

setelah pengajaran. Jadi sebelum adanya pengajaran, siswa tidak

mempunyai kemampuan untuk mengerjakan ataupun melakukannya.

Contoh:

Sebelum ada pengajaran, siswa dapat membuat tabel spesifikasi sesudah

pengajaran diberikan siswa dapat membuat tabel spesifikasi.

Jadi dalam diri siswa terjadi perubahan tingkah laku selama

mengikuti program pengajaran. Atau dengan lain perkataan, perubahan

tingkah laku itu merupakan hasil dari adanya proses belajar mengajar.

Oleh karena baik guru maupun siswa perlu mengetahui perubahan apakah

yang telah terjadi pada waktu pengajaran maka perlu adanya perumusan

yang jelas bagi tujuan instruksional itu.

Sebaiman ketentuan dalam peraturan pemerintah nomor 19 tahun

2005 tebtabg standar pendidikan nasional. Kurikulum yang belaku di

indonesia adalah kurikulum tingkat satuan pendidikan (KTSP) dalam

menggunakan istilah-istilah lama seperti tujuan kurikuler (TK),tujuan

instruksional umum (TIU) dan untuk istilah tujuan yang ingin dicapai oleh

guru menjadi milik siswa dikenal dengan nama indikator istilah indikator

berasal dari bahasa inggris to indicate, berati menunjuikan.dalam hal ini

indikator menunjukan sesuatu sebagai bukti bahwa yang ingin dicapai

sudah dapat betul-betul dicapi. Proses dan langkah sebetulnya sama saja

dengan yang lama, tetapi hanya istilahnya saja yang berbeda berikut ini

disampaikan langkah untuk menentukan tujuan khusu dan dalam KTSP

disebut indikator. Yang digungakan dalam istilah tujuan pembelajaran.

4. Langkah-langkah yang dilakukan dalam merumuskan tujuan

instruksional khusus

a. Membuat sejumlah TIU (tujuan instruksional umum) untuk tiap mata

pelajaran/bidang strudi yang akan diajarkan. Di dalam kurikulum

tahun 1975 maupun 1984, TIU ini sudah asda tercantum dalam buku

Garis-Garis Besar Program Pembelajaran. Dalam merumuskan TIU

digunakan kata kerja yang sifatnya masih umum dan tidak dapat

diukur karena perubahan tingkah laku masih terjadi di dalam diri

Page 122: DASAR-DASAR EVALUASI PENDIDIKAN(SUHARISMI ARIKUNTO.docx

manusia (intern)

b. Dan masing-masing TIU dijabarkan menjadi sejumlah TIK yang

rumusnya jelas, khusus dapat diamati terukur dan menunjukkan

perubahan tingkah laku.

Contoh-contoh rumusan untuk TIU:

- Memahami teori evaluasi

- Mengetahui perbedaan antara skor dan nilai

- Mengerti cara mencari validata

- Menghayati perlunya penilaian yang tepat

- Menyadari pentingnya mengikuti kuliah dengan terartur

- Menghargai kejujuran mahsiswa dalam mengerjakan tes

Dalam contoh-contoh ini digunakan kata-kata kerja, memahami,

mengetahui, mengerti menghayati, menyadari, menghargai dan masih

ada beberapa lagi yang sifatnya masih terlalu umum sehingga

penafsirannya dapat bereda antara orang yang satu dengan yang lain.

Contoh:

Mahasiswa mengeti cara mencari validitas suatu soal. Bagaimanakah

kita tahu bahwa ia mengerti? Apakah karena pada waktu diterangkan

dia tampak mengangguk-angguk kepala? Belh jadi dia mengangguk-

anggukan kepala hanya merupakan suatu usaha agar tidak dikatakan

mengantuk atau sedang melamunkan sesuatu. Tampaknya

menggangguk merekasi kuliah. Tetapi anganya melayang

Atas dasar semua keterangan ini maka agar dalam mengadakan

evaluasi terlihat hasilnya, TIU ini perlu diperinci lagi sehingga jelas

dan tidak dapat disalah tafsikan oelh beberapa orang.

Rumusan TIK yang lengkap memuat 3(tiga) komponen, yaitu:

1) Tingkah laku akhir (terminal behavior)

2) Kondisi demonstrasi (conditional of demonstration or test)

3) Standar keberhasilan (standard of performance)

5. Tingkah laku akhir

Tingkah lai akhir adalah tingkah laku yang diharapkan setelah seseorang

Page 123: DASAR-DASAR EVALUASI PENDIDIKAN(SUHARISMI ARIKUNTO.docx

mengalami proses belajar. Disini tingah laku ini harus menampakan di

dalam suatu pembuatan yang dapat diamati dan diukur (observabke and

measurable)

Contoh:

- Menuliskan kalimat perintah

- Mengalikan pecahan persepuluhan

- Menggambarkan kurva normal

- Menyebutkan batas-batas daerah istimewa yogyakarta

- Menerjemakan bacaan bahasa inggris ke dalam bahasa indonesia

- Menceritakan kembali uraian guru

- Mendemonstrasikan cara mengukur susu

- Mengurakan pendapatnya mengenai sesuatu yang dikemukakan guru

- Menjelaskan hasil bacaan dengan kalimat sendiri. Dan lain-lain yang

berwujud kata kerja perbuatan.operasional (action verb) yang dapat

diamati dan diukur.

6. Kata-kata operasional

a. Cognitve domain; levels and coresponding action verbs

1) Pengetahuan (knowledge)

Mendefinisak, mendeskripsikan mengidentikasikan, mendaftarkan

menjodohkan, menyebutkan, menyatakan (states) mereproduksi.

2) Pemahaman (comprehension)

Mempertahankan, membedakan, menduga (estimates)

menerangkan, memperluas, menyimpulkan, mengeneralisasikan,

memberikan contoh, menuliskan kembali, memperkirakan.

3) Aplikasi

Mengubah, menghitung, mendemonstrasikan, menemukan,

memanipulasikan, memodifikasikan, mengoperasikan,

meramalkan, menyiapkan, menghasilkan, menghubungkan,

menunjukkan, memecahkan, menggunakan.

4) Analisis

Merinci, menyusun diagram, membedakan, mengidentifikasikan,

Page 124: DASAR-DASAR EVALUASI PENDIDIKAN(SUHARISMI ARIKUNTO.docx

mengilustrasikan, menyimpulkan, menunnjukkan,

mengunbungkan, memilihm memisahkan, membagi (subdivides).

5) Sintesis

Mengategorikan mengombinasikan, mengarang, menciptakan,

membuat desain, menjelaskan, memmodifikasikan,

mengorganisasikan, menghubungkan, mereorganisasikan, merevisi,

menulikan kembali, menuliskan, menceritakan.

6) Evaluasi

Menilai, membandingkan, menyimpulkan, mempertentangkan,

mengkritikm mendeskripsikan, membedakan, menerangkan,

memutuskan, menafsikan, menghubungkan.

b. Affective domain; learning levels and corresponding action verbs

7. Kondisi demonstrasi

Kondisi demonstrasi adalah komponen TIK yang menyakatan suatu

kondisi atau situasi yang dikenakan kepada siswa pada saat ia

mendemonstrasikan tingkah laku akhir, misalnya:

Dengan penulisan betul

Urut dari yang paling tinggi

Dengan bahasanya sendiri

Dengan demikian maka rangkaian kata-kata dalam rumusan TIK

menjadi:

Siswa dapat menjumlahkan bilangan yang terdiri dari puluhan dan

satuan dengan penulisan yang betul

Siswa dapat menunjukkan letak gunung-gunung yang ada di jawa

tengah, urut dari yang paling tinggi.

Siswa dapat menceritakan kembali isi bacaan tentang kisah keluarga

dengan bahasa sendiri.

Kata-kata bercetak miring itulah yang menunjukan standar

keberhasilan.

Standar keberhasilan adalah komponen TIK yang menunjukkan

seberapa jauh tingkat keberhasilan yang ditutut oelh penilai bagi tingka

Page 125: DASAR-DASAR EVALUASI PENDIDIKAN(SUHARISMI ARIKUNTO.docx

laku pelajar pad situasi akhir.

Tingkatan keberhasilan dapat dinyatakan dalam jumlah maupun

persentase misalnya:

Dengan 75% betul

Sekurang-kurangnya 5 dari 10

Tanpa kesalahan

Dengan tambahan tingkat keberhasilan ini maka bunyi rumusan

TIK menjadi:

Siswa dapat menumlahkan bilangan yang terdiri dari puluhan dan

satuan tanpa kesalahan

Siswa dpat menyebutkan kembali kota-kota yang ada di jawa barat

urut dari yang paling berat, dengan hanya 25% kesalahan

Yang umum dikerjakan sampai saat ini hanya tingkah laku akhir

saja.

Setelah kurikulu tahun 1975 berjalan bebrapa tahun timbulah

berbagai ketidak puasan di kalang para pengembang kegiatan belajar-

mengajar. Dikatakan bahwa tujuan belajar yang dimaksud terlalu bersifat

behavioristik, yakni mementingkan tingkah laku. Di samping juga hanya

bersifat outpt oriented. Yakni terlalu mementingkan hasil.

Dengan tekanan pada hal-hal tersebut. Guru berusaha

memberikan sebanyak-banyaknya informasi, pengertian dan konsep-

konsep kepada siswa. Pengembangan kegiatan belajar-mengajar yang

mengarah pada proses, belum mendapatkan perhatian sepenuhnya.

Dalam pedoman pelaksanaan kurikulum dijelaskan bahwa dalam

kegiatan belajar mengajar guru diharuskan memerhatikan pula

keterampilan siswa dalam hal memperoleh hasil, yakni memeperoleh

keterampilan tentang prosesnya. Pendekatan ini disebut dengan istilah

pendekatan ketrampilan proses (PKP) ketrampilan yang dimaksud

meliputi ketrampilan dalam hal.

a. Mengamati

b. Menginterprestasikan (menafsirkan) hasil pengamatan

Page 126: DASAR-DASAR EVALUASI PENDIDIKAN(SUHARISMI ARIKUNTO.docx

c. Meramalkan

d. Menerapkan konsep

e. Merencanakan penelitaian

f. Melaksanakan penelitian

g. Mengkomunikasikan hasil penemuan

Sesuai dengan tuntutan tersebut maka guru dalam merumuskan

tujuan instruksional khusus harus mengandung apa yang dilakukan

bagaimana menunnjukan kemampuan atau hasilnya (tingkah laku) dan

perolehanya. Untuk mempermudah tugas ini, dalam buku GBPP

kurikulum 1984, tujuan instruksional umum yang termuat sudah

dirumuskan dalam satu rumusan yang menjelaskan

a. Materi

b. Perilaku mengutarakan hasil

c. Proses mencapainya.

Diagram perumusan TIU dan TIK

1) siswa mampu PKP untuk tingakah lakuisi (pokok bahasan)

2) siswa dapat Tingkah lakuisi (pokok bahasan)

melalui PKP

3) siswa mampuisi (pokok bahasan)

PKP= Pendekatan ketrampilan proses

gabungan PKP dan tingkah laku

Contoh rumusan TIK

Model 1 Siswa mampu melakukan eksperimen untuk selanjutnya dapat menerangkan kepada kawan-kawan sekelasnya tentang proses osmose

Model 2 Siswa dapat menjelaskan perbedaan di sebagai kata depan dan di sebagai awalan melalui pengatan, contoh-contoh yang diberikan guru

Model 3 Siswa mampu menginterpretasi hasil pengamatan dan menerangkan hubungan kata-kata dalam suatu kalimat.

Page 127: DASAR-DASAR EVALUASI PENDIDIKAN(SUHARISMI ARIKUNTO.docx
Page 128: DASAR-DASAR EVALUASI PENDIDIKAN(SUHARISMI ARIKUNTO.docx

BAB 9

TES STANDA DAN TES BUATAN GURU

1. Pengertian Tes Standar

Telah dibicarakan di depan bahwa tes kemampuan pada dasarnya terbagi

menjadi 2 macam yaitu:

a. Aptitude test (test bakat)

b. Achievement tes (tes prestasi)

Perbedaaan antara kedua tes ini sebenarnya tidak tegas, soal-soal

mengenai kedua tes tersebut sering sekali saling melingkupi (overlap) untuk

keua macam tes ini biasanaya menggunakan hitungan-hitungan dan

perbendaharaan kata-kata dan sekelompok tes dari kedua macam tes ini

biasanya juga menguji tentang keterampilan membaca, kesamaan yang lain

adalah bahwa keduanya telah digunakan untuk meramalakann hasil untuk masa

yang akan datang, walupun pada umunya jika kita menggunkanan tes prestasi

penilai melihat apa yang telah siswa (tercoba) itu diberi pelajaran.

Prosedur yang digunakan memnentukan isi dari tes prestasi juga sedikit

berbeda yang digunakan pada waktu penyusunan tes bakat. Di dalam tes

prestasi belajara usaha-usaha digunakan untuk menentukan pengetahuan dan

keterampilan yang sudah diajarkan jadi berbagai tingkat pendidikan dan butir-

butir tes diperuntukan bagi penilaian materi-materi ini,

2. Tes Prestasi standar

Diantara tes prestasi yang digunkan di sekolah ada yang dinamakan prestasi

standar. Dalam salah satu kamus. Arti kata standar adalah a degree og level of

requirement, excellenge, or attainment.

Standar untuk siswa dimaksudkan sebagai suratu tingkatan kemampuan yang

harus dimiliki bagi suatu program tertentu, mungkin standar bagi suatu kusus A

berbeda dengan kursus B, jadi standar ini dapat diubat kersa maupun lunak

tergantung mempunyai kebijaksanaan.

Suatu tes standar dengan demikian berbeda dengan prestasi biasa.

Prosedur yang digunakan menyusun tes standar tes prestasi melalui cara yang

Page 129: DASAR-DASAR EVALUASI PENDIDIKAN(SUHARISMI ARIKUNTO.docx

ditumbuhkan dari tes yang digunakan di kelas. Sedangkan spesifikasi yang

digunakan untuk menentukan isi dalam tes bakat biasanya didasarkan atas

analisis job atau analisis tugas.

Istilah standar dalam tes dimaksudkan bahwa semua siswa menjawab

pertanyaan yang sama dari sejumlah besar pertanyaan dikerjakan dengan

mengikuti petunjuk yabng sama dan dalam batasan waktu yang sama pula.

Dengan demikian, seolah-oleh ada suatu standar atau ukuran sehingga

diperoleh satu penampilan (performance) dan penampilan kelompok lain

dibandingkan penampilan kelompok standar tersebut.

Istilah standar mengandung arti bahwa tes itu mengukur apa yang harus

dan dapat diajarkan suatu tingkat tertentu atau bahwa tes itu menuiapkan suatu

standar prestati dimana siswa dan dapat mencapai suatu tingkatan tertentu.

Sekali lagi tes standar ripolakan untuk penampilan prestasi sekarang(yang ada)

yang dilaksanakan secara seragam baik itu diberikan kepada siswa dalam

pelakasanaan maupun siswa sebagai anggota dari suatu kelompok

Penyusun tes standar selalu mengusahakan agar sistem skoringnya

sangat objektif sehinggga dapat diperoleh reliabilitas yang tinggi. Apabila

mungkin, dilakukan dengan mesin, hal ini tidak berarti bahwa berbentuk tes

standar harus selalu pilihan berganda. Tetapi untk skoringnya diusahakan agar

tidak kena bias faktor-faktor lain. Usaha lain adalah penggunaan skala skor dan

norma yang relevan. Skala skor digunakan untuk menyesuaikan antara bentuk

paralael dan bentuk aslinya. Di samping tui juga diperlukan penjelasan terinci

tentang tes itu.

3. Perbandingan antara te standar dengan tes buatan

Setelah mempelajari uraian tedahulu dapat disimpulkan bahwa tes standar

seenarnya bukanlah suatu yang istimewa dalam tes prestasi belajar. Tes ini

disusun dalam tipe-tipe soal yang sama dan meliputi bahan atau pengetahuan

yang sama banyak dengan bahan atau pengetahuan yang dicakup oleh tes

buatan guru. Lalu apakah perbedaan antara tes standar dengan tes buatan guru

atau apa keuntungan dan keburukan tes standar

Pertama marilah kita tinjau perbedaaan antara tes standar dengan tes buatan

Page 130: DASAR-DASAR EVALUASI PENDIDIKAN(SUHARISMI ARIKUNTO.docx

guru. Perbedaannya adalah sebagai berikut:

NoTes Standar Tes Buatan Guru

1

2

3

4

5

6

a. Didasarkan atas bahan dan tujuan umum dari sekolah-sekolah di seluruh Negara.

Mencakup aspek yang luas dan pengetahuan atau keterampilan dengan hanya sedikit butir tes untuk setiap keterampilan atau topik.

c. Disusun dengan kelengkapan staf profesor, pembahas, dan editor butir tes.

d. Menggunakan butir tes yang sudah diujicobakan (try out), dianalisis dan direvisi sebelum menjadi sebuah tes.

e. Mempunyai reliabilitas yang tinggi.

f. Dimungkinkan menggunakan norma untuk seluruh Negara.

a. Didasarkan atas bahan dan tujuan khusus yang dirumuskan oleh guru untuk kelasnya sendiri.

b. Dapat terjadi hanya mencakup pengetahuan atau keterampilan yang sempit.

c. Biasanya disusun sendiri oleh guru dengan sedikit atau tanpa bantuan orang lain/tenaga ahli.

d. Jarang menggunakan butir tes yang sudah diujicobakan, dianalisis dan direvisi.

e. Mempunyai reliabilitas sedang atau rendah.

f. Norma kelompok terbatas kelas tertentu.

Kedua, untuk menyusun tes standar, diutuhkan waktu yang lama. Seperti disebutkan ahwa untuk memperoleh sebuah tes standar melalui prosedur:

  Penyusunan;

  Uji coba;

  Analisa;

  Revisi;

  Edit.

Kelima kegiatan ini membutuhkan waktu lama.

Page 131: DASAR-DASAR EVALUASI PENDIDIKAN(SUHARISMI ARIKUNTO.docx

4. Kegunaan Tes Standar

a. Jika ingin membuat perbandingan

Ad. a Membuat perbandingan

Banyak situasi pendidikan dimana guru atau pemimpin terpaksa

mengadakan perbandingan. Hal ini dimaksd perbandingan antar siswa

untuk setiap bidang studi atau perbandingan tentang prestasi belajar

yang mendasarkan diri pada kemampuan dasar, atau perbandingan

prestasi setelah digunakan du metode yang berbeda. Nilai yang dibuat

guru yang berada di bidang yang berbeda dari kelompok siswa yang

berbeda dan situasi belajar yang, tidak dapat digunakan untuk alat

pembanding, akan tetapi tugas yang sifatnya umum, norma-norma, tes

yang mempunyai reliabilitas yang tinggi dan tes standar ada

kemungkinan boleh digunakan sebagai alat pembandin.

Ad.b Sebagai ilustrasi dapat dimisalkan sebuah sekolah menengah yang

meneroma 5 orang siswa dari sekolah-sekolah daar yang berbeda. Para

administrator di SLTP dihadapkan pada suatu masalah apabila harus

menentukan efektivitas belajar. Kelima anak ini datang dari SD telah

membawa nilai sendiri-sendiri dari guru yang berbeda sehingga

diiterperestakikan. Nilai yang diperoleh dan guru yang bebeda, tidak

diketahui dasr pertimbangan yang diambil untuk menentukannya.

Guru yang satu mungkin dipengaruhi oleh keterampilan bekerja

sedangkan guru lain didasarkan atas panjang pendeknya jawaban.

Walupun sangat luas, namun secara garis besar kegunaan tes standar

adalah :

Membandingkan prestasi belajar dengan pembawaan individu atau

kelompok.

Membandingkan tingkat prestasi siswa dalam keterampilan di berbagai

bidang studi untuk individu atau kelompok.

Membandingkan prestasi siswa antara berbagai sekolah atau kelas.

Mempelajari perkembangan siswa dalam suatu periode waktu tertentu.

Page 132: DASAR-DASAR EVALUASI PENDIDIKAN(SUHARISMI ARIKUNTO.docx

5. Keguanaan Tes Buatan Guru

Kegunaan tes buatan guru adalah:

a. Untuk menentukan seberapa baik siswa telah menguasai bahan pelajaran

yang diberikan dalam waktu tertentu.

b. Untuk menentukan apakah sesuatu tujuan telah tercapai.

c. Untuk memperoleh suatu nilai.

Selanjutnya baik tes standar dan tes buatan guru dianjurkan dipakai

jika hasilnya akan digunakan untuk:

a. Mengadakan diagnosis terhadap ketidakmampuan siswa.

b. Menentukan tempat siswa dalam suatu kelas atau kelompok.

c. Memberikan bimbingan kepada siswa dalam pendidikan dan pemilihan

jurusan.

d. Memilih siswa untuk program-program khusus.

6. Kelengkapan Tes Standar

Sebuah tes yang sudah distandardisasikan dan sudah dapat disebut sebagai tes

standar, biasanya dilengkapi dengan sebuah manual. Manual ini memuat

keterangan-keterangan atau petunjuk-petunjuk yang perlu terutama yang

menjelaskan tentang pelaksanaan, menskor, dan mengadakan interpretasi.

Secara garis besar manual tes standar ini memuat:

a. Ciri-ciri mengenai tes,

misalnya menyebutkan tingkat validitas, tingkat reliabilitas dan

sebagainya.

b. Tujuan serta keuntungan-keuntungan dari tes.

Misalnya yang disebutkan untuk siapa tes tersebut diberikan dan untuk

tujuan apa.

c. Proses standardisasi tes.

Misalnya mengenai hal-hal yang berhubungan dengan sampel.

a. Besarnya sampel,

b. Teknik sampling,

Page 133: DASAR-DASAR EVALUASI PENDIDIKAN(SUHARISMI ARIKUNTO.docx

c. Kelompok mana yang diambil sebagai sampel (sifat sampel).

Juga mengenai taraf kepercayaan yang diambil dan bagaimana kaitannya

dengan hasil tes.

d. Petunjuk-petunjuk tentang cara melaksanakan tes

Misalnya: dilaksanakan dengan lisan atau tertulis, waktu yang digunakan

untuk mengerjakan setiap bagian, boleh tidaknya tercoba keluar jika sudah

selesai mengerjakan soal itu dan sebagainya.

e. Petunjuk-petunjuk bagaimana cara menskor

Misalnya: untuk beberapa skor tiap-tiap soal/unit, menggunakan sistem

hukuman atau tidak, bagaimana cara menghitung nilai akhir dan

sebagainya.

f. Petunjuk-petunjuk untuk menginterpretasikan hasil

Misalnya:

1. Betul nomor sekian sampai sekian cocok untuk jabatan kepala seksi,

2. Betul nomor sekian saja, cocok untuk jabatan guru dan sebagainya.

g. Saran-saran lain

Misalnya: siapa harus menjadi pengawas, bagaimana seandainya tidak ada

calon yang mencapai skor tertentu dan sebagainya

Page 134: DASAR-DASAR EVALUASI PENDIDIKAN(SUHARISMI ARIKUNTO.docx

BAB 10

PENYUSUNAN TES

1. Fungsi Tes

Setiap kai akan memberikan tes, kebanyakan guru selalu bertanya kepada

dirinya sendiri

“Pertanyaan apakah yang akan saya berikan?”

“Jawaban apakah yang saya perlukan dan jawaban manakah tidak saya

perlukan?”

“berapa butir soal akan sa buat?”

“Bagaimanakah bentuk kunci jawabanya?”

Untuk menjawab pertanyaan tesebut, guru harus selalu ingat akan

fungsi tes, sehubungan dengan hal-hal yang harus diingat pada waktu

penyusunan tes, maka fungsi tes dapat ditinjau dari 3 (tiga) hal:

a. Fungsi untuk kelas

b. fungsi untuk bimbingan.

c. fungsi untuk administrasi]

selain fungsi-fungsi tes ini, hal lainyang harus diingat adalah:

a. hubungan dengan penggunaan

b. komprehensip

c. kontinu

PERBANDINGAN FUNGSI TES

Fungsi untuk kelas Fungsi untuk bimbingan

Fungsi untuk administrasi

1. mengadakan diagnosis terhadap kesulitan belajar siswa

2. mengevaluasi celah antara bakat dengan pencapaian

3. menaikkan tingkat

1. menentukan arah pembicaraan dengan orang tua tentang anak-anak mereka.

2. membantu siswa dalam menentukan pilihan.

1. memberi petunjuk dalam mengelompokkan siswa.

2. penempatan siswa baru

3. membantu siswa memilih kelompok

Page 135: DASAR-DASAR EVALUASI PENDIDIKAN(SUHARISMI ARIKUNTO.docx

prestasi4. mengelompokkan

siswa dalam kelas pada waktu metode kelompok

5. merencanakan kegiatan proses belajar mengajar untuk siswa secara perseorangan.

6. menentukan siswa mana yang memerlukan bimbingan khusus

7. menentukan tingkat pencapaian untuk setiap anak.

3. membantu siswa mencapai tujuan pendidikan dan jurusan.

4. memberi kesempatan kepada pembimbing, guru, dan orang tua dalam memahami kesulitan anak.

4. menilai kurikulum5. memperluas

hubungan masyarakat

6. menyediakan informasi untuk badan-badan lain di luar sekolah.

a. hubungan dengan penggunaan

diatas telah disajikansederetan fungsi tes, waktu mensun tes dalam hati

harus selalu diingat, fungsi mana yang sama saat dipentingkat karena

fungsi yang berbeda akan menentukan bentuk/isi tes yang berbeda pula

b. komprehensip

sebuah tes bebaliknya menckup suatu kebetulan, artinya meliputi

berbagai aspek yang dapat menggambarkan keaad siswa secara

keseluruhan (kecerdasan, sikap, pribadi perasaan sosial dan sebagainya)

hal ini dapat dicapai apabila tes itu merupkan rangkaian tes, misalnya

dari kelas 1 samapi dengan kelas 6.

c. Kontinuitas

Berhubungan dengan prinsip komprehensif maka prinsip kontinuitas

mempunyai persamaan tujuan. Sebaiknya tes disusun sedemikian rupa

sehingga menggambarkan kelanjutan dari awal anak memasuki satu

sekalh sampai dengan kelas terakhir. Dengan demikian akan diketahi

anak tiu tdak dengan terputus.

Page 136: DASAR-DASAR EVALUASI PENDIDIKAN(SUHARISMI ARIKUNTO.docx

2. Langkah-langkah dalam penyusunan tes

Tentu saja setiap guru akan dengan mudah mengatakan bagian pelajaran

mana yang akandicakup dalam sebuah tes jika sudah diketahui tujuannya.

Urutan langkah yang dilakukan adalah sebagai berikut:

a. Menentukan tujuan mengadakan tes

b. Mengadakan pembatasan terhadap bahan yang akan diteskan.

c. Merumuskan Tujuan Instruksional Khusus (TIK) dari tiap bagian bahan.

d. Menderetkan semua TIK  dalam tabel persiapan yang memuat pula aspek

tingkah laku dalam terkandung TIK itu, tabel digunakan untuk

identifikasi terhadap tingkah laku yang dikehendaki, agar tidak terlewati.

Contoh:

Tabel TIK dan Aspek tingkah laku yang dicakup

Indikator Aspek tingkah laku

Ingatan Pemahaman Aplikasi Keterangan

1. Siswa dapat

menjumlahkan 2

bilangan bersusun

2. Siswa dapat

menerangkan

hukum komulatif

dan seterusnya

e. Menyusun tabel spesifikasi yang memuat pokok materi, aspek berfikir

yang diukur beserta imbangan antara kedua hal tersebut.  (Uraian

penjelasan tentang tabel spesifikasi i akan kami jelaskan di sub bab

berikutnya)

f. Menuliskan butir-butir soal, didasarkan atas TIK-TIK yang sudah

dituliskan pada tabel TIK dan aspek tingkah laku yang dicakup

Apabila indikator ditul sangat khsus. Maka saw indikator diukur oleh

saw butir soal. Akan tetapi, jika indikator itu merupakan esensial, maka satu

indikator dapat diukur dengan lebih dari satu evalusasi soal

Page 137: DASAR-DASAR EVALUASI PENDIDIKAN(SUHARISMI ARIKUNTO.docx

Kecenderungan yang ada pada guru-guru beberapa waktu yang lalu

pengukuran ranah kognotof hanya ditekankan pada 3 aspe yang pertama,

uyaitu ingatan, pemahaman dan aplikasi akan tetapi dalam UAAS dan

SNMPTN aspek yang lain juga diukur sejalan dengan bentuk itemnya. Untuk

aspek lainya, walaupun dikehendaki dan diusahkan masuk ke dalam kategori

pemahaman dan aplikasi, setelah diperiksa kemungkinan besar jgua bersifat

ingatan.

a. Soal ingatan

Hampir tidak ada kesulitan bagi para guru untuk membuat item mengenai

ingatan, baik bagi soal bentuk uraian maupun objektif. Pertanyaan

ingatan adalah pertanaan yang jawabannya dapat dicari denagn mudah

pada catatan atu buku. Pertanyaan ingatan biasanya dimulai dengan kata,

kata : mendefinisikan, mendeskripsikan, mengidentifikasikan, mendaftar,

menjodohkan, menyebutkan, menyatakan, mereproduksikan

Pertanyaan ingatan biasa digunakan untuk mengukur penguasaan materi

yang berupa fakta, istilah definisi klasifikasi atau kategori, urutan

maupun kriteria

Contoh contoh pertanyaan ingatan

1) Apa sebab indonesia dapat mencapai kemerdekaan

2) Jelaskan bagaimana terlaksananya proklamasi kemerdeaan

3) Sebutkan satuan yang dipakai dalam sistem MKS untuk besaran:

panjang, masa, waktu kecepatan dan percepatan.

Pilihan ganda

1) Ketahanan nasional indonesia mencakup kebulatan aspek sosial dan

aspek alamiah

a) Dwi Gatra

b) Panca Gatra

c) Catur Gatra

d) Tri Gatra

2) Pertyataan hukum III newton adalah

a) Besar gaya berbanding lurus terhadap masa dan percepatan

Page 138: DASAR-DASAR EVALUASI PENDIDIKAN(SUHARISMI ARIKUNTO.docx

b) Setiap aksi terdapat resaksi yang sama besar dan arah berlawanan

c) Setiap kaksi terdapat reaksi yang arah dan besarnya sama

d) Besar gaya yang menyebabkan saama dengan besar gaya yang

diakibatkan

b. Soal pemahaman

Apabila soal ingatan dapat dijawab dengan melihat buku atau catatan,

tidaklah demikian untuk soal pemahaman, untuk menjawanb pertanyaan

pemahaman siswa dituntut hafal sesuatu pengertian kemudian

menjelaskan dengan kalimat sendiri. Atau siswa memahami dua

pengertain atu lebih kemudian memahami dan menyebutkan

hubunganya, jadi dalam menjawab pemahaman siswa selain harus

mengingat juga berfikir.

Pertanyaan pemahaman biasnya menggunakan kata-kata

perbedaaan, perbandingan, menduga, mengeneralisasikan, memberikan

contoh, menuliskan kembali, memperkirakan

Contoh:

adanya taifun di kepulaian filipina selaluditakuti oelh curah hujan cukup

besar di pulau jawa

sebab

angin pasat tenggara tertarik ke utara katulistiwa melalui pulau jawa yang

menambah banyaknya hujan.

c. Soal aplikasi

Soal aplikasi adalah soal yang menungukur siswa dalam

mengaplikasikan (menerapkan)pengetahannya untuk mememcahkan

masalah sehari-hari atau persoalan yang dikemukakan oleh pembuat

persoalan yang dikarang oleh penyusun soal, bukan kerangan yang

terdapat dalam buku atau pelajaran yang dicatatat.

Kata-kata yan gdigunakan dalam soal aplikasi atau kemampuan

dituntutantara lain mengubah, menghitung mendemonstrasikan,

menemukan, menggunakan

Contoh

Page 139: DASAR-DASAR EVALUASI PENDIDIKAN(SUHARISMI ARIKUNTO.docx

Sebuah benda yang terletak di muka sebuah lensa yang mempunyai jarak

fokus 10 cm. Bayangan yang terjadi ternyata tegak dan tinggi dua kali

tinggi benda itu, jarak antara benda dengan lensa adalah

a) 3,3 sm

b) 5 cm

c) 10 cm

d) 15 cm

e) 30 cm

d. Soal analisis

Soal analiss adalah soal yang menuntut kemampuan siswa menganalisa

atau menguraikan sesuatu persoalan utnuk diketahui bagian-bagiannya.

Dalam hierarki taksonomi, analisis lebih tinggi dari aplikasi. Oleh karena

itu, soal analisis harus dimulai dengan kasus yang dikarang sendiri oleh

guru, bukan mengambil uraian dari buku atau catatan pelajaran.

Kata-kata yang digunakan atau kemampuan yang dituntut antara lain,

meliputi memerinci, menyusun diagram, nenbedakan, mengilustrasikan,

menyimpulkan, memilih, memisahkan, membagi.

e. Soal sintesis

Sebagai kebalikan kemampuan untuk menganalisis adalah kemampuan

tuntuk mengadakan sintesis oleh karena itu, soal sintesis juga harus

dimulai dengan satu kasus untuk mengadakan sintesis, yaitu

menyimpulkan mengategorikan, mengkombinasikan, mengarang,

membuat desain mengorganisasikan, menghubungkan, menulis kembali,

membuat rencana, menyusun, mencoptakan

Contoh kasus seperti yang di contohkan soal analisis dapat digunakan

kasus soal sintesit, tergantung dari bagaimana permintaaan pembuat soal.

f. Soal evaluasi

Soal evaluasi adalah soal yang berhubungan dengan menilai, mengambil

kesimpulan, membandingkan, mempertentangkan, mengkritik,

mendeskripsikan, membedakan, menerangkan, memutuskan,

menafsirkan.

Page 140: DASAR-DASAR EVALUASI PENDIDIKAN(SUHARISMI ARIKUNTO.docx

Soal evaluas selaudidahului dengan kasus yang ditelaah oelh siswa

dengan teropong hukum dalilm prinsip, kemudian mereka mengadakan

penilaian baik atau tidak didasarkan ats benar atau salah.

Misalnya tentang pembangunan bendungan aswan yang diceritakan

tentang letakm kemiringan, daerah yang dikorbankan, dan sebaginya

siswa menilai tindkan pembangunan bentungan bedasarkan atas

pertimbangan sosial, ekonomi politik dan sebagainya

Contoh”

Kasus dapat diambil dai kisah bendungan aswan

Soal

Bagaimana kesuburan tanah di sekitar bendungan aswan? Bedakan

keadaaan darerah di bagian hulu dan hilir dengan kemungkinan lumpur

terbawa arus air dan sebagainya.

3. Komponen-Komponen Tes

Apabila guru sudah bekerja keras sebelum melaksanakn tes, maka pekerjaan

sesudahnya akan menjadi lancar, mudah dan hasilnya leibh baik

Komponen atau kelengkapan sebuah tes terdiri atas.

a       Buku tes, yakni lembaran atau buku yang memuat butir-butir soal yang

mesti dikerjakan oleh siswa

b.      Lembar jawaban tes, yaitu lembaran yang disediakan oleh penilain

bagi testee untuk mengerjakan tes, untuk bentuk pilihan ganda dibuat

lembaran nomor dan huruf  A, B, C, D, E menurut banyaknya

alternative yang disediakan

c.       Kunci  jawaban tes, berisi jawaban-jawaban yang dikehendaki. Kunci

jawaban ini dapat berupa huruf atau kalimat. Untuk test bentuk uraian

yang dituliskan adalah kata-kata kunci atau kalimat seingkat untuk

memberikan ancar-ancar jawaban. Ide dari kunci jawaban ini adalah:

1)      Pemeriksaan tes dapat dilakukan oleh orang lain

2)      Pemeriksaannya betul,

3)      Dilakukan dengan mudah,

4)      Sedikit mungkin masuknya unsur subjektif

Page 141: DASAR-DASAR EVALUASI PENDIDIKAN(SUHARISMI ARIKUNTO.docx

d.      Pedoman penilaian,

pedoman penilaian atau pedoman skoring, berisi tentang pedoman

perincian tentang skor atau angka yang diberikan kepada siswa bagi soal-

soal yang telah dikerjakan

Page 142: DASAR-DASAR EVALUASI PENDIDIKAN(SUHARISMI ARIKUNTO.docx

BAB 11

TES TERTULIS UNTUK PRESTASI BELAJAR

1. Bentuk-bentuk tes

a) Tes subyektif. Secara umum soal subyektif adalah pertanyaan yang menuntut peserta

didik menjawab dalam bentuk menguraikan, menjelaskan, mendiskusikan,

membandingkan, memberikan alasan, dan bentuk lain yang sejenis sesuai

dengan tuntutan pertanyaan dengan menggunakan kata-kata dan bahasa

sendiri. Jumlah soal-soal bentuk subyektif biasanya tidak banyak, hanya

sekitar 5-10 buah soal dalam waktu kurang lebih 90-120 menit. Soal-soal

bentuk ini menuntut kemampuan peserta didik untuk dapat mengorganisir,

menginterpretasi, dan menghubungkan pengertian-pengertian yang telah

dimiliki.

1) Kebaikan-kebaikannya

a. Mudah diapkan dan disusun

b. Tidak memberi banyak kesempatan untuk spekulasi atau untung-

untungan

c. Mendorong siswa untuk berani mengemukakan pendapat serta

menyusun dalam bentuk kalimat

d. Memberi kesempartan kepada siswa untuk meengutrakan

maskusnya dengan gaya bahasa dan caranya sendiri

e. Dapat diketahui sejauh mana siswa mendalami sesuat masalah

yang diteskan.

1) Keburukan-keburukannya

a. Kadar validitas dan relibitias rendah karena sukr diketahui segi-

segi mana dari pengetahuan siswa yang betul-betul telah dikuassai

b. Kurang repersentatif dalam hal mewakili seluruh scope bahan

pelajaran yang akan dites karena soalnya hanya beberapa saja

(terbatas)

Page 143: DASAR-DASAR EVALUASI PENDIDIKAN(SUHARISMI ARIKUNTO.docx

c. Cara memeriksanya banyak dipengaruhi oelh unsur-unsur

subjektif

d. Pemeriksaanya lebih sulit sebab membutuhakn pertimbangan

individual lebih banyak dari penilai

e. Waktu untuk koreksinya llama dan tidak dapat diwakilkan kepada

orang lain.

2) Petunjuk penyusunan

a. Hendaknya soal-soal tes dapat meliputi ide-ide pokok dari bahan

yang diteskan dan kalu mungkin disusun soal yang sifatnya

komprehensif.

b. Hendaknya soal tidka megambil kalimat-kalimat yangdisalin

langsung dari buku atau catatan.

c. Pada waktu menyusun soal-soal itu sudah dilengkapi dengan

kunci jawaban serta pedoman penilaiannya.

d. Hendaknya diusahakan agar pertanyaanya bervariasi antara

jelaskan mengapa bagaimana seberapa jauh agar diketahui lebih

jau penguasaan siswa tehadap bahan.

e. Hendakjnya rumusan soal dibuat sedemikan rupa sehingga mudah

dipahami oleh tercoba.

f. Hendaknya ditegakn model jawaban apa yang dikehendaki oleh

penyusun tes, untuk ini pertanyaan tidak boleh terlalu umu tetapi

harus spesifik

b) Tes objektif.

Tes objektif adalah tes yang dalam pemeriksaannya dapat

dilakukan secara objektif (Arikunto, 1995 : 165). Karena sifatnya

yang objektif maka penskorannya dapat dilakukan dengan bantuan

mesin. Soal ini tidak memberi peluang untuk memberikan penilaian

yang bergradasi karena dia hanya mengenal benar dan salah. Apabila

respons siswa sesuai dengan jawaban yang dikehendaki maka

respons tersebut benar dan biasa diberi skor 1. Apabila kondisi yang

Page 144: DASAR-DASAR EVALUASI PENDIDIKAN(SUHARISMI ARIKUNTO.docx

terjadi sebaliknya, maka respons siswa salah dan biasa diberi skor 0.

Jawaban siswa bersifat mengarah kepada satu jawaban yang benar

(convergence).

Merujuk kepada berbagai pendapat tentang tes objektif dapat

diambil kesimpulan bahwa tes objektif adalah tes yang semua

informasi yang diperlukan peserta tes untuk memberikan respon

telah disediakan oleh penyusun tes, sehingga peserta tes tinggal

memilihnya. Jawaban yang berupa pilihan bersifat deterministik,

sehingga hanya ada dua kemungkinan kebenaran jawaban – benar

atau salah

1) Kebaikan kebaikannya

a) Mengandung lebih banyak segi-segi yang positif mislnya

lebih representative meweakili isi dan luas bahan, lebih

objektif dpat dihindari campur tangannya unsur subjektif

baidari segi siswa maupun guru yang memriksa.

b) Lebih mudah dan cepat cara memriksanya karena

menggunkan kunci tes bahkan alat-alat hasil kemajuan

teknologi

c) Pemeriksaanya dapat disehkan ke oranglain

d) Dalam pemerisaan tidak ada unsur subjetif yang

memengaruhi

2) Kelemahan-kelemahanya

a) Persipan untuk menyusun jeuh lebih sulit dari pada tes esai

karena soelnya banyak dan harus teliti untuk menghindari

kelemahan-kelemahan yang lain.

b) Soalya cenderung untuk menggunkapkan ingatan dan daya

pengenalan kembali saja, dan sukar untuk mengukur proses

mental yang tinggi

c) Banyak kesempatan untuk main untung-untungan

Page 145: DASAR-DASAR EVALUASI PENDIDIKAN(SUHARISMI ARIKUNTO.docx

3) Cara mengatasi kelemahan

Page 146: DASAR-DASAR EVALUASI PENDIDIKAN(SUHARISMI ARIKUNTO.docx

Bab 12 TABEL SPESIFIKASI1.      Fungsi Tabel Spesifikasi

Fungsi dari tabel spesifikasi ialah untuk menjaga agar tes yang kita susun tidak menyimpang dari bahan (materi) serta aspek kejiwaan (tingkah laku) yang akan dicakup dalam tes.

Contoh table spesifikasi:

Aspek yang diungkapPokok Materi

Ingatan(I)

Pemahaman(P)

Aplikasi(A)

Jumlah

Bagian IBagian IIBagian (terakhir)

………………………………

…………….…………….

.…………….

.

………….………….………….

………….……………………

Jumlah ……….. ……………. ………….. …………

2.      Langkah-Langkah Pembuatana.      Untuk materi yang seragam

Yang dimaksud “seragam” disini adalah bahwa antara pokok materi yang satu dengan pokok materi yang lain mempunyai kesamaan dalam imbangan aspek tingkah laku. Misalnya 50% untuk ingatan, 30% untuk pemahaman, dan 20% untuk aplikasi. Selanjutnya banyaknya butir soal untuk setiap sel (kotak kecil) diperoleh dengan cara menghitung persentase dari banyaknya soal bagi tiap pokok materi yang sudah tertulis di kolom paling kanan.Contoh:Tabel Spesifikasi Penyusunan Tes Tarikh Kelas XI

Aspek yang diungkapPokok Materi

Ingatan(50 %)

Pemahaman

(30%)

Aplikasi(20%)

Jumlah

Latar Belakang Berdirinya Umayyah (20%)

[A] [B] [C] 10

Kahalifah-Khalifah Besar Umayyah (30%)

[D] [E] [F] 15

Keberhasilan Umayyah (30%)

[G] [H] [I] 15

Keruntuhan Umayyah (20%)

[J] [K] [L] 10

Jumlah 50

 

Page 147: DASAR-DASAR EVALUASI PENDIDIKAN(SUHARISMI ARIKUNTO.docx

Untuk mengisi/menentukan banyaknya butir soal untuk tiap sel adalah sebagai berikut:Sel A = 50 % x 10 soal = 5 (5 soal)        Sel B = 30%  x 10 soal = 3 (3 soal)Sel C = 20%  x 10 soal = 2 (3 soal)Untuk memgisi sel-sel yang lain, dilakukan dengan cara yang sama seperti hal nya mengisi sel A, B, dan C.Disamping menggunakan cara seperti diatas, dalam menentukan jumlah butir soal untuk tiap-tiap pokok materi, ada lagi cara lain yang dapat diambil yaitu mulai dari pengisian sel-sel kemudian baru diperoleh jumlah soal tiap pokok materi.

b.       Untuk materi yang tidak seragamUntuk membuat tabel spesifikasi pokok-pokok materi yang

tidak seragam, tidak perlu mencantumkan angka persentase imbangan tingkah laku di kepala kolom. Pemberian imbangan dilakukan tiap pokok materi didasarkan atas banyaknya soal untuk pokok materi itu dan imbangan yang dikehendaki oleh penilaian menurut sifat pokok materi yang bersangkutan.Contoh:Tabel Spesifikasi Penyusunan Tes Tarikh Kelas XI

Aspek yang diungkapPokok Materi

IngatanPemahama

nAplikasi Jumlah

Bab I: Daulah Umayyah (30%)

[A] [B] [C] 15

Bab II: Daulah Abbasiyah (40%)

[D] [E] [F] 20

Bab III: Islam di Asia        (30%)

[G] [H] [I] 15

Jumlah (100%) 50

Dalam keadaan seperti dicontohkan misalnya: BAB I mayoritas hafalan, BAB II mayoritas pemahaman, BAB III mayoritas aplikasi. Maka imbangan aspek tingkah laku, tidak dituliskan pada kepala kolom. Penentuan angka yang menunjukkan banyaknya butir soal pada tiap sel, ditentukan per BAB. Misalnya: untuk Bab I, Ingatan 60%, pemahaman 20%, aplikasi 20%, maka:Sel A = 60% x 15 soal = 9 soalSel B = 20% x 15 soal = 3 soalSel C = 20% x 15 soal = 3 soalUntuk Bab II, ingatan 20%, pemahaman 50%, aplikasi 30%, maka:Sel D = 20% x 20 soal = 4 soalSel E = 50% x 20 soal = 10 soalSel F = 30% x 20 soal = 6 soalUntuk Bab III, ingatan 20%, pemahaman 20%, aplikasi 60%, maka:Sel G = 20% x 15 soal = 3 soal

Page 148: DASAR-DASAR EVALUASI PENDIDIKAN(SUHARISMI ARIKUNTO.docx

Sel H = 20% x 15 soal = 3 soalSel I  = 60% x 15 soal = 9 soal

4)       Tidak Lanjut Sesudah Penyususnan Tabel SpesifikasiTerdapat dua langkah lagi sebagai tindak lanjut sesudah

penyususnan tabel spesifikasi untuk memperoleh seperangkat soal tes yaitu:a.       Menentukan bentuk soal. Ada dua hal yang harus dipertimbangkan

dalam menentukan bentuk soal yaitu waktu yang tersedia dan sifat materi yang diteskan.

b.      Menuliskan soal-soal. Langkah terakhir dalam penyusunan tes adalah penulisan soal-soal tes (item writing). Langkah ini merupakan langkah penting karena kegagalan dalam hal ini dapat berakibat fatal. Hal-hal yang harus diperhatikan dalam menuliskan soal-soal tes yaitu:(1)   Bahasanya harus sederhana dan mudah dipahami.(2)   Suatu soal tidak boleh mengandung penafsiran

ganda/membingungkan.(3)   Cara mengenal kalimat atau meletakkan/menata kata-kata perlu

diperhatikan agar tidak ditafsirkan salah.(4)   Petunjuk mengerjakan. Petunjuk ini harus dituliskan sedemikian

rupa sehingga jelas, dan siswa tidak bekerja menyimpang dri yang dikehendaki guru.

Untuk memperoleh sebuah tes yang standar, harus dilakukan uji coba (try out) berkali-kali sehingga diperoleh soal-soal yang baik. Dengan mengadakan uji coba terhadap soal-soal tes yang sudah disusun, maka akan memperoleh manfaat yaitu: pengalaman menggunakan tes tersebut, mengetahui kesukaran bahasa, mengetahui variasi jawaban siswa, mengetahui waktu yang dibutuhkan, dan lain-lain.

Bab 13 MENGANALISISS HASIL TES1.      Menilai Tes yang Dibuat Sendiri

Guru yang sudah banyak berpengalaman, mengajar dan menyusun soal-soal tes, juga masih sukar menyadari bahwa tesnya masih belum sempurna. Oleh karena itu cara yang paling baik adalah secara jujur melihat hasil yang diperoleh oleh siswa.

Ada 4 cara untuk menilai tes, yaitu:a.       Meneliti secara jujur soal-soal yang sudah disusun, kadang-kadang

dapat diperoleh jawaban tentang ketidak jelasan perintah atau bahasa, taraf kesukaran, dan lain-lain keadaan soal tersebut. Pertanyaan-pertanyaan tersebut antara lain:

(1)   Apakah banyaknya soal untuk tiap topik sudah seimbang ?(2)   Apakah semua soal menanyakan bahan yang telah diajarkan ?(3)   Apakah soal yang kita susun tidak merupakan pertanyaan yang

membingungkan (dapat disalah tafsirkan)? (4)   Apakah soal itu tidak sukar untuk dimengerti ? (5)   Apakah soal itu dapat dikerjakan oleh sebagian besar siswa ?

Page 149: DASAR-DASAR EVALUASI PENDIDIKAN(SUHARISMI ARIKUNTO.docx

b.      Mengadakan analisis soal (item analysis). Analisis soal adalah suatu prosedur Yang sistematis, yang akan memberikan informasi-informasi yang sangat khusus terhadap butir tes yang kita susun. Faedah mengadakan analisis soal:

(1)   Membantu kita dalam mengidentifikasi butir-butir soal yang jelek.

(2)   Memperoleh informasi yang akan dapat digunakan untuk menyempurnakan soal-soal untuk kepentingan lebih lanjut.

(3)   Memperoleh gambaran secara selintas tentang keadaan yang kita susun.

c.       Mengadakan checking validitas. Validitas yang paling penting dari tes buatan Guru adalah validitas kurikuler.

d.      Mengadakan checking reliabilita. Salah satu indikator untuk tes yangMempunyai realibilitas yang tinggi adalah bahwa kebanyakan dari soal-soal tes itu mempunyai daya pembeda yang tinggi.

2.      Analisis Butir Soal(Item Analysis)Analisis butir soal yang dalam bahasa inggris disebut item

analiysis dilakukan terhadap empirik.Maksudnya, analisis itu baru dapat dilakukan apabila suatu tes telah dilaksanakan dan hasil jawaban terhadap butir-butir soal telah kita peroleh.

Untuk mengetahui kapan soal dikatakan baik, kurang baik, dan soal yang jelek sangat berhubungan dengan analisis soal, yaitu taraf kesukaran, daya pembeda, dan pola jawaban soal.

a)      Taraf KesukaranSoal yang baik adalah soal yang tidak terlalu mudah atau tidak terlalu sukar. Soal yang terlalu mudah tidak merangsang siswa untuk mempertinggi usaha memecahkannya. Sebaliknya soal yang terlalu sukar akan menyebabkan siswa menjadi putus asa dan tidak mempunyai semangat untuk mencoba lagi karena di luar jangkauannya.Bilangan yang menunjukkan sukar dan mudahnya sesuatu soal disebut indeks kesukaran. Besarnya indeks kesukaran antara 0,00 sampai dengan 1,0. Soal yang indeks kesukaran 0,0 menunjukkan bahwa soal itu terlalu sukar, sebaliknya indeks 1,0 menunjukkan bahwa soalnya terlalu mudah.Didalam istilah evaluasi, indeks kesukaran diberi simbol P (proporsi). Rumus mencari P adalah :P = BJSDimana :P= indeks kesukaranB            = Banyaknya siswa yang menjawab soal itu dengan betulJS           = jumlah seluruh siswa peserta tesMenurut ketentuan yang sering diikuti, indeks kesukaran sering diklasifikasikan sebagai berikut :Soal dengan P 1,00 sampai 0,30 adalah soal sukar

Page 150: DASAR-DASAR EVALUASI PENDIDIKAN(SUHARISMI ARIKUNTO.docx

Soal dengan P 0,30 sampai 0,70 adalah soal sedangSoal dengan P 0,70 sampai 1,00 adalah soal mudahWalaupun demikian ada yang berpendapat bahwa soal – soal yang di anggap baik yaitu soal – soal sedang, tetapi bukan berarti soal – soal yang terlalu mudah atau terlalu sukar tidak bisa digunakan, hal ini tergantung dari penggunaannya.

b)      Daya Pembeda.Daya pembeda soal adalah kemampuan sesuatu soal untuk membedakan antara siswa yang berkemampuan tinggi dengan siswa yang berkemampuan rendah.Angka yang menunjukkan besarnya daya pembeda disebut indeks diskriminasi, indeks diskriminasi ini sama dengan indeks kesukaran yaitu berkisar antara 0,00 sampai 1,00. Hanya bedanya, indeks kesukaran tidak mengenal tanda negatif tetapi pada indeks diskriminasi ada tanda negatif.Bagi suatu soal yang dapat dijawab benar oleh siswa pandai maupun siswa bodoh, maka soal itu tidak baik, demikian pula jika semua siswa, baik pandai maupun bodoh tidak dapat menjawab dengan benar, soal tersebut tidak baik karena keduanya tidak mempunyai daya pembeda. Soal yang baik adalah soal yang dapat dijawab oleh siswa pandai saja.Jika seluruh kelompok atas (pandai) dapat menjawab soal dengan benar, sedang seluruh kelompok bawah (bodoh) menjawab salah, maka soal tersebut mempunyai diskriminasi paling besar, yaitu 1,00. Sebaliknya jika semua kelompok atas menjawab salah, tetapi semua kelompok bawah menjawab betul, maka nilai diskriminasinya adalah -1,00. Tetapi jika siswa kelompok atas dan siswa kelompok bawah sama-sama menjawab benar atau sama-sama menjawab salah, maka soal tersebut mempunyai nilai diskriminasi 0,00 karena tidak mempunyai daya pembeda sama sekali.Rumus mencari nilai Diskriminasi adalah :D = BA/JA – BB/JB = PA – PBDimana :J = jumlah peserta tesJA = banyaknya peserta kelompok atasJB = banyaknya peserta kelompok bawahBA = banyaknya peserta kelompok atas yang menjawab soal itu dengan benarBB BA/JA = banyaknya peserta kelompok bawah yang menjawab soal itu dengan benar.PA = BB/JB = proporsi peserta kelompok atas yang menjawab benar ( P sebagai indeks kesukaran).PB = proporsi peserta kelompok bawah yang menjawab benar

c)      Pola Jawaban SoalPola jawaban yang dimaksud adalah distribusi testee dalam hal menentukan pilihan jawaban pada soal bentuk pilihan ganda. Pola

Page 151: DASAR-DASAR EVALUASI PENDIDIKAN(SUHARISMI ARIKUNTO.docx

jawaban soal diperoleh dengan menghitung banyaknya testee yang memilih pilihan jawaban a, b, c, atau d atau yang tidak memilih pilihan manapun.Dari pola jawaban soal dapat ditentukan apakah pengecoh (distractor) berfungsi sebagai pengecoh dengan baik atau tidak. Pengecoh yang tidak dipilih sama sekali oleh testee berarti bahwa pengecoh itu jelek, sebaliknya sebuah distraktor dapat dikatakan berfungsi dengan baik apabila distraktor tersebut mempunyai daya tarik yang besar bagi pengikut – pengikut tes yang kurang memahami konsep atau kurang menguasai bahan.Dengan melihat pola jawaban soal, dapat diketahui :a. Taraf kesukaran soalb. Daya pembeda soalc. Baik dan tidaknya distraktorKekurangan suatu soal mungkin hanya terletak pada rumusan kalimatnya sehingga hanya perlu ditulis kembali, dengan perubahan seperlunya.

Bab 14 MENSKOR DAN MENILAI1.       Menskor

Sementara orang berpendapat bahwa bagian yang paling penting dari pekerjaan pengukuran dengan tes adalah penyusunan tes. Jika alat tesnya sudah disusun sebaik-baiknya maka anggapannya sudah tercapailah sebagian besar dari maksudnya. Tentu saja anggapan itu tidak benar sama sekali. Penyusunan tes baru merupakan satu bagian dari serentetan pekerjaan mengetes.

Di samping penyusunan dan pelaksanaan tes itu sendiri, menskor dan menilai merupakan pekerjaan yang menuntut ketekunan yang luar biasa dari penilai, ditambah dengan kebijaksanan-kebijaksanaan tertentu. Nama lain menskor adalah memberi angka.

Dalam hal pekerjaan menskor atau menentukan angka, dapat digunakan 3 macam alat bantu yaitu:

a.       Pembantu menentukan jawaban yang benar, disebut kunci jawaban.

b.      Pembantu menyeleksi jawaban yang benar dan yang salah, disebut kunci scoring.

c.       Pembantu menentukan angka, disebut pedoman penilaian.Keterangan dan pengunaannya dalam berbagai bentuk tes.

(1)   Kunci jawaban dan kunci pemberian skor untuk tes bentuk betul-salah.

Untuk tes bentuk betul-salah (true-false) yang dimaksud dengan kunci jawaban adalah deretan jawaban yang kita persiapkan untuk pertanyaan atau soal-soal yang kita susun, sedangkan kunci scoring adalah alat yang kita gunakan untuk mempercepat pekerjaan scoring.

Oleh karena dalam hal ini testee (tercoba) hanya diminta melingkari huruf B atau S maka kunci jawaban yang disediakan hanya

Page 152: DASAR-DASAR EVALUASI PENDIDIKAN(SUHARISMI ARIKUNTO.docx

berbentuk urutan nomor serta huruf dimana kita menghendaki untuk melingkari (atau dapat juga diberi tanda X).

Ada baiknya jika kunci jawaban ini ditentukan terlebih dahulu sebelum menyusun soalnya agar:

dapat diketahui imbangan antara jawaban B dan S.dapat diketahui letak atau pola jawaban B dan S.Bentuk betul-salah sebaiknya disusun sedemikian rupa sehingga

jumlah jawaban B hampir sama banyaknya dengan jawaban S, dan tidak dapat ditebak karena tidak diketahui pola jawabannya. Dalam menentukan angka (skor) untuk tes bentuk B-S ini kita dapat menggunakan 2 cara yaitu:

  Tanpa hukuman atau tanpa denda.  Dengan hukuman atau dengan denda.

(2)   Kunci jawaban dan kunci pemberian skor untuk tes bentuk pilihan ganda (multiple choice)

Dengan tes bentuk pilihan ganda, testee diminta melingkari salah satu huruf di depan pilihan jawaban yang disediakan atau membubuhkan tanda lingkaran atau tanda silang (x) pada tempat yang sesuai di lembar jawaban.

(3)   Kunci jawaban dan kunci pemberian skor untuk tes bentuk jawab singkat (sort answer test)

Tes bentuk jawab singkat adalah bentuk tes yang menghendaki jawaban berbentuk kata atau kalimat pendek. Melihat namanya, maka jawaban untuk tes tersebut tidak boleh berbentuk kalimat-kalimat panjang, tetapi harus sesingkat mungkin dan mengandung satu pengertian. Dengan persyaratan inilah maka bentuk tes ini dapat digolongkan ke dalam bentuk tes objektif.

Kunci jawaban tes bentuk ini merupakan deretan jawaban sesuain dengan nomornya.

Dengan mengingat jawaban yang hanya satu pengertian saja, maka angka bagi tiap nomor soal mudah ditebak. Usaha yang dikeluarkan siswa sedikit, tetapi lebih sulit daripada tes bentuk betul-salah atau bentuk pilihan ganda. Sebaiknya setiap soal diberi angka 2. Dapat juga angka itu kita samakan dengan angka pada bentuk betul-salah atau pilihan ganda jika memang jawaban yang diharapkannya ringan atau mudah. Tetapi sebaliknya apabila jawabannya bervariasi misalnya lengkap sekali, lengkap dan kurang lengkap, maka angka-angkanya dapat dibuat bervariasi pula misalnya 2; 1,5; dan 1.

(4)   Kunci jawaban dan kunci pemberian skor untuk tes bentuk menjodohkan (matching)

Pada dasarnya tes bentuk menjodohkan adalah tes bentuk pilihan ganda, dimana jawaban-jawabannya dijadikan satu, demikian pertanyaan-pertanyaannya. Dengan demikian, maka pilihan jawabannya akan lebih banyak. Satu kesulitan lagi adalah bahwa jawaban yang dipililh dibuat sedemikian rupa sehingga jawaban yang satu tidak diperlukan lagi bagi pertanyaan lain.

Page 153: DASAR-DASAR EVALUASI PENDIDIKAN(SUHARISMI ARIKUNTO.docx

Kunci jawaban tes bentuk menjodohkan dapat berbentuk deretan jawaban yang dikehendaki atau deretan nomor yang diikuti oleh huruf-huruf yang terdapat di depan alternative jawaban.

Telah dijelaskan bahwa tes bentuk menjodohkan adalah tes bentuk pilihan ganda yang lebih kompleks. Maka angka yang diberikan sebagai imbalan juga harus lebih banyak. Sebagai ancar-ancar dapat ditentukan bahwa angka untuk tiap nomor adalah 2 (dua).

(5)   Kunci jawaban dan kunci pemberian skor untuk tes bentuk uraian (essay test)

Sebelum menyusun sebuah tes uraian sebaiknya kita tentukan terlebih dahulu pokok-pokok jawaban yang kita kehendaki. Dengan demikian, maka akan mempermudah kita dalam pekerjaan mengkoreksi tes itu.

Tidak ada jawaban yang pasti terhadap tes bentuk uraian ini. Jawaban yang kita peroleh akan sangat beraneka ragam, berada dari siswa satu ke siswa lain. Untuk menetukan standar terlebih dahulu, tentulah sukar. Berikut adalah saran langkah-langkah apa yang harus kita lakukan pada waktu kita mengoreksi dan member angka tes bentuk uraian:

a)      Membaca soal pertama dari seluruh siswa untuk mengetahui situasi jawaban. Dengan membaca seluruh jawaban, kita dapat memperoleh gambaran lengkap tidaknya jawaban yang diberikan siswa secara keseluruhan.

b)      Menentukan angka untuk soal pertama tersebut. Misalnya jika jawabannya lengkap diberi angka 5, kurang sedikit diberi angka 4, begitu  seterusnya sampai kepada jawaban yang paling minim jika jawabannya meleset sama sekali. Dalam menentukan angka pada hal yang terakhir ini umumnya kita perlu berpikir bahwa tidak ada unsur tebakan. Dengan demikian maka ada dua pendapat, satu pendapat menentukan angka 1 atau 2 bagi jawaban yang salah, tetapi pendapat lain menentukan 0 untuk jawaban itu. Tentu saja bagi jawaban yang kosong (tidak ada jawaban sama sekali), jelas kita berikan angka 0.

c)      Memberikan angka bagi soal pertama.d)      Membaca soal kedua dari seluruh siswa untuk mengetahui

situasi jawaban, dilanjutkan dengan pemberian angka untuk soal kedua.

e)      Mengulangi langkah-langkah tersebut bagi soal-soal tes ketiga, keempat dan seterusnya hingga seluruh soal diberi angka.

f)       Menjumlahkan angka-angka yang diperoleh oleh masing-masing siswa untuk tes bentuk uraian.

Setelah mempelajari langkah-langkah tersebut kita tahu bahwa dengan membaca terlebih dahulu seluruh jawaban yang duberikan oleh siswa, kita menjadi tahu bahwa mungkin tidah ada seorang pun dari siswa yang menjawab dengan betul untuk sesuatu nomor soal.

Menghadapi situasi seperti ini, kita gunakan cara pemberian angka yang relative. Misalnya untuk satu nomor soal jawaban yang paling

Page 154: DASAR-DASAR EVALUASI PENDIDIKAN(SUHARISMI ARIKUNTO.docx

lengkap hanya mengandung 3 unsur, padahal kita menghendaki 5 unsur, maka kepada jawaban yang paling lengkap itulah kita berikan angka 5, sedangkan untuk menjawab hanya 2 atau 1 unsur, kita beri angka sedikit, yaitu misalnya 3,4; 2; 1,5.

(6)   Kunci jawaban dan kunci pemberian skor untuk tugasKunci jawaban untuk memeriksa tugas merupakan poko-pokok

yang harus termuat di dalam pekerjaan siswa. Hal ini menyangkut criteria tentang isi tugas. Namun sebagai kelengkapan dalam pemberian skor, digunakan suatu tolok ukur tertentu. Tolok ukur yang disarankan sebagai ukuran keberhasilan tugas adalah:

a)      Ketepatan waktu penyerahan tugas.b)      Bentuk fisik pengerjaan tugas yang menandakan keseriusan

mahasiswa dalam mengenakan tugas.c)      Sistematika yang menunjukkan alur keruntutan pikiran.d)      Kelengkapan isi menyangkut ketuntasan penyelesaian dan

kepadatan isi.e)      Mutu hasil tugas, yaitu kesesuaian hasil dengan garis-garis yang

sudah ditentukan oleh dosen.2.      Perbedaan Antara Skor dan Nilai

Apa yang terjadi selama ini, banyak di antara para guru sendiri yang masih mencampuradukkan antara dua pengertian yaitu skor dan nilai.Skor : adalah hasil pekerjaan menskor yang diperoleh dengan menjumlahkan angka-angka bagi setiap soal tes yang dijawab betul oleh siswa.Nilai : adalah angka ubahan dari skor dengan menggunakan acuan tertentu, yakni acuan normal atau acuan standar.Secara rinci skor dapat dibedakan atas tiga macam, yaitu skor yang diperoleh (obtained score), skor sebenarnya (true score), dan skor kesalahan (error score).

Score yang diperoleh adalah sejumlah biji yang dimiliki oleh testee sebagai hasil mengerjakan tes. Kelemaham-kelemahan butir tes, situasi yang tidak mendukung, kecemasan dan lain-lain factor dapat berakibat terhadap skor yang diperoleh ini. Apabila factor yang berpengaruh ini muncul, baik sebagian atauppun menyeluruh, penilai tidak dapat mengira-ngira seberapa cermat skor yang diperoleh siswa ini mampu mencerminkan pengetahuan dan keterampilan siswa yang sesungguhnya.

Skor sebenarnya (true score) sering kali juga disebut dengan istilah skor univers = skor alam (universe score), adalah nilai hipotesis yang sangat tergantung dari perbedaan individu berkenaan dengan pengetahuan yang dimiliki secara tetap.

Perbedaan antara skor yang diperoleh dengan skor yang sebenarnya, disebut dengan istilah kesalahan dalam pengukuran atau kesalahan skor, atau dibalik skor kesalahan. Hubungan antara ketiga macam skor tersebut adalah sebagai berikut:

Skor yang diperoleh = skor sebenarnya = skor kesalahan 3.      Norm ReferenceddanCriterion Referenced

Dalam penggunaan Norm – Referenced, prestasi belajar seorang siswa dibandingkan dengan siswalain dalam kelompoknya. Kualitas

Page 155: DASAR-DASAR EVALUASI PENDIDIKAN(SUHARISMI ARIKUNTO.docx

seseorang sangat dipengaruhi oleh kualitas kelompoknya. Dasar pikiran dari penggunaan standar ini adalah adanya asumsi bahwa disetiap populasi yang heterogen tentu terdapat kelomouk baik, kelompok sedang, dan kelompok kurang.

Apabila standar mutlak dan standar relatif ini dihubungkan dengan pengubahab skor menjadi nilai, maka akan terlihat demikian.

a.      Dengan standar mutlak(1)   Pemberian skor terhadap siswa, didasarkan atas pencapaian siswa

terhadap tujuan yang ditentukan.(2)   Nilai diperoleh dengan mencari skor rata-rata langsung dari skor

asal (skor mentah). Contoh :  dari ulangan ke-1, memperoleh skor 60 (mencapai 60 % tujuan)  dari ulangan ke-2, memperoleh skor 80 (mencapai 80 % tujuan)  dari ulangan ke-3, memperoleh skor 50 (mencapai 50 % tujuan)

maka nilai siswa tersebut : 60 + 80 + 50 = 63,3. Dibulatkan 63.b.      Dengan standar relatif

(1)   pemberian skor terhadap siswa juga didasakan atas pencapaian siswa terhadap tujuan yang ditentukan

(2)   nilai diperoleh dengan 2 cara :  mengubah skor dari tiap-tiap ulangan lalu diambil rata-ratanya  menjumlah skor tiap-tiap ulangan, baru diubah ke nilai

Bab 15 MENGOLAH NILAI1.      Beberapa Skala Penilaian

a.       Skala BebasSkala bebas yaitu skala yang tidak tetap, ada kalanya skor tertinggi 20, lain kali lagi 50. Ini semua tergantung dari banyak dan bentuk soal. Jadi, angka tertinggi dari skala yang di gunakan tidak selalu sama.

b.      Skala 1-10Dalam skala 1-10, guru jarang memberikan angka pecahan, misalnya 5,5. Angka 5,5 tersebut di bulatkan menjadi 6. Dengan menggunakan skala 1-10 maka bilangan bulat yang ada masih menunjukan penilaian yang agak kasar.

c.       Skala 1-100Penilaian dengan menggunakan skala 1-100, di mungkinkan melakukan penilaian yang lebih halus karena terdapat 100 bilangan bulat. Nilai 5,5 dalam skala 1-10 yang biasanya di bulatkan menjadi 6, dalam skala 1-100 ini boleh di tuliskan dengan 55.

d.      Skala hurufSelain menggunakan angka, pemberian nilai dapat di lakukan dengan huruf A,B,C,D,dan E. Huruf tidak menunjukan kuantitas, tetapi dapat di gunakan sebagai symbol untuk menggambarkan kualitas.

2.      Distribusi Nilaia.      Distribusi nilai berdasarkan standar mutlak

Pemberian skor terhadap siswa, didasarkan atas pencapaian siswa terhadap tujuan yang ditentukan. Nilai diperoleh dengan

Page 156: DASAR-DASAR EVALUASI PENDIDIKAN(SUHARISMI ARIKUNTO.docx

mencari skor rata-rata langsung dari skor asal (mentah). Apabila soal-soal ulangan yang dibuat oleh guru sangat mudah, sebagian besar siswa akan dapat berhasil mengerjakan soal-soal itu, dan tingkat pencapaiannya tinggi.sebagian besar siswa akan memiliki nilai sekitar 8, 9 atau 10 apabila telah diubah ke skala 10, sebaliknya apabila soal-soal tes yang disusun oleh guru termasuk soal sukar, maka pencapaian siswa akan sebaliknya pula. Sebagian besar siswa akan memiliki nilai 3, 4 bahkan mungkin 2 atau  1. Hanya beberapa orang siswa  yang istimewa saja yang memiliki nilai 6, dan mungkin tidak ada yanig memiliki nilai 7 ke atas. Namun demikian dengan standar mutlak ini mungkin pula diperoleh gambar kurva normal jika soal-soal tes disusun oleh guru dengan tepat seperti gambaran kecakapan siswa-siswanya.

b.      Distribusi nilai berdasarkan standar relativePemberian skor terhadap siswa juga didasarkan atas pencapaian

siswa terhadap tujuan yang ditentukan.Nilai diperoleh dengan 2 cara:  Mengubah skor dari tiap-tiap ulangan lalu diambil rata-ratanya.  Menjumlah skor tiap-tiap ulangan, baru diubah ke nilai.

Telah diterangkan, bahwa dalam menggunakan standar relative atau norm refrenced, kedudukan seseorang sealu dibandingkan dengan kawan-kawannya dalam kelompok. Dalam hal ini tanpa menghiraukan apakah distribusi skor terletak dalam kurva juring positif atau juring negative, tetapai dalam norm refrenced selalu tergambar dalam kurva normal. Hal ini didasarkan atas asumsi bahw apabila distribusi skor tergambar dalam kurva juring positif, yang kurang sempurna adalah soal-soal tesnya, yaitu terlalu sukar. Dengan demikian, nilai siswa lalu direntangkan sedemikian rupa sehingga tersebar dari nilai tinggi ke nilai rendah, dengan sebagian terbesar terletak pada nilai sedang. Demikian pula sebaliknya apabila skor siswa tergambar dalam kurva juring negative. Dalam ubahan menjadi nilai, disebar sedemikian rupa sehingga kurva normal, dengan nilai sedang adalah nilai yang paling banyak.

3.      Standar Nilaia.       Nilai standar berskala Sembilan (stannine), yaitu rentangan atau skala

nilai yang bergerak mulai dari 1 sampai dengan  9,[7] seperti berikut ini:

Staines Interpretasi9  (4%) Tinggi (4%)8  (7%)7  (12%)

Diatas rata-rata (19%)

6  (17%)5  (20%)4  (17%)

Rata-rata  (54%)

3  (12%)2  (7%)

Dibawah rata-rata (19%)

Page 157: DASAR-DASAR EVALUASI PENDIDIKAN(SUHARISMI ARIKUNTO.docx

1  (4%) Rendah (4%)

Misalnya kita memiliki skor-skor seperti disebutkan dalam hasil ulangan IPS kelas V, dengan mudah dapat kita tentukan 4% dari siswa yang mendapat nilai 9, selanjutnya 7% mendapat nilai 8, 12% mendapat nilai 7, 17% mendapat nilai 6, dan seterusnya.

b.      Nilai standar berskala sebelas (standar eleven/ stanel= eleven points scale), yaitu skala nilai yang bergerak mulai  dari nilai 0 sampai dengan nilai 10,[9] yang dikembangkan oleh Fakultas Ilmu Pendidikan UGM disesuaikan dengan system penilaian di Indonesia. Dengan stanel ini, system penilaian membagi skala menjadi 11 golongan, yaitu angka-angka  0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, yang satu sama lain berjarak sama. Tiap-tiap angka menempati  jarak antara

c.       Standar sepuluh. Didalam Buku Pedoman Penilaian (Buku III B Seri Kurikulum SMA Tahun 1975) ditentukan bahwa untuk mengolah hasil tes, digunakan standar relative, dengan nilai berskala 1 – 10. Untuk mengubah skor menjadi nilai, diperlukan dahulu:   Mean (rata-rata skor)  Deviasi Standar (Simpangan Baku)  Tabel Konversi angka ke dalam nilai berskala 1 – 10

Tahap-tahap yang dilalui dalam mengubah skor mentah menjadi nilai berskala 1 – 10 adalah sebagai berikut:  Menyusun distribusi frekuensi dari angka-angka atau skor-skor

mentah  Menghitung rata-rata skor (mean)  Menghitung deviasi standar  Mentransformasi (mengubah) angka-angka mentah ke dalam nilai

berskala 1 – 10Bab 16 KEDUDUKAN SISWA DALAM KELOMPOK

1.      PengertianPengertian yang dimaksud kedudukan siswa dalam kelompoknya

adalah letak seorang siswa di dalam urutan tingkatan, dalam istilah disebut rangking. Untuk dapat diketahui rangking dari siswa  di suatu kelas maka harus diadakan pengurutan nilai siswa tersebut dari yang paling atas sampai ke nilai yang paling bawah.

2.      Cara-cara menentukan kedudukan siswa:a.       Dengan rangking sederhana( simple rank) adalah urutan yang

menunjukkan letak atau kedudukan seseorang dalam kelompoknya dan dinyatakan dengan nomor atau angka biasa.

b.      Dengan rangking presentase (percentile rank) adalah kedudukan seseorang dalam kelompok, yang menunjukkan banyaknya persentase yang berada di bawahnya

c.       Standar Deviasi adalah penentuan kedudukan dengan membagi kelas atas kelompok-kelompok. Tiap kelompok dibatasi oleh suatu standar deviasi tertentu.

Page 158: DASAR-DASAR EVALUASI PENDIDIKAN(SUHARISMI ARIKUNTO.docx

d.      Standard score atau z-score adalah angka yang menunjukkan perbandingan perbedaan score seseorang dari mean dengan standar deviasinya untuk menentukan z-score, harus diketahui:

  Rata-rata skor dari kelompok.   Standar deviasi dari skor-skor tersebut

Pengetrapan dari z-score ini banyak digunakan di dalam menentukan kejuaraan seseorang apabila kebetuan jumlah nilainya sama

Kedudukan seseorang dalam sebuah kelas sangat penting karena dengan begitu peserta didik akan tahu berapa rangking yang telah dicapainya, jika mendapat rangking yang bagus maka dia akan merasa bangga dengan hasil yang diperoleh atas usaha yang telah dilakukan selama ini dalam proses belajar mengajar, sedang apabila rangkingnya jelek maka peserta didik akan lebih termotivasi untuk memperbaiki dirinya. Dalam bab ini telah dijelaskan bagaimana cara menentukan kedudukan siswa melalui beberapa standar yang lazim digunakan.

Page 159: DASAR-DASAR EVALUASI PENDIDIKAN(SUHARISMI ARIKUNTO.docx

Bab 17 MENCARI NILAI AKHIR

1.      Fungsi Nilai Akhir

a.       Fungsi intruksional bertujuan untuk memberikan suatu balikan

yang mencerminkan seberapa jauh seorang siswa telah mencapai

tujuan yang ditetapkan dalam pengajaran atau system intruksional.

b.      Fungsi informatif bertujuan untuk memberikan nilai siswa kepada

orang tuanya mempunyai arti bahwa orang tua siswa tersebut menjadi

tahu akan kemajuan dan prestasi putranya di sekolah.

c.       Fungsi bimbingan bertujuan untuk mengetahui bagian-bagian

mana dari usaha siswa di sekolah yang masih memerlukan bantuan.

d.      Fungsi administratif:

  Menentukan kenaikan dan kelulusan siswa

  Memindahkan atau menempatkan siswa

  Memberikan beasiswa

  Memberikan rekomendasi untuk melanjutkan belajar

  Memberi gambaran tentang prestasi siswa atau lulusan kepada

calon pemakai tenaga kerja.

2.      Faktor-faktor yang mempengaruhi penilaian:

a.       Prestasi/ pencapaian (achievement)

b.      Usaha (effort)

c.       Aspek pribadi dan social (personal and social characteristics)

Page 160: DASAR-DASAR EVALUASI PENDIDIKAN(SUHARISMI ARIKUNTO.docx

d.      Kebiasaan bekerja (working habits).

3.      Cara menentukan nilai akhir:

a.         Untuk memperoleh nilai akhir, perlu diperhitungkan nilai tes

formatif dan tes sumatif.

b.         Nilai akhir diperoleh dari nilai tugas, nilai ulangan harian, dan

nilai ulangan umum dengan bobot 2,3,dan 5.

c.         Nilai akhir untuk STTB diperoleh dari rata-rata nilai ulangan

harian (diberi bobot satu) dan nilai EBTA (diberi bobot dua),

kemudian dibagi 3.

Page 161: DASAR-DASAR EVALUASI PENDIDIKAN(SUHARISMI ARIKUNTO.docx

BAB 19

MEMBUAT LAPORAN

1. Pentingnya laporan

Pentingnya LaporanHamper semua guru tidak menyenangi tugas memriksa pekerjaan

(koreksi) dan membuat catatan tentang hasil atau prestasi siswa pekerjaan

itu membutuhkan ketekunan dan ketelitian yang luar biasa dan menuntut

banyak energi. Jika disuruh memilih kebanyakan guru akan lebih

menyenangi mengajar disbanding dengan memeriksa dan mencataat hasil

ulangan.

Akan tetai dengan kesaran akan pentingnya kegiatan-kegian

tersebut akhirnya guru pun akan melakukan dengan senang hati apalagi bila

telah dijumpai dalam mengajar guru lalu ingin tahu apa sebabnya kesulitan

itu terjadi. Dan hanya dapat ditemukan jika guru sudah memeriksa hasil

ulangan,

Pada waktu mengajar tentu guru sudah berkali-kali membri

kesempatan kepada siswa untuk menanyakan hal yang belum diketahui.

Akan tetapi pada umumnya mereka itu diam, siswa-siwa tersebut sudah

tahu. Walupun sebenarnya guru itu terkecoh. Problemnya baru terbuka

setelah guru memeriksa hasil ulangan. Dari hasil terseut guru mengetahui

bagian-bagian mana dari tujuan pelajaran yang diberikan di kelas belum

tercapai.

Secara sistematis dapat dikemukakan disini bahwa laporan tentang

siswa bermanfaat bagi beberapa pihak yaitu sebagai berikut:

a) Siswa sendiri,

1. secara alamiah setiap orang selalu ingin tahu akibat dari apa yang

telah mereka lakukan,

Page 162: DASAR-DASAR EVALUASI PENDIDIKAN(SUHARISMI ARIKUNTO.docx

2. dengan mengetahui hasil yang positif dari perbuatannya, maka

pengetahuan yang diperoleh akan dikuatkan dan

3. jika siswa mendapat informasi bahwa jawwabannya salah, maka

lain kali ia tidak akan menjawab seperti itu lagi.

Jadi dengan singkat dapat dikatan bahwa dengan jawaban yang

diberikan oleh siswa, akibatnya aka nada:

1. konfirmasi- penguatan

2. refisi-penyempurnaan

b) Guru yang mengajar akan mengetahui catatan laporan kemajuan

siswa.

Dengan melihat pada catatan laporan keamajuan siswa, maka guru

akan dengan tenang mengamati hasil tersebut. Daftar nilai yang

disimpan oleh guru measih merupakan cacatan sementara dan masih

bersifat rahasia. Tetapi laporan kemajuan siswa yang berupa rapor

atau STTB (surat Tanda tamat belajar) sudah merupakan resmi

laporan yang bersifat tetap dan terbuka

Oleh karena laporan ini merupakan titik tolak bagi guru untuk

menentukan langkah selanjutnya. Maka laporan ini harus dibuat

sejujur dan setepat mungkin. Amat disayangkan bahwa apa yang

dicantumkan di buku rapor kadang-kadang sudah tidak murni

merupakan cermin siswa lagi karena sudah dibumbui oleh

kebijsanaan-kebijaksanaan.

c) Guru lain,

Yang dimaksud dengan guru lain disini adalah yang akan mengganti

mengajar terdahulu karena siswa tesebut sudah naik kelas atau adanya

perpiondahan baik siswa yang pindah atau guru yang pindak ke

tempat lain.

Page 163: DASAR-DASAR EVALUASI PENDIDIKAN(SUHARISMI ARIKUNTO.docx

Apabila tidak ada catatan atau laporan mengenai siswa, maka guru

yang mengganti mengajar akan tidak tahu bagaimana meladeni atau

memperlakukan siswa tersebut

d) Petugas lain disekolah.

Siswa yang berada disuatu sekolah, sebenarnya, bukan hanya

merupakan asuhhan atau tanggung jawab guru yang mengajar saja,

kepal sekolah wali kelas, dan guru pembimbing , ketiganya

merupakan personal-personal penting yang juga memerlukan catatan

tentang siswa. Dengan demikian maka hasil belajar siswa

diperhatikan dan diperkirakan oleh beberapa pihak.

e) Orang tua

Secra alamiah, orang tualah yang mempunya tanggung ajawab utama

terhadap pendidikan anak. Akan tetapi karena berkembangya

pengetahuan secara pesat. Menyebabkan oragn tua tidak mampu laig

menguasai seluruh ilmu yang ada

Dengan menyerahkan ke sekolah ini tidak berarti bahwa orang tua

dapat melepas pemikiran dan menyerahkan cita-citanya kepada guru.

Orang tua masih tetap merupakan penanggun gjawab utama dan

masih pula menentukan cita-cita bagi anaknya. Itulah sebabnya maka

orang tua masih ingin selalu mengetahui kemajuan anak dari hari ke

hari, yang dapat dilihat melalui laporan yang dibuat oleh gurunya.

f) Pemakai lulusan,

Setiap siswa yang sudah lulus dari pendidikan, selalu membawa bukti

bahwa ia memili suatu pengetahuan dan keterampilan tertentu. Namu

pengetahuan dan keterampilan yang diperoleh dari suatu sekolah

tidaklah sama bagi semua siswa. Tingkat keberhasilan ini dinyatakan

secara lengkap dalam laporan prestasi

Catatan tentang diri llusan. Akan berguna baginya apabila ia

1) mencari pekerjaan

Page 164: DASAR-DASAR EVALUASI PENDIDIKAN(SUHARISMI ARIKUNTO.docx

dengan gambaran yang tercantum dalam laporan, maka lapangan

kerja akan mengetahui sesuai atau tidaknya bekal pengetahuan

dan keterampilan yang dimiliki oelh lulusan dengan tuntutan bagi

pekerjaan/tugas yang akan diembannya

2) mencari kelanjutan studi

seperti halnya lapangan kerja, lembaga pendidikan merupakan

kelanjutan dari lembaga dimana siswa belajar, juga menginnkan

adanya catatan yang menggambarkan kadaan atau kehasilan siswa

selama menuntut ilmui. Catatan ini akan berguna untuk

a) memupuk apa yang sudah berhasil di lembaga sebelumnya

b) mengatasi masalah yang ada, baik yang sudah dicoba untuk

diatsi maupun yang belum

3. Macam dan Cara Membuat Laporan

pada dasarnya catatan tentang diri siswa ini dusahak selengkap mungkin

agar dapt diperoleh informasi yang selengkapnya pula. Akan tetapi kita

sadrari bahwa membuat catatan yang lengkap setiap saat, meupakan tugas

yang berat dan meminta banyak waktu

secara garis besar, catatan tentang siswa dapat dibuat denga 2 (dua) macam

cara yakni

a. Catatan lengkap

Catatan lengkap adalah catatan tentang siswa yang berisi baik prestai

maupun aspek-aspek pribadi yang lain, misalnya kejujuran,

keberhasilan, kerajainan sikap social, kepercayaan diri sendiri, disiplin,

ketelitian dan sebagainya. Tentang isi catatan ada yang hanya

dinyatkan dengan kata singkat seperti baik sedan atau dengan

keterangan lebih terperinci

b. Catatan tidak lengkap

Catatan tidak lengkap adalah catatan siswa yang hanya berisi

gambaran tentang prestasi siswa dan hanya sedikit saja menyinggung

Page 165: DASAR-DASAR EVALUASI PENDIDIKAN(SUHARISMI ARIKUNTO.docx

tentang kepribadian

Tentag catatan prestasi belajar siswa itu sendiri dapat dibekkan atas 2

(dua) cara:

1. Lulus belum lulus

Penilain atas prestasi belajar dalam system pengajaran yang

menganut prinsip belajar tuntas didasarkan atas sudah berhasil atau

belumnya seorang siswa dalam mencapai tujuan. Dalam hal in I

materi pelajaran dibagi atas unit-unit kecil yang masing-masing

untitssudah disertai dengan tujuan yang dirumuskan secara

terperinci. Apabila seoarng siswa mencapai tujuan (paling sedikit

75%) maka unit tersebut dib tanda (misalnya tanda silang) untuk

memberdakan dari unit yang belum diselesaikan. Dengan demikian

maka akan tergambar banyak sedikitnya unit yang telah

diselesaikan per bidang studi. Gambaran inilah yang disebut profil

keberhasilan siswa. Tanda X menunjukan bahwa unit itu sudah

dikuasai (sudah lulu) garis tebal di sebelah kanan menunjukan

target harus diselesaikan dalam 1 tahun. Dengan demikian dapat

diketahui sjauh mana (sudah beapa persen) siswa A pada bulan

oktober ini sudah lulus

2. Nilai siswa

Pencatatan dengan nilai dilakukan apabila seluruh siswa dalam satu

kelompok berjalan bersama-sama secara klasikal dengan demikian

maka prinsip belajar tuntas sangat sukar dilaksnakan dan pencataan

nilai didasarikan atas nilai-nilai ulangan yang telah diikuti.

Page 166: DASAR-DASAR EVALUASI PENDIDIKAN(SUHARISMI ARIKUNTO.docx

BAB 20

EVALUASI PROGRAM PENGAJARAN

Semua uraian yang telah disajikan pada bab-bab seblum ini berkenaan dengan

evaluasi hasil belajar. Buku ini berjudul “Dasar-dasar Evaluasi Pendidikan”

sebetulnya secara garis besar terdapat dua kegiatan evaluasi yaitu evaluasi

terhadap hasil belajar siswa dan juga proses pengajarannya. Jadi, apabila

pembicaan dalam buku ini hanya mengenai evaluasi hasil belajar saja, tampak

kurang komprehensif. Bab ini akan menjelaskan evaluasi yang kedua yaitu

evaluasi program.

1. Apakah Evaluasi Program Itu?

Evaluasi merupakan suatu kegiatan yang bertujuan untuk menentukan

apakah target progam yang disusun sudah tercapai dengan begitu maka akan

diketahui bagaimana kualitas mengajar seorang guru apakah sudah efektif

atau belum berdasarkan tingkat pencapaian yang sudah dicapai.

a. Program adalah rencana

b. Program adalah kegiatan yang direncakan dengan seksama. Dalam

pembicaran ini yang dimaksudkan adalah pengertian

Dari sedikit uraian tersebut dapat ditangkap bahwa sesuatu kegian

yang peru direncanakan apabila kegiatan yang bersangkutan memang

dipandang penting sehingga apabila tidak direncanakan secara masak-masak

boleh jadi akan menjumpai kesulitan atau hambatan. Seperti sebuah keluarga

yang akan mengadakan peralatan pernikahan. Tentu tidak lancer. Sesudah

selesai pelaksanaan biasnya juga mengadakan evaluasi. Mungkin evaluasi

tersebut tidak melalui prosedur yang sistematis dan mungkin juga tidak

seketika barangkali pada waktu penyelenggaraan peralatan pernikahan lagi

baru mengingat-ingat dahulu pada waktu pelaksanaan dulu kurangnya apa.

Page 167: DASAR-DASAR EVALUASI PENDIDIKAN(SUHARISMI ARIKUNTO.docx

Evaluasi  progam merupakan suatu rangkaian kegiatan yang dilakukan

dengan sengaja untuk melihat tingkat keberhasilan progam. Untuk

menentukan seberapa jauh target progam sudah tercapai, yang dijadikan tolak

ukur adalah tujuan yang sudah dirumuskan dalam tahap perencanaan

kegiatan.

Pentingnya evaluasi progam yaitu agar guru mengetahui betul apa

yang terjadi di dalam proses belajar-mengajar, guru berkepentingan atas

kualitas pengajaran. Untuk memperbaiki proses pengajaran yang akan

dilaksanakan lain waktu, guru perlu mengetahui seberapa tinggi tingkat

pencapaian dari tugas yang telah dikerjakan selama kurun waktu tertentu.

Ada emppat macam kebijaksanan lanjutan yang mungkin diambil

setelah evaluasi program dilakukan yaitu:

a. kegiatan tersebut dilanjutkan karena dari data yang terkumpul diketahui

bahwa program ini sangat bermanfaat dan dpat dilaksanakan denan

lancer tanpa hambatan sehingga kualitas pencapaian tujuannya tinggi

b. kegiatan tersebut dilanjukan, dengan penyempurnaan karena dari data

yang terkumpul diketahui bahwa hasil program sangat bermanfaat tetapi

pelaksanaannya kurang, lancer atau kualitas pencapaian tujuan kurang

tinggi

c. kegiatan tersebut dimodifikasi karena dari data yang terkumpul dapat

dikeahui kemampafaatan hasil program kurang tinggi sehingga perlu

disusun lagi perencanaan secara lebih baik. Dalam hal ini mungkin

tujuannya yang perlu diubah.

d. Kegiatan tersebut tidak dapat dilanjutkan (dengan kata lain dihentikan)

karena dari data terkumpul diketahui bwhwa hasil program kurang

bermanfaat ditambah lagi di dalam pelaksanaan sangat banyak hambatan.

2. Mengapa guru perlu melakukan evaluasi program

Guru adalah orang yang penting statusnya di dalam kegiatan belajar-mengajar

karena guru memegan tugs yang amat penting yaitu mengatur dan

Page 168: DASAR-DASAR EVALUASI PENDIDIKAN(SUHARISMI ARIKUNTO.docx

mengemudikan bahtera kehidupan kelas. Bagaimana suasana kelas

berlangsung merupakan hasil dari kerja guru. Suasana kelas dapat hidup siswa

belajar tekun tetapi tidak merasa terkekakng atu sebaliknya suasana kelas

suram siswa belajar krang atau sebaliknya suasana suram siswa belajar kurang

semangat dan diliputi rasa tahut, itu semua sebagai akibat dari hasil pemikiran

mereka dan upaya guru..

Di dalam melaksanakan tugs yang penting “menciptakan suasana

kelas” tersebut berupaya sekuat tenaga agar keidupan kelas dapat berjalan

mulus. Siswa dapat belajar tanpa hambatan dan dapat menguasai

Untuk menjawab apa sebag guru melakukan evaluasi program terlebih

dahulu kita tahu tentang siapa saja yang dapat melakukan kegiatan evaluasi

program tersebut. Di dalam buku-buku yang membicarakan (evaluator) dalam

kegiatan program dapat orang-orang dari dalam (orang yangikut terlibat di

dalam kegiatan) dan dapat pula orang dari luar (orang yang tidak ikut terlibat

dalam kegiatan program)

Masing-masing jenis evaluator program, mengandung kelemaham

a. Evaluator dalam (interal evaluator) sangat memahami seluk beluk kegiatan

tetapi ada kemungkinan dapat dipengaruhi oelh keingin untuk dapat

dikatakan bahwa programnya berhasil. Dengan kata lain. Evaluator dalam

dapat diganggu oelh unsur subjektivitas jika hal itu terjadi, data yang

tekumpul kurang benar dan kurang akuran meskipun barangkali cukup

lengkap

b. Evaluator luar (external evaluator) mungkin menjumpai kesulitan dalam

memperoloeh data yang lengkap karena da hal-hal yang disembunyak oleh

para pleksna program. Namun karena evaluator tidak berkepentingan akan

nama baik program. Maka data yang terkumpul lebih objektif.

Berdasarkan atas klasifikasi evaluator tersebut. Maka di dalam

kegiatan belajar-mengajar guru dikategorikan sebagai evaluator dalam, guru

adalah pelaksanana sehingga mereka mengetahi beatul apa yang terjadi di

Page 169: DASAR-DASAR EVALUASI PENDIDIKAN(SUHARISMI ARIKUNTO.docx

dalam proses belajr-mengajar. Guru berkepentingan atas kualitas pengajaran.

Untuk memperbaiki proses pengajaran yang akan dilaksanakan lain waktu.

Guru perlu megnetahui seberapa tinggi tingkat pencapaian dari tugas yang

telah dikerjakan selama kurun waktu tertentu.

3. Objek atau sasaran evaluasi progam.

Dalam melakukan evalusi program, apanya dari program yang dievaluasi?

Dengan kata lain, apakah sasaran evalusai progam> untuk dapat mengenal

sasaaran evalusi secara cermat, kita perlu memusatkan perhatian kita pada

aspek-aspek yang bersangkut paut dengan keseluruhan kegiatan belajar-

mengejar. Untuk itu ada baiknya kita mengenal kembali model transformasi

proses pendidikan formal di sekoplah. Di dalam proses transformasi, siswa

yang baru masuk mengikuti proses pendidikan dipandang sebagai bahawn

mentah yang akan diolah (ditransformasikan diubah dari bahan mentah jadi

bahan jadi) melalui proses pengajaran. Siswa yang baru masuk (input)) ini

memiliki karakteristik atau kekhususan sendiri-sendiri yang banyak

mempengaruhi dalam keberhaslilan siswa , yaitu masukan lain yang juga

berpengaruh dalam keberhasilan belajar siswa yaitu masukan instrumental dan

masukan lingkungan. Yang dapat dimasukan sebagai masukan instrumental

adlaah materi/kurikulum guru metode mengajar dan sranana pendidikan

Pada gambar berikut ini disajikan sebuah bagan yang menunjukan hubungan

antara komponmen masukan mentah, saran pemroses dan keluaran yang sudah

selesai di proses.

Page 170: DASAR-DASAR EVALUASI PENDIDIKAN(SUHARISMI ARIKUNTO.docx

Gambar proses transformasi belajar mengajar

Setelah digambarkan dalam bentuk bagan seperti disajikandiatas tampak jelas dan

rinci apa-apa yang mungkin mempengaruhi tingakt hsil belajar siswa. Marilah kita

teliti satu persatu.

a. Input(masukan)

Siswa adalah subjek yang meneima pelajaran. Ada siswa pandai, kurang

pandai, dan tidak pandai. Setiap siswa mempunyai bakat intelektual

emosional social dan lain-lain yang sifatnya khussu. Guru harus mammpu

mengenal kekhususan siswanya agar mampu memberikan pelayanan.

Pendidikan dan administrative secara tepat. Pelayanan pendidikan berupa

pemberian remedial dan sebagainya. Pelayanan administrasi juga harus

disesuaikan dengan jenis kemampunaya. Kepada siswa yang hanya

mempunya kemampuan intelektual rendah, disediakn perlekapann sarana

belajar yang dapat mendukung penginkatan prestasi. Sbaliknya siswa

mempunyai pembawewan menonjol juga sediakan sarana caranggih agar

bakat yang dimiliiki tersebut dapat berkembang secar maksimal.

Aspek-aspek yang ada pada siswa tersebut perlu dipertimbangka

oleh pengelola sekolah baik secar garis besar hal hal yang ada pada siswa

dan berpengaruh terhadap keberhalislan belajar dapat dilihat dari segi fisik

dan mental.

b. Materi atau kurikulum.

Di Indonesia kurikulum berlaku secara nasional karena kita menganut system

sentralisasi. Di Negara lain seperti amerika serikat. Kurikulum sekolah

disusun sendiri oleh dan berlaku untuk sesuatu Negara bagian yang

bersangkutan karena mereka menganut system disentralisasi. Seperti yang

tertulis di dalam administrasi kurikulum. Di Indonesia ini kurulum disusun

bersama oleh direktorat yang mengeloa jenjang dan jenis suatu sekolah

bersama dengan pusat pengembangan kurikulum dan sarana pendidikan

Page 171: DASAR-DASAR EVALUASI PENDIDIKAN(SUHARISMI ARIKUNTO.docx

Apa sebab pusbangkurrandik mengkoordinasikan menyusun dan

mengembangkan kurikulum semua jenjang dan jenis sekolah? Jika kita ingat

bahwa tugas balitbang sebagai lembaga adalah melakukan penelitian dan

pengembangan hal hal yang berkaitan dengan pendidikan di seluurh Negara,

melakukan evalusi program terhadap semua pelakasaan pendidikan. Jika

lingkup dan wilayah yang dievaluasi sendiri. Maka lingkup dan wilayah yang

dievalusi oelh balitbang dikbud meliputi berbagai jenis kegiatan pendidikan

di Departemen Pendidikan dan Kebudayaan. Dari kegiatan evaluasi inilah

balitbang mempunyai data yang lengkap tentang tingkat keberhasilan tiap

kegiatan pendidikan

Meskipun penyusunan dan pengembangan kurikulum sekolah sudah

dilakukan secara cermat dan melibatkan banyak pihak, namun tidak mustahil

bahwa di lapangan masih juga dijumpai kelemaan dan hambatan. Wilayah

Indonesia yang sedemikian luas mengandung keragaman yang tida seditik.

Itulah sebabnya guru perlu dibekaili dengan kemampuan untuk melakukan

evaluasi program, termasuk mengevaluasi materi kurikulum. Sasaran yang

perlu dievaluasi dari komponen kurikulum HIT. Antara lain. Keelasan

pedoman untuk dipahami, kejelasan materi yang tercantum di dalam GBPP.

Urutan materi, kesesuaian antra sumber yang disarankan dengan materi

kurikulum dan sebaginya.

Apabila guru tidak tanggap terhadap kelemahan yanga dal dalam kurikulum

dan guru tak mau mengutarakan apa yang mereka jumpai bagaiman balitbang

dan ditdikdas tahu bahwa kurikulum yang dikeluarkan tidak lancer

dilaksanakandi sekolah? Nah itulah tambahan alasan mengapa evaluasi

lingkup sempit terhadap kurikulum yang dilaksanakan.

c. Guru.

guru merupakan komponen penting dalam kegiatan belajar-mengajar kepad

guru diserahkan untuk digarap suatu masukan bahan mentah berupa siswa

Page 172: DASAR-DASAR EVALUASI PENDIDIKAN(SUHARISMI ARIKUNTO.docx

yang mengingnkan pengetahuan keterampilan dan sikap sikap yang baik yang

akan digunakan oleh mereka untuk menghadapi masa depan dalam

kehidupannya

guru adalah orang yang diberi kepercayaan untuk menciptakan

suasana kelas seperti telah diceritakan diatas. Behasil? Belum tentu mengapa?

Karena guru adalah manusia apakah usaha guru selalu mempunyai kelemahan

bersumber dari fisik dan mental. Hal-hal yang berhubungan denganfisik juga

siswa, antara lain kesehatan, kekebalan dan kerentatan. Hal-hal yang

berhubungan dengan mental antra lain kepandaian, kesabaran tangung jawab

keramah tamahan dan sebagainya.

Apakah dapat dilakukan oleh pengelola dalam memberikan pelayanan

administrative kepada guru? Banyak jika dapat diketahui kebiasan guru dalam

bekerja misalnya dalam mengajar suka OHP, mengajak mengamati barang-

barang yang ada di luar kelas (sekolah), atau suka bekerja tanpa gangguna di

ruang kelas dan lain sebagainya. Maka pengelola berusaha melengkapi sarana

pendudkunya, pemenuhan terhadap kebutuhan psikologis guru berupa antra

lain menyediakantempat bekerja yang nyaman sehingga mereka dapat bekerja

dengan tenang. Akibat selanjutnya mengena pada prestasi belajar siswa yang

optimal

d. Metode atau pendekatan dalam mengajar.

Berbeda denga evaluasi terhadap kurikulum, evaluasi terhadap metode

mengajar merupakan kegiatan guru untuk meninjau kembali tentang metode

mengajar, pendekatan atau strategi pembelajaran yang digunakan oleh guru di

dalam menyampaikan materi kurikulum kepada siswa. Dari perkuliahan lain

kita tahu bahwa yang dimaksud dengan metode mengajar adalah cara-cara

atau teknik yang digunakan dalam mengajar, misalnya ceramah, Tanya jawab

diskusi sosiodrama, demonstrasi eksperimen dan sebagainya. Strategii

pembelajaran menunjuk kepada bagaimana guru mengatur keseluruhan proses

belajar mengajar, meliputi, mengatur waktu, pemenggalan penyajian,

Page 173: DASAR-DASAR EVALUASI PENDIDIKAN(SUHARISMI ARIKUNTO.docx

pemilihan metode, pemilihan pendekatan, dan sebagainya. Dengan pengertian

ini maka di dalam memikirkan strategi, sekaligus guru memikirkan metode

dan pendekatan juga.

Di dalam melaksanakan pengajaran, tidak mustahil bahwa guru

menjumpai kesulitan di tengah-tengah waktu mengajar, disebabkan karena

ketidak tepatan dalam memilih metode atau pendekatan yang dimaksud

dengan metode mengajar adalah cara-cara untuk menyampaikan materi

kepada siswa. Sebagai contoh metode adalah ceramah, diskusi Tanya jawab

dan penugasan. Pendekatan lebih banyak menunjuk pada strategi guru untuk

mengatur jalanna proses pembelajaran, misalnya pendekatan individual,

kelompok kecil atau klasikal. Termasuk dalam pemikiran pendekatan adalah

penggaalnan waktu di dalam penyampaian materi pelajaran.

Telah disebutkan bahwa di dalam melaksanakan kegiatan belajar

mengajar ungkin saja guru menjumpai kesulitan, sehubungan dengan keadaan

siswa. Dalam rencana, guru memilih metode tugas karena dipandang paling

tepat. Siswa diatur agar bekerja dalam kelompok. Namun di tengah-tengah

kesibukan, terasa oleh guru bahwa pemilihan metode dan pendekatan tersebut

ternyata kurang tepat. Apa sebab guru tidak disadari sebetulnya guru sudah

melakukan evaluasi tehadap kegiatnya. Evaluasi program dapat dilakukan

selam dansesuddah program berlangsung. Agar dapat melakukan selama dan

sesudah program berlangsung. Agar pekerjaan guru dari tahun ke tahun

bertambah baik, maka mereka harus dapat memanfaatkan dat yang mereka

peroleh. Disarankan kepada para guru agar tidak henti-hentinya membuat

catatan-catatan kecil pada GBPP tentang metode apa. Pendekatan danstrategi

yang bagaiman yang cocok untuk digunakan dalam penyampaian pokok

bahasan yang bersangkutan.

e. Sarana: alat pelajaran atau media pendidikan.

Page 174: DASAR-DASAR EVALUASI PENDIDIKAN(SUHARISMI ARIKUNTO.docx

Komponen lain yang perlu dievaluasi oleh guru dalam melaksankan

kegiatan belajar mengajar adalah sarana pendidikan, yang melipti alat

pelajaran dan media pendidikan. Sebelum guru memulai kegiatan megnajar,

bahkan sebelum atau sekurang-kurangnya pada waktu menyusun rencana

megnajar, guru telah memilih alat yang kira-kira dapat membantu

melancarkan atau memperjelas konsep yang diajarkan. Selai guru, mnungkin

siswa juga dapat dijadikan titik tolak dalam menentukan apakah saran yang

digunakan di dalam kegiatan belajar-mengajar sudah tepat.

Apabila guru menjumpai kesulitan dalam megnajar atu tidak

berhasilan siswa dengan nilai yang rendah-rendah, ia dapat mencoba

mengadakan evalausi terhadap sarana yang diguanakan, sasaran evaluasi yang

berkenaan dengan sarana pendidikan antra lain kelengkapanya. Ragam

jenisnya. Modelnya, kemudahanya untuk digunakan (dioperasikan) mudah

dan sukar diperoleh kecocokan degnan materi yang diajarkan, jumlah

persedian dibandingkan dengan banyaknya siswa yang memerlukan

f. Lingkungan manusia.

Ada dua macam masukan lingkungan yaitu lingkungan manusia dan

lingkungan bukan manusia. Yang dibicarakan dalam bagian ini adalah

masukanlingkungan manusia yang dapat digolongkakan sebagai masukan

lingkungan manusia bukan hanya kepala sekolah, guru-guru dan pegawai tata

usaha di sekolah itu, tetapi jgua siapa saja yang dengan atu tidak sengaja

berpengaruh terhadap tingkat hasil belajar siswa. Misalnya di taman kanak-

kanak, mungkin saja ibu-ibu pengantar dapat meamnfaatkan oelh sekolah

untuk emberikan contoh perilaku positif yang memperkuat motivasi siswa

dalam belajar. Kepala sekolah yang secara kebetulan dijumpai oleh siswa di

luar kelas mungkin dijadikan sumber informasi. Memberikan keterang-

ketrangan yang diperlukan oleh siswa untuk memperkaya pengetahuannya.

Guru-guru tersebut dilakanya dapat saja melumpuhkan semangat siswa

karena ketika bertemu di halaman sekolah sempat mengejek (tentu saja tidak

Page 175: DASAR-DASAR EVALUASI PENDIDIKAN(SUHARISMI ARIKUNTO.docx

dengan sengaja) atau sebaliknya dapat mengakibatkan tumbuhnya motivasi

pada diri siwa untuk lebih giat dalam belajar.

g. Lingkungan bukan manusia.

Yang dimaksud dengan lingkungan bukan manusia adalah segala hal yang

berada di lingkungan siswa (dalam radius tertentu) yang secara langsung

maupun tidakm berpengaruh terhadap prestasi belajar siswa. Termasuk

kategori lingkungan bukan manusia misalnya suasana sekolah. Tatanan

perabot kelas yang rapi dapat berpengaruh terhadap kesejukan suasana gaduh

di luar kelas dapat menggangu tenteram, sebaliknya Susana garud diluar

dapat menggangu konsentrasi siswa ddan menyebabkan siswa tidak dapat

belajar dengan tenang. Sebagai contoh sedang asyik-asyiknya siswa

mendengarkan penjelasan dari guru atau siswa sedang sibuk melakukan

percobaan, tiba-tiba terdengan sura mobil dengan knalpot terbuka lewat di

sebelah sekolah tidak dapat disangkal bahwa perhatian siswa menjadi buyar

karenya. Dari uraian yang sudah disajikan dapatklah kita ketahui mengapa

guru perlu melakukan evaluasi taerhadap program yang dilaksanakan. Hanya

dengan sambal lalu saja sebetulnya guru sudah dapat menangkap apa kira-

kira yang dapat mengganggu kelancaran proses belajar mengajar.

3.      Cara melaksanakan evaluasi progam.

            Apabila guru ingin melakukan evaluasi progam dengan lebih seksama,

terlebih dahulu harus menyusun rencana evaluasi sekaligus menyusun instrument

pengumpulan data. Mengenai bagaimana menyiapkan instrumen untuk angket,

pedoman wawancar, pedoman pengamatan dapat dipelajari dari buku-buku

penelitian. Sebagai cara yang paling sederhana adalah mengadakan pencatatan

terhadap peristiwa yang dialami dari kegiatan sehari-hari di kelas.

Akan terlalu sulit dan memakan waktu yang amat banyak apabila guru masih

dibebani dengan evaluasi program secara sistematis sperti singkat dan sederhana

yang disusun dalam bentuk pertanyaan saja. Dari jawaban atas pertanyaan-

pertanyaan tesebut guru akan memperoleh umpan terhadap apa yang dilakukan.

Page 176: DASAR-DASAR EVALUASI PENDIDIKAN(SUHARISMI ARIKUNTO.docx

Deretan pertanyaan yang diajukan berpangkal dari komponen komponen

transformsi yang sudah kita ketahui dalam uraian di atas. Berikut ini disampaikan

bebereapa contoh:

a. Pertanyaan tentang siswa

1) Apakah kehadiran siswa sudah baik? Lengkap dan tepat waktu?

2) Apakah siswa tertarik pada pelajaran kita? Jika tidak atau kurang apakah

kira-kira sebabnya?

3) Apakah siswa tidak enggan melibatkan diri dalam kegiatan belajar

mengajar ? dan sebagainya.

b. Pertanyaan tentang guru

1. Apakah sebelum mengeajar guru sudah menguasai materi yang akan

diajarkan dengan sebaik-baiknya?

2. Aapakah guru dapat menjawab pertanyaan yang diajukan oleh siswa

dengan memuaskan

3. Apakah guru dapat berlaku adil terhadap siswa?

4. Apakah gru ssudah memberikan pelayanan yang sebaik-baiknya kepada

siswa? Dan sebagainya.

c. Pertanyaan tentang kurikulum

1. Seberapa tinggikah pemahaman guru terhadap materi yang tertera dala

GBPP?

2. Apakah guru dapat menyajikan materi secara urut seperti urutan

penyajian dalam GBPP?

3. Apaah materi yang tertera dalam GBPP tidak terlalu sulit bagi siswa

untuk kelas yang bersangkutan

d. Pertanyaan tentang sarana

1. Apakah pokok bahasan yang memerlukan alat peraga dipenuhi

kebutuhanya

2. Apakah alat peraga yang dipilh sudah tepat

3. Apakah guru sudah terampil menggunakan alat?

Page 177: DASAR-DASAR EVALUASI PENDIDIKAN(SUHARISMI ARIKUNTO.docx

4. Apakah siswa cukup dilibatkan dalam penggunaan alat peraga? Dan

sebagainya.

e. Petanyaan tentang metode dan pendekatan

1. Apakah dengan metode yang digunakan, hasil belajar siswa sudah cukup

tinggi?

2. Apakah dengan metode yang dipih ini siswa mengikuti pelajaran dengan

bergairah?

3. Dengan mengelompokan yang diambil, apakah semua siswa sudah terlibat

dengan aktif?

4. Apakah hasil tugs yang diselesaikan oleh siswa tidak terlihat bahwa satu

dua orang siswa mendominasi kawannya bekerja? Dan sebagainya

f. Pertanyaan tentang lingkungan manusia

1. Apakah guru sudah meamnfaatkan orang-orang yang ada di lingkungan

untuk menunjang pelaksanaan kegian belajar mengajar?

2. Adakah orang-orang di sekitar siswa yang mempunyai pengaruh kurang

baik terhadap siswa? Andaikata acdda, apakah guru sudah mengambil

langkah dengan tepat?

3. Apakah guru sudah mengarahkan siswa untuk mencoba memanfaatkan

orang-orang yang ada sebagai manusia sumber untuk menambah

pengetahuannya?

g. Pertanyaan tentang lingkungan bukan manusia

1) Apakah guru sudah memanfaatkan dengan baik hal-hal yang ada I

lingkungan siswa untuk menunjang kegiatan belajar mengajar?

2) Apakah siswa sudah diarahkan untuk memanfaatkan lingkungan menurut

kepentingan mereka sendir dan sebagainya.