BAB II ofa - Perpustakaan Pusatlibrary.walisongo.ac.id/digilib/files/disk1/32/jtptiain-gdl-s1... ·...
-
Upload
truongkhanh -
Category
Documents
-
view
221 -
download
0
Transcript of BAB II ofa - Perpustakaan Pusatlibrary.walisongo.ac.id/digilib/files/disk1/32/jtptiain-gdl-s1... ·...
9
BAB II
LANDASAN TEORI : ANALISIS ITEM TES
A. TES
1. Pengertian Tes
Secara harfiah, kata "test" berasal dari bahasa Perancis kuno:
testum yang artinya piring untuk menyisihkan logam-logam mulia. Dalam
bahasa Inggris ditulis dengan "test" yang dalam bahasa Indonesia
diterjemahkan dengan tes, ujian atau percobaan.1
Beberapa istilah yang memerlukan penjelasan sehubungan dengan
masalah di atas, yaitu istilah test, testing, tester dan testee. Test adalah alat
atau prosedur yang dipergunakan dalam rangka pengukuran dan penilaian;
testing berarti saat dilaksanakannya pengukuran dan penilaian; tester
artinya orang yang melaksanakan tes atau pembuat tes; sedangkan testee
adalah peserta tes.2
Adapun dilihat dari segi istilah, definisi tes menurut beberapa
tokoh adalah sebagai berikut:
Lee J. Cronbach dalam bukunya berjudul Essential Of
Psichological Testing menyebutkan bahwa : "A test is a systematic
procedure for Comparing the behavior of two or more persons".3 Tes
adalah suatu prosedur yang sistematis untuk membandingkan tingkah laku
dari dua orang atau lebih.
Clinton I. Chase dalam bukunya yang berjudul Measurement for
Educational Evaluation, menyebutkan bahwa: “A test is systematic
procedure for comparing the performance of an individual with a
designated standard of performance”.4 Tes adalah suatu prosedur yang
1 Anas Sudijono, Pengantar Evaluasi Pendidikan, (Jakarta: Raja Grafindo Persada,
2003), cet. 4, hlm. 66. 2 Ibid. 3 Lee J. Cronbach, Essential of Psychological Testing, (New York: Harper, 1970), hlm.
20. 4 Clinton I. Chase, Measurement for Educational Evaluation, (London: Addison Wesley,
1978), hlm. 6.
10
sistematis untuk membandingkan tingkah laku individu dengan standar
tingkah laku yang telah ditentukan.
Anderson dalam bukunya yang berjudul Encyclopedia of
Educational Evaluation, menjelaskan bahwa : "A test is any series of
questions or exercises or other means of measuring the skill, knowledge,
intelligence, capacities or aptitudes of an individual or group".5 Tes
adalah serangkaian pertanyaan atau latihan atau alat lain yang digunakan
untuk mengukur ketrampilan, pengetahuan, inteligensi, kemampuan atau
bakat yang dimiliki oleh individu atau kelompok
Doughlas Brown mendefinisikan tes sebagai berikut :6 ال معـينجطريقـة لقـياس االفـراد ومـعارفهم في م: تبار خاإل
"Tes adalah cara untuk mengukur pengetahuan individu (testee) dalam bidang tertentu"
Sedangkan Sumardi Suryabrata menjelaskan bahwa:7
Tes adalah pertanyaan-pertanyaan yang harus dijawab dan atau perintah-perintah yang harus dijalankan, yang berdasar atas bagaimana testee menjawab pertanyaan-pertanyaan dan atau melakukan perintah-perintah itu, penyelidik mengambil kesimpulan dengan cara membandingkannya dengan standar atau testee lainnya.
Dari beberapa definisi di atas, maka dapat disimpulkan bahwa tes
adalah cara atau prosedur yang di gunakan untuk mengukur kemampuan
testee dengan memberikan serangkaian pertanyaan yang harus dijawab
oleh testee, sehingga dari hasil pengukuran tersebut dapat dihasilkan nilai
yang dapat di bandingkan dengan nilai-nilai yang dapat dicapai oleh testee
lainnya, atau dibandingkan dengan nilai standar tertentu.
Jadi inti dari suatu tes adalah sebagai berikut:
a. Tes adalah tugas atau serangkaian tugas yang berbentuk pertanyaan-
pertanyaan dan atau perintah-perintah.
5 Anderson, et.al., Encyclopedia of Educational Evaluation, (London: Jossey – Bass Inc.,
1981), hlm. 425 6 Douglas Brown, Ususu at-Ta'allumi al-Lughati wa Ta'limiihaa, terj. Abd. Rajhi dan Ali
Ahmad Syu'ban, (Arab: darun an-Nadhoh, t.t.), hlm. 266. 7 Sumadi Suryabrata, Pembimbing ke Psikodiagnostik, (Yogyakarta: Rake Sarasin, 1984),
hlm. 22.
11
b. Tes itu di berikan kepada testee (seorang atau lebih).
c. Tingkah laku testee dalam mengerjakan tes dapat dibandingkan dengan
sesuatu, yaitu standar tes atau tingkah laku testee lain.
2. Macam-macam Tes
Sebagai alat pengukur, tes dapat dibedakan menjadi beberapa
macam atau golongan tergantung dari segi mana atau dengan alasan apa
penggolongan tes itu dilakukan.
a. Penggolongan menurut objek pengukurannya.
Ditinjau dari segi objek pengukurannya, tes dapat dibedakan
menjadi dua, yaitu tes kepribadian (personality test) dan tes hasil
belajar (achievement test).
1) Tes kepribadian (personality test)
Tes kepribadian adalah tes yang ditujukan untuk mengukur
salah satu atau lebih aspek-aspek non intelektif dari mental atau
psikis seorang individu. Yang termasuk dalam jenis tes ini, antara
lain: pengukuran sikap, pengukuran minat, pengukuran bakat dan
tes inteligensi.8
2) Tes hasil belajar (achievement test)
Tes hasil belajar adalah tes yang digunakan untuk menilai
hasil-hasil pelajaran yang telah diberikan oleh guru kepada murid-
muridnya, atau oleh dosen kepada mahasiswa, dalam jangka waktu
tertentu.9
b. Penggolongan tes menurut fungsinya
Ditinjau dari segi fungsinya, tes dibedakan menjadi empat,
yaitu:
1) Tes penempatan
Tes penempatan adalah tes untuk mengukur kemampuan
dasar yang dimiliki oleh anak didik; kemampuan tersebut dapat
8 M. Chabib Thoha, Teknik Evaluasi Pendidikan, (Jakarta: Raja Grafindo Persada, 1996), hlm. 44.
9 M. Ngalim Purwanto, Prinsip-Prinsip dan Teknik Evaluasi Pengajaran, (Bandung: Remaja Rosdakarya, 1997), hlm. 33.
12
dipakai meramalkan kemampuan peserta didik pada masa
mendatang, sehingga kepadanya dapat dibimbing, diarahkan atau
ditempatkan pada jurusan yang sesuai dengan kemampuan
dasarnya.10
2) Tes formatif
Tes formatif adalah tes untuk mengukur sejauh mana siswa
telah menguasai bahan pelajaran, setelah mengikuti suatu program
kegiatan instruksional tertentu. Tes ini diberikan pada akhir setiap
program kegiatan instruksional sebagai post test.11
3) Tes diagnostik
Tes diagnostik adalah tes yang digunakan untuk
mengetahui sebab kegagalan peserta didik dalam belajar. Oleh
karena itu dalam menyusun butir-butir soal seharusnya
menggunakan item yang memiliki tingkat kesukaran rendah.12
4) Tes sumatif
Tes sumatif adalah tes yang dilaksanakan setelah pemberi
keseluruhan program dalam suatu kegiatan instruksional pada suatu
periode berakhir. Tes ini harus dilaksanakan akhir semester, setelah
diadakannya beberapa tes formatif. Oleh karena itu, bahan tes
sumatif biasanya lebih luas daripada bahan tes formatif.13
c. Penggolongan tes menurut tingkat mutunya
Dilihat dari segi tingkat mutunya, tes dibagi menjadi 2 macam,
yaitu:14
1) Tes buatan guru
Adalah suatu tes yang dibuat dan digunakan oleh seorang
guru sendiri di sekolah. Hasil tes buatan guru dipakai untuk
10 Chabib Thoha dan Abdul Mu’thi, PBM PAI di Sekolah (Eksistensi dan Proses Belajar
Mengajar Pendidikan Agama Islam), (Yogyakarta: Pustaka Pelajar, 1998), hlm. 289. 11 Masidjo, Penilaian Hasil Belajar Siswa di Sekolah, (Yogyakarta: Kanisius, 1995), hlm.
55. 12 James S. Cangelosi, Merancang Tes Untuk Menilai Prestasi Siswa, (Bandung: ITB,
1995), hlm. 48. 13 Masidjo, op.cit., hlm. 56. 14 Ibid., hlm. 57-58.
13
mengetahui antara lain kedudukan prestasi belajar siswa di
kelasnya setelah mengikuti suatu kegiatan instruksional suatu mata
pelajaran dan mengetahui kemajuannya dan sebagainya.
2) Tes Standar
Tes standar adalah suatu tes yang distandarisasikan atau
yang disusun secara cermat oleh seorang atau tim ahli penyusun tes
melalui uji coba berkali-kali, sehingga tes tersebut memiliki mutu
yang tinggi. Dengan demikian, taraf kesukaran item, taraf pembeda
item, taraf validitas tes, dan taraf reliabilitas tesnya sudah
meyakinkan.
d. Penggolongan lain-lain15
Dari segi banyaknya orang yang mengikuit tes, tes dibedakan
menjadi dua macam, yaitu:
1) Tes individual, yaitu tes dimana tester hanya berhadapan dengan
satu orang testee saja.
2) Tes Kelompok, yaitu tes dimana tester berhadapan dengan lebih
dari satu orang testee.
Dari segi bentuk responnya, tes dapat dibedakan menjadi 2
macam, yaitu:
1) Verbal Test, yakni suatu tes yang menghendaki respon (jawaban)
yang tertuang dalam bentuk ungkapan kata-kata atau kalimat, baik
secara lisan maupun secara tertulis
2) Non Verbal Test, yakni tes yang menghendaki respon (jawaban)
dari testee bukan berupa ungkapan kata-kata atau kalimat,
melainkan berupa tindakan atau tingkah laku.
Dilihat dari segi cara mengajukan pertanyaan dan cara
memberikan jawabannya, tes dapat dibedakan menjadi 2 macam, yaitu:
1) Tes tertulis, yakni tes yang dilaksanakan secara tertulis, baik
pertanyaan maupun jawaban.
15 Anas Sudijono, op.cit., hlm. 74-75.
14
2) Tes lisan, yakni tes dimana tester di dalam mengajukan pertanyaan-
pertanyaan atau soalnya dilakukan secara lisan, dan tester
memberikan jawabannya secara lisan pula.
3. Bentuk-Bentuk Tes
Sebagai alat pengukur perkembangan dan kemajuan belajar peserta
didik, apabila ditinjau dari segi bentuk soalnya, tes hasil belajar dapat
dibedakan menjadi 2 macam, yaitu : tes subjektif (bentuk uraian) dan tes
bentuk objektif.
a. Tes Subjektif (bentuk uraian)
Tes bentuk uraian adalah sejenis tes kemajuan belajar yang
memerlukan jawaban yang bersifat pembahasan atau uraian kata-kata.
Ciri-ciri pertanyaannya didahului dengan kata-kata seperti; uraikan,
jelaskan, mengapa, bagaimana, bandingkan, simpulkan, dan
sebagainya..16
Tes bentuk uraian dibedakan atas dua jenis, yaitu :17
1) Uraian bebas, yakni tes yang soal-soalnya harus dijawab dengan
uraian secara bebas.
2) Uraian terbatas, yakni tes yang soalnya menuntut jawaban dalam
bentuk uraian yang telah terarah.
Tes bentuk uraian (tes subjektif) mempunyai beberapa
kelebihan, yaitu :
1) Mudah disiapkan dan disusun.
2) Tidak banyak memberi kesempatan untuk berspekulasi atau
untung-untungan.
3) Mendorong siswa untuk berani mengemukakan pendapat serta
menyusun kalimat dalam bentuk yang bagus.
4) Memberi kesempatan kepada siswa untuk mengutarakan
maksudnya dengan gaya bahasa dan caranya sendiri.
16 Suharsimi Arikunto, Dasar-Dasar Evaluasi Pendidikan, (Jakarta: Bumi aksara, 2001),
cet. 2, hlm. 162. 17 R. Ibrahim, Perencanaan Pengajaran, (Jakarta: Rineka Cipta, 1995), hlm. 90.
15
5) Dapat diketahui sejauh mana siswa mendalami suatu masalah yang
diteskan.
Adapun beberapa kelemahan dari tes bentuk uraian, adalah :
1) Kadar validitas dan realibilitasnya rendah dan sukar diketahui segi-
segi mana dari pengetahuan siswa yang betul-betul dikuasai.
2) Kurang representatif dalam hal mewakili seluruh scope bahan
pelajaran karena soalnya hanya beberapa saja (terbatas).
3) Cara memeriksanya banyak dipengaruhi oleh unsur-unsur
subjektif.
4) Pemeriksaannya lebih sulit karena membutuhkan pertimbangan
individual lebih banyak dari penilai.
5) Waktu untuk koreksinya lama dan tidak dapat diwakilkan kepada
orang lain.18
b. Tes Objektif
Tes Objektif adalah tes yang dibuat sedemikian rupa sehingga
hasil tes tersebut bisa dinilai secara objektif, dinilai oleh siapapun akan
menghasilkan nilai yang sama. Tes objektif disebut juga short answer
test, karena memerlukan jawaban ringkas dan pendek-pendek.19
Sebagai salah satu bentuk tes hasil belajar, tes objektif dapat
dibedakan menjadi lima macam, yaitu :
1) Tes objektif bentuk benar-salah (True-false test).
True-false Test adalah suatu bentuk tes dimana itemnya
berupa statement yang mengandung dua kemungkinan : benar atau
salah.20
2) Tes objektif bentuk menjodohkan (Matching Test).
Matching Test yaitu suatu bentuk tes dimana disediakan
dua kelompok bahan, dan testee harus mencari pasangan-pasangan
yang sesuai antara yang terdapat pada kelompok pertama dan
18 Suharsimi Arikunto, op.cit., hlm. 163. 19 Harjanto, Perencanaan Pengajaran, (Jakarta: Rineka Cipta, 2000), cet. 2, hlm. 279. 20 M. Chabib Thoha, op.cit., hlm. 69.
16
bahan yang terdapat pada kelompok kedua, sesuai dengan petunjuk
pada tes itu.21
3) Tes objektif bentuk melengkapi (Completion Test).
Completion Test yaitu salah satu bentuk tes objektif
dimana butir-butir soalnya berupa satu kalimat dimana bagian-
bagian tertentu yang dianggap penting dikosongkan kemudian
kepada testee diminta untuk mengisi bagian-bagian yang
ditiadakan tersebut.22
4) Tes objektif bentuk Isian (Fill in Test).
Fill in Test yaitu suatu tes yang biasanya berbentuk cerita
atau karangan dimana kata-kata penting dalam cerita tersebut
dikosongkan, kemudian testee diminta untuk mengisi bagian-
bagian yang telah dikosongkan itu.23
5) Tes objektif bentuk pilihan ganda (Multiple Choice Item Test).
Multiple Choice Item yaitu tes bentuk objektif yang terdiri
atas pertanyaan atau pernyataan yang sifatnya belum selesai, dan
untuk menyelesaikannya harus dipilih salah satu dari beberapa
kemungkinan jawaban yang telah disediakan pada tiap-tiap butir
soal yang bersangkutan.24
Tes objektif mempunyai beberapa kelebihan, diantaranya:25
1) Lebih representatif mewakili isi dan luas materi pelajaran.
2) Lebih objektif dalam penilaian dan dapat diserahkan kepada orang
lain.
3) Pemeriksaannya dapat diserahkan orang lain
4) Dalam pemeriksaan tidak ada unsur subjektif yang mempengaruhi
5) Lebih mudah dan cepat memeriksanya karena menggunakan kunci
tes bahkan alat-alat kemajuan teknologi.
21 Sumadi Suryabrata, Psikologi Pendidikan, (Jakarta: Rajka Grafindo Persada, 1993),
cet. 6, hlm. 344. 22 M. Chabib Thoha, op.cit., hlm. 67. 23 Anas Sudjono, op.cit., hlm. 114. 24 Ibid., hlm. 118. 25 Suharsimi Arikunto, op.cit., hlm. 164
17
Adapun kelemahan-kelemahan dari tes bentuk ini, adalah :26
1) Persiapan untuk menyusunnya lebih sulit karena soalnya banyak
dan harus diteliti.
2) Sukar untuk mengukur proses mental yang tinggi.
3) Banyak kesempatan untuk main untung-untungan (spekulasi).
4) "Kerjasama" antar siswa pada waktu mengerjakan soal tes lebih
terbuka.
4. Kriteria Tes Yang Baik
Menurut Sumadi Suryabrata dalam bukunya "Psikologi
Pendidikan" menyebutkan bahwa kriteria dari suatu tes yang baik, adalah
sebagai berikut:27
a. Valid
Suatu tes dikatakan valid apabila tes tersebut mengukur apa
yang seharusnya diukur.
b. Reliable
Suatu tes dikatakan reliable apabila tes tersebut memiliki
ketetapan hasil atau consistency. Artinya jika tes tersebut diberikan
kepada subjekf yang sama pada waktu yang berbeda maka hasilnya
akan tetap sama atau hampir sama.
c. Obyektif
Obyektivitas adalah suatu faktor yang penting yang dapat
mempengaruhi validitas dan reliabilitas. Suatu tes dikatakan memiliki
obyektivitas apabila dalam melaksanakan tes itu tidak ada faktor
subjekftif yang mempengaruhi, baik dari segi scoring-nya maupun dari
segi interpretasi terhadap score pada tes tersebut.
d. Diskriminatif
Suatu tes tersebut diskriminatif apabila tes tersebut disusun
sedemikian rupa sehingga menunjukkan perbedaan-perbedaan kecil
26 Ibid., hlm. 165 27 Sumadi Suryabrata, op.cit., hlm. 327-330.
18
diantara para testee. Makin baik suatu tes maka makin dapatlah tes itu
membuat perbedaan secara teliti.
e. Komprehensif
Suatu tes dikatakan komprehensif apabila tes tersebut
mencakup segala persoalan yang harus diselidiki. Jadi dalam
menyelidiki hasil pelajaran yang telah diterima oleh peserta didik,
maka tes itu harus dapat memberi informasi tentang seluruh bahan
yang telah diajarkan itu, tidak hanya sebagian saja.
f. Praktis
Kriteria untuk mengukur praktis tidaknya suatu tes hasil belajar
dapat ditinjau dari:28
1) Biaya yang diperlukan untuk menyelenggarakan tes itu
2) Waktu yang diperlukan untuk menyusun tes
3) Sukar – mudahnya menyusun tes itu
4) Sukar – mudahnya menilai tes itu
5) Sulit tidaknya menginterpretasikan (mengolah) hasil tes itu
6) Lamanya waktu yang diperlukan untuk melaksanakan tes itu.
5. Kegunaan Tes
Suharsimi Arikunto dalam bukunya "Dasar-Dasar Evaluasi
Pendidikan" menyebutkan bahwa kegunaan atau fungsi tes dapat ditinjau
dari tiga segi, yaitu :29
a. Fungsi untuk kelas, diantaranya :
1) Mengadakan diagnosis terhadap kesulitan belajar siswa
Sebagaimana disebutkan oleh Muhammad Atiyah Al-Abrosyi,
bahwa :30
ات المدرس ن : ةياالمتحان ون م تفاده المتعلم ا اس دار م ة مق لمعرف لتدارك ما يبدو منهم من ضعف, المواد التي درسوها
28 M. Chabib Toha, op.cit., hlm. 142. 29 Suharsimi Arikunto, op.cit., hlm. 152. 30 Muhammad Atiyah al-Abrosyi, Ruhu at-Tarbiyah wa Ta'lim, (Arab: Darul Haya,
1950), hlm. 362.
19
"Tes digunakan untuk mengetahui sejauh mana kemampuan para siswa dalam menerima materi-materi pelajaran yang dipelajarinya dan untuk menemukan kesulitan-kesulitan belajar mereka"
2) Mengevaluasi celah antara bakat dengan pencapaian.
3) Menaikkan tingkat prestasi.
4) Mengelompokan siswa dalam kelas pada waktu metode kelompok.
5) Menentukan siswa mana yang memerlukan bimbingan khusus
6) Merencanakan kegiatan proses belajar mengajar untuk siswa secara
perseorangan.
7) Menentukan tingkat pencapaian hasil belajar untuk setiap anak
b. Fungsi untuk Bimbingan
1) Menentukan arah pembicaraan dengan orang tua tentang anak-anak
mereka.
2) Membantu siswa dalam menentukan pilihan.
3) Membantu siswa mencapai tujuan pendidikan dan jurusan.
4) Memberi kesempatan kepada pembimbing, guru, dan orang tua
dalam memahami kesulitan anak.
c. Fungsi untuk Administrasi
1) Memberi petunjuk dalam mengelompokkan siswa.
2) Penempatan siswa baru.
3) Membantu siswa memilih kelompok.
4) Menilai kurikulum.
5) Memperluas hubungan masyarakat (public relation).
6) Menyediakan informasi untuk badan-badan lain di luar sekolah.
B. ANALISIS ITEM TES
Salah satu cara untuk memperbaiki proses belajar-mengajar yang
paling efektif ialah dengan jalan mengevaluasi tes hasil belajar yang di peroleh
dari proses belajar-mengajar itu sendiri. Dengan kata lain, hasil tes itu kita
oleh sedemikian rupa sehingga dari hasil pengolahan itu dapat di ketahui
komponen-komponen manakah dari proses belajar-mengajar itu yang masih
lemah.
20
Pengolahan tes hasil belajar dalam rangka memperbaiki proses belajar-
mengajar dapat di lakukan dengan membuat analisis soal (item analysis).
1. Pengertian Analisis Item Tes
Analisis soal (item analysis) adalah suatu kegiatan yang berkaitan
dengan proses mengumpulkan, meringkas, dan menggunakan informasi
tentang jawaban siswa terhadap butir soal tes tersebut.31
Nana Sudjana menyebutkan bahwa analisis item tes adalah
pengkajian pertanyaan-pertanyaan tes agar diperoleh perangkat pertanyaan
yang memiliki kualitas yang memadai.32
Menurut Saifuddin Azwar, analisis item tes adalah pengujian
seluruh item tes yang didasarkan pada item empirik (data yang diperoleh
dari hasil pengenaan tes yang sesungguhnya), agar diperoleh bukti
mengenai kualitas item-item tes.33
Sedangkan menurut Wilmar Tinambunan dalam bukunya yang
berjudul "Evaluation of student Achievement" menyebutkan bahwa "The
item analysis is reexamining each test item to discover its strength and
flaws".34 Analisis item adalah pengujian terhadap setiap butir tes agar
diketahui kelebihan dan kelemahan-kelemahan dari butir tes tersebut.
Berdasarkan beberapa definisi di atas, maka dapat disimpulkan
bahwa analisis item tes adalah proses pengkajian butir-butir tes hasil
belajar yang didasarkan pada jawaban siswa terhadap tes tersebut,
sehingga dapat diketahui kualitas dari suatu tes sebagai alat pengukur hasil
belajar siswa.
2. Unsur-unsur Analisis Item Tes
Analisis soal (item analysis) merupakan salah satu cara untuk
menilai kualitas suatu tes hasil belajar.
31 Suke Silverius, Evaluasi Hasil Belajar dan Umpan Balik, (Jakarta: Gramedia, 1991), hlm. 166.
32 Nana Sudjana, Penilaian Hasil Proses Belajar Mengajar, (Bandung: Remaja Rosdakarya offset, 1991), hlm. 135.
33 Saifuddin Azwar, Tes Prestasi (Fungsi Pengembangan Pengukuran Prestasi Belajar), (Yogyakarta: Pustaka Pelajar offset, 2000), hlm. 130.
34 Wilmar Tinambunan, Evaluation of Student Achievement, (Jakarta: Departemen Pendidikan dan Kebudayaan, 1988), hlm. 137.
21
Kualitas tes hasil belajar ditentukan oleh kualitas dari item-
itemnya. Untuk mengetahui apakah masing-masing butir tes itu
mempunyai kualitas yang baik, maka dapat dilakukan analisis terhadap
lima hal, yaitu: validitas, reliabilitas, tingkat kesukaran, daya beda dan
efektivitas fungsi distraktor.
a. Validitas
1) Pengertian Validitas
Suatu tes disebut valid apabila tes tersebut dapat mengukur
apa yang hendak dan seharusnya diukur.35
Validitas adalah suatu konsep yang berkaitan dengan sejauh
mana tes telah mengukut apa yang seharusnya diukur.36
William wiesma menyebutkan bahwa : "Validity is the
extent to which a test measure what it is intended to measure".
Validitas adalah sejauh mana sebuah tes dapat mengukur apa yang
seharusnya diukur.37
Menurut Nana Sudjana, validitas adalah ketepatan alat
penilaian terhadap konsep yang dinilai sehingga betul-betul menilai
apa yang seharusnya dinilai.38
Dari beberapa definisi di atas, dapat disimpulkan bahwa
suatu tes dapat dikatakan valid yaitu apabila tes tersebut dapat
mengukur apa yang hendak dan seharusnya diukur.
Sedangkan yang dimaksud dengan validitas item tes adalah
ketepatan mengukur yang dimiliki oleh sebutir item (yang
merupakan bagian yang tak terpisahkan dari tes sebagai suatu
totalitas), dalam mengukur apa yang seharusnya diukur lewat butir
item tersebut.39
35 Mudjijo, Tes Hasil Belajar, (Jakarta: Bumi Aksara, 1995), hlm. 40. 36 Sumartana Suryapranata, Analisis, Validitas, Reliabilitas, dan Interpretasi Hasil Tes,
(Bandung: Remaja Rosdakarya, 2004), hlm. 50. 37 William Wiersma dan Stephen G. Jurs, Educational Measurement And Testing, (United
States of Amerika: University Toledo, 1990), hlm. 183. 38 Nana Sudjana, op.cit., hlm. 12. 39 Anas Sudijono, op.cit., hlm. 182.
22
2) Teknik Analisis Validitas
Validitas adalah salah satu ciri tes hasil belajar yang baik.
Untuk menentukan apakah suatu tes hasil belajar telah memiliki
validitas atau daya ketepatan mengukur, dapat dilihat dari dua segi,
yaitu dari segi tes itu sendiri sebagai totalitas (validitas tes), dan
dari segi itemnya, sebagai bagian tak terpisahkan dari tes tersebut
(validitas item tes).40
a) Validitas tes
Penganalisisan terhadap validitas tes dapat dilakukan
dengan dua cara. Pertama, penganalisisan yang dilakukan
dengan jalan berpikir secara rasional (validitas rasional).
Kedua, penganalisisan yang dilakukan dengan mendasarkan
diri kepada kenyataan empiris (validitas empiris).
Analisis validitas rasional atau logis dapat dilihat dari
dua segi, yaitu:
(1) Validitas isi (content validity)
Validitas isi adalah validitas yang ditilik dari segi isi
tes itu sendiri sebagai alat pengukur hasil belajar yaitu;
sejauh mana tes hasil belajar sebagai alat pengukur hasil
belajar peserta didik, isinya telah dapat mewakili secara
representatif terhadap keseluruhan materi atau bahan
pelajaran yang seharusnya diteskan.41
(2) Validitas konstruksi (contruct validity)
Suatu tes dikatakan memiliki validitas konstruksi
apabila butir-butir soal yang membangun tes tersebut
40 Ibid., hlm. 163. 41 Ibid., hlm. 164.
23
mengukur setiap aspek berpikir seperti yang disebutkan
dalam tujuan instruksional khusus.42
Adapun analisis validitas empiris juga dapat dilihat dari
dua segi, yaitu:
(1) Validitas ramalan (predictive validity)
Suatu tes dikatakan memiliki validitas ramalan jika
hasil korelasi tes itu dapat meramalkan dengan tepat
keberhasilan seseorang pada masa mendatang di dalam
lapangan tertentu. Tepat tidaknya ramalan tersebut dapat
dilihat dari korelasi koefisien antara hasil tes itu dengan alat
ukur lain pada masa mendatang.43
(2) Validitas bandingan (concurren validity)
Suatu tes dikatakan memiliki validitas bandingan
apabila tes tersebut dalam kurun waktu yang sama secara
tepat telah mampu menunjukkan adanya hubungan yang
searah, antara tes pertama dengan tes berikutnya.44
b) Validitas item tes
Apa yang sudah dibicarakan di atas adalah validitas tes
secara keseluruhan. Disamping mencari validitas tes, perlu juga
dicari validitas item sebagai bagian dari validitas tes. Jika
seorang peneliti atau seorang guru mengetahui bahwa validitas
tes misalnya terlalu rendah atau rendah saja, maka selanjutnya
ingin mengetahui butir-butir manakah yang menyebabkan soal
secara keseluruhan jelek karena memiliki validitas tes rendah.
Maka untuk keperluan inilah dicari validitas butir soal
(validitas item).
Sebuah item memiliki validitas yang tinggi, jika skor
pada item mempunyai kesejajaran dengan skor total.
42 Suharsimi Arikunto, op.cit., hlm. 67. 43 M. Ngalim Purwanto, op.cit., hlm. 138 44 Anas Sudijono, op.cit., hlm. 176-177.
24
Kesejajaran ini dapat diartikan dengan korelasi sehingga untuk
mengetahui validitas item digunakan rumus korelasi.45
Untuk soal-soal bentuk objektif, skor untuk item
biasanya diberikan dengan 1 (bagi item yang dijawab benar)
dan 0 (bagi item yang dijawab salah), sedangkan skor total
selanjutnya merupakan jumlah dari skor untuk semua item
yang membangun soal tersebut.
Salah satu teknik korelasi yang terkenal untuk
menghitung validitas item adalah menggunakan teknik korelasi
point biserial (rpbi), dengan rumus: 46
qp
SDtMtMpr
bip−
=
Keterangan:
rpbi = Koefisien korelasi point biserial Mp = Relata skor dari subjekf yang menjawab betul bagi item
yang dicari validitasnya Mt = Relata skor total SDt = Standar deviasi dari skor total p = Proporsi testee yang menjawab betul terhadap item
yang sedang di uji validitasnya q = Proporsi siswa yang menjawab salah
b. Reliabilitas
1) Pengertian Reliabilitas
Rebialitas sering diartikan dengan keterandalan. Artinya
suatu tes memiliki keterandalan bilamana tes tersebut dipakai
mengukur berulang-ulang hasilnya sama.47
Menurut Muhammad Abdul Kholik dalam bukunya yang
berjudul "Ikhtibaarotun al Lughoh", menyebutkan bahwa:48
ه أن ذات عدم التذب بالثب يقصد :الثبات ا قصد ب ار اذا م ب فى االختب يكون بمثابة المقياس
45 Suharsimi Arikunto, op.cit., hlm. 76. 46 Anas Sudijono, op.cit., hlm. 185. 47 M. Chabib Thoha, op.cit., hlm. 118. 48 Muhammad Abdul Kholik, Ikhtibaarotun al-Lughoh, (Riyadh: Jami'ah Malik Su'ud,
1989), hlm. 39.
25
"Reliabilitas tes adalah tidak adanya perubahan-perubahan dalam tes yang dilaksanakan dengan menggunakan tes yang serupa"
Charles E. Skinner dalam bukunya yang berjudul "Essentials
of Educational Psychology" menyebutkan bahwa: "A test is
reliable if it measures consintenly". Suatu tes dikatakan reliabel
yaitu apabila tes tersebut dapat mengukur secara ajeg atau
konsisten.49
Adapun Anne Anastasi dalam bukunya Psychological
testing, menjelaskan bahwa: "Reliability refers to the consistency
of scores obtained by the same persons when they are reexamined
with the same test on different occasions".50 Reliabilitas adalah
keajegan atau ketetapan nilai yang diperoleh dari individu-individu
yang sama ketika mereka diuji dengan tes yang sama pada waktu
yang berbeda.
Dari definisi-definisi di atas, maka dapat disimpulkan bahwa
reliabilitas tes adalah suatu tes yang memberikan hasil yang relatif
sama kapanpun tes itu diujikan kepada sejumlah testee yang sama.
2) Faktor-faktor yang mempengaruhi reliabilitas
a) Luas tidaknya sampling yang diambil
Makin luas suatu sampling, berarti tes makin andal.
b) Perbedaan bakat dan kemampuan murid yang di tes
Makin variabel kemampuan peserta tes, berarti makin tinggi
keandalan koefisien tes. Tes yang diberikan kepada beberapa
tingkat kelas yang berbeda lebih tinggi keandalannya daripada
yang hanya diberikan kepada beberapa kelas yang sama karena
tingkat kelas yang berbeda akan menghasilkan achievement
yang lebih luas.
c) Suasana dan kondisi testing
49 Charles E. Skinner (ed), Essentials of EducationalPsychology, (englewood Cliffs:
Prentice – Hall inc., t.t.), hlm. 443. 50 Anne Anastasi dan Susana Urbina, Psychological Testing, (New York: Prentice – Hall
Inc., 1984), hlm. 84.
26
Suasana ketika sedang berlangsung testing, seperti tenang,
gaduh, banyak gangguan, pengetes yang marah-marah dapat
mengganggu pengerjaan tes sehingga dapat mempengaruhi
pula hasil dan keandalan tes.51
3) Teknik Analisis Reliabilitas Tes
Dalam rangka menentukan apakah tes hasil belajar bentuk
objektif yang disusun oleh tester telah memiliki keajegan
mengukur ataukah belum, maka dapat dilakukan dengan
menggunakan tiga pendekatan.
a) Pendekatan Single Test-Single Trial (Single Test-Single Trial
Method)
Pendekatan Single Test-Single Trial adalah pendekatan
"serba single" atau pendekatan "serba satu", yaitu satu
kelompok subjek, satu jenis alat pengukur, dan satu kali
pengukuran; atau satu kelompok testee, satu jenis tes, dan satu
kali testing.
Dengan menggunakan pendekatan ini, maka tinggi
rendahnya reliabilitas tes bentuk objektif dapat diketahui
dengan melihat besar kecilnya koefisien realibilitas tes (r11).
Adapun untuk menghitung atau mencari r11 dapat digunakan
lima jenis formula, yaitu : (1) formula Spearman-Brown, (2)
Formula Flanagan, (3) Formula Rulon, (4) Formula Kuder-
Richardson dan (5) Formula C. Hoyt.52
b) Pendekatan Test-retest (single test-double trial)
Pendekatan test-retest adalah pendekatan untuk menguji
reliabilitas tes dengan jalan menguji tes tersebut dua kali atau
lebih, kemudian hasilnya dikorelasikan.
51 Ngalim Purwanto, op.cit., hlm. 141. 52 Ibid., hlm. 214.
27
Pada pendekatan ini, penentuan reliabilitas tes
didasarkan pada konsistensi dari "batang tubuh" tes yang
bersangkutan, yang terbangun dari kumpulan butir-butir item.
Adapun langkah-langkah yang dapat ditempuh pada uji
reliabilitas ini adalah sebagai berikut :53
(1) Menyusun sebuah tes yang akan diukur reliabilitasnya.
(2) Mengujikan tes yang tersusun tersebut (tahap I).
(3) Menghitung skor hasil tes tahap I.
(4) Mengujikan ulang tes yang tersusun tersebut (tahap II).
(5) Menghitung skor hasil tes ulang (tahap II).
(6) Menghitung reliabilitas tes dengan jalan mengkorelasikan
skor tes I dengan skor tes II dengan rumus korelasi product
moment.
c) Pendekatan Alternate Form (double test-double trial)
Pendekatan alternate form adalah pendekatan untuk
menguji reliabilitas tes dengan jalan menyusun dua buah tes
yang memiliki kemiripan atau kesamaan untuk diujikan kepada
sekelompok testee tanpa adanya tenggang waktu.
Adapun langkah-langkah yang dapat ditempuh dalam
pendekatan ini adalah :54
(1) Menyusun dua buah tes yang sejenis.
(2) Mengujikan tes tersebut (dalam waktu yang bersamaan atau
beriringan).
(3) Memberikan skor hasil tes yang telah diujikan, disusun
dengan memisahkan antara tes A dan tes B.
(4) Mencari koefisien stabilitas kedua tes (A dan B) dengan
jalan mencari korelasinya melalui rumus korelasi product
moment.
53 M. Chabib Thoha, op.cit., hlm. 119-120. 54 Ibid., hlm. 122-123.
28
Dari ketiga pendekatan di atas, yang lebih tepat untuk
menentukan reliabilitas tes hasil belajar bentuk objektif secara
langsung terhadap butir-butir tes hasil belajar adalah pendekatan
single test-single trial yang berbentuk formula Kuder-Richardson
dengan salah satu rumusnya yaitu K-R2055
.
Adapun cara menggunakan rumus K-R20 adalah:56
a) Membuat tabel analisis butir tanpa harus dikelompokan nomor
ganjil dan genap.
b) Menghitung proporsi yang menjawab benar dan proprosi yang
menjawab salah pada masing-masing butir dalam tabel analisis
butir.
c) Mengalikan proporsi yang menjawab benar dan proporsi yang
menjawab salah.
d) Mencari varians (standar deviasi kuadrat) dari skor total.
e) Menghitung reliabilitas tes dengan rumus K-R20.
⎥⎦
⎤⎢⎣
⎡ Σ−⎥⎦⎤
⎢⎣⎡
−= 2
2
11 StpiqiSt
1nnr
Keterangan: r11 = Koefisien reliabilitas tes n = Banyaknya butir item I = Bilangan konstan St2 = Varian total pi = Proporsi testee yang menjawab benar qi = Proporsi testee yang menjawab salah = Jumlah dari hasil perkalian pi dengan qi
c. Tingkat Kesukaran
1) Pengertian tingkat kesukaran item
Tingkat kesukaran Item adalah pernyataan tentang seberapa
mudah dan seberapa sulit sebuah butir soal bagi siswa yang dikenai
pengukuran.57
55 Anas Sudijono, op.cit., hlm. 252. 56 M. Chabib Thoha, op.cit., hlm. 133-134. 57 Burhan Nurgiyanto, Penilaian Dalam Pengajaran Bahasa dan Sastra, (Yogyakarta:
BPFE, 1987), hlm. 126.
29
Suke Silverius menyebutkan bahwa tingkat kesukaran item
adalah persentase siswa yang dapat menjawab benar butir soal
tersebut.58
Adapun menurut Anne Anatasi dalam bukunya
Psychological Testing menjelaskan bahwa; "The difficulty of an
item is defined in terms of the precentage of persons who answer it
correctly".59 Tingkat kesukaran suatu butir soal adalah ditandai
oleh persentase siswa (testee) yang menjawab dengan benar
terhadap butir soal yang bersangkutan.
Dari beberapa pengertian di atas, dapat disimpulkan tingkat
kesukaran adalah seberapa besar tingkat kesukaran suatu butir soal
yang ditunjukkan dengan persentase siswa yang menjawab benar
terhadap butir soal tersebut.
2) Teknik analisis tingkat kesukaran
Asumsi yang digunakan untuk memperoleh kualitas soal
yang baik, disamping memenuhi validitas dan reliabilitas adalah
adanya keseimbangan dari tingkat kesulitan soal tersebut.
Keseimbangan yang dimaksudkan adalah adanya soal-soal yang
termasuk mudah, sedang, dan sukar secara proporsional. Tingkat
kesukaran soal dipandang dari kesanggupan atau kemampuan
siswa dalam menjawabnya, bukan dilihat dari sudut guru sebagai
pembuat soal.60
Secara tentatif dapat dikatakan bahwa salah satu ciri butir
soal yang baik adalah bahwa ia tidak terlalu sukar dan tidak terlalu
mudah untuk kelompok tertentu yang akan dites.61
Cara yang dapat ditempuh untuk mengetahui apakah item
tes hasil belajar itu sudah memiliki tingkat kesukaran yang
58 Suke Silverius, op.cit., hlm. 167. 59 Anne Anastasi, Psychological Testing, (New York: Macmillan Publishing Inc., 1976),
hlm. 199. 60 Nana Sudjana, op.cit., hlm. 135. 61 Mudjijo, op.cit., hlm. 62.
30
memadai ataukah belum, maka dapat diketahui dari besar kecilnya
indeks kesukaran item (difficulty index).
Difficulty index (indeks kesukaran item) adalah bilangan
atau angka yang menunjukkan sukar mudahnya suatu item soal.
Besarnya indeks kesukaran antara 0,00 sampai dengan 1,00 artinya,
soal dengan indeks kesukaran 0,00 menunjukkan bahwa soal itu
terlalu sukar, sebaliknya indeks 1,00 menunjukkan bahwa soalnya
terlalu mudah. Untuk lebih jelasnya perhatikan bagan di bawah ini:
0,00 1,00
terlalu sukar terlalu mudah
Di dalam istilah evaluasi, indeks kesukaran ini diberi
simbol P, singkatan dari kata "proporsi". Dengan demikian maka
soal dengan P = 0,70 lebih mudah jika dibandingkan dengan P =
0,20. Sebaliknya soal dengan P = 0,30 lebih sukar dari pada soal
dengan P = 0,80.62
Melihat besarnya bilangan indeks ini maka lebih cocok jika
bukan disebut sebagai indeks kesukaran tetapi indeks kemudahan
atau indeks fasilitas, karena semakin mudah soal itu, semakin besar
pula bilangan indeksnya. Akan tetapi telah disepakati bahwa
walaupun semakin tinggi indeksnya menunjukkan soal yang
semakin mudah, tetapi tetap disebut indeks kesukaran.63
Angka indeks kesukaran (P) dapat diperoleh dengan
menggunakan rumus sebagai berikut:64
NNP P=
keterangan: P = Indeks kesukaran (proporsi) NP = banyaknya siswa yang menjawab soal itu dengan benar N = Jumlah seluruh siswa peserta tes (testee)
62 Daryanto, Evaluasi Pendidikan, (Jakarta: Rineka Cipta, 2001), cet. 2, hlm. 180. 63 Suharsimi Arikunto, op.cit., hlm. 208. 64 Anas Sidijono, op.cit., hlm. 372.
31
Sebagai tindak lanjut hasil analisis terhadap tingkat
kesukaran item tes, maka perlu dilakukan hal-hal sebagai berikut:65
Pertama, untuk butir-butir item yang tingkat kesukarannya
cukup atau sedang, maka butir item tersebut segera dicatat dalam
buku bank soal. Selanjutnya butir-butir soal tersebut dapat
dikeluarkan lagi dalam tes-tes hasil belajar pada waktu-waktu yang
akan datang.
Kedua, untuk butir-butir item yang termasuk dalam kategori
terlalu sukar, ada tiga kemungkinan tindak lanjut, yaitu: (1) Butir
item tersebut dibuang atau didrop dan tidak akan dikeluarkan lagi
dalam tes-tes hasil belajar yang akan datang. (2) Diteliti ulang,
dilacak dan ditelusuri sehingga dapat diketahui faktor yang
menyebabkan butir item yang bersangkutan sulit dijawab oleh
testee; apakah kalimat soalnya kurang jelas, apakah petunjuk
mengerjakan soalnya sulit dipahami, ataukah dalam soal tersebut
terdapat istilah-istilah yang tidak jelas, dan sebagainya. Setelah
dilakukan perbaikan kembali, butir-butir item tersebut dikeluarkan
lagi dalam tes hasil belajar yang akan datang. (3) Butir-butir item
tersebut dapat diambil manfaatnya, yaitu dapat digunakan dalam
tes-tes (terutama tes seleksi) yang sifatnya sangat ketat, dalam arti;
sebagian besar dari testee tidak akan diluluskan dalam tes seleksi
tersebut.
Ketiga, untuk butir-butir item yang termasuk dalam
kategori terlalu mudah, juga ada tiga kemungkinan tindak
lanjutnya, yaitu: (1) Butir item tersebut dibuang atau didrop dan
tidak akan dikeluarkan lagi dalam tes hasil belajar yang akan
datang. (2) Diteliti ulang, dilacak dan ditelusuri secara cermat guna
mengetahui faktor yang menyebabkan butir item tersebut dapat
dijawab betul oleh hampir seluruh testee; ada kemungkinan option
atau alternatif yang dipasang pada butir-butir item tersebut "terlalu
65 Ibid., hlm. 375-378.
32
mudah diketahui" oleh testee; mana option yang merupakan kunci
jawaban item dan mana option yang berfungsi sebagai pengecoh.
Di sini testee harus berusaha memperbaiki atau menggantinya
dengan option yang lain sehingga antara kunci jawaban dengan
pengecoh sulit dibedakan oleh tester. Setelah dilakukan perbaikan,
item tersebut dicoba untuk dikeluarkan lagi pada tes berikutnya. (3)
butir-butir item ini dapat dimanfaatkan pada tes-tes (terutama tes
seleksi) yang sifatnya longgar, dalam arti bahwa sebagian besar
dari testee akan dinyatakan lulus dalam tes seleksi.
d. Daya Pembeda
1) Pengertian Daya Pembeda Item
Daya pembeda suatu soal tes adalah bagaimana
kemampuan soal itu untuk membedakan siswa-siswa yang
termasuk kelompok pandai (upper group) dengan siswa-siswa yang
termasuk kelompok kurang (lower group)66
Menurut Wilmar Tinambunan, "The discriminating power
of a test item is its ability to differentiate between pupils who have
achieved well (the upper group) and those who have achieved
poorly (the lower group)". 67 Daya pembeda item tes adalah
kemampuan item tes tersebut untuk membedakan antara siswa-
siswa yang berkemampuan tinggi dengan siswa-siswa yang
berkemampuan rendah.
Sedangkan Anas Sudijono menjelaskan bahwa:68
Daya pembeda item adalah kemampuan suatu butir item tes hasil belajar untuk dapat membedakan antara testee yang berkemampuan tinggi (pandai) dengan testee yang kemampuannya rendah (bodoh) demikian rupa, sehingga sebagian besar testee yang memiliki kemampuan tinggi untuk menjawab butir item tersebut lebih banyak yang menjawab betul, sementara testee yang kemampuannya rendah untuk
66 Ngali Purwanto, Prinsip-Prinsip dan Teknik Evaluasi Pengajaran, (Bandung: Remaja
Rosadakarya, 1997), cet. 8, hlm. 120. 67 Wilmar Tinambunan, op.cit., hlm. 139. 68 Anas Sudijono, op.cit., hlm. 385-386.
33
menjawab butir item tersebut, sebagian besar tidak dapat menjawab item dengan betul.
Dari beberapa definisi di atas, maka dapat disimpulkan
bahwa suatu item tes memiliki daya pembeda yaitu apabila item tes
itu dapat dijawab benar oleh siswa kelompok atas (pandai) dan
tidak dapat dijawab benar oleh siswa kelompok bawah (bodoh).
2) Teknik Analisis Daya Pembeda Item
Mengetahui daya pembeda item itu penting sekali, sebab
salah satu dasar yang dipegangi untuk menyusun butir-butir item
tes hasil belajar adalah adanya anggapan bahwa kemampuan antara
testee yang satu dengan testee yang lain itu berbeda-beda, dan
bahwa butir-butir item tes hasil belajar itu haruslah mampu
memberikan hasil tes yang mencerminkan adanya perbedaan-
perbedaan kemampuan yang terdapat di kalangan testee tersebut.
Sejalan dengan pernyataan di atas maka kegiatan analisis
terhadap daya pembeda item itu ditujukan untuk menjawab
pertanyaan: "Apakah testee yang kita anggap pandai jawabannya
pada umumnya betul, dan apakah testee yang kita anggap bodoh itu
pada umumnya jawabannya salah?". Jika jawaban atas pertanyaan
itu adalah "ya", maka butir item tersebut dapat kita anggap sebagai
butir item yang baik, dalam arti bahwa butir item itu telah
menunjukkan kemampuannya di dalam membedakan antara testee
yang termasuk dalam kategori pandai dengan testee yang termasuk
dalam kategori bodoh. Sebaliknya, jika jawab atas pertanyaan itu
"tidak", maka butir item tersebut dapat kita nyatakan sebagai butir
item yang jelek, sebab hasil yang dicapai dalam tes itu justru
bertentangan atau berlawanan arah dengan tujuan tes itu sendiri.69
Daya pembeda item dapat diketahui dengan melihat besar
kecilnya angka indeks diskriminasi item. Angka indeks
diskriminasi item adalah sebuah angka atau bilangan yang
69 Ibid., hlm. 396.
34
menunjukkan besarnya daya pembeda yang dimiliki oleh sebutir
item.
Indeks diskriminasi item, umumnya diberi lambang D
(discriminatory power). Seperti halnya indeks kesukaran, indeks
diskriminasi (daya pembeda) ini berkisar antara 0,00 sampai 1,00.
Hanya bedanya, indeks kesukaran tidak mengenal tanda negatif (-),
tetapi pada indeks diskriminasi ada tanda negatif. Tanda negatif
pada indeks diskriminasi digunakan jika suatu soal "terbalik"
menunjukkan kualitas testee. Artinya anak pandai disebut bodoh
dan anak bodoh disebut pandai.
Dengan demikian ada tiga titik pada daya pembeda item,
yaitu70
- 1,00 0,00 1,00
daya pembeda daya pembeda daya pembeda
negatif rendah tinggi (positif)
Indeks diskriminasi pada dasarnya dihitung atas dasar
pembagian testee ke dalam dua kelompok, yaitu kelompok atas
(pandai) dan kelompok bawah (bodoh). Cara menentukan dua
kelompok itu bervariasi, misalnya: dapat membagi dua kelompok
tersebut menjadi 27% dari kelompok atas dan 27% dari kelompok
bawah; dapat juga menggunakan median, yaitu 50% testee
kelompok atas dan 50% testee kelompok bawah; dan dapat juga
dengan hanya mengambil 20% dari testee kelompok atas dan 20%
dari testee kelompok bawah. Dari beberapa pembagian tersebut,
para pakar di bidang evaluasi pendidikan lebih banyak
menggunakan presentase sebesar 27% dari testeekelompok atas
dan 27% dari testee kelompok bawah. Hal ini disebabkan adanya
bukti-bukti empirik bahwa pembagian tersebut telah menunjukkan
kesensitifannya, atau dengan kata lain cukup dapat diandalkan.71
70 Suharsimi Arikunto, op.cit., hlm. 211. 71 Anas Sudijono, op.cit., hlm. 387.
35
Sebagaimana yang dijelaskan oleh Sumadi Suryabrata, bahwa
pembagian 27% kelompok atas dan 27% dari kelompok bawah itu,
memberikan efisiensi tertinggi dalam memperkirakan daya
pembeda soal.72
Indeks diskriminasi (D) dapat dihitung menggunakan
rumus, sebagai berikut: 73
BAB
B
A
A PPJB
JBD −=−=
keterangan:
D = Discriminatory Power (Angka indeks diskriminasi item) BA = Banyaknya testee kelompok atas yang menjawab benar BB = Banyaknya testee kelompok bawah yang menjawab benar JA = banyaknya testee kelompok atas. JB = banyaknya testee kelompok bawah. PA = Proporsi testee kelompok atas yang menjawab benar PB = Proporsi testee kelompok bawah yang menjawab benar
Sebagai tindak lanjut dari hasil analisis terhadap daya
pembeda item tes, maka perlu dilakukan hal-hal sebagai berikut:74
Pertama, untuk butir-butir item yang sudah memiliki daya
pembeda item baik, hendaknya dicatat dalam buku bank soal tes
hasil belajar. Selanjutnya butir-butir item tersebut dapat
dikeluarkan pada tes hasil belajar yang akan datang.
Kedua, untuk butir-butir item yang daya pembedanya masih
rendah, ada dua kemungkinan tindak lanjut, yaitu: (1) Ditelusuri,
untuk kemudian diperbaiki, dan setelah diperbaiki dapat diajukan
lagi dalam tes hasil belajar yang akan datang. (2) Dibuang (didrop)
dan tidak akan dikeluarkan lagi pada tes yang akan datang.
Ketiga, untuk butir-butir item yang angka indeks
diskriminasi itemnya bertanda negatif, sebaiknya tidak dikeluarkan
lagi pada tes yang akan datang, karena butir item tersebut memiliki
72 Sumadi Suryabrata, Pengembangan tes Hasil Belajar, (Jakarta: Rajawali Pers, 1987),
hlm. 108. 73 Suharsimi Arikunto, op.cit., hlm. 213-214. 74 Anas Sudijono, op.cit., hlm. 408-409
36
kualitas sangat jelek (testee yang termasuk pandai lebih banyak
yang menjawab salah daripada testee yang termasuk bodoh, justru
hanya sedikit saja yang jawabannya salah).
e. Efektivitas Fungsi Distraktor
Dalam setiap tes objektif selalu digunakan alternatif jawaban
yang mengandung dua unsur sekaligus, yaitu jawaban tepat dan
jawaban yang salah sebagai penyesat (distraktor)75
Tujuan utama pemasangan distraktor pada setiap butir item itu
adalah, agar dari sekian banyak testee yang mengikuti tes hasil belajar
ada yang tertarik atau terangsang untuk memilihnya, sebab mereka
menyangka bahwa distraktor yang mereka pilih itu merupakan
jawaban betul. Makin banyak testee yang terkecoh, maka distraktor
tersebut dapat menjalankan fungsinya dengan baik. Sebaliknya, apabila
distraktor yang dipasang pada setiap butir item itu "tidak laku"
(maksudnya: tidak ada seorangpun dari sekian banyak testee yang
merasa tertarik atau terangsang untuk memilih distraktor tersebut
sebagai jawaban betul), maka distraktor tersebut tidak dapat
menjalankan fungsinya dengan baik. Dengan kata lain, distraktor baru
dapat dikatakan telah menjalankan fungsinya dengan baik, apabila
distraktor tersebut memiliki daya rangsang atau daya tarik, sehingga
testee (khususnya testee dari kelompok bawah) menjadi terkecoh untuk
memilih distraktor sebagai jawaban betul.76
Analisis fungsi distraktor yang sering dikenal dengan istilah
lain, yaitu pola penyebaran jawaban soal. Adapun yang dimaksud pola
penyebaran jawaban soal adalah distribusi testee dalam hal
menentukan pilihan jawaban pada soal bentuk pilihan ganda. Pola
jawaban soal diperoleh dengan menghitung banyaknya testee yang
75 M. Chabib Thoha, op.cit., hlm. 149. 76 Anas Sudijono, op.cit., hlm. 410.
37
memilih option a, b, c, atau d atau yang tidak memilih option manapun
(blangko). Dalam istilah evaluasi disebut omit, disingkat O.77
Suatu distraktor dapat diperlakukan dengan 3 cara:78
1) Diterima, karena sudah baik.
2) Ditolak, karena tidak baik.
3) Ditulis kembali, karena kurang baik.
Cara untuk menentukan, apakah suatu distraktor telah dapat
menjalankan fungsinya dengan baik atau belum, maka dapat dianalisis
menggunakan rumus:79
%100X)testee(tespesertaJumlahoptionmemilihyangtesteeBanyaknyaDistraktor =
Apabila distraktor tersebut sekurang-kurangnya sudah dipilih
oleh 5% dari seluruh testee, maka distraktor itu telah berfungsi dengan
baik. Sebaliknya apabila distraktor tersebut dipilih kurang dari 5% dari
seluruh testee, maka distraktor itu belum berfungsi dengan baik.
3. Kegunaan Analisis Item Tes
Analisis item tes (item analysis) merupakan suatu prosedur yang
sistematis, yang akan memberikan informasi-informasi yang sangat khusus
terhadap butir tes yang kita susun.
Suharsimi Arikunto dalam bukunya yang berjudul “Dasar-Dasar
Evaluasi Pendidikan”, menjelaskan bahwa faedah atau kegunaan dari
analisis item tes adalah:80
a. Membantu kita dalam mengidentifikasikan butir-butir soal yang jelek.
b. Memperoleh informasi yang akan dapat digunakan untuk
menyempurnakan soal-soal untuk kepentingan lebih lanjut.
c. Memperoleh gambaran secara selintas tentang keadaan tes yang kita
susun.
77 Suharsimi Arikunto, op.cit., hlm. 219. 78 Daryanto, op.cit., hlm. 193. 79 Anas Sudijono, op.cit., hlm. 412. 80 Suharsimi Arikunto, op.cit., hlm. 205.
38
Adapun manfaat atau kegunaan analisis soal buatan guru menurut
Suke Silverius dalam bukunya yang berjudul “Evaluasi Hasil Belajar dan
Umpan Balik”, adalah sebagai berikut:81
a. Menentukan apakah butir soal berfungsi tepat seperti yang
dimaksudkan oleh guru.
Untuk menentukan apakah butir soal telah berfungsi
sebagaimana mestinya, guru perlu mempertimbangkan hal-hal berikut:
1) Apakah tes itu ditujukan untuk mengukur pencapaian tujuan
instruksional yang dimaksudkan?
2) Apakah tes itu mempunyai tingkat kesukaran yang memadai,
dipandang dari materi yang dipakai untuk menulis butir soal itu
dan tingkat kemampuan yang diukur?
3) Apakah kunci jawaban telah betul?
4) Apakah distraktor berfungsi dengan baik?
b. Umpan balik bagi siswa mengenai penampilannya dan merupakan
dasar untuk diskusi kelas
Siswa berhak mengetahui bagaimana tesnya dinilai dan
jawaban yang benar dari setiap butir soal. Dengan demikian dia dapat
membetulkan kesalahan jawabannya, sementara guru dapat
menjelaskan sejauhmana jawaban yang diinginkan dari setiap soal. Hal
ini menyebabkan siswa lebih memahami pokok bahasan atau subpokok
bahasan melalui jawaban yang baik dan benar dari setiap soal.
c. Umpan balik bagi guru tentang kesulitan belajar siswa.
Suatu prosedur sederhana seperti mentabulasi presentase siswa
yang menjawab benar suatu butir soal dapat memberikan informasi
kepada guru mengenai pokok-pokok bahasan yang membutuhkan
penjelasan tambahan dan perbaikan. Tentu saja sekelompok butir soal
yang menanyakan bahan yang sama akan memberikan informasi yang
lebih reliabel (ajeg) daripada satu soal saja.
81 Suke Silverius, op.cit., hlm. 176-177.
39
Mengidentifikasi kesalahan apa yang ada dalam jawaban
terhadap soal-soal dapat sangat membantu guru untuk perbaikan
tingkat pemahaman siswa terhadap pokok bahasan atau subpokok
bahasan yang diteskan itu.
d. Bidang-bidang kurikulum yang memerlukan perbaikan.
Jika ada butir soal tertentu yang selalu sukar bagi siswa, atau
selalu ada jenis kesalahan tertentu yang sering terjadi, maka mungkin
masalahnya di luar jangkauan guru-guru. Mungkin kurikulumnya yang
perlu direvisi. Analisis soal dapat membantu menemukan hal ini.
e. Perbaikan butir soal.
Hasil analisis butir soal dapat menunjukkan kualitas butir soal
itu. Maka hasil analisis dapat dipakai untuk mengupayakan perbaikan
butir soal tersebut. Butir-butir soal yang diperbaiki itu dapat disimpan
untuk dipakai lagi pada tahun yang akan datang.
f. Meningkatkan ketrampilan penulisan soal.
Cara yang paling efektif untuk meningkatkan keterampilan
menulis soal tes adalah menganalisis butir-butir soal dan cara siswa
menjawab soal-soal itu. Kemudian, memanfaatkan informasi ini untuk
perbaikan butir soal dan mencobanya lagi kepada para siswa. Hanya
membaca buku teori tidaklah cukup.
C. MATA PELAJARAN AQIDAH AKHLAK
1. Kurikulum Aqidah Akhlak
Pendidikan aqidah akhlak adalah upaya sadar dan terencana dalam
menyiapkan peserta didik untuk mengenal, memahami, menghayati dan
mengimani Allah dan merealisasikannya dalam perilaku akhlak mulia
dalam kehidupan sehari-hari melalui kegiatan bimbingan, pengajaran
latihan, penggunaan pengalaman dan pembiasaan. Dalam kehidupan
masyarakat yang majemuk dalam bidang keagamaan, pendidikan ini juga
diarahkan pada peneguhan aqidah di satu sisi dan peningkatan toleransi
40
serta saling menghormati dengan penganut agama lain dalam rangka
mewujudkan kesatuan dan persatuan bangsa.82
a. Tujuan Pendidikan Aqidah Akhlak
Berdasarkan UU RI No. 20 Tahun 2003, Pendidikan Agama
bertujuan untuk membentuk peserta didik menjadi manusia yang
beriman dan bertaqwa kepada Tuhan Yang Maha Esa serta berakhlak
mulia.83
Menurut Zuhairini, tujuan umum pendidikan agama adalah
membimbing peserta didik agar mereka menjadi muslim sejati,
beriman teguh, beramal shaleh, dan berakhlak mulia serta berguna bagi
masyarakat, agama dan negara.84
Sedangkan M. Arifin menjelaskan bahwa: 85
Tujuan Pendidikan Islam adalah perwujudan nilai-nilai Islami dalam pribadi manusia didik yang diikhtiarkan oleh pendidik muslim melalui proses yang terminal pada hasil (produk) yang berkepribadian Islam yang beriman, bertakwa dan berilmu pengetahuan yang sanggup mengembangkan dirinya menjadi hamba Allah yang taat.
Ketaatan kepada Allah Swt merupakan tujuan akhir dari
pendidikan Islam. Sebagaimana firman Allah dalam surat Adz-Dzariat
ayat 56, yaitu:
نودبعي لال إسنإلا ونج التقلا خمو“Aku tidak menjadikan jin dan manusia kecuali agar mereka itu beribadah kepada-Ku” (QS. Adz-Dzariyat: 56). 86
Salah satu bagian dari pendidikan agama Islam adalah
pendidikan Aqidah Akhlak. Adapun tujuan pendidikan Aqidah akhlak
di Madrasah Aliyah adalah untuk menumbuhkan dan meningkatkan
82 Departemen Agama RI, Kurikulum 2004 (Pedoman Khusus Pengembangan Silabus
dan Sistem Penilaian Akidah Akhak Madrasah Aliyah), (Jakarta: Direktorat Kelembagaan Agama Islam, 2004), hlm. 21.
83 Undang-Undang SISDIKNAS (Sistem Pendidikan Nasional) 2003, (UU RI No.20 Th. 2003), (Jakarta: Sinar Grafika Offset, 2003), hlm. 50.
84 Zuhairini dkk., Metodologi Pendidikan Agama, (Solo: Ramadhani, 1993), hlm. 35. 85 Arifin, Ilmu Pendidikan Islam, (Jakarta: Bumi Aksara, 2000), hlm. 224. 86 Departemen Agama Ri, Al-Qur'an dan Terjemahnya, (Jakarta: Yayasan Penyelenggara
Penerjemah/Penafsir Al-Qur'an, 1990), hlm. 862.
41
keimanan peserta didik yang diwujudkan dalam akhlaknya yang
terpuji, melalui pemberian dan pemupukan pengetahuan, penghayatan,
pengamalan serta pengalaman peserta didik tentang aqidah dan akhlak
Islam, sehingga menjadi manusia muslim yang terus berkembang dan
meningkat kualitas keimanan dan ketaqwaannya kepada Allah Swt
serta berakhlak mulia dalam kehidupan pribadi, bermasyarakat,
berbangsa san bernegara, serta untuk dapat melanjutkan pada jenjang
pendidikan yang lebih tinggi.87
b. Materi Aqidah Akhlak
Pelajaran Aqidah Akhlak di Madrasah Aliyah berisi bahan
pelajaran yang dapat mengarahkan pada pencapaian kemampuan dasar
peserta didik untuk dapat memahami rukun iman secara ilmiah serta
pengalaman dan pembiasaan berakhlak Islami, untuk dapat dijadikan
landasan perilaku dalam kehidupan sehari-hari serta sebagai bekal
untuk jenjang pendidikan berikutnya. Ruang lingkup pelajaran Aqidah
akhlak meliputi: aspek aqidah, aspek akhlak dan aspek kisah
keteladanan.88
Materi pelajaran Aqidah Akhlak untuk kelas I semester genap,
adalah sebagai berikut:89
- Iman kepada Malaikat.
- Akhlak terpuji (kreatif, dinamis, sabar dan tawakal).
- Akhlak tercela (pasif, pesimis, putus asa, dan bergantung pada
orang lain).
- Iman kepada Kitab Allah.
- Akhlak terpuji (Sikap bijaksana, amanah dan futuristik).
- Akhlak tercela (memfitnah, mencuri, picik, hedonisme, ananiah,
dan materialistik).
87 Departemen Agama RI, op.cit., hlm. 22. 88 Ibid. 89 Ibid., hlm. 30-32.
42
2. Pembelajaran Aqidah Akhlak
Untuk mencapai tujuan pembelajaran aqidah akhlak, maka
diperlukan adanya beberapa pendekatan dalam proses belajar mengajar,
yaitu:90
a. Keimanan, yang mendorong peserta didik untuk mengembangkan
pemahaman dan keyakinan tentang adanya Allah SWT. Sebagai
sumber kehidupan.
b. Pengamalan, mengkondisikan peserta didik untuk mengembangkan
dan merasakan hasil-hasil pengamalan akhlak mulia dalam kehidupan
sehari-hari.
c. Pembiasaan, melaksanakan pembelajaran dengan membiasakan sikap
dan perilaku yang baik yang sesuai dengan ajaran Islam yang
terkandung dalam al-Qur’an dan Hadits serta dicontohkan oleh para
ulama.
d. Rasional, usaha meningkatkan kualitas proses dan hasil pembelajaran
aqidah akhlak dengan pendekatan yang memfungsikan rasio peserta
didik, sehingga isi dan nilai-nilai yang ditanamkan mudah dipahami
dengan penalaran.
e. Emosional, upaya menggugah perasaan (emosi) peserta didik dalam
menghayati aqidah dan akhlak mulia sehingga lebih terkesan dalam
jiwa peserta didik.
f. Fungsional, menyajikan materi aqidah akhlak yang memberikan
manfaat nyata bagi peserta didik dalam kehidupan sehari-hari dalam
arti luas.
g. Keteladanan, yaitu pendidikan yang menempatkan dan memerankan
guru serta komponen madrasah lainnya sebagai teladan; sebagai
cerminan dari individu yang memiliki keimanan teguh dan berakhlak
mulia.
90 Ibid., hlm. 25-27.
43
3. Evaluasi Mata Pelajaran Aqidah Akhlak
Evaluasi merupakan rangkaian akhir dari proses pendidikan.
Berhasil atau tidaknya pendidikan dalam mencapai tujuannya dapat dilihat
setelah dilakukan evaluasi atau penilaian terhadap out put yang dihasilkan.
Dalam pendidikan Islam, penilaian atau evaluasi dapat dilakukan
dengan dua cara, yaitu :91
a. Evaluasi terhadap diri sendiri (self evaluation / intropeksi)
Evaluasi terhadap diri sendiri adalah mengadakan intropeksi atau
perhitungan terhadap diri sendiri. Evaluasi ini tentunya berdasarkan
kesadaran sendiri yang bertujuan untuk meningkatkan kreativitas dan
produktivitas (amal saleh) pribadi.
Evaluasi terhadap diri sendiri sangat dianjurkan dalam Islam. hal
ini sesuai dengan firman Allah Swt dalam surat al-Hasyr ayat 18,
yaitu:
}18: الحشر {... يا أيها الذين آمنوا اتقوا الله ولتنظر نفس ما قدمت لغد“Hai orang-orang yang beriman, bertakwalah kepada Allah dan hendaklah setiap diri memperhatikan apa yang telah diperbuatnya untuk hari esok (akhirat)” (QS. Al-Hasyr : 18).92
Dalam sebuah hadits yang diriwayatkan oleh Umar bin Khattab
juga disebutkan adanya anjuran untuk mengevaluasi terhadap diri
sendiri, yaitu: 93
ال ه ق ي اهللا عن اب رض ن الخط ر ب ن عم لىاهللا: ع و ل اهللا ص ال رس ق }رواه الترمذى{حاسبوا أنفسكم قبل أن تحاسبوا : عليه وسلم
“Dari Umar bin Khattab r.a berkata, Rasulullah Saw bersabda: Evaluasilah dirimu sebelum engkau di evaluasi”
Berdasarkan ayat dan hadits di atas, maka manusia dituntut
selalu waspada dan memperhitungkan segala tindakannya, agar
kehidupannya kelak tidak merugi.
b. Evaluasi terhadap orang lain (peserta didik)
91 Ramayulis, Ilmu Pendidikan Islam, (Jakarta : Kalam Mulia, 2004), hlm. 200-201. 92 Departemen Agama RI, op.cit., hlm. 919 93 At-Tirmidzi, Sunan al-Tirmidzi, (Beirut Libanon: Dar al-Fikr, 1994), hlm. 208.
44
Evaluasi terhadap orang lain (peserta didik) merupakan bagian
dari kegiatan pendidikan Islam. Kegiatan ini tidak sekedar boleh, tetapi
bahkan diwajibkan. Kewajiban di sini tentunya berdasarkan niat “amar
ma’ruf nahi munkar” yang bertujuan untuk perbaikan perbuatan
sesama umat Islam.
Salah satu bagian dari pendidikan Islam adalah pendidikan
aqidah akhlak. Hal ini berarti bahwa evaluasi dalam pendidikan aqidah
akhlak juga sangat dianjurkan.
Sebagaimana evaluasi yang dilakukan oleh Nabi Sulaiman, yaitu:
}27: النمل {قال سننظر أصدقت أم آنت من الكاذبين Berkata Sulaiman: "Akan kami lihat, apa kamu benar, ataukah kamu termasuk orang-orang yang berdusta”. (QS. An-Naml : 27).94
Pada umumnya ada tiga sasaran pokok dalam penilaian atau
evaluasi terhadap peserta didik, yaitu :95
1) Segi tingkah laku, artinya segi yang menyangkut sikap, minat,
perhatian, ketrampilan siswa sebagai akibat dari proses mengajar
dan belajar.
2) Segi isi pendidikan, artinya penguasaan bahan pelajaran yang
diberikan guru dalam proses mengajar-belajar.
3) Segi yang menyangkut proses mengajar dan belajar itu sendiri.
Proses mengajar dan belajar perlu diadakan penilaian secara
objektif dari guru, sebab baik tidaknya proses mengajar dan belajar
akan menentukan baik tidaknya hasil belajar yang dicapai siswa.
Evaluasi mata pelajaran Aqidah Akhlak untuk Madrasah Aliyah
didasarkan pada pencapaian kompetensi yang harus dikuasai oleh peserta
didik selama menempuh pendidikan di MA. Kompetensi ini berorientasi
pada perilaku afektif dan psikomotorik dengan dukungan pengetahuan
kognitif dalam rangka memperkuat aqidah serta meningkatkan kualitas
94 Departemen Agama RI, op.cit., hlm. 596. 95 Nana Sudjana, Dasar-Dasar Proses Belajar Mengajar, (Bandung: Sinar Baru
Algensindo, 1995), hlm. 44.
45
akhlak sesuai dengan ajaran Islam. Adapun kompetensi mata pelajaran
aqidah akhlak untuk kelas I semester genap adalah sebagai berikut :96
a). Memahami dan meyakini hakekat iman kepada Malaikat serta mampu
menganalisis secara ilmiah dan terbiasa berakhlak terpuji (kreatif,
dinamis, dan tawakal) dan menghindari akhlak tercela (pasif, pesimis,
putus asa, dan tergantung pada orang lain) dalam kehidupan sehari-hari
b). Memahami dan meyakini kebenaran kitab-kitab Allah serta mampu
menganalisis secara ilmiah dan terbiasa berakhlak mulia (bersikap
amanah, berpikir dan berorientasi masa depan) dan menghindari akhlak
tercela (memfitnah, mencuri, picik, hedonisme, ananiah dan
materialistik) dalam kehidupan sehari-hari.
Berdasarkan kurikulum 2004, penilaian atau evaluasi mata
pelajaran aqidah akhlak dilakukan dengan rambu-rambu sebagai berikut :97
1). Penilaian yang dilakukan meliputi penilaian kemajuan belajar dan
penilaian hasil belajar peserta didik yang terdiri dari pengetahuan
(aspek kognitif), sikap (aspek afektif), dan perilaku mereka (aspek
psikomotorik)
2). Penilaian kemajuan belajar merupakan pengumpulan informasi
tentang kemajuan belajar peserta didik. Penilaian ini bertujuan untuk
mengetahui tingkat kemampan dasar yang dicapai peserta didik
setelah mengikuti kegiatan pembelajaran dalam kurun waktu, unit
satuan, atau jenjang tertentu
3). Penilaian hasil belajar aqidah dan akhlak adalah upaya untuk
pengumpulan informasi untuk menentukan tingkat penguasan peserta
didik terhadap kompetensi meliputi : pengetahuan, sikap dan nilai.
Penilaian hasil belajar ini dilakukan sepenuhnya oleh madrasah yang
bersangkutan. Hasil penilaian dijadikan sebagai pertimbangan utama
dalam memasuki pendidikan jenjang berikutnya
96 Departemen Agama RI, Op.Cit., hlm 24 97 Ibid., hlm. 26-27
46
4). Penilaian hasil belajar aqidah dan akhlak secara nasional dilakukan
dengan mengacu pada kompetensi dasar, hasil belajar, materi standar,
dan indikator yang telah ditetapkan di dalam Kurikulum Nasional.
Penilaian tingkat Naional berfungsi untuk memperoleh informasi dan
data tentang mutu hasil penyelenggaraan mata pelajaran aqidah dan
akhlak
5). Teknik dan instrument penilaian yang digunakan adalah yang dapat
mengukur dengan tepat kemampuan dan usaha belajar peserta didik
6). Penilaian dilakukan melalui tes dan non tes
7). Pengukuran terhadap ranah afektif dapat dilakukan dengan
menggunakan cara non tes, seperti skala penilaian, observasi, dan
wawancara.
8). Penilaian terhadap ranah psikomotorik dengan tes perbuatan dengan
menggunakan lembar pengamatan atau isntrumen lainnya
D. KAJIAN PENELITIAN YANG RELEVAN
Untuk memperoleh gambaran yang jelas tentang posisi penelitian ini di
antara karya-karya yang sudah ada, berikut ini akan penulis ilustrasikan dua
karya yang mengkaji tentang kualitas tes.
Pertama, Mohamad Nurdin (3100330) dalam karya skripsinya yang
berjudul “Uji Validitas dan Reliabilitas Instrumen Tes Objektif Mata Pelajaran
Akhlak kelas III Semester VI di SMP Muhammadiyah 08 Mijen Semarang
Tahun 2003/2004”, menyebutkan bahwa kualitas tes mata pelajaran akhlak
kelas III yang berjumlah 108 siswa pada semester VI di SMP Muhammadiyah
08 Mijen Semarang adalah sebagai berikut:98
1. Ditinjau dari segi validitas butir soalnya adalah cukup / sedang karena
sebanyak 28 butir soal (58 %) dikategorikan valid dan 22 butir soal
lainnya (44 %) adalah invalid.
98 Mohamad Nurdin, “Uji Validitas dan Reliabilitas Instrumen Tes Objektif Mata
Pelajaran Akhlak kelas III Semester VI di SMP Muhammadiyah 08 Mijen Semarang Tahun 2003/2004”, (Perpustakaan Fakultas Tarbiyah IAIN Walisongo Semarang: 2005), t.d, hlm. 67.
47
2. Ditinjau dari segi reliabilitas tesnya adalah cukup / sedang karena nilai
koefisien reliabitasnya (r11) adalah sebesar 0,640.
Kedua, Indras Rahmawati (3101206) dalam karya skripsinya yang
berjudul “Analisis Tingkat Kesukaran, Daya Pembeda dan Efektivitas Fungsi
Distraktor Pada Tes Mata Pelajaran PAI di SMP Negeri 36 Semarang”,
menjelaskan bahwa kualitas tes mata pelajaran PAI kelas II yang berjumlah
207 siswa di SMP Negeri 36 Semarang tahun 2004/2005 adalah sebagai
berikut:99
1. Ditinjau dari segi tingkat kesukarannya adalah cukup / sedang, karena 11,1
% adalah butir soal yang terlalu sukar, 37,8 %butir soal yang cukup dan
51,1 % butir soal lainnya adalah terlalu mudah.
2. Ditinjau dari segi daya pembedanya adalah cukup /sedang, karena 31,1 %
merupakan butir soal yang memiliki daya pembeda lemah, 46,7 %
memiliki daya pembeda cukup dan 20 % memiliki daya pembeda baik.
3. Dinjau dari segi fungsi distraktornya adalah baik karena 63 % dari seluruh
distraktor yang dipasang pada soal tes tersebut telah berfungsi dengan
baik.
Dari kedua penelitian di atas, dapat diketahui bahwa posisi penelitian
ini memang mempunyai tema yang sama yaitu tentang kualitas tes hasil
belajar, akan tetapi berbeda objek penelitiannya, dimana pada penelitian ini
yang menjadi objek penelitian adalah tes bentuk objektif pada mata pelajaran
Aqidah Akhlak pada tingkat Madrasah Aliyah di Kabupaten Demak,
sedangkan objek penelitian dari kedua penelitian sebelumnya adalah tes mata
pelajaran PAI pada tingkat SMP di Kota Semarang.
99 Indras Rahmawati, “Analisis Tingkat Kesukaran, Daya Pembeda dan Efektivitas
Fungsi Distraktor Pada Tes Mata Pelajaran PAI di SMP Negeri 36 Semarang”, (Perpustakaan Fakultas Tarbiyah IAIN Walisongo Semarang: 2005), t.d, hlm. 64-65.