BAB II ofa - Perpustakaan Pusatlibrary.walisongo.ac.id/digilib/files/disk1/32/jtptiain-gdl-s1... ·...

9

BAB II

LANDASAN TEORI : ANALISIS ITEM TES

A. TES

1. Pengertian Tes

Secara harfiah, kata "test" berasal dari bahasa Perancis kuno:

testum yang artinya piring untuk menyisihkan logam-logam mulia. Dalam

bahasa Inggris ditulis dengan "test" yang dalam bahasa Indonesia

diterjemahkan dengan tes, ujian atau percobaan.1

Beberapa istilah yang memerlukan penjelasan sehubungan dengan

masalah di atas, yaitu istilah test, testing, tester dan testee. Test adalah alat

atau prosedur yang dipergunakan dalam rangka pengukuran dan penilaian;

testing berarti saat dilaksanakannya pengukuran dan penilaian; tester

artinya orang yang melaksanakan tes atau pembuat tes; sedangkan testee

adalah peserta tes.2

Adapun dilihat dari segi istilah, definisi tes menurut beberapa

tokoh adalah sebagai berikut:

Lee J. Cronbach dalam bukunya berjudul Essential Of

Psichological Testing menyebutkan bahwa : "A test is a systematic

procedure for Comparing the behavior of two or more persons".3 Tes

adalah suatu prosedur yang sistematis untuk membandingkan tingkah laku

dari dua orang atau lebih.

Clinton I. Chase dalam bukunya yang berjudul Measurement for

Educational Evaluation, menyebutkan bahwa: “A test is systematic

procedure for comparing the performance of an individual with a

designated standard of performance”.4 Tes adalah suatu prosedur yang

1 Anas Sudijono, Pengantar Evaluasi Pendidikan, (Jakarta: Raja Grafindo Persada,

2003), cet. 4, hlm. 66. 2 Ibid. 3 Lee J. Cronbach, Essential of Psychological Testing, (New York: Harper, 1970), hlm.

20. 4 Clinton I. Chase, Measurement for Educational Evaluation, (London: Addison Wesley,

1978), hlm. 6.

10

sistematis untuk membandingkan tingkah laku individu dengan standar

tingkah laku yang telah ditentukan.

Anderson dalam bukunya yang berjudul Encyclopedia of

Educational Evaluation, menjelaskan bahwa : "A test is any series of

questions or exercises or other means of measuring the skill, knowledge,

intelligence, capacities or aptitudes of an individual or group".5 Tes

adalah serangkaian pertanyaan atau latihan atau alat lain yang digunakan

untuk mengukur ketrampilan, pengetahuan, inteligensi, kemampuan atau

bakat yang dimiliki oleh individu atau kelompok

Doughlas Brown mendefinisikan tes sebagai berikut :6 ال معـينجطريقـة لقـياس االفـراد ومـعارفهم في م: تبار خاإل

"Tes adalah cara untuk mengukur pengetahuan individu (testee) dalam bidang tertentu"

Sedangkan Sumardi Suryabrata menjelaskan bahwa:7

Tes adalah pertanyaan-pertanyaan yang harus dijawab dan atau perintah-perintah yang harus dijalankan, yang berdasar atas bagaimana testee menjawab pertanyaan-pertanyaan dan atau melakukan perintah-perintah itu, penyelidik mengambil kesimpulan dengan cara membandingkannya dengan standar atau testee lainnya.

Dari beberapa definisi di atas, maka dapat disimpulkan bahwa tes

adalah cara atau prosedur yang di gunakan untuk mengukur kemampuan

testee dengan memberikan serangkaian pertanyaan yang harus dijawab

oleh testee, sehingga dari hasil pengukuran tersebut dapat dihasilkan nilai

yang dapat di bandingkan dengan nilai-nilai yang dapat dicapai oleh testee

lainnya, atau dibandingkan dengan nilai standar tertentu.

Jadi inti dari suatu tes adalah sebagai berikut:

a. Tes adalah tugas atau serangkaian tugas yang berbentuk pertanyaan-

pertanyaan dan atau perintah-perintah.

5 Anderson, et.al., Encyclopedia of Educational Evaluation, (London: Jossey – Bass Inc.,

1981), hlm. 425 6 Douglas Brown, Ususu at-Ta'allumi al-Lughati wa Ta'limiihaa, terj. Abd. Rajhi dan Ali

Ahmad Syu'ban, (Arab: darun an-Nadhoh, t.t.), hlm. 266. 7 Sumadi Suryabrata, Pembimbing ke Psikodiagnostik, (Yogyakarta: Rake Sarasin, 1984),

hlm. 22.

11

b. Tes itu di berikan kepada testee (seorang atau lebih).

c. Tingkah laku testee dalam mengerjakan tes dapat dibandingkan dengan

sesuatu, yaitu standar tes atau tingkah laku testee lain.

2. Macam-macam Tes

Sebagai alat pengukur, tes dapat dibedakan menjadi beberapa

macam atau golongan tergantung dari segi mana atau dengan alasan apa

penggolongan tes itu dilakukan.

a. Penggolongan menurut objek pengukurannya.

Ditinjau dari segi objek pengukurannya, tes dapat dibedakan

menjadi dua, yaitu tes kepribadian (personality test) dan tes hasil

belajar (achievement test).

1) Tes kepribadian (personality test)

Tes kepribadian adalah tes yang ditujukan untuk mengukur

salah satu atau lebih aspek-aspek non intelektif dari mental atau

psikis seorang individu. Yang termasuk dalam jenis tes ini, antara

lain: pengukuran sikap, pengukuran minat, pengukuran bakat dan

tes inteligensi.8

2) Tes hasil belajar (achievement test)

Tes hasil belajar adalah tes yang digunakan untuk menilai

hasil-hasil pelajaran yang telah diberikan oleh guru kepada murid-

muridnya, atau oleh dosen kepada mahasiswa, dalam jangka waktu

tertentu.9

b. Penggolongan tes menurut fungsinya

Ditinjau dari segi fungsinya, tes dibedakan menjadi empat,

yaitu:

1) Tes penempatan

Tes penempatan adalah tes untuk mengukur kemampuan

dasar yang dimiliki oleh anak didik; kemampuan tersebut dapat

8 M. Chabib Thoha, Teknik Evaluasi Pendidikan, (Jakarta: Raja Grafindo Persada, 1996), hlm. 44.

9 M. Ngalim Purwanto, Prinsip-Prinsip dan Teknik Evaluasi Pengajaran, (Bandung: Remaja Rosdakarya, 1997), hlm. 33.

12

dipakai meramalkan kemampuan peserta didik pada masa

mendatang, sehingga kepadanya dapat dibimbing, diarahkan atau

ditempatkan pada jurusan yang sesuai dengan kemampuan

dasarnya.10

2) Tes formatif

Tes formatif adalah tes untuk mengukur sejauh mana siswa

telah menguasai bahan pelajaran, setelah mengikuti suatu program

kegiatan instruksional tertentu. Tes ini diberikan pada akhir setiap

program kegiatan instruksional sebagai post test.11

3) Tes diagnostik

Tes diagnostik adalah tes yang digunakan untuk

mengetahui sebab kegagalan peserta didik dalam belajar. Oleh

karena itu dalam menyusun butir-butir soal seharusnya

menggunakan item yang memiliki tingkat kesukaran rendah.12

4) Tes sumatif

Tes sumatif adalah tes yang dilaksanakan setelah pemberi

keseluruhan program dalam suatu kegiatan instruksional pada suatu

periode berakhir. Tes ini harus dilaksanakan akhir semester, setelah

diadakannya beberapa tes formatif. Oleh karena itu, bahan tes

sumatif biasanya lebih luas daripada bahan tes formatif.13

c. Penggolongan tes menurut tingkat mutunya

Dilihat dari segi tingkat mutunya, tes dibagi menjadi 2 macam,

yaitu:14

1) Tes buatan guru

Adalah suatu tes yang dibuat dan digunakan oleh seorang

guru sendiri di sekolah. Hasil tes buatan guru dipakai untuk

10 Chabib Thoha dan Abdul Mu’thi, PBM PAI di Sekolah (Eksistensi dan Proses Belajar

Mengajar Pendidikan Agama Islam), (Yogyakarta: Pustaka Pelajar, 1998), hlm. 289. 11 Masidjo, Penilaian Hasil Belajar Siswa di Sekolah, (Yogyakarta: Kanisius, 1995), hlm.

55. 12 James S. Cangelosi, Merancang Tes Untuk Menilai Prestasi Siswa, (Bandung: ITB,

1995), hlm. 48. 13 Masidjo, op.cit., hlm. 56. 14 Ibid., hlm. 57-58.

13

mengetahui antara lain kedudukan prestasi belajar siswa di

kelasnya setelah mengikuti suatu kegiatan instruksional suatu mata

pelajaran dan mengetahui kemajuannya dan sebagainya.

2) Tes Standar

Tes standar adalah suatu tes yang distandarisasikan atau

yang disusun secara cermat oleh seorang atau tim ahli penyusun tes

melalui uji coba berkali-kali, sehingga tes tersebut memiliki mutu

yang tinggi. Dengan demikian, taraf kesukaran item, taraf pembeda

item, taraf validitas tes, dan taraf reliabilitas tesnya sudah

meyakinkan.

d. Penggolongan lain-lain15

Dari segi banyaknya orang yang mengikuit tes, tes dibedakan

menjadi dua macam, yaitu:

1) Tes individual, yaitu tes dimana tester hanya berhadapan dengan

satu orang testee saja.

2) Tes Kelompok, yaitu tes dimana tester berhadapan dengan lebih

dari satu orang testee.

Dari segi bentuk responnya, tes dapat dibedakan menjadi 2

macam, yaitu:

1) Verbal Test, yakni suatu tes yang menghendaki respon (jawaban)

yang tertuang dalam bentuk ungkapan kata-kata atau kalimat, baik

secara lisan maupun secara tertulis

2) Non Verbal Test, yakni tes yang menghendaki respon (jawaban)

dari testee bukan berupa ungkapan kata-kata atau kalimat,

melainkan berupa tindakan atau tingkah laku.

Dilihat dari segi cara mengajukan pertanyaan dan cara

memberikan jawabannya, tes dapat dibedakan menjadi 2 macam, yaitu:

1) Tes tertulis, yakni tes yang dilaksanakan secara tertulis, baik

pertanyaan maupun jawaban.

15 Anas Sudijono, op.cit., hlm. 74-75.

14

2) Tes lisan, yakni tes dimana tester di dalam mengajukan pertanyaan-

pertanyaan atau soalnya dilakukan secara lisan, dan tester

memberikan jawabannya secara lisan pula.

3. Bentuk-Bentuk Tes

Sebagai alat pengukur perkembangan dan kemajuan belajar peserta

didik, apabila ditinjau dari segi bentuk soalnya, tes hasil belajar dapat

dibedakan menjadi 2 macam, yaitu : tes subjektif (bentuk uraian) dan tes

bentuk objektif.

a. Tes Subjektif (bentuk uraian)

Tes bentuk uraian adalah sejenis tes kemajuan belajar yang

memerlukan jawaban yang bersifat pembahasan atau uraian kata-kata.

Ciri-ciri pertanyaannya didahului dengan kata-kata seperti; uraikan,

jelaskan, mengapa, bagaimana, bandingkan, simpulkan, dan

sebagainya..16

Tes bentuk uraian dibedakan atas dua jenis, yaitu :17

1) Uraian bebas, yakni tes yang soal-soalnya harus dijawab dengan

uraian secara bebas.

2) Uraian terbatas, yakni tes yang soalnya menuntut jawaban dalam

bentuk uraian yang telah terarah.

Tes bentuk uraian (tes subjektif) mempunyai beberapa

kelebihan, yaitu :

1) Mudah disiapkan dan disusun.

2) Tidak banyak memberi kesempatan untuk berspekulasi atau

untung-untungan.

3) Mendorong siswa untuk berani mengemukakan pendapat serta

menyusun kalimat dalam bentuk yang bagus.

4) Memberi kesempatan kepada siswa untuk mengutarakan

maksudnya dengan gaya bahasa dan caranya sendiri.

16 Suharsimi Arikunto, Dasar-Dasar Evaluasi Pendidikan, (Jakarta: Bumi aksara, 2001),

cet. 2, hlm. 162. 17 R. Ibrahim, Perencanaan Pengajaran, (Jakarta: Rineka Cipta, 1995), hlm. 90.

15

5) Dapat diketahui sejauh mana siswa mendalami suatu masalah yang

diteskan.

Adapun beberapa kelemahan dari tes bentuk uraian, adalah :

1) Kadar validitas dan realibilitasnya rendah dan sukar diketahui segi-

segi mana dari pengetahuan siswa yang betul-betul dikuasai.

2) Kurang representatif dalam hal mewakili seluruh scope bahan

pelajaran karena soalnya hanya beberapa saja (terbatas).

3) Cara memeriksanya banyak dipengaruhi oleh unsur-unsur

subjektif.

4) Pemeriksaannya lebih sulit karena membutuhkan pertimbangan

individual lebih banyak dari penilai.

5) Waktu untuk koreksinya lama dan tidak dapat diwakilkan kepada

orang lain.18

b. Tes Objektif

Tes Objektif adalah tes yang dibuat sedemikian rupa sehingga

hasil tes tersebut bisa dinilai secara objektif, dinilai oleh siapapun akan

menghasilkan nilai yang sama. Tes objektif disebut juga short answer

test, karena memerlukan jawaban ringkas dan pendek-pendek.19

Sebagai salah satu bentuk tes hasil belajar, tes objektif dapat

dibedakan menjadi lima macam, yaitu :

1) Tes objektif bentuk benar-salah (True-false test).

True-false Test adalah suatu bentuk tes dimana itemnya

berupa statement yang mengandung dua kemungkinan : benar atau

salah.20

2) Tes objektif bentuk menjodohkan (Matching Test).

Matching Test yaitu suatu bentuk tes dimana disediakan

dua kelompok bahan, dan testee harus mencari pasangan-pasangan

yang sesuai antara yang terdapat pada kelompok pertama dan

18 Suharsimi Arikunto, op.cit., hlm. 163. 19 Harjanto, Perencanaan Pengajaran, (Jakarta: Rineka Cipta, 2000), cet. 2, hlm. 279. 20 M. Chabib Thoha, op.cit., hlm. 69.

16

bahan yang terdapat pada kelompok kedua, sesuai dengan petunjuk

pada tes itu.21

3) Tes objektif bentuk melengkapi (Completion Test).

Completion Test yaitu salah satu bentuk tes objektif

dimana butir-butir soalnya berupa satu kalimat dimana bagian-

bagian tertentu yang dianggap penting dikosongkan kemudian

kepada testee diminta untuk mengisi bagian-bagian yang

ditiadakan tersebut.22

4) Tes objektif bentuk Isian (Fill in Test).

Fill in Test yaitu suatu tes yang biasanya berbentuk cerita

atau karangan dimana kata-kata penting dalam cerita tersebut

dikosongkan, kemudian testee diminta untuk mengisi bagian-

bagian yang telah dikosongkan itu.23

5) Tes objektif bentuk pilihan ganda (Multiple Choice Item Test).

Multiple Choice Item yaitu tes bentuk objektif yang terdiri

atas pertanyaan atau pernyataan yang sifatnya belum selesai, dan

untuk menyelesaikannya harus dipilih salah satu dari beberapa

kemungkinan jawaban yang telah disediakan pada tiap-tiap butir

soal yang bersangkutan.24

Tes objektif mempunyai beberapa kelebihan, diantaranya:25

1) Lebih representatif mewakili isi dan luas materi pelajaran.

2) Lebih objektif dalam penilaian dan dapat diserahkan kepada orang

lain.

3) Pemeriksaannya dapat diserahkan orang lain

4) Dalam pemeriksaan tidak ada unsur subjektif yang mempengaruhi

5) Lebih mudah dan cepat memeriksanya karena menggunakan kunci

tes bahkan alat-alat kemajuan teknologi.

21 Sumadi Suryabrata, Psikologi Pendidikan, (Jakarta: Rajka Grafindo Persada, 1993),

cet. 6, hlm. 344. 22 M. Chabib Thoha, op.cit., hlm. 67. 23 Anas Sudjono, op.cit., hlm. 114. 24 Ibid., hlm. 118. 25 Suharsimi Arikunto, op.cit., hlm. 164

17

Adapun kelemahan-kelemahan dari tes bentuk ini, adalah :26

1) Persiapan untuk menyusunnya lebih sulit karena soalnya banyak

dan harus diteliti.

2) Sukar untuk mengukur proses mental yang tinggi.

3) Banyak kesempatan untuk main untung-untungan (spekulasi).

4) "Kerjasama" antar siswa pada waktu mengerjakan soal tes lebih

terbuka.

4. Kriteria Tes Yang Baik

Menurut Sumadi Suryabrata dalam bukunya "Psikologi

Pendidikan" menyebutkan bahwa kriteria dari suatu tes yang baik, adalah

sebagai berikut:27

a. Valid

Suatu tes dikatakan valid apabila tes tersebut mengukur apa

yang seharusnya diukur.

b. Reliable

Suatu tes dikatakan reliable apabila tes tersebut memiliki

ketetapan hasil atau consistency. Artinya jika tes tersebut diberikan

kepada subjekf yang sama pada waktu yang berbeda maka hasilnya

akan tetap sama atau hampir sama.

c. Obyektif

Obyektivitas adalah suatu faktor yang penting yang dapat

mempengaruhi validitas dan reliabilitas. Suatu tes dikatakan memiliki

obyektivitas apabila dalam melaksanakan tes itu tidak ada faktor

subjekftif yang mempengaruhi, baik dari segi scoring-nya maupun dari

segi interpretasi terhadap score pada tes tersebut.

d. Diskriminatif

Suatu tes tersebut diskriminatif apabila tes tersebut disusun

sedemikian rupa sehingga menunjukkan perbedaan-perbedaan kecil

26 Ibid., hlm. 165 27 Sumadi Suryabrata, op.cit., hlm. 327-330.

18

diantara para testee. Makin baik suatu tes maka makin dapatlah tes itu

membuat perbedaan secara teliti.

e. Komprehensif

Suatu tes dikatakan komprehensif apabila tes tersebut

mencakup segala persoalan yang harus diselidiki. Jadi dalam

menyelidiki hasil pelajaran yang telah diterima oleh peserta didik,

maka tes itu harus dapat memberi informasi tentang seluruh bahan

yang telah diajarkan itu, tidak hanya sebagian saja.

f. Praktis

Kriteria untuk mengukur praktis tidaknya suatu tes hasil belajar

dapat ditinjau dari:28

1) Biaya yang diperlukan untuk menyelenggarakan tes itu

2) Waktu yang diperlukan untuk menyusun tes

3) Sukar – mudahnya menyusun tes itu

4) Sukar – mudahnya menilai tes itu

5) Sulit tidaknya menginterpretasikan (mengolah) hasil tes itu

6) Lamanya waktu yang diperlukan untuk melaksanakan tes itu.

5. Kegunaan Tes

Suharsimi Arikunto dalam bukunya "Dasar-Dasar Evaluasi

Pendidikan" menyebutkan bahwa kegunaan atau fungsi tes dapat ditinjau

dari tiga segi, yaitu :29

a. Fungsi untuk kelas, diantaranya :

1) Mengadakan diagnosis terhadap kesulitan belajar siswa

Sebagaimana disebutkan oleh Muhammad Atiyah Al-Abrosyi,

bahwa :30

ات المدرس ن : ةياالمتحان ون م تفاده المتعلم ا اس دار م ة مق لمعرف لتدارك ما يبدو منهم من ضعف, المواد التي درسوها

28 M. Chabib Toha, op.cit., hlm. 142. 29 Suharsimi Arikunto, op.cit., hlm. 152. 30 Muhammad Atiyah al-Abrosyi, Ruhu at-Tarbiyah wa Ta'lim, (Arab: Darul Haya,

1950), hlm. 362.

19

"Tes digunakan untuk mengetahui sejauh mana kemampuan para siswa dalam menerima materi-materi pelajaran yang dipelajarinya dan untuk menemukan kesulitan-kesulitan belajar mereka"

2) Mengevaluasi celah antara bakat dengan pencapaian.

3) Menaikkan tingkat prestasi.

4) Mengelompokan siswa dalam kelas pada waktu metode kelompok.

5) Menentukan siswa mana yang memerlukan bimbingan khusus

6) Merencanakan kegiatan proses belajar mengajar untuk siswa secara

perseorangan.

7) Menentukan tingkat pencapaian hasil belajar untuk setiap anak

b. Fungsi untuk Bimbingan

1) Menentukan arah pembicaraan dengan orang tua tentang anak-anak

mereka.

2) Membantu siswa dalam menentukan pilihan.

3) Membantu siswa mencapai tujuan pendidikan dan jurusan.

4) Memberi kesempatan kepada pembimbing, guru, dan orang tua

dalam memahami kesulitan anak.

c. Fungsi untuk Administrasi

1) Memberi petunjuk dalam mengelompokkan siswa.

2) Penempatan siswa baru.

3) Membantu siswa memilih kelompok.

4) Menilai kurikulum.

5) Memperluas hubungan masyarakat (public relation).

6) Menyediakan informasi untuk badan-badan lain di luar sekolah.

B. ANALISIS ITEM TES

Salah satu cara untuk memperbaiki proses belajar-mengajar yang

paling efektif ialah dengan jalan mengevaluasi tes hasil belajar yang di peroleh

dari proses belajar-mengajar itu sendiri. Dengan kata lain, hasil tes itu kita

oleh sedemikian rupa sehingga dari hasil pengolahan itu dapat di ketahui

komponen-komponen manakah dari proses belajar-mengajar itu yang masih

lemah.

20

Pengolahan tes hasil belajar dalam rangka memperbaiki proses belajar-

mengajar dapat di lakukan dengan membuat analisis soal (item analysis).

1. Pengertian Analisis Item Tes

Analisis soal (item analysis) adalah suatu kegiatan yang berkaitan

dengan proses mengumpulkan, meringkas, dan menggunakan informasi

tentang jawaban siswa terhadap butir soal tes tersebut.31

Nana Sudjana menyebutkan bahwa analisis item tes adalah

pengkajian pertanyaan-pertanyaan tes agar diperoleh perangkat pertanyaan

yang memiliki kualitas yang memadai.32

Menurut Saifuddin Azwar, analisis item tes adalah pengujian

seluruh item tes yang didasarkan pada item empirik (data yang diperoleh

dari hasil pengenaan tes yang sesungguhnya), agar diperoleh bukti

mengenai kualitas item-item tes.33

Sedangkan menurut Wilmar Tinambunan dalam bukunya yang

berjudul "Evaluation of student Achievement" menyebutkan bahwa "The

item analysis is reexamining each test item to discover its strength and

flaws".34 Analisis item adalah pengujian terhadap setiap butir tes agar

diketahui kelebihan dan kelemahan-kelemahan dari butir tes tersebut.

Berdasarkan beberapa definisi di atas, maka dapat disimpulkan

bahwa analisis item tes adalah proses pengkajian butir-butir tes hasil

belajar yang didasarkan pada jawaban siswa terhadap tes tersebut,

sehingga dapat diketahui kualitas dari suatu tes sebagai alat pengukur hasil

belajar siswa.

2. Unsur-unsur Analisis Item Tes

Analisis soal (item analysis) merupakan salah satu cara untuk

menilai kualitas suatu tes hasil belajar.

31 Suke Silverius, Evaluasi Hasil Belajar dan Umpan Balik, (Jakarta: Gramedia, 1991), hlm. 166.

32 Nana Sudjana, Penilaian Hasil Proses Belajar Mengajar, (Bandung: Remaja Rosdakarya offset, 1991), hlm. 135.

33 Saifuddin Azwar, Tes Prestasi (Fungsi Pengembangan Pengukuran Prestasi Belajar), (Yogyakarta: Pustaka Pelajar offset, 2000), hlm. 130.

34 Wilmar Tinambunan, Evaluation of Student Achievement, (Jakarta: Departemen Pendidikan dan Kebudayaan, 1988), hlm. 137.

21

Kualitas tes hasil belajar ditentukan oleh kualitas dari item-

itemnya. Untuk mengetahui apakah masing-masing butir tes itu

mempunyai kualitas yang baik, maka dapat dilakukan analisis terhadap

lima hal, yaitu: validitas, reliabilitas, tingkat kesukaran, daya beda dan

efektivitas fungsi distraktor.

a. Validitas

1) Pengertian Validitas

Suatu tes disebut valid apabila tes tersebut dapat mengukur

apa yang hendak dan seharusnya diukur.35

Validitas adalah suatu konsep yang berkaitan dengan sejauh

mana tes telah mengukut apa yang seharusnya diukur.36

William wiesma menyebutkan bahwa : "Validity is the

extent to which a test measure what it is intended to measure".

Validitas adalah sejauh mana sebuah tes dapat mengukur apa yang

seharusnya diukur.37

Menurut Nana Sudjana, validitas adalah ketepatan alat

penilaian terhadap konsep yang dinilai sehingga betul-betul menilai

apa yang seharusnya dinilai.38

Dari beberapa definisi di atas, dapat disimpulkan bahwa

suatu tes dapat dikatakan valid yaitu apabila tes tersebut dapat

mengukur apa yang hendak dan seharusnya diukur.

Sedangkan yang dimaksud dengan validitas item tes adalah

ketepatan mengukur yang dimiliki oleh sebutir item (yang

merupakan bagian yang tak terpisahkan dari tes sebagai suatu

totalitas), dalam mengukur apa yang seharusnya diukur lewat butir

item tersebut.39

35 Mudjijo, Tes Hasil Belajar, (Jakarta: Bumi Aksara, 1995), hlm. 40. 36 Sumartana Suryapranata, Analisis, Validitas, Reliabilitas, dan Interpretasi Hasil Tes,

(Bandung: Remaja Rosdakarya, 2004), hlm. 50. 37 William Wiersma dan Stephen G. Jurs, Educational Measurement And Testing, (United

States of Amerika: University Toledo, 1990), hlm. 183. 38 Nana Sudjana, op.cit., hlm. 12. 39 Anas Sudijono, op.cit., hlm. 182.

22

2) Teknik Analisis Validitas

Validitas adalah salah satu ciri tes hasil belajar yang baik.

Untuk menentukan apakah suatu tes hasil belajar telah memiliki

validitas atau daya ketepatan mengukur, dapat dilihat dari dua segi,

yaitu dari segi tes itu sendiri sebagai totalitas (validitas tes), dan

dari segi itemnya, sebagai bagian tak terpisahkan dari tes tersebut

(validitas item tes).40

a) Validitas tes

Penganalisisan terhadap validitas tes dapat dilakukan

dengan dua cara. Pertama, penganalisisan yang dilakukan

dengan jalan berpikir secara rasional (validitas rasional).

Kedua, penganalisisan yang dilakukan dengan mendasarkan

diri kepada kenyataan empiris (validitas empiris).

Analisis validitas rasional atau logis dapat dilihat dari

dua segi, yaitu:

(1) Validitas isi (content validity)

Validitas isi adalah validitas yang ditilik dari segi isi

tes itu sendiri sebagai alat pengukur hasil belajar yaitu;

sejauh mana tes hasil belajar sebagai alat pengukur hasil

belajar peserta didik, isinya telah dapat mewakili secara

representatif terhadap keseluruhan materi atau bahan

pelajaran yang seharusnya diteskan.41

(2) Validitas konstruksi (contruct validity)

Suatu tes dikatakan memiliki validitas konstruksi

apabila butir-butir soal yang membangun tes tersebut

40 Ibid., hlm. 163. 41 Ibid., hlm. 164.

23

mengukur setiap aspek berpikir seperti yang disebutkan

dalam tujuan instruksional khusus.42

Adapun analisis validitas empiris juga dapat dilihat dari

dua segi, yaitu:

(1) Validitas ramalan (predictive validity)

Suatu tes dikatakan memiliki validitas ramalan jika

hasil korelasi tes itu dapat meramalkan dengan tepat

keberhasilan seseorang pada masa mendatang di dalam

lapangan tertentu. Tepat tidaknya ramalan tersebut dapat

dilihat dari korelasi koefisien antara hasil tes itu dengan alat

ukur lain pada masa mendatang.43

(2) Validitas bandingan (concurren validity)

Suatu tes dikatakan memiliki validitas bandingan

apabila tes tersebut dalam kurun waktu yang sama secara

tepat telah mampu menunjukkan adanya hubungan yang

searah, antara tes pertama dengan tes berikutnya.44

b) Validitas item tes

Apa yang sudah dibicarakan di atas adalah validitas tes

secara keseluruhan. Disamping mencari validitas tes, perlu juga

dicari validitas item sebagai bagian dari validitas tes. Jika

seorang peneliti atau seorang guru mengetahui bahwa validitas

tes misalnya terlalu rendah atau rendah saja, maka selanjutnya

ingin mengetahui butir-butir manakah yang menyebabkan soal

secara keseluruhan jelek karena memiliki validitas tes rendah.

Maka untuk keperluan inilah dicari validitas butir soal

(validitas item).

Sebuah item memiliki validitas yang tinggi, jika skor

pada item mempunyai kesejajaran dengan skor total.

42 Suharsimi Arikunto, op.cit., hlm. 67. 43 M. Ngalim Purwanto, op.cit., hlm. 138 44 Anas Sudijono, op.cit., hlm. 176-177.

24

Kesejajaran ini dapat diartikan dengan korelasi sehingga untuk

mengetahui validitas item digunakan rumus korelasi.45

Untuk soal-soal bentuk objektif, skor untuk item

biasanya diberikan dengan 1 (bagi item yang dijawab benar)

dan 0 (bagi item yang dijawab salah), sedangkan skor total

selanjutnya merupakan jumlah dari skor untuk semua item

yang membangun soal tersebut.

Salah satu teknik korelasi yang terkenal untuk

menghitung validitas item adalah menggunakan teknik korelasi

point biserial (rpbi), dengan rumus: 46

qp

SDtMtMpr

bip−

=

Keterangan:

rpbi = Koefisien korelasi point biserial Mp = Relata skor dari subjekf yang menjawab betul bagi item

yang dicari validitasnya Mt = Relata skor total SDt = Standar deviasi dari skor total p = Proporsi testee yang menjawab betul terhadap item

yang sedang di uji validitasnya q = Proporsi siswa yang menjawab salah

b. Reliabilitas

1) Pengertian Reliabilitas

Rebialitas sering diartikan dengan keterandalan. Artinya

suatu tes memiliki keterandalan bilamana tes tersebut dipakai

mengukur berulang-ulang hasilnya sama.47

Menurut Muhammad Abdul Kholik dalam bukunya yang

berjudul "Ikhtibaarotun al Lughoh", menyebutkan bahwa:48

ه أن ذات عدم التذب بالثب يقصد :الثبات ا قصد ب ار اذا م ب فى االختب يكون بمثابة المقياس

45 Suharsimi Arikunto, op.cit., hlm. 76. 46 Anas Sudijono, op.cit., hlm. 185. 47 M. Chabib Thoha, op.cit., hlm. 118. 48 Muhammad Abdul Kholik, Ikhtibaarotun al-Lughoh, (Riyadh: Jami'ah Malik Su'ud,

1989), hlm. 39.

25

"Reliabilitas tes adalah tidak adanya perubahan-perubahan dalam tes yang dilaksanakan dengan menggunakan tes yang serupa"

Charles E. Skinner dalam bukunya yang berjudul "Essentials

of Educational Psychology" menyebutkan bahwa: "A test is

reliable if it measures consintenly". Suatu tes dikatakan reliabel

yaitu apabila tes tersebut dapat mengukur secara ajeg atau

konsisten.49

Adapun Anne Anastasi dalam bukunya Psychological

testing, menjelaskan bahwa: "Reliability refers to the consistency

of scores obtained by the same persons when they are reexamined

with the same test on different occasions".50 Reliabilitas adalah

keajegan atau ketetapan nilai yang diperoleh dari individu-individu

yang sama ketika mereka diuji dengan tes yang sama pada waktu

yang berbeda.

Dari definisi-definisi di atas, maka dapat disimpulkan bahwa

reliabilitas tes adalah suatu tes yang memberikan hasil yang relatif

sama kapanpun tes itu diujikan kepada sejumlah testee yang sama.

2) Faktor-faktor yang mempengaruhi reliabilitas

a) Luas tidaknya sampling yang diambil

Makin luas suatu sampling, berarti tes makin andal.

b) Perbedaan bakat dan kemampuan murid yang di tes

Makin variabel kemampuan peserta tes, berarti makin tinggi

keandalan koefisien tes. Tes yang diberikan kepada beberapa

tingkat kelas yang berbeda lebih tinggi keandalannya daripada

yang hanya diberikan kepada beberapa kelas yang sama karena

tingkat kelas yang berbeda akan menghasilkan achievement

yang lebih luas.

c) Suasana dan kondisi testing

49 Charles E. Skinner (ed), Essentials of EducationalPsychology, (englewood Cliffs:

Prentice – Hall inc., t.t.), hlm. 443. 50 Anne Anastasi dan Susana Urbina, Psychological Testing, (New York: Prentice – Hall

Inc., 1984), hlm. 84.

26

Suasana ketika sedang berlangsung testing, seperti tenang,

gaduh, banyak gangguan, pengetes yang marah-marah dapat

mengganggu pengerjaan tes sehingga dapat mempengaruhi

pula hasil dan keandalan tes.51

3) Teknik Analisis Reliabilitas Tes

Dalam rangka menentukan apakah tes hasil belajar bentuk

objektif yang disusun oleh tester telah memiliki keajegan

mengukur ataukah belum, maka dapat dilakukan dengan

menggunakan tiga pendekatan.

a) Pendekatan Single Test-Single Trial (Single Test-Single Trial

Method)

Pendekatan Single Test-Single Trial adalah pendekatan

"serba single" atau pendekatan "serba satu", yaitu satu

kelompok subjek, satu jenis alat pengukur, dan satu kali

pengukuran; atau satu kelompok testee, satu jenis tes, dan satu

kali testing.

Dengan menggunakan pendekatan ini, maka tinggi

rendahnya reliabilitas tes bentuk objektif dapat diketahui

dengan melihat besar kecilnya koefisien realibilitas tes (r11).

Adapun untuk menghitung atau mencari r11 dapat digunakan

lima jenis formula, yaitu : (1) formula Spearman-Brown, (2)

Formula Flanagan, (3) Formula Rulon, (4) Formula Kuder-

Richardson dan (5) Formula C. Hoyt.52

b) Pendekatan Test-retest (single test-double trial)

Pendekatan test-retest adalah pendekatan untuk menguji

reliabilitas tes dengan jalan menguji tes tersebut dua kali atau

lebih, kemudian hasilnya dikorelasikan.

51 Ngalim Purwanto, op.cit., hlm. 141. 52 Ibid., hlm. 214.

27

Pada pendekatan ini, penentuan reliabilitas tes

didasarkan pada konsistensi dari "batang tubuh" tes yang

bersangkutan, yang terbangun dari kumpulan butir-butir item.

Adapun langkah-langkah yang dapat ditempuh pada uji

reliabilitas ini adalah sebagai berikut :53

(1) Menyusun sebuah tes yang akan diukur reliabilitasnya.

(2) Mengujikan tes yang tersusun tersebut (tahap I).

(3) Menghitung skor hasil tes tahap I.

(4) Mengujikan ulang tes yang tersusun tersebut (tahap II).

(5) Menghitung skor hasil tes ulang (tahap II).

(6) Menghitung reliabilitas tes dengan jalan mengkorelasikan

skor tes I dengan skor tes II dengan rumus korelasi product

moment.

c) Pendekatan Alternate Form (double test-double trial)

Pendekatan alternate form adalah pendekatan untuk

menguji reliabilitas tes dengan jalan menyusun dua buah tes

yang memiliki kemiripan atau kesamaan untuk diujikan kepada

sekelompok testee tanpa adanya tenggang waktu.

Adapun langkah-langkah yang dapat ditempuh dalam

pendekatan ini adalah :54

(1) Menyusun dua buah tes yang sejenis.

(2) Mengujikan tes tersebut (dalam waktu yang bersamaan atau

beriringan).

(3) Memberikan skor hasil tes yang telah diujikan, disusun

dengan memisahkan antara tes A dan tes B.

(4) Mencari koefisien stabilitas kedua tes (A dan B) dengan

jalan mencari korelasinya melalui rumus korelasi product

moment.

53 M. Chabib Thoha, op.cit., hlm. 119-120. 54 Ibid., hlm. 122-123.

28

Dari ketiga pendekatan di atas, yang lebih tepat untuk

menentukan reliabilitas tes hasil belajar bentuk objektif secara

langsung terhadap butir-butir tes hasil belajar adalah pendekatan

single test-single trial yang berbentuk formula Kuder-Richardson

dengan salah satu rumusnya yaitu K-R2055

.

Adapun cara menggunakan rumus K-R20 adalah:56

a) Membuat tabel analisis butir tanpa harus dikelompokan nomor

ganjil dan genap.

b) Menghitung proporsi yang menjawab benar dan proprosi yang

menjawab salah pada masing-masing butir dalam tabel analisis

butir.

c) Mengalikan proporsi yang menjawab benar dan proporsi yang

menjawab salah.

d) Mencari varians (standar deviasi kuadrat) dari skor total.

e) Menghitung reliabilitas tes dengan rumus K-R20.

⎥⎦

⎤⎢⎣

⎡ Σ−⎥⎦⎤

⎢⎣⎡

−= 2

2

11 StpiqiSt

1nnr

Keterangan: r11 = Koefisien reliabilitas tes n = Banyaknya butir item I = Bilangan konstan St2 = Varian total pi = Proporsi testee yang menjawab benar qi = Proporsi testee yang menjawab salah = Jumlah dari hasil perkalian pi dengan qi

c. Tingkat Kesukaran

1) Pengertian tingkat kesukaran item

Tingkat kesukaran Item adalah pernyataan tentang seberapa

mudah dan seberapa sulit sebuah butir soal bagi siswa yang dikenai

pengukuran.57

55 Anas Sudijono, op.cit., hlm. 252. 56 M. Chabib Thoha, op.cit., hlm. 133-134. 57 Burhan Nurgiyanto, Penilaian Dalam Pengajaran Bahasa dan Sastra, (Yogyakarta:

BPFE, 1987), hlm. 126.

29

Suke Silverius menyebutkan bahwa tingkat kesukaran item

adalah persentase siswa yang dapat menjawab benar butir soal

tersebut.58

Adapun menurut Anne Anatasi dalam bukunya

Psychological Testing menjelaskan bahwa; "The difficulty of an

item is defined in terms of the precentage of persons who answer it

correctly".59 Tingkat kesukaran suatu butir soal adalah ditandai

oleh persentase siswa (testee) yang menjawab dengan benar

terhadap butir soal yang bersangkutan.

Dari beberapa pengertian di atas, dapat disimpulkan tingkat

kesukaran adalah seberapa besar tingkat kesukaran suatu butir soal

yang ditunjukkan dengan persentase siswa yang menjawab benar

terhadap butir soal tersebut.

2) Teknik analisis tingkat kesukaran

Asumsi yang digunakan untuk memperoleh kualitas soal

yang baik, disamping memenuhi validitas dan reliabilitas adalah

adanya keseimbangan dari tingkat kesulitan soal tersebut.

Keseimbangan yang dimaksudkan adalah adanya soal-soal yang

termasuk mudah, sedang, dan sukar secara proporsional. Tingkat

kesukaran soal dipandang dari kesanggupan atau kemampuan

siswa dalam menjawabnya, bukan dilihat dari sudut guru sebagai

pembuat soal.60

Secara tentatif dapat dikatakan bahwa salah satu ciri butir

soal yang baik adalah bahwa ia tidak terlalu sukar dan tidak terlalu

mudah untuk kelompok tertentu yang akan dites.61

Cara yang dapat ditempuh untuk mengetahui apakah item

tes hasil belajar itu sudah memiliki tingkat kesukaran yang

58 Suke Silverius, op.cit., hlm. 167. 59 Anne Anastasi, Psychological Testing, (New York: Macmillan Publishing Inc., 1976),

hlm. 199. 60 Nana Sudjana, op.cit., hlm. 135. 61 Mudjijo, op.cit., hlm. 62.

30

memadai ataukah belum, maka dapat diketahui dari besar kecilnya

indeks kesukaran item (difficulty index).

Difficulty index (indeks kesukaran item) adalah bilangan

atau angka yang menunjukkan sukar mudahnya suatu item soal.

Besarnya indeks kesukaran antara 0,00 sampai dengan 1,00 artinya,

soal dengan indeks kesukaran 0,00 menunjukkan bahwa soal itu

terlalu sukar, sebaliknya indeks 1,00 menunjukkan bahwa soalnya

terlalu mudah. Untuk lebih jelasnya perhatikan bagan di bawah ini:

0,00 1,00

terlalu sukar terlalu mudah

Di dalam istilah evaluasi, indeks kesukaran ini diberi

simbol P, singkatan dari kata "proporsi". Dengan demikian maka

soal dengan P = 0,70 lebih mudah jika dibandingkan dengan P =

0,20. Sebaliknya soal dengan P = 0,30 lebih sukar dari pada soal

dengan P = 0,80.62

Melihat besarnya bilangan indeks ini maka lebih cocok jika

bukan disebut sebagai indeks kesukaran tetapi indeks kemudahan

atau indeks fasilitas, karena semakin mudah soal itu, semakin besar

pula bilangan indeksnya. Akan tetapi telah disepakati bahwa

walaupun semakin tinggi indeksnya menunjukkan soal yang

semakin mudah, tetapi tetap disebut indeks kesukaran.63

Angka indeks kesukaran (P) dapat diperoleh dengan

menggunakan rumus sebagai berikut:64

NNP P=

keterangan: P = Indeks kesukaran (proporsi) NP = banyaknya siswa yang menjawab soal itu dengan benar N = Jumlah seluruh siswa peserta tes (testee)

62 Daryanto, Evaluasi Pendidikan, (Jakarta: Rineka Cipta, 2001), cet. 2, hlm. 180. 63 Suharsimi Arikunto, op.cit., hlm. 208. 64 Anas Sidijono, op.cit., hlm. 372.

31

Sebagai tindak lanjut hasil analisis terhadap tingkat

kesukaran item tes, maka perlu dilakukan hal-hal sebagai berikut:65

Pertama, untuk butir-butir item yang tingkat kesukarannya

cukup atau sedang, maka butir item tersebut segera dicatat dalam

buku bank soal. Selanjutnya butir-butir soal tersebut dapat

dikeluarkan lagi dalam tes-tes hasil belajar pada waktu-waktu yang

akan datang.

Kedua, untuk butir-butir item yang termasuk dalam kategori

terlalu sukar, ada tiga kemungkinan tindak lanjut, yaitu: (1) Butir

item tersebut dibuang atau didrop dan tidak akan dikeluarkan lagi

dalam tes-tes hasil belajar yang akan datang. (2) Diteliti ulang,

dilacak dan ditelusuri sehingga dapat diketahui faktor yang

menyebabkan butir item yang bersangkutan sulit dijawab oleh

testee; apakah kalimat soalnya kurang jelas, apakah petunjuk

mengerjakan soalnya sulit dipahami, ataukah dalam soal tersebut

terdapat istilah-istilah yang tidak jelas, dan sebagainya. Setelah

dilakukan perbaikan kembali, butir-butir item tersebut dikeluarkan

lagi dalam tes hasil belajar yang akan datang. (3) Butir-butir item

tersebut dapat diambil manfaatnya, yaitu dapat digunakan dalam

tes-tes (terutama tes seleksi) yang sifatnya sangat ketat, dalam arti;

sebagian besar dari testee tidak akan diluluskan dalam tes seleksi

tersebut.

Ketiga, untuk butir-butir item yang termasuk dalam

kategori terlalu mudah, juga ada tiga kemungkinan tindak

lanjutnya, yaitu: (1) Butir item tersebut dibuang atau didrop dan

tidak akan dikeluarkan lagi dalam tes hasil belajar yang akan

datang. (2) Diteliti ulang, dilacak dan ditelusuri secara cermat guna

mengetahui faktor yang menyebabkan butir item tersebut dapat

dijawab betul oleh hampir seluruh testee; ada kemungkinan option

atau alternatif yang dipasang pada butir-butir item tersebut "terlalu

65 Ibid., hlm. 375-378.

32

mudah diketahui" oleh testee; mana option yang merupakan kunci

jawaban item dan mana option yang berfungsi sebagai pengecoh.

Di sini testee harus berusaha memperbaiki atau menggantinya

dengan option yang lain sehingga antara kunci jawaban dengan

pengecoh sulit dibedakan oleh tester. Setelah dilakukan perbaikan,

item tersebut dicoba untuk dikeluarkan lagi pada tes berikutnya. (3)

butir-butir item ini dapat dimanfaatkan pada tes-tes (terutama tes

seleksi) yang sifatnya longgar, dalam arti bahwa sebagian besar

dari testee akan dinyatakan lulus dalam tes seleksi.

d. Daya Pembeda

1) Pengertian Daya Pembeda Item

Daya pembeda suatu soal tes adalah bagaimana

kemampuan soal itu untuk membedakan siswa-siswa yang

termasuk kelompok pandai (upper group) dengan siswa-siswa yang

termasuk kelompok kurang (lower group)66

Menurut Wilmar Tinambunan, "The discriminating power

of a test item is its ability to differentiate between pupils who have

achieved well (the upper group) and those who have achieved

poorly (the lower group)". 67 Daya pembeda item tes adalah

kemampuan item tes tersebut untuk membedakan antara siswa-

siswa yang berkemampuan tinggi dengan siswa-siswa yang

berkemampuan rendah.

Sedangkan Anas Sudijono menjelaskan bahwa:68

Daya pembeda item adalah kemampuan suatu butir item tes hasil belajar untuk dapat membedakan antara testee yang berkemampuan tinggi (pandai) dengan testee yang kemampuannya rendah (bodoh) demikian rupa, sehingga sebagian besar testee yang memiliki kemampuan tinggi untuk menjawab butir item tersebut lebih banyak yang menjawab betul, sementara testee yang kemampuannya rendah untuk

66 Ngali Purwanto, Prinsip-Prinsip dan Teknik Evaluasi Pengajaran, (Bandung: Remaja

Rosadakarya, 1997), cet. 8, hlm. 120. 67 Wilmar Tinambunan, op.cit., hlm. 139. 68 Anas Sudijono, op.cit., hlm. 385-386.

33

menjawab butir item tersebut, sebagian besar tidak dapat menjawab item dengan betul.

Dari beberapa definisi di atas, maka dapat disimpulkan

bahwa suatu item tes memiliki daya pembeda yaitu apabila item tes

itu dapat dijawab benar oleh siswa kelompok atas (pandai) dan

tidak dapat dijawab benar oleh siswa kelompok bawah (bodoh).

2) Teknik Analisis Daya Pembeda Item

Mengetahui daya pembeda item itu penting sekali, sebab

salah satu dasar yang dipegangi untuk menyusun butir-butir item

tes hasil belajar adalah adanya anggapan bahwa kemampuan antara

testee yang satu dengan testee yang lain itu berbeda-beda, dan

bahwa butir-butir item tes hasil belajar itu haruslah mampu

memberikan hasil tes yang mencerminkan adanya perbedaan-

perbedaan kemampuan yang terdapat di kalangan testee tersebut.

Sejalan dengan pernyataan di atas maka kegiatan analisis

terhadap daya pembeda item itu ditujukan untuk menjawab

pertanyaan: "Apakah testee yang kita anggap pandai jawabannya

pada umumnya betul, dan apakah testee yang kita anggap bodoh itu

pada umumnya jawabannya salah?". Jika jawaban atas pertanyaan

itu adalah "ya", maka butir item tersebut dapat kita anggap sebagai

butir item yang baik, dalam arti bahwa butir item itu telah

menunjukkan kemampuannya di dalam membedakan antara testee

yang termasuk dalam kategori pandai dengan testee yang termasuk

dalam kategori bodoh. Sebaliknya, jika jawab atas pertanyaan itu

"tidak", maka butir item tersebut dapat kita nyatakan sebagai butir

item yang jelek, sebab hasil yang dicapai dalam tes itu justru

bertentangan atau berlawanan arah dengan tujuan tes itu sendiri.69

Daya pembeda item dapat diketahui dengan melihat besar

kecilnya angka indeks diskriminasi item. Angka indeks

diskriminasi item adalah sebuah angka atau bilangan yang

69 Ibid., hlm. 396.

34

menunjukkan besarnya daya pembeda yang dimiliki oleh sebutir

item.

Indeks diskriminasi item, umumnya diberi lambang D

(discriminatory power). Seperti halnya indeks kesukaran, indeks

diskriminasi (daya pembeda) ini berkisar antara 0,00 sampai 1,00.

Hanya bedanya, indeks kesukaran tidak mengenal tanda negatif (-),

tetapi pada indeks diskriminasi ada tanda negatif. Tanda negatif

pada indeks diskriminasi digunakan jika suatu soal "terbalik"

menunjukkan kualitas testee. Artinya anak pandai disebut bodoh

dan anak bodoh disebut pandai.

Dengan demikian ada tiga titik pada daya pembeda item,

yaitu70

- 1,00 0,00 1,00

daya pembeda daya pembeda daya pembeda

negatif rendah tinggi (positif)

Indeks diskriminasi pada dasarnya dihitung atas dasar

pembagian testee ke dalam dua kelompok, yaitu kelompok atas

(pandai) dan kelompok bawah (bodoh). Cara menentukan dua

kelompok itu bervariasi, misalnya: dapat membagi dua kelompok

tersebut menjadi 27% dari kelompok atas dan 27% dari kelompok

bawah; dapat juga menggunakan median, yaitu 50% testee

kelompok atas dan 50% testee kelompok bawah; dan dapat juga

dengan hanya mengambil 20% dari testee kelompok atas dan 20%

dari testee kelompok bawah. Dari beberapa pembagian tersebut,

para pakar di bidang evaluasi pendidikan lebih banyak

menggunakan presentase sebesar 27% dari testeekelompok atas

dan 27% dari testee kelompok bawah. Hal ini disebabkan adanya

bukti-bukti empirik bahwa pembagian tersebut telah menunjukkan

kesensitifannya, atau dengan kata lain cukup dapat diandalkan.71

70 Suharsimi Arikunto, op.cit., hlm. 211. 71 Anas Sudijono, op.cit., hlm. 387.

35

Sebagaimana yang dijelaskan oleh Sumadi Suryabrata, bahwa

pembagian 27% kelompok atas dan 27% dari kelompok bawah itu,

memberikan efisiensi tertinggi dalam memperkirakan daya

pembeda soal.72

Indeks diskriminasi (D) dapat dihitung menggunakan

rumus, sebagai berikut: 73

BAB

B

A

A PPJB

JBD −=−=

keterangan:

D = Discriminatory Power (Angka indeks diskriminasi item) BA = Banyaknya testee kelompok atas yang menjawab benar BB = Banyaknya testee kelompok bawah yang menjawab benar JA = banyaknya testee kelompok atas. JB = banyaknya testee kelompok bawah. PA = Proporsi testee kelompok atas yang menjawab benar PB = Proporsi testee kelompok bawah yang menjawab benar

Sebagai tindak lanjut dari hasil analisis terhadap daya

pembeda item tes, maka perlu dilakukan hal-hal sebagai berikut:74

Pertama, untuk butir-butir item yang sudah memiliki daya

pembeda item baik, hendaknya dicatat dalam buku bank soal tes

hasil belajar. Selanjutnya butir-butir item tersebut dapat

dikeluarkan pada tes hasil belajar yang akan datang.

Kedua, untuk butir-butir item yang daya pembedanya masih

rendah, ada dua kemungkinan tindak lanjut, yaitu: (1) Ditelusuri,

untuk kemudian diperbaiki, dan setelah diperbaiki dapat diajukan

lagi dalam tes hasil belajar yang akan datang. (2) Dibuang (didrop)

dan tidak akan dikeluarkan lagi pada tes yang akan datang.

Ketiga, untuk butir-butir item yang angka indeks

diskriminasi itemnya bertanda negatif, sebaiknya tidak dikeluarkan

lagi pada tes yang akan datang, karena butir item tersebut memiliki

72 Sumadi Suryabrata, Pengembangan tes Hasil Belajar, (Jakarta: Rajawali Pers, 1987),

hlm. 108. 73 Suharsimi Arikunto, op.cit., hlm. 213-214. 74 Anas Sudijono, op.cit., hlm. 408-409

36

kualitas sangat jelek (testee yang termasuk pandai lebih banyak

yang menjawab salah daripada testee yang termasuk bodoh, justru

hanya sedikit saja yang jawabannya salah).

e. Efektivitas Fungsi Distraktor

Dalam setiap tes objektif selalu digunakan alternatif jawaban

yang mengandung dua unsur sekaligus, yaitu jawaban tepat dan

jawaban yang salah sebagai penyesat (distraktor)75

Tujuan utama pemasangan distraktor pada setiap butir item itu

adalah, agar dari sekian banyak testee yang mengikuti tes hasil belajar

ada yang tertarik atau terangsang untuk memilihnya, sebab mereka

menyangka bahwa distraktor yang mereka pilih itu merupakan

jawaban betul. Makin banyak testee yang terkecoh, maka distraktor

tersebut dapat menjalankan fungsinya dengan baik. Sebaliknya, apabila

distraktor yang dipasang pada setiap butir item itu "tidak laku"

(maksudnya: tidak ada seorangpun dari sekian banyak testee yang

merasa tertarik atau terangsang untuk memilih distraktor tersebut

sebagai jawaban betul), maka distraktor tersebut tidak dapat

menjalankan fungsinya dengan baik. Dengan kata lain, distraktor baru

dapat dikatakan telah menjalankan fungsinya dengan baik, apabila

distraktor tersebut memiliki daya rangsang atau daya tarik, sehingga

testee (khususnya testee dari kelompok bawah) menjadi terkecoh untuk

memilih distraktor sebagai jawaban betul.76

Analisis fungsi distraktor yang sering dikenal dengan istilah

lain, yaitu pola penyebaran jawaban soal. Adapun yang dimaksud pola

penyebaran jawaban soal adalah distribusi testee dalam hal

menentukan pilihan jawaban pada soal bentuk pilihan ganda. Pola

jawaban soal diperoleh dengan menghitung banyaknya testee yang

75 M. Chabib Thoha, op.cit., hlm. 149. 76 Anas Sudijono, op.cit., hlm. 410.

37

memilih option a, b, c, atau d atau yang tidak memilih option manapun

(blangko). Dalam istilah evaluasi disebut omit, disingkat O.77

Suatu distraktor dapat diperlakukan dengan 3 cara:78

1) Diterima, karena sudah baik.

2) Ditolak, karena tidak baik.

3) Ditulis kembali, karena kurang baik.

Cara untuk menentukan, apakah suatu distraktor telah dapat

menjalankan fungsinya dengan baik atau belum, maka dapat dianalisis

menggunakan rumus:79

%100X)testee(tespesertaJumlahoptionmemilihyangtesteeBanyaknyaDistraktor =

Apabila distraktor tersebut sekurang-kurangnya sudah dipilih

oleh 5% dari seluruh testee, maka distraktor itu telah berfungsi dengan

baik. Sebaliknya apabila distraktor tersebut dipilih kurang dari 5% dari

seluruh testee, maka distraktor itu belum berfungsi dengan baik.

3. Kegunaan Analisis Item Tes

Analisis item tes (item analysis) merupakan suatu prosedur yang

sistematis, yang akan memberikan informasi-informasi yang sangat khusus

terhadap butir tes yang kita susun.

Suharsimi Arikunto dalam bukunya yang berjudul “Dasar-Dasar

Evaluasi Pendidikan”, menjelaskan bahwa faedah atau kegunaan dari

analisis item tes adalah:80

a. Membantu kita dalam mengidentifikasikan butir-butir soal yang jelek.

b. Memperoleh informasi yang akan dapat digunakan untuk

menyempurnakan soal-soal untuk kepentingan lebih lanjut.

c. Memperoleh gambaran secara selintas tentang keadaan tes yang kita

susun.

77 Suharsimi Arikunto, op.cit., hlm. 219. 78 Daryanto, op.cit., hlm. 193. 79 Anas Sudijono, op.cit., hlm. 412. 80 Suharsimi Arikunto, op.cit., hlm. 205.

38

Adapun manfaat atau kegunaan analisis soal buatan guru menurut

Suke Silverius dalam bukunya yang berjudul “Evaluasi Hasil Belajar dan

Umpan Balik”, adalah sebagai berikut:81

a. Menentukan apakah butir soal berfungsi tepat seperti yang

dimaksudkan oleh guru.

Untuk menentukan apakah butir soal telah berfungsi

sebagaimana mestinya, guru perlu mempertimbangkan hal-hal berikut:

1) Apakah tes itu ditujukan untuk mengukur pencapaian tujuan

instruksional yang dimaksudkan?

2) Apakah tes itu mempunyai tingkat kesukaran yang memadai,

dipandang dari materi yang dipakai untuk menulis butir soal itu

dan tingkat kemampuan yang diukur?

3) Apakah kunci jawaban telah betul?

4) Apakah distraktor berfungsi dengan baik?

b. Umpan balik bagi siswa mengenai penampilannya dan merupakan

dasar untuk diskusi kelas

Siswa berhak mengetahui bagaimana tesnya dinilai dan

jawaban yang benar dari setiap butir soal. Dengan demikian dia dapat

membetulkan kesalahan jawabannya, sementara guru dapat

menjelaskan sejauhmana jawaban yang diinginkan dari setiap soal. Hal

ini menyebabkan siswa lebih memahami pokok bahasan atau subpokok

bahasan melalui jawaban yang baik dan benar dari setiap soal.

c. Umpan balik bagi guru tentang kesulitan belajar siswa.

Suatu prosedur sederhana seperti mentabulasi presentase siswa

yang menjawab benar suatu butir soal dapat memberikan informasi

kepada guru mengenai pokok-pokok bahasan yang membutuhkan

penjelasan tambahan dan perbaikan. Tentu saja sekelompok butir soal

yang menanyakan bahan yang sama akan memberikan informasi yang

lebih reliabel (ajeg) daripada satu soal saja.

81 Suke Silverius, op.cit., hlm. 176-177.

39

Mengidentifikasi kesalahan apa yang ada dalam jawaban

terhadap soal-soal dapat sangat membantu guru untuk perbaikan

tingkat pemahaman siswa terhadap pokok bahasan atau subpokok

bahasan yang diteskan itu.

d. Bidang-bidang kurikulum yang memerlukan perbaikan.

Jika ada butir soal tertentu yang selalu sukar bagi siswa, atau

selalu ada jenis kesalahan tertentu yang sering terjadi, maka mungkin

masalahnya di luar jangkauan guru-guru. Mungkin kurikulumnya yang

perlu direvisi. Analisis soal dapat membantu menemukan hal ini.

e. Perbaikan butir soal.

Hasil analisis butir soal dapat menunjukkan kualitas butir soal

itu. Maka hasil analisis dapat dipakai untuk mengupayakan perbaikan

butir soal tersebut. Butir-butir soal yang diperbaiki itu dapat disimpan

untuk dipakai lagi pada tahun yang akan datang.

f. Meningkatkan ketrampilan penulisan soal.

Cara yang paling efektif untuk meningkatkan keterampilan

menulis soal tes adalah menganalisis butir-butir soal dan cara siswa

menjawab soal-soal itu. Kemudian, memanfaatkan informasi ini untuk

perbaikan butir soal dan mencobanya lagi kepada para siswa. Hanya

membaca buku teori tidaklah cukup.

C. MATA PELAJARAN AQIDAH AKHLAK

1. Kurikulum Aqidah Akhlak

Pendidikan aqidah akhlak adalah upaya sadar dan terencana dalam

menyiapkan peserta didik untuk mengenal, memahami, menghayati dan

mengimani Allah dan merealisasikannya dalam perilaku akhlak mulia

dalam kehidupan sehari-hari melalui kegiatan bimbingan, pengajaran

latihan, penggunaan pengalaman dan pembiasaan. Dalam kehidupan

masyarakat yang majemuk dalam bidang keagamaan, pendidikan ini juga

diarahkan pada peneguhan aqidah di satu sisi dan peningkatan toleransi

40

serta saling menghormati dengan penganut agama lain dalam rangka

mewujudkan kesatuan dan persatuan bangsa.82

a. Tujuan Pendidikan Aqidah Akhlak

Berdasarkan UU RI No. 20 Tahun 2003, Pendidikan Agama

bertujuan untuk membentuk peserta didik menjadi manusia yang

beriman dan bertaqwa kepada Tuhan Yang Maha Esa serta berakhlak

mulia.83

Menurut Zuhairini, tujuan umum pendidikan agama adalah

membimbing peserta didik agar mereka menjadi muslim sejati,

beriman teguh, beramal shaleh, dan berakhlak mulia serta berguna bagi

masyarakat, agama dan negara.84

Sedangkan M. Arifin menjelaskan bahwa: 85

Tujuan Pendidikan Islam adalah perwujudan nilai-nilai Islami dalam pribadi manusia didik yang diikhtiarkan oleh pendidik muslim melalui proses yang terminal pada hasil (produk) yang berkepribadian Islam yang beriman, bertakwa dan berilmu pengetahuan yang sanggup mengembangkan dirinya menjadi hamba Allah yang taat.

Ketaatan kepada Allah Swt merupakan tujuan akhir dari

pendidikan Islam. Sebagaimana firman Allah dalam surat Adz-Dzariat

ayat 56, yaitu:

نودبعي لال إسنإلا ونج التقلا خمو“Aku tidak menjadikan jin dan manusia kecuali agar mereka itu beribadah kepada-Ku” (QS. Adz-Dzariyat: 56). 86

Salah satu bagian dari pendidikan agama Islam adalah

pendidikan Aqidah Akhlak. Adapun tujuan pendidikan Aqidah akhlak

di Madrasah Aliyah adalah untuk menumbuhkan dan meningkatkan

82 Departemen Agama RI, Kurikulum 2004 (Pedoman Khusus Pengembangan Silabus

dan Sistem Penilaian Akidah Akhak Madrasah Aliyah), (Jakarta: Direktorat Kelembagaan Agama Islam, 2004), hlm. 21.

83 Undang-Undang SISDIKNAS (Sistem Pendidikan Nasional) 2003, (UU RI No.20 Th. 2003), (Jakarta: Sinar Grafika Offset, 2003), hlm. 50.

84 Zuhairini dkk., Metodologi Pendidikan Agama, (Solo: Ramadhani, 1993), hlm. 35. 85 Arifin, Ilmu Pendidikan Islam, (Jakarta: Bumi Aksara, 2000), hlm. 224. 86 Departemen Agama Ri, Al-Qur'an dan Terjemahnya, (Jakarta: Yayasan Penyelenggara

Penerjemah/Penafsir Al-Qur'an, 1990), hlm. 862.

41

keimanan peserta didik yang diwujudkan dalam akhlaknya yang

terpuji, melalui pemberian dan pemupukan pengetahuan, penghayatan,

pengamalan serta pengalaman peserta didik tentang aqidah dan akhlak

Islam, sehingga menjadi manusia muslim yang terus berkembang dan

meningkat kualitas keimanan dan ketaqwaannya kepada Allah Swt

serta berakhlak mulia dalam kehidupan pribadi, bermasyarakat,

berbangsa san bernegara, serta untuk dapat melanjutkan pada jenjang

pendidikan yang lebih tinggi.87

b. Materi Aqidah Akhlak

Pelajaran Aqidah Akhlak di Madrasah Aliyah berisi bahan

pelajaran yang dapat mengarahkan pada pencapaian kemampuan dasar

peserta didik untuk dapat memahami rukun iman secara ilmiah serta

pengalaman dan pembiasaan berakhlak Islami, untuk dapat dijadikan

landasan perilaku dalam kehidupan sehari-hari serta sebagai bekal

untuk jenjang pendidikan berikutnya. Ruang lingkup pelajaran Aqidah

akhlak meliputi: aspek aqidah, aspek akhlak dan aspek kisah

keteladanan.88

Materi pelajaran Aqidah Akhlak untuk kelas I semester genap,

adalah sebagai berikut:89

- Iman kepada Malaikat.

- Akhlak terpuji (kreatif, dinamis, sabar dan tawakal).

- Akhlak tercela (pasif, pesimis, putus asa, dan bergantung pada

orang lain).

- Iman kepada Kitab Allah.

- Akhlak terpuji (Sikap bijaksana, amanah dan futuristik).

- Akhlak tercela (memfitnah, mencuri, picik, hedonisme, ananiah,

dan materialistik).

87 Departemen Agama RI, op.cit., hlm. 22. 88 Ibid. 89 Ibid., hlm. 30-32.

42

2. Pembelajaran Aqidah Akhlak

Untuk mencapai tujuan pembelajaran aqidah akhlak, maka

diperlukan adanya beberapa pendekatan dalam proses belajar mengajar,

yaitu:90

a. Keimanan, yang mendorong peserta didik untuk mengembangkan

pemahaman dan keyakinan tentang adanya Allah SWT. Sebagai

sumber kehidupan.

b. Pengamalan, mengkondisikan peserta didik untuk mengembangkan

dan merasakan hasil-hasil pengamalan akhlak mulia dalam kehidupan

sehari-hari.

c. Pembiasaan, melaksanakan pembelajaran dengan membiasakan sikap

dan perilaku yang baik yang sesuai dengan ajaran Islam yang

terkandung dalam al-Qur’an dan Hadits serta dicontohkan oleh para

ulama.

d. Rasional, usaha meningkatkan kualitas proses dan hasil pembelajaran

aqidah akhlak dengan pendekatan yang memfungsikan rasio peserta

didik, sehingga isi dan nilai-nilai yang ditanamkan mudah dipahami

dengan penalaran.

e. Emosional, upaya menggugah perasaan (emosi) peserta didik dalam

menghayati aqidah dan akhlak mulia sehingga lebih terkesan dalam

jiwa peserta didik.

f. Fungsional, menyajikan materi aqidah akhlak yang memberikan

manfaat nyata bagi peserta didik dalam kehidupan sehari-hari dalam

arti luas.

g. Keteladanan, yaitu pendidikan yang menempatkan dan memerankan

guru serta komponen madrasah lainnya sebagai teladan; sebagai

cerminan dari individu yang memiliki keimanan teguh dan berakhlak

mulia.

90 Ibid., hlm. 25-27.

43

3. Evaluasi Mata Pelajaran Aqidah Akhlak

Evaluasi merupakan rangkaian akhir dari proses pendidikan.

Berhasil atau tidaknya pendidikan dalam mencapai tujuannya dapat dilihat

setelah dilakukan evaluasi atau penilaian terhadap out put yang dihasilkan.

Dalam pendidikan Islam, penilaian atau evaluasi dapat dilakukan

dengan dua cara, yaitu :91

a. Evaluasi terhadap diri sendiri (self evaluation / intropeksi)

Evaluasi terhadap diri sendiri adalah mengadakan intropeksi atau

perhitungan terhadap diri sendiri. Evaluasi ini tentunya berdasarkan

kesadaran sendiri yang bertujuan untuk meningkatkan kreativitas dan

produktivitas (amal saleh) pribadi.

Evaluasi terhadap diri sendiri sangat dianjurkan dalam Islam. hal

ini sesuai dengan firman Allah Swt dalam surat al-Hasyr ayat 18,

yaitu:

}18: الحشر {... يا أيها الذين آمنوا اتقوا الله ولتنظر نفس ما قدمت لغد“Hai orang-orang yang beriman, bertakwalah kepada Allah dan hendaklah setiap diri memperhatikan apa yang telah diperbuatnya untuk hari esok (akhirat)” (QS. Al-Hasyr : 18).92

Dalam sebuah hadits yang diriwayatkan oleh Umar bin Khattab

juga disebutkan adanya anjuran untuk mengevaluasi terhadap diri

sendiri, yaitu: 93

ال ه ق ي اهللا عن اب رض ن الخط ر ب ن عم لىاهللا: ع و ل اهللا ص ال رس ق }رواه الترمذى{حاسبوا أنفسكم قبل أن تحاسبوا : عليه وسلم

“Dari Umar bin Khattab r.a berkata, Rasulullah Saw bersabda: Evaluasilah dirimu sebelum engkau di evaluasi”

Berdasarkan ayat dan hadits di atas, maka manusia dituntut

selalu waspada dan memperhitungkan segala tindakannya, agar

kehidupannya kelak tidak merugi.

b. Evaluasi terhadap orang lain (peserta didik)

91 Ramayulis, Ilmu Pendidikan Islam, (Jakarta : Kalam Mulia, 2004), hlm. 200-201. 92 Departemen Agama RI, op.cit., hlm. 919 93 At-Tirmidzi, Sunan al-Tirmidzi, (Beirut Libanon: Dar al-Fikr, 1994), hlm. 208.

44

Evaluasi terhadap orang lain (peserta didik) merupakan bagian

dari kegiatan pendidikan Islam. Kegiatan ini tidak sekedar boleh, tetapi

bahkan diwajibkan. Kewajiban di sini tentunya berdasarkan niat “amar

ma’ruf nahi munkar” yang bertujuan untuk perbaikan perbuatan

sesama umat Islam.

Salah satu bagian dari pendidikan Islam adalah pendidikan

aqidah akhlak. Hal ini berarti bahwa evaluasi dalam pendidikan aqidah

akhlak juga sangat dianjurkan.

Sebagaimana evaluasi yang dilakukan oleh Nabi Sulaiman, yaitu:

}27: النمل {قال سننظر أصدقت أم آنت من الكاذبين Berkata Sulaiman: "Akan kami lihat, apa kamu benar, ataukah kamu termasuk orang-orang yang berdusta”. (QS. An-Naml : 27).94

Pada umumnya ada tiga sasaran pokok dalam penilaian atau

evaluasi terhadap peserta didik, yaitu :95

1) Segi tingkah laku, artinya segi yang menyangkut sikap, minat,

perhatian, ketrampilan siswa sebagai akibat dari proses mengajar

dan belajar.

2) Segi isi pendidikan, artinya penguasaan bahan pelajaran yang

diberikan guru dalam proses mengajar-belajar.

3) Segi yang menyangkut proses mengajar dan belajar itu sendiri.

Proses mengajar dan belajar perlu diadakan penilaian secara

objektif dari guru, sebab baik tidaknya proses mengajar dan belajar

akan menentukan baik tidaknya hasil belajar yang dicapai siswa.

Evaluasi mata pelajaran Aqidah Akhlak untuk Madrasah Aliyah

didasarkan pada pencapaian kompetensi yang harus dikuasai oleh peserta

didik selama menempuh pendidikan di MA. Kompetensi ini berorientasi

pada perilaku afektif dan psikomotorik dengan dukungan pengetahuan

kognitif dalam rangka memperkuat aqidah serta meningkatkan kualitas

94 Departemen Agama RI, op.cit., hlm. 596. 95 Nana Sudjana, Dasar-Dasar Proses Belajar Mengajar, (Bandung: Sinar Baru

Algensindo, 1995), hlm. 44.

45

akhlak sesuai dengan ajaran Islam. Adapun kompetensi mata pelajaran

aqidah akhlak untuk kelas I semester genap adalah sebagai berikut :96

a). Memahami dan meyakini hakekat iman kepada Malaikat serta mampu

menganalisis secara ilmiah dan terbiasa berakhlak terpuji (kreatif,

dinamis, dan tawakal) dan menghindari akhlak tercela (pasif, pesimis,

putus asa, dan tergantung pada orang lain) dalam kehidupan sehari-hari

b). Memahami dan meyakini kebenaran kitab-kitab Allah serta mampu

menganalisis secara ilmiah dan terbiasa berakhlak mulia (bersikap

amanah, berpikir dan berorientasi masa depan) dan menghindari akhlak

tercela (memfitnah, mencuri, picik, hedonisme, ananiah dan

materialistik) dalam kehidupan sehari-hari.

Berdasarkan kurikulum 2004, penilaian atau evaluasi mata

pelajaran aqidah akhlak dilakukan dengan rambu-rambu sebagai berikut :97

1). Penilaian yang dilakukan meliputi penilaian kemajuan belajar dan

penilaian hasil belajar peserta didik yang terdiri dari pengetahuan

(aspek kognitif), sikap (aspek afektif), dan perilaku mereka (aspek

psikomotorik)

2). Penilaian kemajuan belajar merupakan pengumpulan informasi

tentang kemajuan belajar peserta didik. Penilaian ini bertujuan untuk

mengetahui tingkat kemampan dasar yang dicapai peserta didik

setelah mengikuti kegiatan pembelajaran dalam kurun waktu, unit

satuan, atau jenjang tertentu

3). Penilaian hasil belajar aqidah dan akhlak adalah upaya untuk

pengumpulan informasi untuk menentukan tingkat penguasan peserta

didik terhadap kompetensi meliputi : pengetahuan, sikap dan nilai.

Penilaian hasil belajar ini dilakukan sepenuhnya oleh madrasah yang

bersangkutan. Hasil penilaian dijadikan sebagai pertimbangan utama

dalam memasuki pendidikan jenjang berikutnya

96 Departemen Agama RI, Op.Cit., hlm 24 97 Ibid., hlm. 26-27

46

4). Penilaian hasil belajar aqidah dan akhlak secara nasional dilakukan

dengan mengacu pada kompetensi dasar, hasil belajar, materi standar,

dan indikator yang telah ditetapkan di dalam Kurikulum Nasional.

Penilaian tingkat Naional berfungsi untuk memperoleh informasi dan

data tentang mutu hasil penyelenggaraan mata pelajaran aqidah dan

akhlak

5). Teknik dan instrument penilaian yang digunakan adalah yang dapat

mengukur dengan tepat kemampuan dan usaha belajar peserta didik

6). Penilaian dilakukan melalui tes dan non tes

7). Pengukuran terhadap ranah afektif dapat dilakukan dengan

menggunakan cara non tes, seperti skala penilaian, observasi, dan

wawancara.

8). Penilaian terhadap ranah psikomotorik dengan tes perbuatan dengan

menggunakan lembar pengamatan atau isntrumen lainnya

D. KAJIAN PENELITIAN YANG RELEVAN

Untuk memperoleh gambaran yang jelas tentang posisi penelitian ini di

antara karya-karya yang sudah ada, berikut ini akan penulis ilustrasikan dua

karya yang mengkaji tentang kualitas tes.

Pertama, Mohamad Nurdin (3100330) dalam karya skripsinya yang

berjudul “Uji Validitas dan Reliabilitas Instrumen Tes Objektif Mata Pelajaran

Akhlak kelas III Semester VI di SMP Muhammadiyah 08 Mijen Semarang

Tahun 2003/2004”, menyebutkan bahwa kualitas tes mata pelajaran akhlak

kelas III yang berjumlah 108 siswa pada semester VI di SMP Muhammadiyah

08 Mijen Semarang adalah sebagai berikut:98

1. Ditinjau dari segi validitas butir soalnya adalah cukup / sedang karena

sebanyak 28 butir soal (58 %) dikategorikan valid dan 22 butir soal

lainnya (44 %) adalah invalid.

98 Mohamad Nurdin, “Uji Validitas dan Reliabilitas Instrumen Tes Objektif Mata

Pelajaran Akhlak kelas III Semester VI di SMP Muhammadiyah 08 Mijen Semarang Tahun 2003/2004”, (Perpustakaan Fakultas Tarbiyah IAIN Walisongo Semarang: 2005), t.d, hlm. 67.

47

2. Ditinjau dari segi reliabilitas tesnya adalah cukup / sedang karena nilai

koefisien reliabitasnya (r11) adalah sebesar 0,640.

Kedua, Indras Rahmawati (3101206) dalam karya skripsinya yang

berjudul “Analisis Tingkat Kesukaran, Daya Pembeda dan Efektivitas Fungsi

Distraktor Pada Tes Mata Pelajaran PAI di SMP Negeri 36 Semarang”,

menjelaskan bahwa kualitas tes mata pelajaran PAI kelas II yang berjumlah

207 siswa di SMP Negeri 36 Semarang tahun 2004/2005 adalah sebagai

berikut:99

1. Ditinjau dari segi tingkat kesukarannya adalah cukup / sedang, karena 11,1

% adalah butir soal yang terlalu sukar, 37,8 %butir soal yang cukup dan

51,1 % butir soal lainnya adalah terlalu mudah.

2. Ditinjau dari segi daya pembedanya adalah cukup /sedang, karena 31,1 %

merupakan butir soal yang memiliki daya pembeda lemah, 46,7 %

memiliki daya pembeda cukup dan 20 % memiliki daya pembeda baik.

3. Dinjau dari segi fungsi distraktornya adalah baik karena 63 % dari seluruh

distraktor yang dipasang pada soal tes tersebut telah berfungsi dengan

baik.

Dari kedua penelitian di atas, dapat diketahui bahwa posisi penelitian

ini memang mempunyai tema yang sama yaitu tentang kualitas tes hasil

belajar, akan tetapi berbeda objek penelitiannya, dimana pada penelitian ini

yang menjadi objek penelitian adalah tes bentuk objektif pada mata pelajaran

Aqidah Akhlak pada tingkat Madrasah Aliyah di Kabupaten Demak,

sedangkan objek penelitian dari kedua penelitian sebelumnya adalah tes mata

pelajaran PAI pada tingkat SMP di Kota Semarang.

99 Indras Rahmawati, “Analisis Tingkat Kesukaran, Daya Pembeda dan Efektivitas

Fungsi Distraktor Pada Tes Mata Pelajaran PAI di SMP Negeri 36 Semarang”, (Perpustakaan Fakultas Tarbiyah IAIN Walisongo Semarang: 2005), t.d, hlm. 64-65.

BAB II ofa - Perpustakaan Pusatlibrary.walisongo.ac.id/digilib/files/disk1/32/jtptiain-gdl-s1... ·...

Documents

Transcript of BAB II ofa - Perpustakaan Pusatlibrary.walisongo.ac.id/digilib/files/disk1/32/jtptiain-gdl-s1... ·...