MATERI ITEMAN-1
-
Upload
emma-dwi-ratnasari -
Category
Documents
-
view
732 -
download
8
Transcript of MATERI ITEMAN-1
ANALISIS BUTIR TES OBJEKTIF
DENGAN BANTUAN KOMPUTER
PROGRAM ITEMAN VERSION 3.00
Oleh:
Suhartono
PROGRAM STUDI PENDIDIKAN GURU SEKOLAH DASAR
FAKULTAS KEGURUAN DAN ILMU PENDIDIKAN
UNIVERSITAS SEBELAS MARET SURAKARTA
2010
A. PENDAHULUAN
0
Penilaian hasil belajar merupakan upaya mengumpulkan informasi untuk mengetahui
seberapa jauh pengetahuan dan kemampuan telah dicapai oleh para siswa setiap semester,
akhir tahun ajaran, atau akhir pendidikan. Penilaian yang dilaksanakan di sekolah-sekolah saat
ini paling banyak menggunakan instrumen tes.
Penyelenggaraan penilaian hasil belajar pada akhir semester atau akhir tahun ajaran
dilaksanakan oleh sekolah yang bersangkutan dengan berpedoman pada kisi-kisi dari Kantor
Wilayah Depatemen Pendidikan Nasional. Sebagai konsekuensinya, setiap guru dituntut
untuk dapat menyusun soal-soal tes dalam melaksanan penilaian tersebut. Agar soal-soal tes
yang disusun guru dapat memenuhi fungsinya dengan baik maka perlu dikuasai kaidah
penyusunan soal-soal tes.
Soal-soal tes yang telah disusun oleh guru dibuat berdasarkan ketentuan yang ada sesuai
dengan kemampuan masing-masing. Selanjutnya, untuk mengetahui apakah soal-soal tes
tersebut sudah baik atau belum perlu dianalisis hasilnya. Analisis tes bertujuan untuk
mengadakan identifikasi soal-soal yang baik, kurang baik, dan soal yang jelek. Dengan
analisis soal dapat diperoleh informasi tentang kejelekan sebuah soal dan petunjuk untuk
mengadakan perbaikan. Butir soal (tes objektif) yang baik dapat dilihat dari tiga hal, yaitu:
taraf kesukaran, daya beda, dan pola jawaban soal. Di samping itu, perlu juga diketahui
reliabilitas soal-soal tes yang telah dibuat.
Menghitung taraf kesukaran, daya beda, pola jawaban, dan reliabilitas soal tes jika
dilakukan secara manual memerlukan waktu yang cukup lama dan melelahkan serta kadang-
kadang hasilnya tidak tepat. Dengan kemajuan teknologi komputer, penyelesaian pekerjaan di
atas dapat dilakukan dalam waktu yang singkat dengan hasil yang akurat. Di antara program
yang dapat digunakan untuk menganalisis hasil tes adalah Program Iteman Version 3.00.
Tulisan berikut merupakan upaya untuk membantu para guru dalam menganalisis tes
objektif yang dibuat sendiri. Informasi yang dihasilkan diharapkan dapat mereka gunakan
untuk mengetahui kualitas tes yang telah dibuat.
B. KELAYAKAN KARAKTERISTIK BUTIR SOAL TES OBJEKTIF
Agar butir soal yang digunakan memenuhi syarat yang baik maka perlu dilakukan
analisis butir soal secara kuantitatif berdasarkan data yang dihasilkan dari pengetesan.
Analisis butir soal dapat dilakukan secara manual maupun dengan bantuan komputer.
Analisis secara manual memerlukan waktu cukup lama dan kadang-kadang hasilnya tidak
1
akurat. Dengan bantuan program komputer, analisis butir soal tes dapat dilakukan dengan
waktu yang singkat serta hasil yang akurat. Analisis mengenai karakteristik butir soal ini
meliputi: (1) tingkat kesukaran butir soal; (2) daya beda butir soal; (3) distribusi jawaban,
termasuk kunci jawaban dan pengecoh pada setiap butir soal; (4) reliabilitas soal; dan (5)
kesalahan baku pengukuran.
1. Tingkat Kesukaran Butir Soal
Tingkat kesukaran butir soal adalah pernyataan tentang seberapa mudah atau sulit
sebuah bitir soal bagi siswa yang dikenai pengukuran (Oller, 1979). Saifuddin Azwar (1998)
menyatakan bahwa tingkat kesukaran butir soal merupakan rasio antara penjawab butir soal
dengan benar dan banyaknya penjawab butir soal. Tingkat kesukaran butir soal dinyatakan
oleh suatu indeks yang disebut indeks kesukaran. Indeks kesukaran butir soal disimbolkan
dengan huruf p.
Selanjutnya dinyatakan bahwa secara teoretik p sebenarnya merupakan probabilitas
empirik untuk lulus butir soal tertentu bagi kelompok siswa tertentu. Rumus indeks kesukaran
butir soal adalah:
p = ni/N atau p = B/JS
Keterangan:
ni atau B = banyaknya siswa yang menjawab butir soal dengan benar
N atau JS = banyaknya siswa yang menjawab butir soal
Indeks kesukaran butir soal atau p dinyatakan dengan angka yang berada antara 0,00
sampai dengan 1,00. Klasifikasi indeks/tingkat kesukaran butir soal menurut Depdikbud
(1987) adalah: p = 0,21 – 0,40 , kategori butir soal sukar; p = 0,41 – 0,70 , kategori butir soal
sedang; dan p = 0,71 – 0,90 , kategori butir soal mudah.
Berdasarkan klasifikasi tingkat kesukaran tersebut, kategori butir soal sukar, sedang,
dan mudah dapat digunakan. Adapun butir soal yang ekstrem sukar (p sangat rendah), yaitu p
kurang dari 0,21 dan butir soal yang ekstrem mudah (p sangat tinggi), yaitu p lebih dari 0,90
tidak dipakai. Menurut Saifuddin Azwar (1998), butir soal yang tingkat kesukarannya sangat
rendah atau sangat tinggi akan mempunyai daya beda yang kurang baik. Butir soal dianggap
baik apabila memiliki tingkat kesukaran p antara 0,21 sampai dengan 0,90 atau yang
memiliki tingkat kesukaran mudah, sedang, dan sukar.
Contoh penghitungan:
2
Dari hasil analisis tes yang terdiri atas 10 butir soal yang dikerjakan oleh 20 orang siswa,
terdapat dalam tabel berikut.
SiswaKelom-
pok
Nomor Soal Skor
Siswa1 2 3 4 5 6 7 8 9 10
A B 1 0 1 0 0 0 1 1 1 0 5
B A 0 1 1 1 1 1 0 0 1 1 7
C A 1 0 1 0 1 1 1 1 1 1 8
D B 0 0 1 0 0 1 1 1 1 0 5
E A 1 1 1 1 1 1 1 1 1 1 10
F B 1 1 0 0 0 1 1 1 1 0 6
G B 0 1 0 0 0 1 1 1 1 1 6
H B 0 1 1 0 0 1 0 1 1 1 6
I A 1 1 1 0 0 1 1 1 1 1 8
J A 1 1 1 1 0 0 1 0 1 1 7
K A 1 1 1 0 0 1 1 1 1 0 7
L B 0 1 0 1 1 0 0 1 1 0 5
M B 0 1 0 0 0 0 0 1 1 0 3
N A 0 0 1 0 1 1 1 1 1 1 7
O A 1 1 0 1 1 1 1 1 1 1 9
P B 0 1 0 0 0 1 0 0 1 0 3
Q A 1 1 0 1 0 1 1 1 1 1 8
R A 1 1 1 1 0 1 1 1 1 0 8
S B 1 0 1 0 0 1 1 1 1 0 6
T B 0 1 0 1 0 1 1 1 1 0 6
Jumlah 11 15 12 8 6 16 15 17 20 10
Tk. Kesukaran 0,55 0,75
Daya Beda
Berdasarkan tabel di atas, soal nomor 1 mempunyai tingkat kesukaran 11 : 20 = 0,55
soal nomor 2 mempunyai tingkat kesukaran 15 : 20 = 0,75
soal nomor 3 dst. cobalah hitung tingkat kesukarannya!
2. Daya Beda Butir Soal
3
Daya beda butir soal adalah kemampuan butir soal dalam membedakan antara siswa
yang mempunyai kemampuan tinggi (kelompok tinggi) dan siswa yang mempunyai
kemampuan rendah (kelompok rendah) (Saifuddin Azwar, 1998).
Suatu butir soal dikatakan mempunyai daya beda yang tinggi harus dijawab dengan
benar oleh semua atau sebagian besar subjek kelompok tinggi dan tidak dapat dijawab dengan
benar oleh semua atau sebagian besar subjek kelompok rendah. Adapun rumus daya beda
butir soal adalah:
d = (Ba – Bb) : 0,5T atau d = niT/NT – niR/NR
Keterangan:
Ba atau niT = banyaknya penjawab butir soal dengan benar dari kelompok
tinggi/atas
NT = banyaknya penjawab dari kelompok tinggi/atas
Bb atau niR = banyaknya penjawab butir soal dengan benar dari kelompok
rendah/bawah
NR = banyaknya penjawab dari kelompok rendah/bawah
T = jumlah peserta tes (jika gasal, T = jumlah peserta tes dikurangi 1)
Cara menentukan kelompok tinggi/atas dan kelompok rendah/bawah yaitu:
Untuk kelompok kecil (kurang dari 100): seluruh testi dibagi dua, 50% testi yang
mendapatkan skor tertinggi sebagai kelompok tinggi dan 50% testi yang mendapatkan
skor terendah sebagai kelompok rendah
Untuk kelompok besar: diambil 2 kelompok, 27% skor teratas sebagi kelompok tinggi dan
27% skor terendah sebagi kelompok rendah.
Indeks daya beda d besarnya berkisar mulai dari –1 sampai dengan +1, namun hanya
harga d yang positif sajalah yang memiliki arti dalam analisis butir soal.
Indeks daya beda yang ideal adalah yang mendekati angka 1. Semakin besar indeks
daya beda berarti butir soal tersebut semakin mampu membedakan antara mereka yang
mampu menguasai bahan yang diujikan dan mereka yang tidak. Semakin kecil indeks daya
beda (semakin mendekati 0) berarti semakin tidak jelaslah fungsi butir yang bersangkutan
dalam membedakan mana subjek yang mampu menguasai bahan yang diujikan dan mana
subjek yang tidak tahu apa-apa.
Ebel (1979) mengelompokkan indeks daya beda dalam empat kategori, yaitu:
4
0,40 atau lebih = bagus sekali
0,30 - 0,39 = lumayan bagus, tetapi mungkin masih perlu peningkatan
0,20 - 0,29 = belum memuaskan, perlu diperbaiki
kurang dari 0,20 = jelek dan harus dibuang
Menurut Suharsimi Arikunto, indeks daya beda dikategorikan sebagai berikut:
0,00 – 0,20 = jelek
0,21 – 0,40 = cukup
0,41 – 0,70 = baik
0,71 – 1,00 = baik sekali
Contoh penghitungan:
Berdasarkan data pada tabel di atas, soal nomor 1 diketahui bahwa:
Kelompok tinggi yang menjawab betul 8 orang
Kelompok rendah yang menjawab betul 3 orang
Maka d = (8 – 3) : 10 = 0,5
Jadi, daya beda butir soal nomor 1 adalah 0,5
Selanjutnya, cobalah hitung daya beda butir soal nomor 2 s.d. nomor 10
3. Distribusi Jawaban
Struktur butir soal terdiri atas pokok soal atau stem dan alternatif jawaban atau opsi
yang terdiri atas kunci jawaban dan pengecoh.
Untuk setiap kunci jawaban, kelompok tinggi harus memilih lebih banyak daripada
kelompok rendah dan kelompok rendah harus lebih banyak memilih pada pengecoh daripada
kelompok tinggi. Selain itu, semua alternatif jawaban yang disediakan harus ada siswa yang
memilihnya.
Efektivitas pengecoh dilihat dari dua kriteria, yaitu (a) pengecoh dipilih oleh siswa
dari kelompok rendah, dan (b) pemilih pengecoh tersebar relatif proporsional pada masing-
masing pengecoh yang ada (Saifuddin Azwar, 1998). Apabila proporsi siswa yang memilih
pengecoh kurang dari 0,03 maka pengecoh tersebut harus direvisi. Adapun pengecoh yang
tidak ada pemilihnya atau proporsinya 0,00 ditolak. Pakpahan (1990) menyatakan bahwa
proporsi jawaban pengecoh yang kurang dari 0,03 perlu direvisi.
Pengecoh yang baik memiliki daya beda yang negatif, yang berarti setiap pengecoh
dipilih lebih sedikit atau paling tidak daya beda pengecoh itu tidak lebih besar daripada daya
beda kunci jawaban pada setiap butir soal. Butir soal yang daya bedanya lebih rendah
5
daripada pengecoh harus ditinjau kembali atau digugurkan. Pengecoh yang layak dipakai
yaitu yang memiliki daya beda sekurang-kurangnya 0,03.
4. Reliabilitas Soal
Reliabilitas dapat diartikan sebagai sejauh mana suatu alat ukur dapat diyakini
memberikan informasi yang konsisten dan tidak mendua tentang karakteristik perserta tes
yang diujikan (S. Hamid Hasan dan Asmawi Zainul, 1991/1992).
Pengukuran yang memiliki reliabilitas tinggi disebut sebagai pengukuran yang
reliabel. Walaupun reliabilitas mempunyai berbagai nama lain seperti ketepercayaan,
keterandalan, keajegan, kestabilan, konsistensi, dan sebagainya, namun ide pokok yang
terkandung dalam konsep reliabilitas adalah sejauh mana hasil suatu pengukuran dapat
dipercaya (Saifuddin Azwar, 1998). Hasil pengukuran dapat dipercaya apabila dalam
beberapa kali pengukuran terhadap kelompok subjek yang sama diperoleh hasil yang relatif
sama, selama aspek yang diukur dalam diri subjek memang belum berubah. Setiap
pengukuran/tes dilakukan pemakai tes mengharapkan jaminan bahwa hasil yang diperoleh
akan sama apabila individu peserta tes yang sama dites ulang dengan kondisi yang sama.
Konsistensi skor tes yang diperoleh ini yang disebut reliabilitas. Jadi, istilah reliabilitas tes
adalah tingkat seberapa jauh skor deviasi seseorang tetap konsisten dengan pengulangan tes
yang sama atas tes yang dianggap sama (Croeker & Algina, 1986).
Reliabilitas yang dapat digunakan dalam menganalisis soal-soal tes adalah reliabilitas
dengan pendekatan konsistensi internal. Pendekatan ini dalam estimasi reliabilitas
dimaksudkan antara lain untuk menghindari masalah-masalah yang biasanya ditimbulkan oleh
pendekatan tes ulang dan pendekatan bentuk paralel. Reliabilitas internal diperoleh dengan
cara mengujicobakan kepada sasaran satu kali kemudian dianalisis dengan menggunakan
teknik analisis formula koefisien Alpha () Cronbach, yaitu untuk mengetahui besarnya
koefisien reliabilitas. Dari analisis dapat diketahui apakah instrumen itu memiliki tingkat
keandalan yang tinggi atau tidak. Tinggi rendahnya keandalan instrumen secara empirik
dibuktikan dengan besarnya reliabilitas instrumen yang diperoleh berdasarkan hasil uji coba
instrumen.
Besarnya koefisien reliabilitas berkisar antara 0 sampai dengan 1,00 akan tetapi pada
kenyataannya koefisien sebesar 1,00 tidak pernah dijumpai. Kesepakatan informal
menghendaki bahwa koefisien reliabilitas haruslah setinggi-tingginya, biasanya suatu
koefisien reliabilitas di sekitar 0,90 dapat dianggap memuaskan (Saifuddin Azwar, 1998).
6
Adapun menurut Mehrens & Lehman (1978), kriteria minimal koefisien reliabilitas instrumen
untuk pengukuran kelompok adalah 0,65 dan untuk pengukuran individu sebesar 0,85.
Adapun rumus yang dapat digunakan untuk mencari koefisien reliabilitas di antaranya
adalah rumus yang dikemukakan oleh Kuder dan Richardson, yaitu K-R.20 dan K-R.21
Rumus K-R.20:
n S2 - pq r11 = ( --- ) ( ------------- ) n – 1 S2
Rumus K-R.21:
n M (n – M)r11 = ( ----- ) ( ------------ ) n – 1 nSt
2
Keterangan:
r11 = reliabilitas tes secara keseluruhan
p = proporsi subjek yang menjawab butir soal dengan benar
q = proporsi subjek yang menjawab butir soal dengan salah (q = 1 – p)
pq = jumlah hasil perkalian antara p dan q
n = banyaknya butir soal
S = standar deviasi tes (standar deviasi = akar varians)
M = mean atau rerata skor total
5. Kesalahan Baku Pengukuran
Kesalahan baku pengukuran disebut juga error standar dalam pengukuran (standard
error of measurement atau SEM). Kesalahan pengukuran dalam tes dapat disebabkan oleh
kesalahan pengambilan sampel atau kesalahan pengukuran dalam instrumen itu sendiri.
Semakin kecil harga se maka pengukuran semakin cermat dan semakin dapat
dipercaya. Melihat besarnya error standar dalam pengukuran lebih penting dalam
membandingkan ketepercayaan hasil ukur suatu tes sebab tes yang reliabel adalah yang paling
kecil varians errornya dalam melakukan pengukuran (Saifuddin Azwar, 1997). Untuk
mencari besarnya SEM perangkat tes, Hopkins, K.D., Stanley,J.C., dan Hopkins, B.R. (1990)
mengemukakan rumus:
7
e = 1 - xx
Keterangan:
e = kesalahan baku pengukuran
= simpangan baku (standar deviasi) skor tes
xx = koefisien reliabilitas tes
Untuk menentukan standar kesalahan pengukuran, harga SEM tersebut dibandingkan
dengan perkiraan standar kesalahan suatu perangkat tes berdasarkan panjang tes. Adapun cara
untuk menentukan besarnya perkiraan yang akurat mengenai standar kesalahan pengukuran,
Hopkins et.al. (1990) mengemukakan rumus sebagai berikut:
e = 0,43 K
Keterangan:
e = perkiraan yang akurat kesalahan baku pengukuran
K = panjang tes atau banyaknya butir soal tes.
C. ANALISIS BUTIR DENGAN PROGRAM ITEMAN
1. Informasi Umum
ITEMAN (Item and Test Analysis) adalah perangkat lunak komputer yang
diciptakan untuk keperluan analisis statistik butir soal dan tes. Program ITEMAN dibuat
dengan pendekatan analisis butir soal secara klasikal, yang berguna untuk menentukan
kualitas butir soal dan tes berdasarkan data empiris hasil ujicoba. Hasil analisis butir soal
mencakup informasi mengenai tingkat kesukaran soal, daya pembeda soal, dan statistik
sebaran jawaban. Selain menghasilkan statistik butir soal, program ITEMAN juga
menghasilkan statistik tes yang meliputi reliabilitas tes, kesalahan pengukuran, dan
distribusi skor.
2. Sistem Komputer yang Digunakan
Sistem operasi minimal yang dipersyaratkan adalah DOS versi 3.0, yang berarti
program ini juga dapat dijalankan pada sistem operasi DOS versi yang lebih tinggi.
Program ITEMAN memerlukan program editor untuk mengedit program dan mengentry
(memasukkan) data. Program editor yang bisa digunakan antara lain WORDSTAR,
WORD PERFECT, dan SIDE KICK untuk sistem operasi DOS. Sedangkan untuk sistem
8
operasi Windows, program editor yang bisa digunakan adalah MICROSOFT WORD,
NOTE PAD, atau WORD PAD.
3. Instalasi Program
a. Jika menggunakan sistem operasi DOS (mungkin sekarang jarang/tidak digunakan)
Buat directory ITEMAN dengan perintah C:\MD ITEMAN
Masuk ke directory ITEMAN dengan perintah C:\CD ITEMAN
Setelah muncul C>ITEMAN, masukkan disket yang berisi program
ITEMAN.EXE ke drive A
Kopi program ITEMAN dengan perintah C>COPY A:ITEMAN.EXE
b. Jika menggunakan sistem operasi Windows
Buat folder ITEMAN dengan mengeklik tombol kanan mouse
Masuk ke folder ITEMAN dengan mengeklik dua kali folder ITEMAN
Masukkan disket yang berisi program ITEMAN.EXE ke drive A
Kopi program ITEMAN dengan perintah DRUG and DROP pada Windows
Explorer atau EDIT COPY pada My Computer
4. Format File Data
Program ITEMAN hanya dapat menganalisis file data dengan format ASCII. File
tersebut dapat dibuat dengan menggunakan text editor atau word processor yang dapat
menghasilkan file ASCII atau teks non-document. Seluruh data yang akan dianalisis
berada dalam satu file. Program ITEMAN mampu menganalisis maksimum 250 butir soal
dalam satu file, dengan kapasitas 3000 responden. Lebar karakter maksimum dalam satu
file adalah 255 karakter, termasuk identitas responden.
File data untuk analisis dengan program ITEMAN terdiri atas dua bagian, yaitu
kontrol dan jawaban responden. Jawaban responden dapat berupa huruf (A, B, C, D, dst.)
atau angka (1, 2, 3, 4, dst.). Dalam hal ini A = a = 1; B = b = 2, dan seterusnya. Data yang
akan dianalisis disimpan dalam file dengan nama tertentu diikuti tanda titik dan tulisan txt
atau dat, misalnya contoh.txt atau contoh.dat; latihan-1.txt atau latihan-1.dat.
Contoh penulisan data: nama file: contoh.txt
056 0 N 02
9
acbbbaccdabadcbabccdcdabaaabcbcbdabbdacbdaaaacdbaddadbac
44444444444444444444444444444444444444444444444444444444
yyyyyyyyyyyyyyyyyyyyyyyyyyyyyyyyyyyyyyyyyyyyyyyyyyyyyyyy
01dccbaadcdcbbdaaacccdcdadabcdbaabdadbdacbaaaacccbadcaabac
02acbdaaccddcddcbabdbdcdadacabbadadabbdaccaabaaadbacdabbac
03acacaacccdbccdbdbabdadaaaadbcacbadbbcacbdcaaacdcaddadbad
04abbaaaccddbadacbdddddcdadabcbcacddaddbacbaabaccdcadcabca
05acadbaccdcbadcdadbddadabadcabbdbdabbcacbddbadcdbadcabbad
06daacaabadcaaadddcbddcdadabdbcbdaadbbaacbddbaccbbadcabbad
07accaaaabacdaacdccadacdadbdaaddbdaabcbbbacbbabccbacaabaca
08acaaaaccddaadcadbabdadadadbbcacbdabbaaacaabaccdbadcabbbd
09accaaaacddbaccbdcabccbcaabcacbabdabbbacababadcdaadcadbab
10acbbbaccddbbdcbabdbdcdaaadcbacbbbaccddbbcdbabdbdcdaaadcb
11acadacccdcbbdabdccbdcdadaddcdbdadabbdacbcabadccbaacadbad
12accaaaabacdaacdccadacdadbdaaddbdaabcbbbacbbabccbacaabaca
13abbaaaccddbadacbdddddcdadabcbcacddaddbacbaabaccdcadcabca
14acbcaaccdddbdcbadcbdcdadadcbcbcbaabbdacbcaaadcdcaccacbad
15acbcaacddcbadccacbbdcdabaacbbbdbdabbbadcdaaabcdbaddabdab
………………………………………………………………………………………………………………………………………………………..
10
50abbaaaccddbadacbdddddcdadabcbcacddaddbacbaabaccdcadcabca
Keterangan:
Empat baris pertama isi file merupakan baris kontrol
Baris kelima dan seterusnya berisi jawaban setiap responden
a. Baris pertama
Kolom Isi Dalam Contoh Keterangan
1 – 3 Jumal butir soal (maks. 250) 056 Ada 56 soal
4 Kosong (spasi) - -
5 Untuk jawaban omit (kosong) 0 -
6 Kosong (spasi) - -
7 Untuk soal yang belum sempat dikerjakan
N
8 Kosong (spasi) - -
9 –10 Jumlah identitas data siswa (maksimum 80)
02 Ada 2 digit identitas res-ponden
b. Baris kedua berisi kunci jawaban. Kode kunci jawaban harus sama dengan kode
jawaban responden, apakah huruf atau angka.
c. Baris ketiga berisi jumlah pilihan jawaban (opsi). Dalam contoh ada 4 pilihan
jawaban. Angka 4 dalam contoh ditulis sama banyak dengan banyaknya butir soal
(kunci jawaban).
d. Baris keempat berisi kode/skala tes, “Y” menyatakan butir soal dianalisis, sedangkan
“N” menyatakan butir soal tidak dianalisis (dianulir). Untuk tes berskala kode/skala
tes bisa diisi dengan bilangan “0”, “1”, “2”, dan seterusnya.
e. Baris kelima dan seterusnya berisi jawaban tipa-tiap responden.
Apabila jawaban siswa dinyatakan dengan angka maka isi file contoh.txt akan tampak
seperti berikut.
056 0 N 02
13222233441243212324...dst.
44444444444444444444...dst.
11
yyyyyyyyyyyyyyyyyyyy...dst.
0143421143432242113334...dst.
0213241133443443212424
0313131133342334242124
0412211133442141324414
0513142133422143414214
0641131121431114443244
0713411112114113433141
0813111133441143142124
0913311123442133243123
1013222133442243212424...dst.
......................
5013222133442243212424...dst.
5. Langkah-langkah Memasukkan Data
a. Melalui DOS
1) Masuk ke DOS promt, pada layar monitor akan muncul tulisan C:\WINDOWS\
2) Ketiklah cd\ kemudian tekan enter maka akan muncul C:\>
3) Selanjutnya ketiklah edit kemudian tekan enter maka akan muncul halaman kosong
untuk mengisikan data. Pada halaman ini tulislah data sebagaimana terdapat pada
contoh penulisan data di muka.
4) Setelah data dimasukkan semua, klik File kemudian klik Save, selanjutnya tulislah
nama File yang dikehendaki (misalnya Contoh.txt) dan tekan enter.
5) Pengisian data telah selesai.
6) Untuk mengakhiri pengisisan data klik File kemudian klik Exit maka akan muncul
C:\>.
7) Langkah selanjutnya adalah menjalankan program ITEMAN dengan cara
menuliskan ITEMAN di belakang C:\>
b. Melalui Notepad
1) Buka halaman Notepad melalui menu Accessories.
2) Pada halaman ini tulislah data sebagaimana terdapat pada contoh penulisan data di
muka.
12
3) Setelah data dimasukkan semua, klik File kemudian klik Save, selanjutnya tulislah
nama File yang dikehendaki (misalnya Contoh.txt) dan tekan enter.
4) Pengisian data telah selesai.
5) Langkah selanjutnya adalah menjalankan program ITEMAN
6. Menjalankan Program
Program ITEMAN dalam sistem operasi DOS dijalankan dengan mengetik
ITEMAN dilanjutkan ENTER pada directory yang ada program ITEMAN-nya.
Sedangkan pada sistem WINDOWS prorgram ITEMAN dijalankan dengan mengeklik
shortcut ITEMAN dua kali. Apabila hal itu sudah dijalankan maka di layar komputer
akan muncul:
MicroCAT (tm) Testing System Copyright (c) 1982, 1984, 1986, 1988 by Assessment Systems Corporation
Beta-Test Version—Univ. of Pittsburgh
Item and Test Analysis Program -- ITEMAN (tm) Version 3.00
Enter the name of the input file:
a. Komputer minta diisikan nama file input (dalam contoh adalah file contoh.txt). Ketikkan
nama file contoh.txt kemudian tekan enter!
Selanjutnya di layar komputer akan muncul:
Enter the name of output file: _
b. Komputer minta diisikan nama file output (misalnya dalam contoh digunakan file
hasil.txt). Ketikkan nama file hasil.txt. kemudian tekan enter!
Selanjutnya di layar komputer akan muncul:
Do you want the score written to file? (Y/N)_
13
c. Komputer minta jawaban Y (Yes) atau N (No). apabila dikehendaki dibuat file output
maka ketikkan Y, sedangkan bila tidak dikehendaki ketikkan N. Bila diketik/ditulis Y
maka di layar akan muncul:
Enter the name of the score file: _
d. Komputer minta diisikan nama file untuk skor peserta tes (misalnya dalam contoh
digunakan file skor.txt). Ketikkan nama file skor.txt kemudian tekan enter!
e. Dengan demikian, proses analisis telah selesai.
Apabila hal ini dilakukan melalui DOS maka dalam selang waktu beberapa detik di layar
komputer akan muncul:
**ITEM ANALYSIS IS COMPLETE**
f. Selanjutnya, keluar dari program dengan menutup Program Iteman (jika menggunakan
DOS, maka tuliskan exit untuk keluar dari program tersebut.
7. Hasil Analisis
Apabila proses menjalankan program ITEMAN pada nomor 6 sudah dilakukan
dengan baik maka akan diperoleh hasil analisis yang tersimpan dalam file hasil.txt. File
tersebut dibuka dengan program text editor atau word processor. Hasilnya adalah sbb.:
MicroCAT (tm) Testing System Copyright (c) 1982, 1984, 1986, 1988 by Assessment Systems Corporation
Item and Test Analysis Program -- ITEMAN (tm) Version 3.00
Item analysis for data from file contoh.dat Page 1
Item Statistics Alternative Statistics ----------------------- -----------------------------------Seq. Scale Prop. Point Prop. PointNo. -Item Correct Biser. Biser. Alt. Endorsing Biser. Biser. Key---- ----- ------- ------ ------ ----- --------- ------ ------ ---
1 0-1 0.800 0.943 0.660 a 0.000 -9.000 -9.000 b 0.180 -1.000 -0.699 c 0.800 0.943 0.660 * d 0.020 0.090 0.031 Other 0.000 -9.000 -9.000
2 0-2 0.740 0.831 0.614 a 0.180 -1.000 -0.699 b 0.740 0.831 0.614 * c 0.040 0.101 0.044 d 0.040 -0.113 -0.049 Other 0.000 -9.000 -9.000
14
3 0-3 0.340 0.576 0.445 a 0.340 0.576 0.445 * b 0.060 0.039 0.020 c 0.240 -0.010 -0.007 d 0.360 -0.568 -0.443 Other 0.000 -9.000 -9.000 4 0-4 0.720 -0.047 -0.035 a 0.080 0.083 0.046 b 0.160 -0.049 -0.033 CHECK THE KEY c 0.040 0.178 0.078 ? d was specified, c works better d 0.720 -0.047 -0.035 * Other 0.000 -9.000 -9.000
5 0-5 0.220 0.320 0.228 a 0.220 0.320 0.228 * b 0.220 0.065 0.047 CHECK THE KEY c 0.320 -0.689 -0.528 a was specified, d works better d 0.240 0.426 0.310 ? Other 0.000 -9.000 -9.000
6 0-6 0.700 0.774 0.587 a 0.040 0.062 0.027 b 0.700 0.774 0.587 * c 0.060 -0.045 -0.023 d 0.200 -0.961 -0.673 Other 0.000 -9.000 -9.000 ……………………………………………………………………………………………………………………………………………………………………………… 70 0-70 0.600 -0.273 -0.215 a 0.080 0.117 0.064 b 0.260 0.313 0.232 ? CHECK THE KEY c 0.060 -0.115 -0.058 d was specified, b works better d 0.600 -0.273 -0.215 * Other 0.000 -9.000 -9.000 …….……………………………………………………………………………………………
MicroCAT (tm) Testing SystemCopyright (c) 1982, 1984, 1986, 1988 by Assessment Systems Corporation
Item and Test Analysis Program -- ITEMAN (tm) Version 3.00
Item analysis for data from file contoh.dat Page 11
There were 50 examinees in the data file.
Scale Statistics----------------
Scale: 0 -------N of Items 70N of Examinees 50Mean 44.400Variance 143.160Std. Dev. 11.965Skew -1.226Kurtosis 0.742
15
Minimum 12.000Maximum 61.000Median 48.000Alpha 0.920SEM 3.376Mean P 0.634Mean Item-Tot. 0.396Mean Biserial 0.521
----------------------------------------------------------------------Print Out Skor Tes
2 1 Scores for examinees from file contoh.txt
01 34.00
02 37.00
03 35.00
04 19.00
………..
50 19.00
Penjelasan Hasil Analisis
a. Statistik Butir Soal
Seq.No. adalah nomor urut butir soal dalam file data.
Scale-Item adalah nomor urut butir soal dalam skala (tes/subtes).
Prop-Correct adalah proporsi responden yang menjawab benar butir soal tersebut.
Biser adalah indeks daya pembeda soal dengan menggunakan koefisien korelasi
biserial.
Point Biser adalah indeks daya pembeda soal dan pilihan jawaban dengan
menggunakan koefisien point-biserial
b. Statistik Tes/Skala
N of Items adalah jumlah butir soal dalam tes/skala yang ikut dianalisis.
N of Examinees adalah jumlah peserta tes (jumlah responden).
Mean adalah skor rata-rata peserta tes.
Variance adalah varians dari distribusi skor peserta tes.
Std. Dev. Adalah deviasi standar dari distribusi skor peserta tes.
Skew adalah kemiringan distribusi skor peserta tes.
Kurtosis adalah puncak distribusi skor atau keruncingan kurva.
Minimum adalah skor terendah peserta tes.
16
Maximum adalah skor tertinggi peserta tes.
Median adalah skor tengah peserta tes.
Alpha adalah koefisien reliabilitas alpha untuk tes/skala tersebut.
SEM adalah kesalahan pengukuran standar.
Mean P adalah rata-rata tingkat kesukaran semua butir soal dalam tes secara klasikal.
Mean Item Tot adalah nilai rata-rata indeks daya pembeda dari semua soal dalam tes,
yang dihitung dari rata-rata koefisien point-biserial.
Mean Beserial adalah juga nilai rata-rata indeks daya pembeda dari semua soal
dalam tes, yang dihitung dari rata-rata koefisien biserial.
DAFTAR PUSTAKA
Croeker, L. & Algina, J. (1986). Introduction to Classical and Modern Test Theory. New York: Holts, Rinehart, and Winston.
Depdikbud. (1987). Pedoman Penulisan Tes Hasil Belajar. Jakarta: Balitbang Depdikbud.
Ebel, R.L. (1979). Essentials of Educational Measurement,. (3th ed). Englewood Cliffs, NJ: Prentice-Hall, Inc.
Hopkins, K.D., Stanley, J.C. dan Hopkins, B.R. (1990). Educational and Psychological Measurement and Evaluation. Englewood Cliffs, NJ: Prentice Hall.
Mehrens, W.A., & Lehman, I.J. (1978). Measurement and Evaluation in Education and Psychology, (3th ed). New York: The Dryden Press.
Oller, John W. (1979). Language Tests at School, Pragmatic Approach. London: Logman Group.
Pakpahan. (1990). Analisis Soal Berdasarkan Data Empirik. Jakarta: Pusisjian Depdikbud.
Saifuddin Azwar. (1997). Reliabilitas dan Validitas. Yogyakarta: Pustaka Pelajar. ----------------------. (1998). Tes Prestasi. Yogyakarta: Pustaka Pelajar.
S. Hamid Hasan dan Asmawi Zainul. (1901/1992). Evaluasi Hasil Belajar. Jakarta:
17
Suharsimi Arikunto. (1997). Dasar-dasar Evaluasi Pendidikan. Jakarta: Bumi Aksara.
18