MATERI ITEMAN-1

ANALISIS BUTIR TES OBJEKTIF

DENGAN BANTUAN KOMPUTER

PROGRAM ITEMAN VERSION 3.00

Oleh:

Suhartono

PROGRAM STUDI PENDIDIKAN GURU SEKOLAH DASAR

FAKULTAS KEGURUAN DAN ILMU PENDIDIKAN

UNIVERSITAS SEBELAS MARET SURAKARTA

2010

A. PENDAHULUAN

0

Penilaian hasil belajar merupakan upaya mengumpulkan informasi untuk mengetahui

seberapa jauh pengetahuan dan kemampuan telah dicapai oleh para siswa setiap semester,

akhir tahun ajaran, atau akhir pendidikan. Penilaian yang dilaksanakan di sekolah-sekolah saat

ini paling banyak menggunakan instrumen tes.

Penyelenggaraan penilaian hasil belajar pada akhir semester atau akhir tahun ajaran

dilaksanakan oleh sekolah yang bersangkutan dengan berpedoman pada kisi-kisi dari Kantor

Wilayah Depatemen Pendidikan Nasional. Sebagai konsekuensinya, setiap guru dituntut

untuk dapat menyusun soal-soal tes dalam melaksanan penilaian tersebut. Agar soal-soal tes

yang disusun guru dapat memenuhi fungsinya dengan baik maka perlu dikuasai kaidah

penyusunan soal-soal tes.

Soal-soal tes yang telah disusun oleh guru dibuat berdasarkan ketentuan yang ada sesuai

dengan kemampuan masing-masing. Selanjutnya, untuk mengetahui apakah soal-soal tes

tersebut sudah baik atau belum perlu dianalisis hasilnya. Analisis tes bertujuan untuk

mengadakan identifikasi soal-soal yang baik, kurang baik, dan soal yang jelek. Dengan

analisis soal dapat diperoleh informasi tentang kejelekan sebuah soal dan petunjuk untuk

mengadakan perbaikan. Butir soal (tes objektif) yang baik dapat dilihat dari tiga hal, yaitu:

taraf kesukaran, daya beda, dan pola jawaban soal. Di samping itu, perlu juga diketahui

reliabilitas soal-soal tes yang telah dibuat.

Menghitung taraf kesukaran, daya beda, pola jawaban, dan reliabilitas soal tes jika

dilakukan secara manual memerlukan waktu yang cukup lama dan melelahkan serta kadang-

kadang hasilnya tidak tepat. Dengan kemajuan teknologi komputer, penyelesaian pekerjaan di

atas dapat dilakukan dalam waktu yang singkat dengan hasil yang akurat. Di antara program

yang dapat digunakan untuk menganalisis hasil tes adalah Program Iteman Version 3.00.

Tulisan berikut merupakan upaya untuk membantu para guru dalam menganalisis tes

objektif yang dibuat sendiri. Informasi yang dihasilkan diharapkan dapat mereka gunakan

untuk mengetahui kualitas tes yang telah dibuat.

B. KELAYAKAN KARAKTERISTIK BUTIR SOAL TES OBJEKTIF

Agar butir soal yang digunakan memenuhi syarat yang baik maka perlu dilakukan

analisis butir soal secara kuantitatif berdasarkan data yang dihasilkan dari pengetesan.

Analisis butir soal dapat dilakukan secara manual maupun dengan bantuan komputer.

Analisis secara manual memerlukan waktu cukup lama dan kadang-kadang hasilnya tidak

1

akurat. Dengan bantuan program komputer, analisis butir soal tes dapat dilakukan dengan

waktu yang singkat serta hasil yang akurat. Analisis mengenai karakteristik butir soal ini

meliputi: (1) tingkat kesukaran butir soal; (2) daya beda butir soal; (3) distribusi jawaban,

termasuk kunci jawaban dan pengecoh pada setiap butir soal; (4) reliabilitas soal; dan (5)

kesalahan baku pengukuran.

1. Tingkat Kesukaran Butir Soal

Tingkat kesukaran butir soal adalah pernyataan tentang seberapa mudah atau sulit

sebuah bitir soal bagi siswa yang dikenai pengukuran (Oller, 1979). Saifuddin Azwar (1998)

menyatakan bahwa tingkat kesukaran butir soal merupakan rasio antara penjawab butir soal

dengan benar dan banyaknya penjawab butir soal. Tingkat kesukaran butir soal dinyatakan

oleh suatu indeks yang disebut indeks kesukaran. Indeks kesukaran butir soal disimbolkan

dengan huruf p.

Selanjutnya dinyatakan bahwa secara teoretik p sebenarnya merupakan probabilitas

empirik untuk lulus butir soal tertentu bagi kelompok siswa tertentu. Rumus indeks kesukaran

butir soal adalah:

p = ni/N atau p = B/JS

Keterangan:

ni atau B = banyaknya siswa yang menjawab butir soal dengan benar

N atau JS = banyaknya siswa yang menjawab butir soal

Indeks kesukaran butir soal atau p dinyatakan dengan angka yang berada antara 0,00

sampai dengan 1,00. Klasifikasi indeks/tingkat kesukaran butir soal menurut Depdikbud

(1987) adalah: p = 0,21 – 0,40 , kategori butir soal sukar; p = 0,41 – 0,70 , kategori butir soal

sedang; dan p = 0,71 – 0,90 , kategori butir soal mudah.

Berdasarkan klasifikasi tingkat kesukaran tersebut, kategori butir soal sukar, sedang,

dan mudah dapat digunakan. Adapun butir soal yang ekstrem sukar (p sangat rendah), yaitu p

kurang dari 0,21 dan butir soal yang ekstrem mudah (p sangat tinggi), yaitu p lebih dari 0,90

tidak dipakai. Menurut Saifuddin Azwar (1998), butir soal yang tingkat kesukarannya sangat

rendah atau sangat tinggi akan mempunyai daya beda yang kurang baik. Butir soal dianggap

baik apabila memiliki tingkat kesukaran p antara 0,21 sampai dengan 0,90 atau yang

memiliki tingkat kesukaran mudah, sedang, dan sukar.

Contoh penghitungan:

2

Dari hasil analisis tes yang terdiri atas 10 butir soal yang dikerjakan oleh 20 orang siswa,

terdapat dalam tabel berikut.

SiswaKelom-

pok

Nomor Soal Skor

Siswa1 2 3 4 5 6 7 8 9 10

A B 1 0 1 0 0 0 1 1 1 0 5

B A 0 1 1 1 1 1 0 0 1 1 7

C A 1 0 1 0 1 1 1 1 1 1 8

D B 0 0 1 0 0 1 1 1 1 0 5

E A 1 1 1 1 1 1 1 1 1 1 10

F B 1 1 0 0 0 1 1 1 1 0 6

G B 0 1 0 0 0 1 1 1 1 1 6

H B 0 1 1 0 0 1 0 1 1 1 6

I A 1 1 1 0 0 1 1 1 1 1 8

J A 1 1 1 1 0 0 1 0 1 1 7

K A 1 1 1 0 0 1 1 1 1 0 7

L B 0 1 0 1 1 0 0 1 1 0 5

M B 0 1 0 0 0 0 0 1 1 0 3

N A 0 0 1 0 1 1 1 1 1 1 7

O A 1 1 0 1 1 1 1 1 1 1 9

P B 0 1 0 0 0 1 0 0 1 0 3

Q A 1 1 0 1 0 1 1 1 1 1 8

R A 1 1 1 1 0 1 1 1 1 0 8

S B 1 0 1 0 0 1 1 1 1 0 6

T B 0 1 0 1 0 1 1 1 1 0 6

Jumlah 11 15 12 8 6 16 15 17 20 10

Tk. Kesukaran 0,55 0,75

Daya Beda

Berdasarkan tabel di atas, soal nomor 1 mempunyai tingkat kesukaran 11 : 20 = 0,55

soal nomor 2 mempunyai tingkat kesukaran 15 : 20 = 0,75

soal nomor 3 dst. cobalah hitung tingkat kesukarannya!

2. Daya Beda Butir Soal

3

Daya beda butir soal adalah kemampuan butir soal dalam membedakan antara siswa

yang mempunyai kemampuan tinggi (kelompok tinggi) dan siswa yang mempunyai

kemampuan rendah (kelompok rendah) (Saifuddin Azwar, 1998).

Suatu butir soal dikatakan mempunyai daya beda yang tinggi harus dijawab dengan

benar oleh semua atau sebagian besar subjek kelompok tinggi dan tidak dapat dijawab dengan

benar oleh semua atau sebagian besar subjek kelompok rendah. Adapun rumus daya beda

butir soal adalah:

d = (Ba – Bb) : 0,5T atau d = niT/NT – niR/NR

Keterangan:

Ba atau niT = banyaknya penjawab butir soal dengan benar dari kelompok

tinggi/atas

NT = banyaknya penjawab dari kelompok tinggi/atas

Bb atau niR = banyaknya penjawab butir soal dengan benar dari kelompok

rendah/bawah

NR = banyaknya penjawab dari kelompok rendah/bawah

T = jumlah peserta tes (jika gasal, T = jumlah peserta tes dikurangi 1)

Cara menentukan kelompok tinggi/atas dan kelompok rendah/bawah yaitu:

Untuk kelompok kecil (kurang dari 100): seluruh testi dibagi dua, 50% testi yang

mendapatkan skor tertinggi sebagai kelompok tinggi dan 50% testi yang mendapatkan

skor terendah sebagai kelompok rendah

Untuk kelompok besar: diambil 2 kelompok, 27% skor teratas sebagi kelompok tinggi dan

27% skor terendah sebagi kelompok rendah.

Indeks daya beda d besarnya berkisar mulai dari –1 sampai dengan +1, namun hanya

harga d yang positif sajalah yang memiliki arti dalam analisis butir soal.

Indeks daya beda yang ideal adalah yang mendekati angka 1. Semakin besar indeks

daya beda berarti butir soal tersebut semakin mampu membedakan antara mereka yang

mampu menguasai bahan yang diujikan dan mereka yang tidak. Semakin kecil indeks daya

beda (semakin mendekati 0) berarti semakin tidak jelaslah fungsi butir yang bersangkutan

dalam membedakan mana subjek yang mampu menguasai bahan yang diujikan dan mana

subjek yang tidak tahu apa-apa.

Ebel (1979) mengelompokkan indeks daya beda dalam empat kategori, yaitu:

4

0,40 atau lebih = bagus sekali

0,30 - 0,39 = lumayan bagus, tetapi mungkin masih perlu peningkatan

0,20 - 0,29 = belum memuaskan, perlu diperbaiki

kurang dari 0,20 = jelek dan harus dibuang

Menurut Suharsimi Arikunto, indeks daya beda dikategorikan sebagai berikut:

0,00 – 0,20 = jelek

0,21 – 0,40 = cukup

0,41 – 0,70 = baik

0,71 – 1,00 = baik sekali

Contoh penghitungan:

Berdasarkan data pada tabel di atas, soal nomor 1 diketahui bahwa:

Kelompok tinggi yang menjawab betul 8 orang

Kelompok rendah yang menjawab betul 3 orang

Maka d = (8 – 3) : 10 = 0,5

Jadi, daya beda butir soal nomor 1 adalah 0,5

Selanjutnya, cobalah hitung daya beda butir soal nomor 2 s.d. nomor 10

3. Distribusi Jawaban

Struktur butir soal terdiri atas pokok soal atau stem dan alternatif jawaban atau opsi

yang terdiri atas kunci jawaban dan pengecoh.

Untuk setiap kunci jawaban, kelompok tinggi harus memilih lebih banyak daripada

kelompok rendah dan kelompok rendah harus lebih banyak memilih pada pengecoh daripada

kelompok tinggi. Selain itu, semua alternatif jawaban yang disediakan harus ada siswa yang

memilihnya.

Efektivitas pengecoh dilihat dari dua kriteria, yaitu (a) pengecoh dipilih oleh siswa

dari kelompok rendah, dan (b) pemilih pengecoh tersebar relatif proporsional pada masing-

masing pengecoh yang ada (Saifuddin Azwar, 1998). Apabila proporsi siswa yang memilih

pengecoh kurang dari 0,03 maka pengecoh tersebut harus direvisi. Adapun pengecoh yang

tidak ada pemilihnya atau proporsinya 0,00 ditolak. Pakpahan (1990) menyatakan bahwa

proporsi jawaban pengecoh yang kurang dari 0,03 perlu direvisi.

Pengecoh yang baik memiliki daya beda yang negatif, yang berarti setiap pengecoh

dipilih lebih sedikit atau paling tidak daya beda pengecoh itu tidak lebih besar daripada daya

beda kunci jawaban pada setiap butir soal. Butir soal yang daya bedanya lebih rendah

5

daripada pengecoh harus ditinjau kembali atau digugurkan. Pengecoh yang layak dipakai

yaitu yang memiliki daya beda sekurang-kurangnya 0,03.

4. Reliabilitas Soal

Reliabilitas dapat diartikan sebagai sejauh mana suatu alat ukur dapat diyakini

memberikan informasi yang konsisten dan tidak mendua tentang karakteristik perserta tes

yang diujikan (S. Hamid Hasan dan Asmawi Zainul, 1991/1992).

Pengukuran yang memiliki reliabilitas tinggi disebut sebagai pengukuran yang

reliabel. Walaupun reliabilitas mempunyai berbagai nama lain seperti ketepercayaan,

keterandalan, keajegan, kestabilan, konsistensi, dan sebagainya, namun ide pokok yang

terkandung dalam konsep reliabilitas adalah sejauh mana hasil suatu pengukuran dapat

dipercaya (Saifuddin Azwar, 1998). Hasil pengukuran dapat dipercaya apabila dalam

beberapa kali pengukuran terhadap kelompok subjek yang sama diperoleh hasil yang relatif

sama, selama aspek yang diukur dalam diri subjek memang belum berubah. Setiap

pengukuran/tes dilakukan pemakai tes mengharapkan jaminan bahwa hasil yang diperoleh

akan sama apabila individu peserta tes yang sama dites ulang dengan kondisi yang sama.

Konsistensi skor tes yang diperoleh ini yang disebut reliabilitas. Jadi, istilah reliabilitas tes

adalah tingkat seberapa jauh skor deviasi seseorang tetap konsisten dengan pengulangan tes

yang sama atas tes yang dianggap sama (Croeker & Algina, 1986).

Reliabilitas yang dapat digunakan dalam menganalisis soal-soal tes adalah reliabilitas

dengan pendekatan konsistensi internal. Pendekatan ini dalam estimasi reliabilitas

dimaksudkan antara lain untuk menghindari masalah-masalah yang biasanya ditimbulkan oleh

pendekatan tes ulang dan pendekatan bentuk paralel. Reliabilitas internal diperoleh dengan

cara mengujicobakan kepada sasaran satu kali kemudian dianalisis dengan menggunakan

teknik analisis formula koefisien Alpha () Cronbach, yaitu untuk mengetahui besarnya

koefisien reliabilitas. Dari analisis dapat diketahui apakah instrumen itu memiliki tingkat

keandalan yang tinggi atau tidak. Tinggi rendahnya keandalan instrumen secara empirik

dibuktikan dengan besarnya reliabilitas instrumen yang diperoleh berdasarkan hasil uji coba

instrumen.

Besarnya koefisien reliabilitas berkisar antara 0 sampai dengan 1,00 akan tetapi pada

kenyataannya koefisien sebesar 1,00 tidak pernah dijumpai. Kesepakatan informal

menghendaki bahwa koefisien reliabilitas haruslah setinggi-tingginya, biasanya suatu

koefisien reliabilitas di sekitar 0,90 dapat dianggap memuaskan (Saifuddin Azwar, 1998).

6

Adapun menurut Mehrens & Lehman (1978), kriteria minimal koefisien reliabilitas instrumen

untuk pengukuran kelompok adalah 0,65 dan untuk pengukuran individu sebesar 0,85.

Adapun rumus yang dapat digunakan untuk mencari koefisien reliabilitas di antaranya

adalah rumus yang dikemukakan oleh Kuder dan Richardson, yaitu K-R.20 dan K-R.21

Rumus K-R.20:

n S2 - pq r11 = ( --- ) ( ------------- ) n – 1 S2

Rumus K-R.21:

n M (n – M)r11 = ( ----- ) ( ------------ ) n – 1 nSt

2

Keterangan:

r11 = reliabilitas tes secara keseluruhan

p = proporsi subjek yang menjawab butir soal dengan benar

q = proporsi subjek yang menjawab butir soal dengan salah (q = 1 – p)

pq = jumlah hasil perkalian antara p dan q

n = banyaknya butir soal

S = standar deviasi tes (standar deviasi = akar varians)

M = mean atau rerata skor total

5. Kesalahan Baku Pengukuran

Kesalahan baku pengukuran disebut juga error standar dalam pengukuran (standard

error of measurement atau SEM). Kesalahan pengukuran dalam tes dapat disebabkan oleh

kesalahan pengambilan sampel atau kesalahan pengukuran dalam instrumen itu sendiri.

Semakin kecil harga se maka pengukuran semakin cermat dan semakin dapat

dipercaya. Melihat besarnya error standar dalam pengukuran lebih penting dalam

membandingkan ketepercayaan hasil ukur suatu tes sebab tes yang reliabel adalah yang paling

kecil varians errornya dalam melakukan pengukuran (Saifuddin Azwar, 1997). Untuk

mencari besarnya SEM perangkat tes, Hopkins, K.D., Stanley,J.C., dan Hopkins, B.R. (1990)

mengemukakan rumus:

7

e = 1 - xx

Keterangan:

e = kesalahan baku pengukuran

= simpangan baku (standar deviasi) skor tes

xx = koefisien reliabilitas tes

Untuk menentukan standar kesalahan pengukuran, harga SEM tersebut dibandingkan

dengan perkiraan standar kesalahan suatu perangkat tes berdasarkan panjang tes. Adapun cara

untuk menentukan besarnya perkiraan yang akurat mengenai standar kesalahan pengukuran,

Hopkins et.al. (1990) mengemukakan rumus sebagai berikut:

e = 0,43 K

Keterangan:

e = perkiraan yang akurat kesalahan baku pengukuran

K = panjang tes atau banyaknya butir soal tes.

C. ANALISIS BUTIR DENGAN PROGRAM ITEMAN

1. Informasi Umum

ITEMAN (Item and Test Analysis) adalah perangkat lunak komputer yang

diciptakan untuk keperluan analisis statistik butir soal dan tes. Program ITEMAN dibuat

dengan pendekatan analisis butir soal secara klasikal, yang berguna untuk menentukan

kualitas butir soal dan tes berdasarkan data empiris hasil ujicoba. Hasil analisis butir soal

mencakup informasi mengenai tingkat kesukaran soal, daya pembeda soal, dan statistik

sebaran jawaban. Selain menghasilkan statistik butir soal, program ITEMAN juga

menghasilkan statistik tes yang meliputi reliabilitas tes, kesalahan pengukuran, dan

distribusi skor.

2. Sistem Komputer yang Digunakan

Sistem operasi minimal yang dipersyaratkan adalah DOS versi 3.0, yang berarti

program ini juga dapat dijalankan pada sistem operasi DOS versi yang lebih tinggi.

Program ITEMAN memerlukan program editor untuk mengedit program dan mengentry

(memasukkan) data. Program editor yang bisa digunakan antara lain WORDSTAR,

WORD PERFECT, dan SIDE KICK untuk sistem operasi DOS. Sedangkan untuk sistem

8

operasi Windows, program editor yang bisa digunakan adalah MICROSOFT WORD,

NOTE PAD, atau WORD PAD.

3. Instalasi Program

a. Jika menggunakan sistem operasi DOS (mungkin sekarang jarang/tidak digunakan)

Buat directory ITEMAN dengan perintah C:\MD ITEMAN

Masuk ke directory ITEMAN dengan perintah C:\CD ITEMAN

Setelah muncul C>ITEMAN, masukkan disket yang berisi program

ITEMAN.EXE ke drive A

Kopi program ITEMAN dengan perintah C>COPY A:ITEMAN.EXE

b. Jika menggunakan sistem operasi Windows

Buat folder ITEMAN dengan mengeklik tombol kanan mouse

Masuk ke folder ITEMAN dengan mengeklik dua kali folder ITEMAN

Masukkan disket yang berisi program ITEMAN.EXE ke drive A

Kopi program ITEMAN dengan perintah DRUG and DROP pada Windows

Explorer atau EDIT COPY pada My Computer

4. Format File Data

Program ITEMAN hanya dapat menganalisis file data dengan format ASCII. File

tersebut dapat dibuat dengan menggunakan text editor atau word processor yang dapat

menghasilkan file ASCII atau teks non-document. Seluruh data yang akan dianalisis

berada dalam satu file. Program ITEMAN mampu menganalisis maksimum 250 butir soal

dalam satu file, dengan kapasitas 3000 responden. Lebar karakter maksimum dalam satu

file adalah 255 karakter, termasuk identitas responden.

File data untuk analisis dengan program ITEMAN terdiri atas dua bagian, yaitu

kontrol dan jawaban responden. Jawaban responden dapat berupa huruf (A, B, C, D, dst.)

atau angka (1, 2, 3, 4, dst.). Dalam hal ini A = a = 1; B = b = 2, dan seterusnya. Data yang

akan dianalisis disimpan dalam file dengan nama tertentu diikuti tanda titik dan tulisan txt

atau dat, misalnya contoh.txt atau contoh.dat; latihan-1.txt atau latihan-1.dat.

Contoh penulisan data: nama file: contoh.txt

056 0 N 02

9

acbbbaccdabadcbabccdcdabaaabcbcbdabbdacbdaaaacdbaddadbac

44444444444444444444444444444444444444444444444444444444

yyyyyyyyyyyyyyyyyyyyyyyyyyyyyyyyyyyyyyyyyyyyyyyyyyyyyyyy

01dccbaadcdcbbdaaacccdcdadabcdbaabdadbdacbaaaacccbadcaabac

02acbdaaccddcddcbabdbdcdadacabbadadabbdaccaabaaadbacdabbac

03acacaacccdbccdbdbabdadaaaadbcacbadbbcacbdcaaacdcaddadbad

04abbaaaccddbadacbdddddcdadabcbcacddaddbacbaabaccdcadcabca

05acadbaccdcbadcdadbddadabadcabbdbdabbcacbddbadcdbadcabbad

06daacaabadcaaadddcbddcdadabdbcbdaadbbaacbddbaccbbadcabbad

07accaaaabacdaacdccadacdadbdaaddbdaabcbbbacbbabccbacaabaca

08acaaaaccddaadcadbabdadadadbbcacbdabbaaacaabaccdbadcabbbd

09accaaaacddbaccbdcabccbcaabcacbabdabbbacababadcdaadcadbab

10acbbbaccddbbdcbabdbdcdaaadcbacbbbaccddbbcdbabdbdcdaaadcb

11acadacccdcbbdabdccbdcdadaddcdbdadabbdacbcabadccbaacadbad

12accaaaabacdaacdccadacdadbdaaddbdaabcbbbacbbabccbacaabaca


14acbcaaccdddbdcbadcbdcdadadcbcbcbaabbdacbcaaadcdcaccacbad

15acbcaacddcbadccacbbdcdabaacbbbdbdabbbadcdaaabcdbaddabdab

………………………………………………………………………………………………………………………………………………………..

10


Keterangan:

Empat baris pertama isi file merupakan baris kontrol

Baris kelima dan seterusnya berisi jawaban setiap responden

a. Baris pertama

Kolom Isi Dalam Contoh Keterangan

1 – 3 Jumal butir soal (maks. 250) 056 Ada 56 soal

4 Kosong (spasi) - -

5 Untuk jawaban omit (kosong) 0 -


7 Untuk soal yang belum sempat dikerjakan

N


9 –10 Jumlah identitas data siswa (maksimum 80)

02 Ada 2 digit identitas res-ponden

b. Baris kedua berisi kunci jawaban. Kode kunci jawaban harus sama dengan kode

jawaban responden, apakah huruf atau angka.

c. Baris ketiga berisi jumlah pilihan jawaban (opsi). Dalam contoh ada 4 pilihan

jawaban. Angka 4 dalam contoh ditulis sama banyak dengan banyaknya butir soal

(kunci jawaban).

d. Baris keempat berisi kode/skala tes, “Y” menyatakan butir soal dianalisis, sedangkan

“N” menyatakan butir soal tidak dianalisis (dianulir). Untuk tes berskala kode/skala

tes bisa diisi dengan bilangan “0”, “1”, “2”, dan seterusnya.

e. Baris kelima dan seterusnya berisi jawaban tipa-tiap responden.

Apabila jawaban siswa dinyatakan dengan angka maka isi file contoh.txt akan tampak

seperti berikut.

056 0 N 02

13222233441243212324...dst.

44444444444444444444...dst.

11

yyyyyyyyyyyyyyyyyyyy...dst.

0143421143432242113334...dst.

0213241133443443212424

0313131133342334242124

0412211133442141324414

0513142133422143414214

0641131121431114443244

0713411112114113433141

0813111133441143142124

0913311123442133243123

1013222133442243212424...dst.

......................

5013222133442243212424...dst.

5. Langkah-langkah Memasukkan Data

a. Melalui DOS

1) Masuk ke DOS promt, pada layar monitor akan muncul tulisan C:\WINDOWS\

2) Ketiklah cd\ kemudian tekan enter maka akan muncul C:\>

3) Selanjutnya ketiklah edit kemudian tekan enter maka akan muncul halaman kosong

untuk mengisikan data. Pada halaman ini tulislah data sebagaimana terdapat pada

contoh penulisan data di muka.

4) Setelah data dimasukkan semua, klik File kemudian klik Save, selanjutnya tulislah

nama File yang dikehendaki (misalnya Contoh.txt) dan tekan enter.

5) Pengisian data telah selesai.

6) Untuk mengakhiri pengisisan data klik File kemudian klik Exit maka akan muncul

C:\>.

7) Langkah selanjutnya adalah menjalankan program ITEMAN dengan cara

menuliskan ITEMAN di belakang C:\>

b. Melalui Notepad

1) Buka halaman Notepad melalui menu Accessories.

2) Pada halaman ini tulislah data sebagaimana terdapat pada contoh penulisan data di

muka.

12

3) Setelah data dimasukkan semua, klik File kemudian klik Save, selanjutnya tulislah

nama File yang dikehendaki (misalnya Contoh.txt) dan tekan enter.

4) Pengisian data telah selesai.

5) Langkah selanjutnya adalah menjalankan program ITEMAN

6. Menjalankan Program

Program ITEMAN dalam sistem operasi DOS dijalankan dengan mengetik

ITEMAN dilanjutkan ENTER pada directory yang ada program ITEMAN-nya.

Sedangkan pada sistem WINDOWS prorgram ITEMAN dijalankan dengan mengeklik

shortcut ITEMAN dua kali. Apabila hal itu sudah dijalankan maka di layar komputer

akan muncul:

MicroCAT (tm) Testing System Copyright (c) 1982, 1984, 1986, 1988 by Assessment Systems Corporation

Beta-Test Version—Univ. of Pittsburgh

Item and Test Analysis Program -- ITEMAN (tm) Version 3.00

Enter the name of the input file:

a. Komputer minta diisikan nama file input (dalam contoh adalah file contoh.txt). Ketikkan

nama file contoh.txt kemudian tekan enter!

Selanjutnya di layar komputer akan muncul:

Enter the name of output file: _

b. Komputer minta diisikan nama file output (misalnya dalam contoh digunakan file

hasil.txt). Ketikkan nama file hasil.txt. kemudian tekan enter!

Selanjutnya di layar komputer akan muncul:

Do you want the score written to file? (Y/N)_

13

c. Komputer minta jawaban Y (Yes) atau N (No). apabila dikehendaki dibuat file output

maka ketikkan Y, sedangkan bila tidak dikehendaki ketikkan N. Bila diketik/ditulis Y

maka di layar akan muncul:

Enter the name of the score file: _

d. Komputer minta diisikan nama file untuk skor peserta tes (misalnya dalam contoh

digunakan file skor.txt). Ketikkan nama file skor.txt kemudian tekan enter!

e. Dengan demikian, proses analisis telah selesai.

Apabila hal ini dilakukan melalui DOS maka dalam selang waktu beberapa detik di layar

komputer akan muncul:

**ITEM ANALYSIS IS COMPLETE**

f. Selanjutnya, keluar dari program dengan menutup Program Iteman (jika menggunakan

DOS, maka tuliskan exit untuk keluar dari program tersebut.

7. Hasil Analisis

Apabila proses menjalankan program ITEMAN pada nomor 6 sudah dilakukan

dengan baik maka akan diperoleh hasil analisis yang tersimpan dalam file hasil.txt. File

tersebut dibuka dengan program text editor atau word processor. Hasilnya adalah sbb.:

MicroCAT (tm) Testing System Copyright (c) 1982, 1984, 1986, 1988 by Assessment Systems Corporation


Item analysis for data from file contoh.dat Page 1

Item Statistics Alternative Statistics ----------------------- -----------------------------------Seq. Scale Prop. Point Prop. PointNo. -Item Correct Biser. Biser. Alt. Endorsing Biser. Biser. Key---- ----- ------- ------ ------ ----- --------- ------ ------ ---

1 0-1 0.800 0.943 0.660 a 0.000 -9.000 -9.000 b 0.180 -1.000 -0.699 c 0.800 0.943 0.660 * d 0.020 0.090 0.031 Other 0.000 -9.000 -9.000

2 0-2 0.740 0.831 0.614 a 0.180 -1.000 -0.699 b 0.740 0.831 0.614 * c 0.040 0.101 0.044 d 0.040 -0.113 -0.049 Other 0.000 -9.000 -9.000

14

3 0-3 0.340 0.576 0.445 a 0.340 0.576 0.445 * b 0.060 0.039 0.020 c 0.240 -0.010 -0.007 d 0.360 -0.568 -0.443 Other 0.000 -9.000 -9.000 4 0-4 0.720 -0.047 -0.035 a 0.080 0.083 0.046 b 0.160 -0.049 -0.033 CHECK THE KEY c 0.040 0.178 0.078 ? d was specified, c works better d 0.720 -0.047 -0.035 * Other 0.000 -9.000 -9.000

5 0-5 0.220 0.320 0.228 a 0.220 0.320 0.228 * b 0.220 0.065 0.047 CHECK THE KEY c 0.320 -0.689 -0.528 a was specified, d works better d 0.240 0.426 0.310 ? Other 0.000 -9.000 -9.000

6 0-6 0.700 0.774 0.587 a 0.040 0.062 0.027 b 0.700 0.774 0.587 * c 0.060 -0.045 -0.023 d 0.200 -0.961 -0.673 Other 0.000 -9.000 -9.000 ……………………………………………………………………………………………………………………………………………………………………………… 70 0-70 0.600 -0.273 -0.215 a 0.080 0.117 0.064 b 0.260 0.313 0.232 ? CHECK THE KEY c 0.060 -0.115 -0.058 d was specified, b works better d 0.600 -0.273 -0.215 * Other 0.000 -9.000 -9.000 …….……………………………………………………………………………………………

MicroCAT (tm) Testing SystemCopyright (c) 1982, 1984, 1986, 1988 by Assessment Systems Corporation


Item analysis for data from file contoh.dat Page 11

There were 50 examinees in the data file.

Scale Statistics----------------

Scale: 0 -------N of Items 70N of Examinees 50Mean 44.400Variance 143.160Std. Dev. 11.965Skew -1.226Kurtosis 0.742

15

Minimum 12.000Maximum 61.000Median 48.000Alpha 0.920SEM 3.376Mean P 0.634Mean Item-Tot. 0.396Mean Biserial 0.521

----------------------------------------------------------------------Print Out Skor Tes

2 1 Scores for examinees from file contoh.txt

01 34.00

02 37.00

03 35.00

04 19.00

………..

50 19.00

Penjelasan Hasil Analisis

a. Statistik Butir Soal

Seq.No. adalah nomor urut butir soal dalam file data.

Scale-Item adalah nomor urut butir soal dalam skala (tes/subtes).

Prop-Correct adalah proporsi responden yang menjawab benar butir soal tersebut.

Biser adalah indeks daya pembeda soal dengan menggunakan koefisien korelasi

biserial.

Point Biser adalah indeks daya pembeda soal dan pilihan jawaban dengan

menggunakan koefisien point-biserial

b. Statistik Tes/Skala

N of Items adalah jumlah butir soal dalam tes/skala yang ikut dianalisis.

N of Examinees adalah jumlah peserta tes (jumlah responden).

Mean adalah skor rata-rata peserta tes.

Variance adalah varians dari distribusi skor peserta tes.

Std. Dev. Adalah deviasi standar dari distribusi skor peserta tes.

Skew adalah kemiringan distribusi skor peserta tes.

Kurtosis adalah puncak distribusi skor atau keruncingan kurva.

Minimum adalah skor terendah peserta tes.

16

Maximum adalah skor tertinggi peserta tes.

Median adalah skor tengah peserta tes.

Alpha adalah koefisien reliabilitas alpha untuk tes/skala tersebut.

SEM adalah kesalahan pengukuran standar.

Mean P adalah rata-rata tingkat kesukaran semua butir soal dalam tes secara klasikal.

Mean Item Tot adalah nilai rata-rata indeks daya pembeda dari semua soal dalam tes,

yang dihitung dari rata-rata koefisien point-biserial.

Mean Beserial adalah juga nilai rata-rata indeks daya pembeda dari semua soal

dalam tes, yang dihitung dari rata-rata koefisien biserial.

DAFTAR PUSTAKA

Croeker, L. & Algina, J. (1986). Introduction to Classical and Modern Test Theory. New York: Holts, Rinehart, and Winston.

Depdikbud. (1987). Pedoman Penulisan Tes Hasil Belajar. Jakarta: Balitbang Depdikbud.

Ebel, R.L. (1979). Essentials of Educational Measurement,. (3th ed). Englewood Cliffs, NJ: Prentice-Hall, Inc.

Hopkins, K.D., Stanley, J.C. dan Hopkins, B.R. (1990). Educational and Psychological Measurement and Evaluation. Englewood Cliffs, NJ: Prentice Hall.

Mehrens, W.A., & Lehman, I.J. (1978). Measurement and Evaluation in Education and Psychology, (3th ed). New York: The Dryden Press.

Oller, John W. (1979). Language Tests at School, Pragmatic Approach. London: Logman Group.

Pakpahan. (1990). Analisis Soal Berdasarkan Data Empirik. Jakarta: Pusisjian Depdikbud.

Saifuddin Azwar. (1997). Reliabilitas dan Validitas. Yogyakarta: Pustaka Pelajar. ----------------------. (1998). Tes Prestasi. Yogyakarta: Pustaka Pelajar.

S. Hamid Hasan dan Asmawi Zainul. (1901/1992). Evaluasi Hasil Belajar. Jakarta:

17

Suharsimi Arikunto. (1997). Dasar-dasar Evaluasi Pendidikan. Jakarta: Bumi Aksara.

18

MATERI ITEMAN-1

Documents

Transcript of MATERI ITEMAN-1