Tingkat Kesukaran Dan Daya Beda

26
TINGKAT KESUKARAN DAN DAYA BEDA RANGKUMAN Disusun untuk memenuhi tugas matakuliah Asesmen Pembelajaran Bahasa dan Sastra Indonesia yang dibina oleh Prof. Dr. Sumadi, M.Pd. dan Dr. Mudjianto, M.Pd. Oleh Agus Purnomo A.P. (140211807666) Helmi Wicaksono (140211807133) Nur Aisyah Sefrianah (140211807156)

description

rangkuman Tingkat kesukaran dan daya beda

Transcript of Tingkat Kesukaran Dan Daya Beda

TINGKAT KESUKARAN DAN DAYA BEDA

RANGKUMANDisusun untuk memenuhi tugas matakuliah Asesmen Pembelajaran Bahasa dan Sastra Indonesiayang dibina oleh Prof. Dr. Sumadi, M.Pd. dan Dr. Mudjianto, M.Pd.

OlehAgus Purnomo A.P. (140211807666)Helmi Wicaksono (140211807133)Nur Aisyah Sefrianah(140211807156)

UNIVERSITAS NEGERI MALANGPASCASARJANAS2 PENDIDIKAN BAHASA INDONESIAMARET 2015

TINGKAT KESUKARAN DAN DAYA BEDA

PENDAHULUANAlat evaluasi berfungsi untuk mengukur hasil pembelajaran atau untuk tujuan lain. Pengukuran hasil pembelajaran dengan alat evaluasi sering ditemukan tingkat kesulitan butir-bitir soal yang ditulis ke dalam kategori-kategori tertentu. Dasar penentuan tingkat kesulitan itu adalah berdasarkan logika dan penghitungan data empirik setelah sebuah soal diujicobakan. Berdasarkan hasil uji coba itulah dapat ditentukan tingkat kesukaran, indeks daya beda, dan analisis pengecoh butir soal. Peningkatan mutu alat ukur berupa tes hasil belajar harus diperhatikan oleh seorang pendidik. Seorang pendidik harus bisa membiasakan diri untuk menganalisis butir soal. Hal tersebut dilakukan supaya soal benar-benar tepat untuk mengukur tujuan pembelajaran. Selain itu, supaya siswa bisa mengerti petunjuk dan materi yang hendak dicapai. Oleh karena itu, perlu dilakukan analisis butir soal untuk menentukan tingkat kesukaran dan menentukan daya beda. Bahkan, Wahyuni & Ibrahim (2012:28), menambahkan perlu juga adanya analisis pengecoh untuk mengetahui sebaran distribusi frekuensi jawaban pada alternatif yang disediakan. Berdasarkan hal tersebut, berikut ini akan dijelaskan mengenai tingkat kesukaran dan daya beda serta pemahaman secara umum tentang analisis pengecoh secara lebih komprehensif dan menjadi bekal bagi guru/peneliti dalam mengembangkan alat asesmen. Pokok-pokok bahasan yang akan dijelaskan adalah (1) konsep dasar analisis butir soal dan (2) langkah-langkah analisis butir soal. Adapun penjelasan mengenai kedua hal tersebut adalah sebagai berikut. 1. KONSEP DASAR ANALISIS BUTIR SOAL Pada konsep dasar analisis butir soal dijelaskan empat hal. Keempat hal tersebut antara lain (1) analisis butir soal, (2) indeks tingkat kesukaran, (3) indeks daya beda, dan (4) analisis pengecoh. Penjelasan keempat hal tersebut adalah sebagai berikut. 1.1 Analisis Butir Soal Analisis butir soal adalah estimasi kualitas butir-butir soal sebuah alat tes atau yang dimaksudkan untuk menguji efektivitas butir soal. Alat tes yang baik didukung oleh butir-butir pertanyaan yang baik, efektif, dan dapat dipertanggungjawabkan. Menurut Nurgiyantoro (2014:190-191), bahwa analisis butir soal merupakan analisis hubungan antara soal-soal dengan skor keseluruhan, membandingkan jawaban peserta didik terhadap suatu soal dengan jawaban keseluruhan tes. Tujuan analisis butir soal tersebut menurut Tuckman (1975:271), adalah membuat tiap butir soal itu konsisten dengan keseluruhan tes. Terdapat dua teori pengukuran yang terkait dengan butir soal yaitu teori pengukuran klasik (classical measurement theory) dan teori respon butir (item response theory). Teori respon butir mucul sebagai reaksi dan koreksi terhadap sejumlah kelemahan teori pengukuran klasik. Salah satu kelemahan teori pengukuran klasik adalah adanya saling keterkaitan antara peserta tes yang diuji dan tingkat kesulitan butir soal. Butir-butir soal akan menjadi mudah jika peserta tes termasuk kelompok pintar. Sebaliknya, butir-butir soal akan menjadi sulit jika peserta tes termasuk kelompok rendah. Idealnya, kesulitan butir-butir soal sesuai dengan pandangan teori respon butir, bersifat konstan, tidak peduli kelompok tinggi atau rendah.

Teori pengukuran klasik mempunyai banyak kelemahan. Namun, teori tersebut lebih sedikit tuntutan jumlah peserta didik yang akan dianalisis jawabannya. Selain itu, proses analisis juga lebih mudah dilakukan baik secara manual mapun progam komputer. Analisis butir soal dalam teori pengukuran klasik dimaksudkan untuk menghitung indeks tingkat kesukaran, indeks daya beda, dan analisis pengecoh. Pada teori respon butir, analisis butir soal untuk menghitung indeks tingkat kesukaran saja (model satu parameter) indeks kesukaran dan daya beda (model dua parameter) dan indeks tingkat kesukaran, daya beda, serta unsur spekulasi (model tiga parameter). Semakin banyak unsur yang dianalisis (dua atau tiga parameter) akan semakin banyak jumlah peserta tes yang harus dianalisis jawabannya.Berdasarkan berbagai pertimbangan, teori pengukuran klasik jauh lebih praktis diterapkan oleh guru. Pembahasan dalam rangkuman ini dibatasi pada analisis butir soal menurut model pengukuran klasik, terutama indeks tingkat kesukaran dan daya beda. Selain itu, juga dijelaskan secara umum tentang analisis pengecoh sebagai pendukung dalam analisis butir soal. Kedua hal tersebut dijelaskan secara rinci sebagai berikut. 1.2 Indeks Tingkat Kesukaran Tingkat kesukaran (item difficulty) adalah pernyataan tentang seberapa mudah atau sulit butir soal bagi peserta didik yang dikenai pengukuran (Oller, 1979:246). Pendapat lain mengenai tingkat kesukaran, yakni Crocker dan Algina (1986:311), yang mendefinisikan tingkat kesukaran sebagai proporsi siswa peserta tes yang menjawab benar. Analisis tingkat kesukaran butir tes dimaksudkan untuk mengetahui seberapa sulit atau mudahnya tes yang telah diselenggarakan, baik tes secara keseluruhan maupun masing-masing butir tesnya. Hal tersebut senada dengan penjelasan Arikunto (1999:207), bahwa analisis tingkat kesukaran dimaksudkan untuk mengetahui apakah soal tersebut tergolong mudah atau sukar. Tingkat kesukaran adalah bilangan untuk menunjukkan sukar atau mudahnya suatu soal. Tingkat kesukaran pada umumnya dinyatakan dalam bentuk indeks yang disebut sebagai indeks tingkat kesukaran. Indeks tingkat kesukaran (ITK) merupakan indeks yang menunjukkan seberapa mudah atau sulit suatu butir soal bagi peserta tes. Butir soal yang baik adalah yang tingkat kesukarannya sedang, tidak terlalu mudah atau terlalu sulit. Butir soal yang terlalu mudah atau terlalu sulit sama tidak baiknya karena keduanya tidak dapat mencerminkan capaian hasil pembelajaran yang dilakukan karena baik siswa kelompok tinggi maupun kelompok rendah sama-sama berhasil atau gagal. Butir soal tersebut tidak memberikan informasi apa-apa tentang pembedaan prestasi antara setiap individu.Tingkat kesukaran diperhitungkan dari perbandingan antara jumlah peserta tes yang dapat menjawab dengan benar dan yang tidak mampu menjawab dengan benar. Dasar perhitungannya adalah semakin banyak peserta tes yang dapat menjawab dengan benar, semakin mudah tes atau butir tes yang bersangkutan. Tingkat kesukaran suatu butir soal dinyatakan dengan sebuah indeks yang berkisar antara 0,00-1,00. Indeks 0,00 berarti butir soal yang bersangkutan sangat sulit karena tidak ada yang menjawab dengan benar. Sebaliknya, indeks 1,00 berarti butir soal yang bersangkutan sangat mudah karena semua peserta dapat menjawabnya dengan benar. Ada beberapa pendapat mengenai interval indeks tingkat kesukaran suatu butir soal. Allen dan Yen (1979:122) menyatakan bahwa secara umum indeks kesukaran suatu butir soal sebaiknya terletak pada interval 0,3-0,7. Berbeda dengan Allen dan Yen, Oller (1979:247) mengemukakan bahwa semua butir soal dinyatakan layak jika indeks tingkat kesukarannya berkisar antara 0,15-0,85. Indeks yang diluar itu berarti terlalu mudah atau sulit, maka butir soal tersebut perlu direvisi atau diganti. Dari beberapa pendapat tersebut, Nurgiyantoro (2014:195) menyatakan bahwa rentangan interval tersebut masih terlalu luas, bahkan indeks 0,15 dan 0,85 juga masih terlihat ekstrem sulit dan mudah. Oleh karena itu, indeks tingkat kesukaran (ITK) yang dapat ditoleransi adalah yang berkisar antara 0,20-0,80. Pembagian indeks tingkat kesukaran (ITK) secara rinci dapat dilihat pada tabel berikut.Soal kategori terlalu mudah (tidak layak): 0,81-1,00 Soal kategori mudah (oke): 0,61-0,80Soal kategori sedang (oke): 0,41-0,60Soal kategori sulit (oke): 0,20-0,40Soal kategori terlalu sulit (tidak layak): 0,00-0,19

ITK dapat dihitung dengan dua cara, yakni secara manual dan menggunakan komputer. ITK merupakan perhitungan yang didasarkan proporsi jawaban benar baik untuk kelompok tinggi maupun rendah. Caranya adalah menjumlah jawaban benar kemudian dibagi jumlah peserta tes. Masalah tingkat kesukaran butir tes, memiliki dampak terhadap susunan butir tes pada suatu tes, terutama tes yang dikembangkan dan yang hasilnya diinterpretasikan atas dasar kurva normal. Dari segi tingkat kesukaran, dampak terhadap jumlah butir tes secara keseluruhan berupa upaya agar (1) sebagian besar butir tesnya berupa butir tes yang normal; dalam arti tidak terlalu sulit dan tidak terlalu mudah, (2) sedikit butir tes yang lebih mudah dan sedikit butir tes yang lebih sulit, dan (3) jauh lebih sedikit butir tes yang amat mudah, dan yang amat sulit (Surapranata, 2005:12). Butir-butir tes tersebut disusun sedemikian rupa sehingga secara keseluruhan, tes diawali dengan butir tes yang amat mudah, diikuti dengan butir-butir tes yang sedang (normal), butir-butir tes yang lebih sulit, dan diakhiri dengan butir-butir tes paling sulit. Hal ini dimaksudkan agar peserta tes mengerjakan mulai dari butir tes yang mudah untuk secara bertahap menjadi lebih sulit, dan berakhir dengan butir tes yang paling sulit. 1.3 Indeks Daya Beda Daya beda butir soal (item discrimination) merupakan suatu pernyataan tentang seberapa besar daya sebuah butir soal dapat membedakan kemampuan antara peserta kelompok tinggi dan kelompok rendah (Nurgiyantoro, 2014:197). Arikunto (1999:211) juga menjelaskan bahwa daya pembeda soal adalah kemampuan suatu soal untuk membedakan antara siswa yang berkemampuan tinggi dengan siswa yang berkemampuan rendah. Daya beda butir dinyatakan dalam bentuk indeks daya beda (discrimination index). Indeks daya beda (IDB) merupakan indeks yang menunjukkan seberapa besar sebuah butir soal membedakan kemampuan antara peserta kelompok tinggi dan kelompok rendah. Sebuah butir soal yang baik adalah yang mempunyai daya untuk membedakan kemampuan antara peserta uji kedua kelompok tersebut. Besarnya daya untuk membedakan kemampuan tersebut dinyatakan dengan indeks sehingga secara lengkap disebut sebagai indeks daya beda (IDB) butir soal. Menurut Crocker dan Algina (1986), jika tes atau soal mengukur hal yang sama, dapat diharapkan bahwa setiap peserta tes yang mampu dapat menjawab soal dengan benar, dan peserta tes yang tidak mampu akan menjawab salah. Dengan kata lain, soal-soal tersebut membedakan (discriminate) antara peserta tes yang mampu dengan peserta tes yang tidak mampu. Secara teoritis besarnya IDB dapat berkisar antara -1,00 - +1,00, namun ideks yang mendekati bilagan 0 (nol) atau apalagi negatif dinyatakan tidak layak. Tanda negatif menunjukkan bahwa peserta tes yang kemampuannya rendah dapat menjawab benar sedangkan peserta tes yang kemampuannya tinggi menjawab salah. Dengan demikian, soal yang indeks daya pembedanya negatif menunjukkan terbaliknya kualitas peserta tes. Sebagian ahli menyatakan bahwa sebuah butir soal dapat dinyatakan layak jika paling tidak memiliki IDB sebesar 0,25, bahkan sebagian yang lain menyatakan 0,30. Pada kenyataannya memeroleh IDB yang memenuhi persyaratan tersebut tidak mudah, apalagi jika kemampuan peserta tes hampir seimbang. Artinya, kemampuan antara peserta kelompok tinggi dan rendah tidak terlalu besar, dan indikator untuk itu dapat dilihat dari besarnya simpangan baku skor tes yang bersangkutan. Oleh karena itu, untuk keperluan pembelajaran di kelas, dapat diambil jalan yang lebih moderat, yaitu dengan menerima IDB sebesar 0,20 sebagai indeks yang sudah dinyatakan layak, tetapi untuk keperluan penelitian yang lebih besar yang melibatkan peserta uji yang banyak, IDB minimum yang dipakai adalah 0,25 (Nurgiyantoro, 2014:197-198). Besar kecilnya IDB sebuah butir soal menentukan tinggi rendahnya daya sebuah butir soal untuk dapat membedakan kemampuan peserta uji kelompok tinggi dan kelompok rendah. Semakin tinggi indeks yang dimiliki oleh sebuah butir soal, akan semakin baik butir soal yang bersangkutan karena mempunyai daya untuk membedakan kemampuan peserta kedua kelompok tersebut. Sebaliknya, jika IDB menjadi negatif yang berarti serta kelompok rendah menjawab dengan benar lebih banyak daripada kelompok tinggi, butir soal yang bersangkutan dinyatakan tidak layak dan harus dibuang karena dinyatakan gugur.Menurut Davis (1966:308-312), terdapat kaitan di antara daya beda butir dengan tingkat kesukaran butir tes. Oleh karena itu, analisis butir cukup menggunakan daya beda untuk menentukan kelayakan butir tes. Ada sejumlah rumus untuk mengukur daya beda butir tes. Bentuk paling sederhana adalah perbedaan tingkat kesukaran antara kelompok responden skor tinggi dan kelompok responden skor rendah. Pembagian indeks daya beda (IDB) secara rinci dapat dilihat pada tabel berikut.Rambu-rambu indeks daya beda:0,40-1,00 : Sangat baik0,30-0,39: Baik 0,20-0,29: Sedang 0,00-0,19: Direvisi-1,00-0,00: Dibuang atau diganti

1.4 Analisis PengecohAnalisis butir pengecoh setiap butir soal perlu diperhatikan dalam melihat kelayakan butir soal, tidak hanya dilihat berdasarkan indeks tingkat kesukaran dan daya beda saja. Dasar pemikiran analisis pengecoh yakni harus adanya perbedaan frekuensi jawaban antara siswa kelompok atas dan siswa kelompok bawah. Pengecoh yang baik adalah pilihan jawaban yang dapat dihindari oleh anak-anak yang pandai dan dipilih oleh anak-anak yang kurang pandai, jangan terjadi sebaliknya (Wahyuni & Ibrahim, 2012:141). Selain itu, sema alternatif jawaban yang disediakan harus ada siswa yang memilihnya. Menurut Nurgiyantoro (2014:201), bahwa ada tiga kriteria untuk menetapkan efektivitas pengecoh. Pertama, semua jawaban pengecoh harus ada yang memilih. Kedua, jumlah pemilih jawaban pengecoh (opsi salah) dari peserta kelompok tinggi harus lebih sedikit dari kelompok rendah. Ketiga, jika pemilih jawaban pengecoh (opsi salah) hanya satu, ia harus dari kelompok rendah. Kriteria kedua dan ketiga sering dipandang memberatkan, maka yang digunakan secara efektif adalah kriteria yang pertama. 2. LANGKAH-LANGKAH ANALISIS BUTIR SOALPada langkah-langkah analisis butir soal dijelaskan dua hal. Kedua hal tersebut antara lain (1) analisis butir soal secara manual dan (2) analisis butir soal dengan menggunakan komputer. Penjelasan kedua hal tersebut adalah sebagai berikut. 2.1 Analisis Butir Soal Secara ManualPada analisis butir soal secara manual dibahas dua hal, yaitu langkah-langkah analisis butir soal pilihan ganda dan esai. Kedua hal tersebut dijelaskan sebagai berikut.2.1.1 Langkah-langkah Analisis Butir Soal Pilihan Ganda A. Indeks Tingkat Kesukaran (ITK)TABEL BUTIR SOALNama SiswaNomor Butir SoalSkor total

123456789101112131415

A10111101001101110

B11111011001111112

C1010101010101018

D1100110110110019

E11111100110011111

F1111111000100109

G1010101010100118

H0111000100100106

I1111110011100009

J0011010000001104

K01011011101101110

L11101111111111114

M1000001010101016

N11011101111101112

O1011001011001119

P1010111000101119

Q1010001010100106

R0101001100101107

S11011101111010010

T0101111001000017

Langkah 1:Mengurutkan skor yang diperoleh peserta tes dari skor tertinggi sampai dengan skor terendah. Nama SiswaNomor Butir SoalSkor total

123456789101112131415

L11101111111111114

B11111011001111112

N11011101111101112

E11111100110011111

A10111101001101110

K01011011101101110

S11011101111010010

D1100110110110019

F1111111000100109

I1111110011100009

O1011001011001119

P1010111000101119

C1010101010101018

G1010101010100118

R0101001100101107

T0101111001000017

H0111000100100106

M1000001010101016

Q1010001010100106

J0011010000001104

Langkah 2: Menetapkan sebanyak 27, 5 % peserta tes kelompok atas dan 27,5 % peserta tes kelompok bawah. pada analisis butir soal di atas 27,5 % dari n=20 adalah 6. Jadi, jumlah kelompok atas 6 orang dan kelompok bawah 6 orang. Langkah 3:Menganalisis jawaban benar per butir soal per peserta tes, pada kelompok atas dan bawah.Kelompok atas Nama SiswaNomor Butir SoalSkor total

123456789101112131415

L11101111111111114

B11111011001111112

N11011101111101112

E11111100110011111

A10111101001101110

K01011011101101110

Jumlah554564354355366

Kelompok bawahNama SiswaNomor Butir SoalSkor total

123456789101112131415

R0101001100101107

T0101111001000017

H0111000100100106

M1000001010101016

Q1010001010100106

J0011010000001104

jumlah224312329040442

Langkah 4:Menganalisis tingkat kesulitan butir soal menggunakan rumus FKT + FKRN

ITK =

Keterangan :ITK = indeks tingkat kesulitan yang dicariFKT = jumlah jawaban benar kelompok tinggiFKR = jumlah jawaban benar kelompok rendahN = jumlah peserta tes kedua kelompokRambu-rambu indeks tingkat kesulitan:Soal kategori terlalu mudah (tidak layak): 0,81-1,00 Soal kategori mudah (oke): 0,61-0,80Soal kategori sedang (oke): 0,41-0,60Soal kategori sulit (oke): 0,20-0,40Soal kategori terlalu sulit (tidak layak): 0,00-0,19Menganalisis tingkat kesulitan butir soalButir soal nomor 1 : 5 + 212= 0,58 Sedang (oke)

5 + 212= 0,58 Sedang (oke)

Butir soal nomor 2 :

Butir soal nomor 3 : 4 + 412= 0,67 Mudah (oke)

dan seterusnya

B. Indeks Daya Beda (IDB)TABEL BUTIR SOALNama SiswaNomor Butir SoalSkor total

123456789101112131415

A10111101001101110

B11111011001111112

C1010101010101018

D1100110110110019

E11111100110011111

F1111111000100109

G1010101010100118

H0111000100100106

I1111110011100009

J0011010000001104

K01011011101101110

L11101111111111114

M1000001010101016

N11011101111101112

O1011001011001119

P1010111000101119

Q1010001010100106

R0101001100101107

S11011101111010010

T0101111001000017

Langkah 1: Mengurutkan skor yang diperoleh peserta tes dari skor tertinggi ke skor terendah. Nama SiswaNomor Butir SoalSkor total

123456789101112131415

L11101111111111114

B11111011001111112

N11011101111101112

E11111100110011111

A10111101001101110

K01011011101101110

S11011101111010010

D1100110110110019

F1111111000100109

I1111110011100009

O1011001011001119

P1010111000101119

C1010101010101018

G1010101010100118

R0101001100101107

T0101111001000017

H0111000100100106

M1000001010101016

Q1010001010100106

J0011010000001104

Langkah 2:Menetapkan sebanyak 27,5 % dari jumlah peserta tes dari jumlah peserta tes dengan perolehan skor tinggi (disebut kelompok atas); 27,5% dari jumlah peserta tes dari jumlah peserta tes dengan perolehan skor rendah (disebut kelompok bawah); dan sisanya disebut kelompok tengah. Langkah tersebut dilakukan jika jumlah peserta tes terlalu besar, tetapi jika hanya sedikit cukup dibedakan dari kelompok atas dan bawah.Langkah 3: Menganalisis jawaban benar atau salah per butir soal per peserta tes. Analisis ini hanya dilakukan terhadap jawaban peserta tes kelompok atas dan kelompok bawah.Kelompok atas Nama SiswaNomor Butir SoalSkor total

123456789101112131415

L11101111111111114

B11111011001111112

N11011101111101112

E11111100110011111

A10111101001101110

K01011011101101110

Jumlah554564354355366

Kelompok bawahNama SiswaNomor Butir SoalSkor total

123456789101112131415

R0101001100101107

T0101111001000017

H0111000100100106

M1000001010101016

Q1010001010100106

J0011010000001104

Jumlah224312329040442

FKT - FKRn

Langkah 4: Menulis daya pembeda butir soal dengan rumus: IDB = Keterangan :IDB= indeks daya beda yang dicari FKT = jumlah jawaban benar kelompok tinggiFKR= jumlah jawaban benar kelompok rendahn = jumlah peserta kelompok tinggi atau rendah (27,5 %)Rambu-rambu indeks daya beda:0,40-1,00 : Sangat baik0,30-0,39: Baik 0,20-0,29: Sedang 0,00-0,19: Direvisi-1,00-0,00: Dibuang atau digantiLangkah 5:Hasil perhitungan Butir Soal5 - 26= 0,50 Sangat baik

Butir soal nomor 1 : 5 - 26= 0,50 Sangat baik

Butir soal nomor 2 : 4 - 46= 0 Direvisi

Butir soal nomor 3 : dan seterusnya2.1.2 Langkah-langkah Analisis Butir Soal Esai Analisis butir soal esai juga bisa dianalisis dari tingkat kesulitan dan daya beda dengan menggunakan rumus Noll adalah sebagai berikut. St + Sr (2n X Skor Min)2n x (Skormaks-Skormin)

Tingkat Kesulitan : (ITK)St + Srn (Skormaks-Skormin)

Daya Pembeda : (IDB)Keterangan: ITK= Indeks Tingkat Kesulitan yang dicari IDB= Indeks Daya Beda yang dicariSt= Jumlah skor benar kelompok tinggi Sr= Jumlah skor benar kelompok rendah Skormaks= Skor maksimal suatu butir soalSkormin= Skor minimal suatu butir soal N= Jumlah subjek kelompok atas atau bawah (27,5%)Langkah-langkah untuk menganalisis butir soal esai hampir sama dengan analisis butir soal objektif. Pada soal uraian jawaban biasanya dibuat berskala, misal 1-4, 1-5, atau 1-10 bergantung kompleksitas masing-masing soal. Adapun langkah-langkah menganalisis butir esai yaitu sebagai berikut.1. Mengurutkan skor yang diperoleh peserta tes dari skor tertinggi sampai dengan skor terendah.2. Menetapkan sebanyak 27,5% dari jumlah peserta tes dengan perolehan skor tinggi (disebut kelompok atas); 27, 5 % peserta tes dengan skor rendah (disebut kelompok bawah); dan sisanya disebut disebut dengan kelompok tengah. Langkah ini dilakukan jika jumlah peserta tes relatif besar; tetapi jika hanya sedikit cukup dibedakan atas kelompok atas dan kelompok bawah saja. 3. Memberikan skor pada setiap nomor butir soal pada semua siswa, baik kelompok atas maupun bawah.4. Menganalisis tingkat kesulitan dan daya pembeda dengan rumus seperti di atas. Interpretasi Indeks Tingkat Kesulitan:Soal kategori terlalu mudah (tidak layak): 0,81-1,00 Soal kategori mudah (oke): 0,61-0,80Soal kategori sedang (oke): 0,41-0,60Soal kategori sulit (oke): 0,20-0,40Soal kategori terlalu sulit (tidak layak): 0,00-0,19Interpretasi Indeks Daya Pembeda INDEKS DAYA PEMBEDA INTERPRETASI

ID > 0,400,30 ID < 0,390,20 ID < 0,290,00 ID < 0,19ID < 0,00 (negatif) Sangat baikBaik Sedang DirevisiDibuang/Diganti

Hasil analisis butir soal esai dari sebuah tes menulis adalah sebagai berikut: Nomor SiswaNomor Butir Soal

1234

189108

29897

38788

47867

55695

Jumlah37384235

Nomor SiswaNomor Butir Soal

1234

18458

29537

38624

49325

58222

Jumlah42201422

Dari kedua data tersebut, selanjutnya diadakan penghitungan tingkat kesulitan dan daya pembeda butir soal sebagai berikut. Butir soal nomor 117+42-(2X5X1)2X5X(10-1)= 0,77 Mudah (oke)

ITK =

37-425X(10-1)= -0,11 Jelek, dibuang/diganti

IDB =

Butir soal nomor 238+20-(2X5X1)2X5X(10-1)= 0,53 Sedang (oke)

ITK =

38-205X(10-1)= -0,40 Sangat baik

IDB =

Butir soal nomor 3 42+14-(2X5X1)2X5X(10-1)= 0,51 Sedang (oke)

ITK =

42-145X(10-1)= -0,62 Sangat baik

IDB =

Butir soal nomor 4 35+22-(2X5X1)2X5X(10-1)= 0,52 Sedang (oke)

ITK = 35-225X(10-1)= -0,29 Sedang

IDB =

2.2 Analisis Butir Soal dengan Menggunakan KomputerSelain penghitungan ITK dan IDB dilakukan secara manual, penghitungan dapat pula dilakukan dengan bantuan komputer. Kelebihan dari penghitungan menggunakan bantuan komputer adalah waktu analisis yang dibutuhkan lebih singkat dan keakuratan penghitungan juga dapat lebih dipertanggungjawabkan. Analisis butir soal dengan program komputer dapat dilakukan berdasarkan model pengukuran yang dipergunakan, yaitu model pengukuran klasik dan teori respon butir. Analisis butir untuk model pengukuran klasik dapat mempergunakan program Iteman, sedangkan teori respon butir mempergunakan program Ascal dan Rascal (Nurgiyantoro, 2014:204). Penghitungan dengan bantuan komputer pada pembahasan ini menggunakan program Item And Test Analysis (Iteman).Item And Test Analysis (Iteman) merupakan perangkat lunak (software) yang dibuat melalui bahasa pemrograman komputer dan dibuat khusus untuk analisis butir soal dan tes. Hasil analisis dengan iteman meliputi:a. Tingkat kesukaranb. Daya pembeda soalc. Statistic sebaran jawaband. Reliabilitas tese. Kesalahan pengukuranf. Distribusi skor setiap peserta tes2.2.1 Langkah-langkahAda tiga bagian besar pada langkah-langkah menganalisis butir soal dengan Iteman, yakni (1) membuat file data, (2) menjalankan program iteman, (3) melakukan interpretasi hasil.2.2.1.1 Membuat File Data1. Buka program notepad pada komputer2. Masukkan data dengan ketentuan berikut.a. Baris Pertama: Kolom 1-3 : jumlah butir soal (contoh: 020) 4 : Spasi 5 : jawaban kosong (omit), ditulis o 6 : Spasi 7 : soal yang belum dikerjakan, ditulis N 8 : spasi 9-10 : jumlah karakter data siswa (contoh: 4)b. Baris kedua : kunci jawabanc. Baris ketiga : jumlah jawaband. Baris keempat : Y butir soal yang dianalisis, N butir soal yang tidak dianalisise. Baris kelima dan seterusnya :berisi jawaban siswaContoh:020 o N 04ACCDABEABDABECCBDDEE55555555555555555555YYYYYYYYYYYYYYYYYYYY001 ACCDABEABDABECCBDDEE002 ACCAABEABDABECCBDDEE003 ACCBABEABDABECCBDAEE004 ACCDABEABACBECCBDDAE005 ACCDAABABDABBCCBDDEA006 ACCCABECBAABECCBDBBB007 AACCABEABCCAEDCCDCCA008 ACCEABEABECBECCBDDDC009 ABCBABECADBAEBCCDAEC010 BCCBABEBCCDBECCBDDAD011 ACCABBCDBADBECCBADED012 ACACACEBABCBCCDBDDBD013 CDCCABBAABEEEACDDBEE014 ECCABBDACBEDECCDBCCC015 DCCACBCADCDEECCEBDDE016 DCBEDBEACEDDECAACEEE017 EEDEDDEABDECDDAEADAA018 ECCBEBBEDCBAECCACBEB019 BCEACBDDEBBDECBAEDEB020 BAABEBAEEEBCEEECEDEE

2.2.1.2 Menjalankan Program ItemanBerikut langkah-langkah menjalankan program iteman.1. Double klik file program iteman.2. Tulislah file data: contoh UH BI XA.TXT, kemudian tekan enter.3. Ketik nama file hasil analisis, contoh UH BI XA.hsl, kemudian tekan enter.4. Ketik Y, kemudian tekan enter.5. Ketik file untuk total skor siswa, contoh UH BI XA.SKR, kemudian tekan enter.6. Analisis selesai.2.2.1.3 Interpretasi hasil AnalisisHasil analisis dengan iteman dapat dibedakan menjadi 2 bagian, yaitu statistik butir soal dan hasil analisis statistik tes/skala.a. Statistik butir soal:Untuk tes yang terdiri dari butir-butir soal yang bersifat dikotomi misalnya pilihan ganda, statistik berikut adalah output dari setiap butir soal yang dianalisis: Seq.No: adalah nomor urut butir soal dalam file data Scale item: nomor urut butir soal dalam tes Prop.Correct: proporsi siswa yang menjawab benar butir tes yang menunjukkan Indeks Tingkat Kesulitan (ITK), Catatan: Soal kategori terlalu mudah (tidak layak): 0,81-1,00; Soal kategori mudah (oke): 0,61-0,80; Soal kategori sedang (oke): 0,41-0,60; Soal kategori sulit (oke): 0,20-0,40; Soal kategori terlalu sulit (tidak layak): 0,00-0,19. Biser : indeks daya pembeda soal (koef.korelasi biserial). Nilai positif artinya peserta tes yang menjawab benar butir soal mempunyai skor relative tinggi dalam tes tersebut. Sebaliknya nilai negative menunjukkan bahwa peserta tes yang menjawab benar butir tes memperoleh skor tes yang relative lebih rendah dalam tes. Point biser: juga indeks daya pembeda soal (koef. point biserial)Catatan: Daya pembeda soal berfungsi untuk menentukan dapat tidaknya suatu soal membedakan kelompok dalam aspek yang diukur dengan perbedaan yang ada pada kelompok itu. Tujuan dari pengujian daya pembeda adalah untuk melihat kemampuan butir soal dalam membedakan antara peserta didik yang berkemanpuan tinggi dengan peserta didik yang berkemampuan rendah. Koefisien inilah yang dinyatakan sebagai Indeks Daya Beda (IDB). IDB yang layak adalah di atas 0,20.b. Statistik tesKeterangan output dari statistik tes dijelaskan sebagai berikut. N of Items : jumlah btir soal dalam tes yang dianalisis. N of Examines : Jumlah peserta tes Mean : Skor/rerata peserta tes Variance : varian dari dsitribusi skor peserta tes yang memberikan gambaran tentang sebaran skor peserta tes. Std.Deviasi : Deviasi standar dari distribusi skor tes (akar dari varians) Skew : kemiringan Kurtosis : puncak distribusi Minimum :skor terndah Maximum : skor tertinggi Median : skor tengah Aplha : homogenitas tes SEM : kesalahan pengukuran standar Mean P : rerata tingkat kesukaran Mean item tot : rerata indeks daya pembeda (koef point biserial) Mean biserial : rerata indek daya pembeda (koef. Biserial) Scale intercorelation : indeks korelasi antara skor-skor peserta tesLewat analisis butir dengan program Iteman, sekaligus akan diperoleh indeks reliabilitas Alpha Cronbach, sehingga kita tidak perlu menghitung indeks reliabilitas secara tersendiri.

Lampiran hasil analisis ITK dan IDB dengan Iteman MicroCAT (tm) Testing System Copyright (c) 1982, 1984, 1986, 1988 by Assessment Systems Corporation

Item and Test Analysis Program -- ITEMAN (tm) Version 3.00

Item analysis for data from file latihan.txt Page 1

Item Statistics Alternative Statistics ----------------------- -----------------------------------Seq. Scale Prop. Point Prop. PointNo. -Item Correct Biser. Biser. Alt. Endorsing Biser. Biser. Key---- ----- ------- ------ ------ ----- --------- ------ ------ ---

1 0-1 0.550 0.942 0.749 A 0.550 0.942 0.749 * B 0.150 -0.518 -0.338 C 0.050 -0.251 -0.119 D 0.100 -0.356 -0.208 E 0.150 -0.702 -0.459 Other 0.000 -9.000 -9.000 (ITK: sedang, IDB: sangat baik) 2 0-2 0.750 0.610 0.448 A 0.100 -0.479 -0.280 B 0.050 -0.146 -0.069 C 0.750 0.610 0.448 * D 0.050 -0.251 -0.119 E 0.050 -0.669 -0.316 Other 0.000 -9.000 -9.000 (ITK: mudah, IDB: sangat baik) 3 0-3 0.750 0.814 0.597 A 0.100 -0.540 -0.316 B 0.050 -0.355 -0.168 C 0.750 0.814 0.597 * D 0.050 -0.669 -0.316 E 0.050 -0.564 -0.267 Other 0.000 -9.000 -9.000 (ITK: mudah, IDB: sangat baik)Dan seterusnya.Statistik TesScale Statistics----------------

Scale: 0 -------N of Items 20N of Examinees 20Mean 11.400Variance 21.540Std. Dev. 4.641Skew 0.381Kurtosis -1.109Minimum 5.000Maximum 20.000Median 10.000Alpha 0.847SEM 1.817Mean P 0.570Mean Item-Tot. 0.500Mean Biserial 0.653

DAFTAR RUJUKANAllen, M. J. & Yen, W.M. 1979. Introduction to Measurement Theory. Monterey, CA: Brooks/Cole Publishing Company.Arikunto, Suharsimi. 1999. Dasar-dasar Evaluasi Pendidikan. Jakarta: Bumi Aksara.Bachman, L.F. 1990. Fundamental Consideration in Language Testing. Oxford: Oxford University Press. Crocker, Linda and J. Algina. 1986. Introduction to classical and modern test theory. Fort Worth: Harcourt Brace Jovanovich College PublishersDavis, F.B. 1966. Item selection technique, Educational Measurement (ed. E.F. Linquist). Washington, D.C.: American Council on EducationGronlund, N.E. & Waugh, C.K. 2009. Assessment of Student Achievement. New Jersey: Pearson Education, Inc.Harsiati, T. 2011. Penilaian dalam Pembelajaran: Aplikasi pada Pembelajaran Membaca dan Menulis. Malang: Penerbit Universitas Negeri Malang (UM Press).Oller, J.W. 1979. Languange Test at School. London: Longman Group Limited.Tuckman, B.C. 1975. Measuring Educational Outcomes: Fundamentals of Testing. New York: Harcourt Brace Jovanovich, Inc.Wahyuni, S. dan Ibrahim, A.S. 2012. Asesmen Pembelajaran Bahasa. Bandung: PT Refika Aditama.Weir, C.J. 1990. Communicative Language Testing. New York: Prentice Hall. Widoyoko, E.P. 2013. Evaluasi Program Pembelajaran: Panduan Praktis bagi Pendidik dan Calon Pendidik. Yogyakarta: Pustaka Pelajar.

18