PANDUAN PRAKTIKUM TEORI RESPON BUTIRstaffnew.uny.ac.id/upload/198810132015041004/... · PANDUAN...

72
PANDUAN PRAKTIKUM TEORI RESPON BUTIR Analisis Butir dengan Pendekatan Klasik dan Modern SEPTEMBER-DESEMBER, 2018 JURUSAN PENDIDIKAN IPA, FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM Kampus Pusat UNY, Jln Colombo No 1, Yogyakarta 55281 Dosen Pengampu: Didik Setyawarno, M.Pd

Transcript of PANDUAN PRAKTIKUM TEORI RESPON BUTIRstaffnew.uny.ac.id/upload/198810132015041004/... · PANDUAN...

PANDUAN PRAKTIKUM TEORI RESPON BUTIR

Analisis Butir dengan Pendekatan Klasik dan Modern

SEPTEMBER-DESEMBER, 2018

JURUSAN PENDIDIKAN IPA, FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM Kampus Pusat UNY, Jln Colombo No 1, Yogyakarta 55281

Dosen Pengampu:

Didik Setyawarno, M.Pd

1

PRAKTIKUM 1

ANALISIS VALIDITAS DAN RELIABILITAS BUTIR SECARA KLASIK

A. Tujuan

Mahasiswa mampu untuk menganalisis butir dari data politomi maupun dikotomi untuk menentukan nilai

validitas dan reliabilitasnya.

B. Dasar Teori

Validitas alat ukur adalah ketepatan alat ukur dengan hal yang diukur. Ada beberapa jenis

validitas alat ukur, yaitu: (1) Validitas isi (content validity), (2) validitas konstruksi (construct validity), (3)

validitas ramalan (predictive validity), dan (4) validitas sama saat (concurrent validity). Uji validitas secara

empiris dilakukan melalui uji coba instrument kepada responden.

Jika datanya berbentuk politomi misal data angket dan soal uraian, maka analisis validitas dilakukan

dengan menggunakan teknik korelasi Product Moment dengan rumus berikut.

𝑟𝑥𝑦 =𝑁∑𝑋𝑌 − (∑𝑋)(∑𝑌)

√(𝑁∑𝑋2 − (∑𝑋)2)(𝑁∑𝑌2 − (∑𝑌)2)

Keterangan:

N = banyaknya kasus atau sampel

X = skor butir tes

Y = skor total

Data yang berbentuk dikotomi misal data soal pilihan ganda dengan benar skor 1 dan salah skor 0,

maka analisis validitas dengan menggunakan teknik Korelasi Point Biserial, dengan rumus sebagai

berikut.

𝑟𝑝𝑏𝑖 =𝑀𝑝 −𝑀𝑡

𝑆𝑡√𝑝

𝑞

Keterangan:

rpbi = koefisien korelasi point biserial

Mp = rerata skor dari subjek yang menjawab betul bagi butir yang dicari validitasnya

Mt = rerata skor total

st = standar deviasi dari skor total

p = proporsi peserta didik yang menjawab betul (banyaknya peserta didik yang

menjawab betul dibagi dengan jumlah seluruh peserta didik)

q = proporsi peserta didik yang menjawab salah (q = 1 – p)

Suatu butir tes dinyatakan valid jika nilai r hitung (rxy atau rpbi) lebih besar daripada r tabel dengan taraf

signifikansi atau taraf kekeliruan secara umum 5% (rhit > rtab dengan taraf signifikansi 5%), namun

beberapa ada yang menggunakan lebih ketat lagi yaitu 1%.

Reliabilitas alat ukur adalah keterandalan alat ukur atau keajegan alat ukur; artinya, kapanpun

alat ukur itu digunakan akan menghasilkan hasil ukur yang relatif tetap. Ada beberapa jenis reliabilitas,

yaitu: (1) konsistensi internal, (2) stabilitas, dan (3) ekuivalen. Reliabilitas konsistensi internal alat ukur dapat

dihitung dengan menggunakan rumus Koefisien Alpha-Cronbach, Kuder-Richardson (KR-20 atau KR-21),

dan Teknik Belah Dua.

KR-20 ini secara khusus untuk menghitung reliabilitas tes yang datanya dikotomi misalnya soal pilihan

ganda dengan skor benar 1 dan salah 0, dengan rumus sebagai berikut.

2

𝑟1.1 = (𝑘

𝑘 − 1)(

𝑆𝐷𝑡2 − ∑𝑝𝑞

𝑆𝐷𝑡2 )

Keterangan :

r1.1 = koefisien reliabilitas tes

p = proporsi testee yang menjawab betul

q = proporsi testee yang menjawab salah

n = banyaknya testee

SD2t = varian total tes

pq = p x q

k = banyak butir tes

Jika taraf kesulitan butir tes homogen, maka analisis yang digunakan adalah KR – 21, dengan rumus

sebagai berikut.

𝑟1.1 = (𝑘

𝑘 − 1)(1 −

𝑀(𝑘 −𝑀)

𝑘. 𝑆𝐷𝑡2 )

Keterangan:

r1.1 = reliabilitas tes

M = rata-rata hitung

k = banyak butir

SD2t = varian total tes

Varian merupakan kuadrat dari simpangan baku atau standar deviasi. Nilai standar deviasi dapat

dihitung dengan rumus sebagai berikut.

𝑆𝐷𝑡 = √𝑛∑𝑋2 − (∑𝑋)2

𝑛(𝑛 − 1)

Keterangan:

SDt = simpangan baku (standar deviasi)

n = jumlah responden

Jika datanya berbentuk politomi misal data angket atau soal uraian, maka digunakan rumus Alpha-

Cronbach, dengan rumus sebagai berikut.

𝑟1.1 = (𝑘

𝑘 − 1)(

𝑆𝐷𝑡2 − ∑𝑆𝐷𝑖

2

𝑆𝐷𝑡2 )

Keterangan :

r1.1 = koefisien reliabilitas perangkat tes

k = banyak butir tes 2

iSD = varians skor tiap butir (item)

2

totSD = varian skor total

Untuk menentukan derajat reliabilitas tes, dapat digunakan kriteria sebagai berikut.

≤ 0,20 : sangat rendah

0,20 ≤ 0,40 : rendah

0,40 ≤ 0,60 : sedang

0,60 ≤ 0,80 : tinggi

0,80 ≤ 1,00 : sangat tinggi

3

C. Data Butir Soal dan Angket

1. Data jawaban dari soal objektif (pilihan ganda: benar 1, salah 0) yang terdiri dari 10 nomor dan

dikerjakan oleh 20 siswa

Nomor butir Tes Objektif

Responden 1 2 3 4 5 6 7 8 9 10

1 1 1 1 1 1 1 1 1 1 1

2 0 0 0 0 0 0 0 1 0 0

3 0 0 0 0 0 0 0 0 0 0

4 1 0 1 1 1 1 1 1 0 1

5 0 1 1 1 0 0 0 0 0 0

6 1 1 1 1 1 1 1 1 1 0

7 0 1 0 0 1 0 0 1 1 0

8 1 1 0 0 1 1 1 1 1 1

9 0 1 1 0 0 0 0 0 0 0

10 1 1 1 0 1 1 1 0 0 1

11 1 1 1 1 0 1 1 1 1 1

12 0 1 0 0 1 1 0 0 0 0

13 0 0 0 0 0 0 0 0 0 0

14 1 1 0 1 1 1 1 0 1 1

15 1 1 1 1 1 1 1 1 1 1

16 0 1 1 1 0 0 1 1 1 1

17 0 1 1 1 0 0 0 1 0 1

18 1 1 1 1 1 1 1 1 1 1

19 0 0 1 1 0 0 1 0 0 1

20 0 1 1 0 1 1 0 0 1 1

2. Data jawaban dari angket (1 = sangat tidak setuju/ STS, 2 = tidak setuju/TS, 3 = netral/N, 4 =

setuju/S, dan 5 = sangat setuju/SS) yang terdiri dari 10 pernyataan dan diisi oleh 20 peserta

Nomor Butir Angket

Responden 1 2 3 4 5 6 7 8 9 10

1 3 4 3 2 4 3 3 3 3 3

2 2 4 3 4 4 3 4 4 4 3

3 4 4 4 3 4 4 4 4 4 4

4 3 4 4 3 3 3 3 3 3 3

5 2 3 2 4 3 4 2 4 2 3

6 4 3 4 4 4 4 5 5 5 5

7 3 3 4 4 4 3 3 4 3 4

8 4 4 3 4 4 4 4 4 3 5

9 3 4 3 4 5 4 3 3 4 4

10 2 4 4 2 3 3 2 3 4 3

11 2 3 4 3 2 4 2 2 4 2

12 3 2 1 4 5 4 3 3 4 4

13 4 3 2 5 4 4 4 3 2 4

14 4 4 3 4 4 4 4 4 3 4

15 3 4 4 3 3 4 3 4 4 4

16 4 4 4 4 4 4 3 4 5 3

17 3 3 4 4 4 4 2 4 4 4

18 4 4 5 4 5 3 2 4 5 4

19 3 5 4 5 5 4 2 5 4 3

20 3 5 4 5 5 4 2 5 4 3

4

D. Prosedur Kerja dan Alat Bantu 1. Gunakan rumus yang berlaku pada teori test klasik untuk menentukan tingkat validitas dan

reliabilitas yang sesuai dengan jenis data. 2. Gunakan bantuan aplikasi Ms. Excel untuk menghitungnya. 3. Buatlah tabel yang bisa membantu dalam menganalisisnya. 4. Bandingkan hasil hitungan dengan nilai tabel/ acuan untuk menentukan status butir.

E. Analisis Data dengan Aplikasi Excel

1. Analisis validitas butir objektif/ PG

Nomor butir Tes Objektif

Responden 1 2 3 4 5 6 7 8 9 10 Total

1 1 1 1 1 1 1 1 1 1 1

2 0 0 0 0 0 0 0 1 0 0

3 0 0 0 0 0 0 0 0 0 0

4 1 0 1 1 1 1 1 1 0 1

5 0 1 1 1 0 0 0 0 0 0

6 1 1 1 1 1 1 1 1 1 0

7 0 1 0 0 1 0 0 1 1 0

8 1 1 0 0 1 1 1 1 1 1

9 0 1 1 0 0 0 0 0 0 0

10 1 1 1 0 1 1 1 0 0 1

11 1 1 1 1 0 1 1 1 1 1

12 0 1 0 0 1 1 0 0 0 0

13 0 0 0 0 0 0 0 0 0 0

14 1 1 0 1 1 1 1 0 1 1

15 1 1 1 1 1 1 1 1 1 1

16 0 1 1 1 0 0 1 1 1 1

17 0 1 1 1 0 0 0 1 0 1

18 1 1 1 1 1 1 1 1 1 1

19 0 0 1 1 0 0 1 0 0 1

20 0 1 1 0 1 1 0 0 1 1

P

q

Rerata Benar

Rerata total

SD tot

rpbi

r tabel

Status Butir VALID

2. Analisis validitas butir angket

Nomor Butir Angket

Responden 1 2 3 4 5 6 7 8 9 10 Total

1 3 4 3 2 4 3 3 3 3 3

2 2 4 3 4 4 3 4 4 4 3

3 4 4 4 3 4 4 4 4 4 4

4 3 4 4 3 3 3 3 3 3 3

5 2 3 2 4 3 4 2 4 2 3

6 4 3 4 4 4 4 5 5 5 5

7 3 3 4 4 4 3 3 4 3 4

8 4 4 3 4 4 4 4 4 3 5

9 3 4 3 4 5 4 3 3 4 4

10 2 4 4 2 3 3 2 3 4 3

5

11 2 3 4 3 2 4 2 2 4 2

12 3 2 1 4 5 4 3 3 4 4

13 4 3 2 5 4 4 4 3 2 4

14 4 4 3 4 4 4 4 4 3 4

15 3 4 4 3 3 4 3 4 4 4

16 4 4 4 4 4 4 3 4 5 3

17 3 3 4 4 4 4 2 4 4 4

18 4 4 5 4 5 3 2 4 5 4

19 3 5 4 5 5 4 2 5 4 3

20 3 5 4 5 5 4 2 5 4 3

Kore- lasi

r tabel

Status VALID

3. Analisis reliabilitas butir soal objektif/ PG

Nomor butir Tes Objektif (yang dimasukkan adalah butir yang valid)

Responden No. Soal No. Soal No. Soal No. Soal No. Soal No. Soal Total

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

Banyak butir k

P

q

pq

Sigma pq

Varians total

KR-20

4. Analisis reliabilitas butir angket

Nomor butir angket (yang dimasukkan adalah butir yang valid)

Responden No.Butir No.Butir No.Butir No.Butir No.Butir No.Butir No.Butir Total

1

2

3

4

6

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

k

Var total

Var butir

Sigma varbut

Alpha- Cronbach

F. Kesimpulan

Berdasarkan hasil analisis tersebut, tuliskan kesimpulan yang dapat diperoleh.

7

LAMPIRAN 1. TABEL NILAI-NILAI r PRODUCT MOMENT/POINT BISERIAL

N Taraf Signifikansi

N Taraf Signifikansi

N Taraf Signifikansi

5% 1% 5% 1% 5% 1%

3 0,997 0,999 27 0,381 0,487 55 0,266 0,345 4 0,950

0,878 0,990 0,959

28 0,374 0,478 60 0,254 0,244

0,330 0,317 5 29 0,367 0,470 65

6 0,811 0,917 30 0,361 0,463 70 0,235 0,306 7 0,754 0,874 31 0,355 0,456 75 0,227 0,296 8 0,707 0,834 32 0,349 0,449 80 0,220 0,286 9 0,666 0,798 33 0,344 0,442 85 0,213 0,278

10 0,632 0,765 34 0,339 0,436 90 0,207 0,270

11 0,602 0,735 35 0,334 0,430 95 0,202 0,263 12 0,576 0,708 36 0,329 0,424 100 0,195 0,250 13 0,553 0,684 37 0,325 0,418 125 0,176 0,230 14 0,532 0,661 38 0,320 0,413 150 0,159 0,210 15 0,514 0,641 39 0,316 0,408 175 0,148 0,194

16 0,497 0,623 40 0,312 0,403 200 0,138 0,181 17 0,482 0,606 41 0,308 0,398 300 0,113 0,148 18 0,468 0,590 42 0,304 0,393 400 0,098 0,128 19 0,456 0,575 43 0,301 0,389 500 0,088 0,115 20 0,444 0,561 44 0,297 0,384 600 0,080 0,105

21 0,433 0,549 45 0,294 0,380 700 0,074 0,097 22 0,423 0,537 46 0,291 0,376 800 0,070 0,091 23 0,413 0,526 47 0,288 0,372 900 0,065 0,086 24 0,404 0,515 48 0,284 0,368 1000 0,062 0,081 25 0,396 0,505 49 0,281 0,364 26 0,388 0,496 50 0,279 0,361

PANDUAN PRAKTIKUM TEORI RESPON BUTIR

Analisis Butir dengan Pendekatan Klasik dan Modern

SEPTEMBER-DESEMBER, 2018

JURUSAN PENDIDIKAN IPA, FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM Kampus Pusat UNY, Jln Colombo No 1, Yogyakarta 55281

Dosen Pengampu:

Didik Setyawarno, M.Pd

1

PRAKTIKUM 2

ANALISIS TARAF KESUKARAN DAN DAYA BEDA BUTIR SOAL DAN TES

A. Tujuan

Mahasiswa mampu untuk menganalisis butir soal pilihan ganda (data dikotomi) untuk menentukan indek

daya beda dan taraf kesukaran butir soal dan instrumen.

B. Dasar Teori

1. Taraf Kesukaran

Taraf kesukaran tes adalah kesulitan tes dipandang dari kemampuan peserta didik untuk menjawab soal

yang digunakan untuk tes; artinya, tes tersebut akan lebih banyak dapat dijawab benar oleh peserta

didik yang pandai dan lebih banyak dijawab salah oleh peserta didik yang bodoh. Tingkat kesukaran

butir tes merupakan bilangan yang menunjukkan proporsi peserta ujian (testee) yang dapat menjawab

betul butir soal tersebut. Sedangkan tingkat kesukaran perangkat tes adalah bilangan yang menunjukkan

rata-rata proporsi testee yang dapat menjawab seluruh (perangkat) tes tersebut. Rumus tingkat kesukaran

instrumen tes untuk soal bentuk pilihan ganda maupun uraian sebagai berikut.

𝑃𝑝 =∑𝑃𝑖𝑛

Keterangan :

Pp = tingkat kesukaran perangkat tes

P = tingkat kesukaran tiap butir

n = banyaknya butir tes

Tingkat kesukaran tiap butir soal berbentuk pilihan ganda, dihitung dengan rumus :

𝑃𝑖 =𝑛𝐵𝑛

Keterangan :

Pi = tingkat kesukaran butir tes pilihan ganda nomor i

nB = banyaknya subyek yang menjawab soal dengan betul

n = jumlah subyek (testee) seluruhnya

Pada tingkat kesukaran soal tes esai/uraian, dihitung dengan menggunakan rumus:

𝑃𝑖 =𝑥�̅�𝑠𝑚

Keterangan :

Pi = tingkat kesukaran butir tes uraian nomor i

𝑥�̅� = rata-rata skor butir soal

sm = skor maksimal setiap butir yang ditetapkan

Kriteria tingkat kesukaran (P) :

0,00 – 0,30 = sukar

0,31 – 0,70 = sedang*

0,71 – 1,00 = mudah

Referesni lain ada yang menyatakan bahwa tes yang baik adalah tes yang memiliki taraf kesukaran

antara 0,25 – 0,75.

2

2. Daya Beda

Daya pembeda tes adalah kemampuan tes untuk membedakan antara peserta didik yang pandai

(kelompok atas) dan bodoh (kelompok bawah); artinya, jika tes tersebut diberikan kepada anak yang

tergolong pandai akan lebih banyak dapat dijawab dengan benar, sedangkan jika diberikan kepada

peserta didik yang tergolong bodoh akan lebih banyak dijawab salah. Daya pembeda tes yang baik

adalah antara 20% - 80% atau antara 30% - 70%. Daya beda butir tes ialah kemampuan butir tes

tersebut membedakan antara testee kelompok atas (pinter) dan testee kelompok bawah (lemah). Daya

beda perangkat tes adalah rata-rata kemampuan tiap butir tes membedakan antara testee kelompok

atas (pinter) dan testee kelompok bawah (lemah). Rumus untuk menghitung tingkat daya beda tes

berbentuk pilihan ganda atau uraian sebagai berikut.

𝐷𝑝 =∑(𝑃𝐴 − 𝑃𝐵)

𝑛=∑𝐷𝑖𝑛

Keterangan :

Dp = Daya beda instrumen tes

n = jumlah butir tes

Rumus untuk menghitung daya beda butir tes berbentuk pilihan ganda adalah sebagai berikut :

𝐷𝑖 =𝑛𝐵𝐴

𝑛𝐴−

𝑛𝐵𝐵

𝑛𝐵 atau 𝐷𝑖 = 𝑃𝐴 − 𝑃𝐵

Keterangan:

Di = Daya beda butir soal nomor i

nBA = jumlah subyek yang menjawab betul pada kelompok atas

nBB = jumlah subyek yang menjawab betul pada kelompok bawah

nA = jumlah subyek kelompok atas

nB = jumlah subyek kelompok bawah

Rumus untuk menghitung daya beda butir tes berbentuk uraian adalah sebagai berikut :

𝐷𝑖 =𝑥�̅�𝐴 − 𝑥�̅�𝐵

𝑠𝑚

Keterangan:

Di = Daya beda butir soal nomor i

𝑥�̅�𝐴 = rata-rata skor kelompok atas pada butir soal nomor i

𝑥�̅�𝐵 = rata-rata skor kelompok bawah pada butir soal nomor i

sm = skor maksimal setiap butir yang ditetapkan

Kriteria Daya Beda (D) :

0,00 – 0,19 = kurang baik

0,20 – 0,39 = cukup baik

0,40 – 0,70 = baik

0,71 – 1,00 = sangat baik

* Jika “D” negatif, soal tersebut sangat buruk dan harus dibuang.

3

C. Data Butir Soal

1. Data jawaban dari soal objektif (pilihan ganda: benar 1, salah 0) yang terdiri dari 10 nomor dan

dikerjakan oleh 20 siswa

Nomor butir Tes Objektif

Responden 1 2 3 4 5 6 7 8 9 10

1 1 1 1 1 1 1 1 1 1 1

2 0 0 0 0 0 0 0 1 0 0

3 0 0 0 0 0 0 0 0 0 0

4 1 0 1 1 1 1 1 1 0 1

5 0 1 1 1 0 0 0 0 0 0

6 1 1 1 1 1 1 1 1 1 0

7 0 1 0 0 1 0 0 1 1 0

8 1 1 0 0 1 1 1 1 1 1

9 0 1 1 0 0 0 0 0 0 0

10 1 1 1 0 1 1 1 0 0 1

11 1 1 1 1 0 1 1 1 1 1

12 0 1 0 0 1 1 0 0 0 0

13 0 0 0 0 0 0 0 0 0 0

14 1 1 0 1 1 1 1 0 1 1

15 1 1 1 1 1 1 1 1 1 1

16 0 1 1 1 0 0 1 1 1 1

17 0 1 1 1 0 0 0 1 0 1

18 1 1 1 1 1 1 1 1 1 1

19 0 0 1 1 0 0 1 0 0 1

20 0 1 1 0 1 1 0 0 1 1

2. Data jawaban dari soal uraian dengan skor maksimal seragam (minimal 0 dan maksimal 5) dari 10

butir soal uraian yang diisi oleh 20 peserta

Nomor Butir Uraian

Responden 1 2 3 4 5 6 7 8 9 10

1 3 4 3 2 4 3 3 3 3 3

2 2 4 3 4 4 3 4 4 4 3

3 4 4 4 3 4 4 4 4 4 4

4 3 4 4 3 3 3 3 3 3 3

5 2 3 2 4 3 4 2 4 2 3

6 4 3 4 4 4 4 5 5 5 5

7 3 3 4 4 4 3 3 4 3 4

8 4 4 3 4 4 4 4 4 3 5

9 3 4 3 4 5 4 3 3 4 4

10 2 4 4 2 3 3 2 3 4 3

11 2 3 4 3 2 4 2 2 4 2

12 3 2 1 4 5 4 3 3 4 4

13 4 3 2 5 4 4 4 3 2 4

14 4 4 3 4 4 4 4 4 3 4

15 3 4 4 3 3 4 3 4 4 4

16 4 4 4 4 4 4 3 4 5 3

17 3 3 4 4 4 4 2 4 4 4

18 4 4 5 4 5 3 2 4 5 4

19 3 5 4 5 5 4 2 5 4 3

20 3 5 4 5 5 4 2 5 4 3

4

D. Prosedur Kerja dan Alat Bantu 1. Gunakan rumus yang berlaku pada teori test klasik untuk menentukan tingkat kesukaran perangkat tes,

tingkat kesukaran butir tes, daya beda perangkat tes, dan daya beda butir tes yang sesuai dengan jenis data.

2. Gunakan bantuan aplikasi Ms. Excel untuk menghitungnya. 3. Buatlah tabel yang bisa membantu dalam menganalisisnya. 4. Bandingkan hasil hitungan dengan nilai tabel/ acuan untuk menentukan status butir.

E. Analisis Data dengan Aplikasi Excel

1. Analisis tingkat kesukaran dan daya beda butir objektif/ PG

Nomor butir Tes Objektif

Responden 1 2 3 4 5 6 7 8 9 10 Total

Data diurutkan dari total skor tertinggi ke terendah (1-10 atau setengah dari jumlah peserta tes adalah kelompok atas)

11-20 atau setengah dari jumlah peserta tes berikutnya adalah kelompok bawah

Kelompok atas menjawab benar

Kelompok bawah menjawab benar

Jumlah benar pada semua kelompok

Tingkat Kesukaran

Daya Beda

Kualitas Butir Baik

5

1. Analisis tingkat kesukaran dan daya beda soal uraian

Nomor butir Tes Objektif

Responden 1 2 3 4 5 6 7 8 9 10 Total

Data diurutkan dari total skor tertinggi ke terendah (1-10 atau setengah dari jumlah peserta tes adalah kelompok atas)

11-20 atau setengah dari jumlah peserta tes berikutnya adalah kelompok bawah

Rata-rata kelompok atas menjawab benar

Rata-rata kelompok bawah menjawab benar

Rata-rata menjawab benar pada semua kelompok

Tingkat Kesukaran

Daya Beda

Kualitas Butir Baik

F. Kesimpulan

Berdasarkan hasil analisis tersebut, tuliskan kesimpulan yang dapat diperoleh.

PANDUAN PRAKTIKUM TEORI RESPON BUTIR

Analisis Butir dengan Pendekatan Klasik dan Modern

SEPTEMBER-DESEMBER, 2018

JURUSAN PENDIDIKAN IPA, FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM Kampus Pusat UNY, Jln Colombo No 1, Yogyakarta 55281

Dosen Pengampu:

Didik Setyawarno, M.Pd

1

PRAKTIKUM 3

ANALISIS DISTRAKTOR/ KEBERFUNGSIAN PENGECOH DAN INDEK SENSITIVITAS BUTIR

A. Tujuan

Mahasiswa mampu untuk menganalisis distraktor atau keberfunsian pengecoh pada butir soal pilihan

ganda dan indek sensitivitas butir.

B. Dasar Teori

1. Distraktor atau Pengecoh

Pengecoh atau distractor yang baik adalah pengecoh yang dapat mengecoh peserta didik untuk memilih

jawaban pada butir soal; artinya, pengecoh tersebut dapat mengecoh peserta didik atau paling sedikit

pengecoh tersebut dipilih oleh 2% atau 3% dari peserta tes. Pengecoh yang baik (efektif) ialah pengecoh

yang dipilih oleh minimal 2-3% dari pengikut tes (ada beberapa referensi mengatakan minimal 5% sudah

dikatakan efektif). Berikut diberikan contoh cara menghitung efektifitas pengecoh untuk 1 butir tes objektif

yang memiliki 4 option a,b,c, dan d.

Pilihan A* B C D *kunci

Kelompok atas 2 6 0 1 10

A Kelompok bawah 6 1 0 4 10

Jumlah 8 7 0 5 20

Jumlah (%) 40% 35% 0% 25% 100%

Kunci jawaban betul untuk soal di atas adalah pilihan jawaban (A). Pilihan jawaban b, c, dan d sebagai

pengecoh. Pada umumnya sebuah pengecoh yang baik dapat mengundang jawaban lebih besar

jumlahnya pada peserta didik kelompok lemah, dan lebih sedikit pada kelompok pandai. Pilihan jawaban

b, sebagai pengecoh tidak efektif, sebab menarik jawaban lebih banyak dari kelompok peserta didik

pandai. Kejadian itu disebabkan karena distractor (b) membingungkan. Pilihan jawaban c sama sekali

tidak efektif, karena tidak dapat menarik jawaban seorangpun. Pilihan jawaban d dipandang telah

memenuhi fungsinya, sebab dapat mengundang jawaban oleh peserta didik kelompok pandai yang lebih

stedikit.

2. Indek Sensitivitas Tes

Indeks sinsitivitas butir pada dasarnya merupakan ukuran seberapa baik butir soal atau perangkat tes

untuk membedakan antara siswa yang telah dan yang belum mengikuti kegiatan pembelajaran. Prosedur

penentuan sensitivitas pembelajaran dengan cara memberikan pre-test dan post-test kepada kelompok

siswa yang sama. Rumus untuk menghitung indek sensitivitas adalah selisih dari jumlah peserta didik yang

menjawab benar butir soal atau item sesudah proses pembelajaran (posttest) dengan jumlah peserta didik

yang menjawab benar butir soal atau item sebelum proses pembelajaran (pretest). Dengan demikian

sensitivtas instrumen tes merupakan rerata dari sensitivitas setiap butir soal yang ada di instrumen tes dan

dapat dihitung dengan rumus sebagai berikut.

𝑠𝑝 =∑ 𝑠𝑖

𝑛

Keterangan

sp = indek sensitivitas perangkat tes

si = indek sensitivitas butir soal atau item

n = jumlah butir soal di perangkat tes

Indeks sensitivitas butir soal pilihan ganda dengan skor benar 1 dan salah 0 dapat dihitung dengan

menggunakan rumus berikut.

𝑠𝑖 =𝑟𝐴 − 𝑟𝐵

𝑡

2

Keterangan

si = indek sensitivitas butir soal atau item nomor i

t = jumlah siswa yang mengikuti tes

rA = jumlah peserta didik yang menjawab benar butir soal atau item sesudah proses

pembelajaran (posttest)

rB = jumlah peserta didik yang menjawab benar butir soal atau item sebelum proses

pembelajaran (pretest)

Indeks sensitivitas butir soal uraian dengan skor maksimal sm dapat dihitung dengan menggunakan rumus

berikut.

𝑠𝑖 =𝑥𝐴̅̅ ̅ − 𝑥𝐵̅̅ ̅

𝑠𝑚

Keterangan

si = indek sensitivitas butir soal atau item nomor i

sm = jumlah skor maksimal butir

xA = jumlah peserta didik yang menjawab benar butir soal atau item sesudah proses

pembelajaran (posttest)

xB = jumlah peserta didik yang menjawab benar butir soal atau item sebelum proses

pembelajaran (pretest)

Indeks sensitivitas butir yang efektif berada di antara 0,00 – 1.00. Semakin besar indeks sensitivitas butir

menunjukkan semakin besar keberhasilan pembelajarannya.

C. Data Butir Soal

1. Data jawaban dari soal objektif (pilihan ganda: benar 1, salah 0) yang terdiri dari 5 nomor dan

dikerjakan oleh 16 siswa.

SISWA NOMOR SOAL

1 2 3 4 5

1 A B C A C

2 B C B C D

3 B A B C D

4 A B B C A

5 A B C A C

6 B B B C A

7 A B C A A

8 A C B D A

9 A C A C A

10 A B A C A

11 A B B C A

12 A B C A C

13 B B B C A

14 A B C A A

15 A C B D A

16 B C B C D

Adapun kunci jawaban untuk butir soal di atas sebagai berikut.

No Kunci

3

1 A

2 B

3 B

4 C

5 D

2. Data pretest dan posttest dari soal berbentuk uraian dengan skor maksimal setiap item 3.

Siswa Jawaban Butir Soal Pretest

Siswa Jawaban Butir Soal Postest

1 2 3 4 5 1 2 3 4 5

1 1 2 1 0 0 1 1 2 2 2 2

2 2 2 1 0 1 2 1 2 2 2 0

3 1 1 2 2 1 3 1 1 0 2 2

4 1 1 1 1 1 4 2 2 2 0 2

5 1 1 2 2 1 5 1 2 2 2 1

6 1 2 1 1 2 6 2 2 1 2 2

7 1 0 2 0 2 7 1 0 2 2 2

8 1 2 0 2 2 8 1 2 2 2 2

9 1 2 1 1 0 9 1 2 0 2 2

10 1 1 2 2 1 10 1 2 2 2 1

11 1 2 1 1 2 11 2 0 1 2 2

12 1 2 1 0 0 12 0 2 2 0 2

13 1 1 2 2 1 13 2 2 2 2 1

14 1 2 1 1 1 14 2 1 1 2 2

15 1 0 2 2 2 15 2 2 2 1 2

16 1 2 1 2 2 16 0 2 2 2 1

17 1 2 1 1 0 17 2 1 0 2 2

18 1 2 1 0 0 18 2 2 2 0 0

19 1 1 0 1 1 19 2 2 0 2 2

20 1 2 0 1 1 20 2 2 2 2 2

3. Data pretest dan posttest dari soal berbentuk pilihan ganda dengan skor benar 1 dan salah 0.

Siswa Jawaban Butir Soal Pretest

Siswa Jawaban Butir Soal Posttest

1 2 3 4 5 1 2 3 4 5

1 0 1 1 0 1 1 1 1 1 1 1

2 1 1 1 0 1 2 1 1 1 1 1

3 0 1 0 1 0 3 1 1 1 1 1

4 1 0 1 1 1 4 1 1 1 1 1

5 1 1 1 1 1 5 0 1 1 0 1

6 0 1 0 1 0 6 1 1 0 1 1

7 1 1 0 1 1 7 1 1 1 1 1

8 0 1 1 0 1 8 1 1 1 1 1

9 1 1 0 1 1 9 0 1 0 1 0

10 1 1 0 1 1 10 1 1 1 1 1

11 1 1 1 1 0 11 1 1 1 1 1

4

12 0 1 0 1 0 12 1 0 1 1 1

13 1 0 1 1 1 13 0 1 1 0 1

14 1 1 0 1 1 14 1 1 1 1 1

15 1 1 1 1 0 15 1 1 1 1 1

16 0 1 1 0 1 16 1 1 1 1 1

17 1 0 1 1 1 17 1 1 1 0 1

18 1 1 1 1 0 18 1 1 1 1 1

19 0 1 1 0 1 19 1 1 1 1 0

20 0 1 0 1 0 20 1 0 1 1 1

D. Prosedur Kerja dan Alat Bantu 1. Analisis Distraktor

a. Koreksilah jawaban siswa dengan kunci jawaban dan berilah skor yang benar 1 dan yang salah 0. b. Buatlah tabel yang bisa membantu dalam menganalisisnya. c. Jumlahkan skor yang diperoleh oleh setiap siswa dan bagilah menjadi dua kelompok atas dan bawah. d. Hitunglah distribusi jawaban setiap siswa untuk setiap butir soal dan nyatakan dalam prosentase. e. Bandingkan hasil hitungan dari distribusi jawaban dengan acuan untuk menentukan status

keberfungsian pengecoh. 2. Analisis Indek Sensitivitas Butir

a. Gunakan rumus yang berlaku untuk menghitung indek sensitivitas butir dan perangkat butir dengan bantuan aplikasi excel

b. Buatlah tabel yang bisa membantu dalam menganalisisnya. c. Hitunglah indek sensitivitas setiap butir dan perangkat instrument baik soal bentuk pilihan ganda

maupun uraian. d. Bandingkan indeks sensitivitas butir yang telah dihitung dengan kriteria bahwa butir yang efektif

berada di antara 0,00 – 1.00. Semakin besar indeks sensitivitas butir menunjukkan semakin besar keberhasilan pembelajarannya.

E. Analisis Data dengan Aplikasi Excel 1. Analisis kelompok atas dan bawah untuk butir objektif/ PG

Responden Nomor butir Tes Objektif

Total 1 2 3 4 5 6 7 8 9 10

Data diurutkan dari total skor tertinggi ke terendah (1-10 atau setengah dari jumlah peserta tes adalah kelompok atas)

11-20 atau setengah dari jumlah peserta tes berikutnya adalah kelompok bawah

5

Analisis keberfungsian pengecoh pada butir PG

No Butir Pilihan A B* C D *kunci

1 Kelompok atas

Kelompok bawah

Jumlah

Kesimpulan

2 Kelompok atas

Kelompok bawah

Jumlah

Kesimpulan

DAN SETERUSNYA

2. Data pretest dan posttest dari soal berbentuk uraian dengan skor maksimal setiap item 3.

Siswa Jawaban Butir Soal Pretest

Siswa Jawaban Butir Soal Postest

1 2 3 4 5 1 2 3 4 5

1 1

2 2

3 3

4 4

5 5

6 6

7 7

8 8

9 9

10 10

11 11

12 12

13 13

14 14

15 15

16 16

17 17

18 18

19 19

20 20

xB xA

si

sp

3. Data pretest dan posttest dari soal berbentuk pilihan ganda dengan skor benar 1 dan salah 0.

Siswa Jawaban Butir Soal Pretest

Siswa Jawaban Butir Soal Posttest

1 2 3 4 5 1 2 3 4 5

1 1

2 2

3 3

6

4 4

5 5

6 6

7 7

8 8

9 9

10 10

11 11

12 12

13 13

14 14

15 15

16 16

17 17

18 18

19 19

20 20

rB rA

rA-rB

si

sp

F. Kesimpulan Berdasarkan hasil analisis tersebut, tuliskan kesimpulan yang dapat diperoleh.

PANDUAN PRAKTIKUM TEORI RESPON BUTIR

Analisis Butir dengan Pendekatan Klasik dan Modern

SEPTEMBER-DESEMBER, 2018

JURUSAN PENDIDIKAN IPA, FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM Kampus Pusat UNY, Jln Colombo No 1, Yogyakarta 55281

Dosen Pengampu:

Didik Setyawarno, M.Pd

1

PRAKTIKUM 4

PENENTUAN INDEKS PERSETUJUAN KAPPA

A. Tujuan

Mahasiswa mampu untuk menghitung indeks persetujuan dan indeks Kappa dalam menganalisis instrument

butir soal baik dengan dua kali pelaksanaan tes maupun dengan sekali pelaksanaan tes.

B. Dasar Teori

1. Indeks persetujuan dan indeks Kappa dengan Dua Pengadministrasian Tes

Indeks keandalan yang direkomendasikan untuk tes beracuan kriteria adalah (a) koefisien persetujuan

(agreement coefficient), (b) koefisien kappa. Dua koefisien ini mengukur konsistensi dari klasifikasi berhasil-

gagal (mastery-nonmastery) antarkedua pelaksanaan ujian atau pengadministrasian tes. Indeks tersebut

memerlukan interpretasi yang berbeda dibanding koefisien keterandalan tradisional KR 20, KR 21, atau

Alpha-Cronbach yang menggunakan koefisien korelasi skor butir dengan skor total. Pengklasifikasian

berhasil-gagal pada kedua pelaksanaan tes dan pengadministrasian tes dapat diringkas sebagaimana pada Tabel

1. Tabel 1. Klasifikasi Penempuh Ujian di Dua Pelaksanaan Tes

Pelaksanaan Tes 2

Berhasil Gagal

Pelaksanaan Tes 1 Berhasil A B (A + B)

Gagal C D (C + D)

(A + C) (B + D) N

Koefisien persetujuan adalah proporsi penempuh tes yang secara konsisten tergolongkan ke dalam

kelompok yang berhasil dan yang gagal dari kedua-dua pengadministrasian pengujian tes. Koefisien

persetujuan menunjuk nilai po yang dihitung dengan rumus sebagai berikut.

𝒑𝒐 = ( 𝑨 + 𝑫)

𝑵

Keterangan:

A = jumlah penempuh tes kelompok yang berhasil di kedua pengadministrasi tes

D = jumlah penempuh tes kelompok yang gagal di kedua pengadministrasi tes

N = jumlah peserta tes di kedua pengadministrasian tes

Batas atas dari koefisien persetujuan adalah 1,00, yang tercapai jika klasifikasi-klasifikasi di kedua-dua

pengadministrasian tes bersifat konsisten untuk semua penempuh tes dimasing-masing kelompok. Batas

bawah dari koefisien persetujuan dapat dihitung dengan rumus sebagai berikut.

𝒑𝒄𝒉𝒂𝒏𝒄𝒆 = [( 𝑨 + 𝑩)(𝑨 + 𝑪) + ( 𝑪 + 𝑫)(𝑩 + 𝑫)]

𝑵𝟐

Keterangan:

B = jumlah penempuh tes kelompok yang berhasil di pengadministrasi tes pertama tetapi

gagal di pengadministrasi tes kedua

C = jumlah penempuh tes kelompok yang gagal di kedua pengadministrasi tes pertama tetapi

berhasil di pengadministrasi tes kedua

Batas bawah (pchance) merupakan proporsi klasifikasi-klasifikasi yang konsisten secara kebetulan jika hasil

mastery-nonmastery pada pengadministrasian tes yang kedua dengan sepenuhnya tidak terikat pada

pengadministrasin tes yang pertama dimana besarnya pchance ≥ 0,50. Koefisien kappa (K) dapat dihitung

dengan rumus sebagai berikut.

2

𝑲 = 𝒑𝒐 − 𝒑𝒄𝒉𝒂𝒏𝒄𝒆

𝟏 − 𝒑𝒄𝒉𝒂𝒏𝒄𝒆

Koefisien kappa merupakan proporsi klasifikasi-klasifikasi yang konsisten yang sesuai dengan harapan

dan yang secara kebetulan. Batas atas dan batas bawah dari koeifisen kappa adalah 1,00 dan 0,00,

yang terjadi ketika hasil-hasil pada kedua pengadministrasian tes bertutur-turut di dalam persetujuan yang

sempurna atau bebas secara penuh.

2. Indeks persetujuan dan indeks Kappa dengan Satu Pengadministrasian Tes

Penentuan indeks persetujuan dan indeks Kappa dengan satu pengadministrasian tes dapat dilakukan

dengan menggunakan tabel nilai taksiran (Approximate Values) dari koefisien persetujuan (Agreement

Coefficient) dan nilai taksiran (Approximate Value) dari Koefisien Kappa (Kappa Coefficient)

sebagaimana Tabel 2 dan Tabel 3 terlampir. Prosedur yang harus dilakukan dengan metode ini yaitu:

a. menghitung nilai standard score atau z score (z) dari skor penggalan (cutoff score) dari tes yang

dinyatakan sebagai suatu skor patokan/ kriteria

b. menghitung nilai reliabilitas tradisional KR 20, KR 21, atau Alpha-Cronbach (r)

Nilai hitung dari standard score atau z score (z) dan r dapat dihitung dari data yang sudah diadministrasi

dalam satu kali pelaksanaan. Nilai (z) dapat dihitung dengan menggunakan persamaan berikut.

|𝑧| =𝑐 − 0,5 − �̅�

𝑆𝐷

Keterangan:

c = skor penggalan mentah dari tes

�̅� = skor rata-rata yang diperoleh siswa

𝑆𝐷 = simpangan baku

Nilai 0,5 pada persamaan diatas merupakan suatu koreksi kekontinuan yang dibangun dari fakta dalam

tables nilai taksiran (Approximate Values) dari koefisien persetujuan (Agreement Coefficient) dan nilai

taksiran (Approximate Value) dari Koefisien Kappa (Kappa Coefficient) yang diperoleh dengan

memperkirakan skor tes mengikuti distribusi diskret untuk diubah menjadi distribusi normal yang kontinum.

Distribusi z hasil perhitungan berbentuk distribusi normal dan menggunakan tanda mutlak, sehingga

besarnya koefisien persetujuan atau koefisien kappa selalu bernilai positif. Jadi, dengan memberikan

tanda mutlak untuk z dapat menggunakan Tabel 3 dan 4. Keandalan skor tes r, yang muncul di

dalam Tabel 2 dan 3, dapat diperoleh dengan menggunakan indeks reliabilitas tradisional seperti

koefisien keandalan Kuder- Richardson (K-R) atau alfa-Cronbach.

Tabel 2. Nilai Taksiran dari Koefisien Persetujuan

IzI Reliabilitas Tradisional (r)

.10 .20 . 3 0 .40 .50 .60 .70 80 .90

.00 .53 .56 .60 .63 .67 .70 .75 .80 .86

.10 .53 .57 .60 .63 .67 .71 .75 .80 . 8 6

.20 .54 .57 .61 .64 .67 .71 .75 .80 .86

.30 .56 .59 .62 .65 .68 .72 .76 . 8 0 .86

.40 .58 .60 .63 .66 .69 .73 .77 .81 . 8 7

.50 .60 .62 .65 .68 .71 .74 .78 .82 .87

.60 .62 .65 .67 .70 .73 .76 .79 .83 .88

.70 65 .67 .70 .72 .75 .77 .80 .84 .89

.80 .68 .70 .72 .74 .77 .79 .82 .85 .90

.90 . 7 I .73 .75 .77 .79 .81 .84 .87 .90

1.00 .75 .76 .77 .77 .81 .83 .85 .80 .91

3

1.10 .78 .79 .80 .81 .83 .85 .87 .89 .92

1.20 .80 .81 .62 .84 .85 .86 .88 .90 93

1.30 .83 .84 85 .86 .67 .88 .90 .91 .94

1.40 .86 .86 .87 .88 .89 .90 .91 .93 .95

1.50 .88 . 8 8 .89 .90 .90 .91 .97 .94 .95

1.60 .90 .90 .90 .91 .92 .93 .93 .95 .96

1.70 .92 .92 .92 .93 .93 .94 95 .95 .97

1.80 .93 .93 .94 .94 .94 .95 .95 .96 .97

1.90 .95 .95 .95 .95 .95 .96 .96 .97 .98

2.00 .96 .96 .96 .96 .96 .97 .97 .97 .98

Tabel 3. Nilai Taksiran dari Koefisien Kappa

|z| Reliabilitas Tradisional (r)

.10 .20 .30 .40 .50 .60 .70 .8O .90

.00 .06 .13 .19 .26 .33 .41 .49 .59 .71

.10 .06 .13 .19 .26 .33 .41 .49 .59 .71

.20 .06 .13 .19 .26 .33 41 .49 .59 .71

.30 .06 .12 .19 .26 .33 .40 .49 .59 .71

.40 .06 .12 .19 .25 .32 .40 .48 .58 .71

.50 .06 .12 . 1 8 .25 .32 .40 .48 .58 .70

.60 .06 .12 .18 .24 .31 .39 .47 .57 .70

.70 .05 .11 .17 .24 .31 .38 .47 .57 .70

.60 .05 .11 .17 .23 .30 .37 .46 .56 .69

.90 .05 .10 .16 .22 .29 .36 .45 .55 .68

1.00 .05 .10 .15 .21 .28 .35 .44 .54 .68

1.10 .04 .09 .14 .20 .27 .34 .43 .53 .67

1.20 .04 .08 .14 .19 .26 .33 .42 .52 .66

1.10 .04 .08 .13 .18 .25 .32 .41 .51 .65

1.40 .03 .07 .12 .17 .23 .31 .39 .50 .64

1.50 .03 .07 .11 .16 .22 .29 .30 .49 .63

1.60 .03 .06 .10 .15 .21 .28 .37 .47 .62

1.70 .02 .05 .09 .14 .20 .27 .35 .46 .61

1.90 .02 .05 .08 .13 .16 .25 .34 .45 .60

1.90 .02 .04 .08 .12 .17 .24 .32 .43 .59

2.00 .02 .04 .07 .11 .16 .22 .31 .42 .58

3. Interpretasi koefisien persetujuan (agreement coefficient) dan koefisien kappa

Suatu tes dikatakan memiliki keandalan yang baik adalah jika memiliki koefisien persetujuan po ≥ 0,86

meskipun demikian juga bergantung pada penempatan skor penggalan sebagai skor patokan dan skor

rata-rata yang diperoleh dari tes yang bersangkutan. Nilai po = 0,86 berpasangan dengan situasi di

mana harga |z| = 0,00, yang menyiratkan bahwa separuh dari penempuh ujian adalah menguasai dan

separuh lainnya tidak menguasai. Interpretasi koefisien kappa sebagaimana Tabel 4.

4

Tabel 4. Interpretasi Koefisien Kappa

Indeks Kappa Agreement

<0,20 Rendah/Poor

0,21 – 0,40 Lumayan/ Fair

0,41 – 0,60 Cukup/ Moderate

0,61 – 0,80 Kuat/ Good

>0,80 Sangat Kuat/ Very good

Selain itu, suatu tes yang diterapkan dalam suatu kelas pada periode yang penuh (misalnya 1 semester)

dapat menggunakan nilai koefisien kappa sebesar 0,35 sampai 0,50 atau lebih dari itu.

C. Data Butir Soal

1. Indeks persetujuan dan indeks Kappa dengan Dua Pengadministrasian Tes

Siswa Jawaban Butir Soal Pengujian 1

Siswa Jawaban Butir Soal Pengujian 2

1 2 3 4 5 1 2 3 4 5

1 0 1 1 0 1 1 1 1 1 1 1

2 1 1 1 0 1 2 1 1 1 1 1

3 0 1 0 1 0 3 1 1 1 1 1

4 1 0 1 1 1 4 1 1 1 1 1

5 1 1 1 1 1 5 0 1 1 0 1

6 0 1 0 1 0 6 1 1 0 1 1

7 1 1 0 1 1 7 1 1 1 1 1

8 0 1 1 0 1 8 1 1 1 1 1

9 1 1 0 1 1 9 0 1 0 1 0

10 1 1 0 1 1 10 1 1 1 1 1

Keterangan: 0 = gagal, dan 1=berhasil.

2. Indeks persetujuan dan indeks Kappa dengan Satu Pengadministrasian Tes

Gunakan data praktikum 1 tentang penentuan validitas dan reliabilitas untuk data dikotomi. Skor penggalan

mentah dari tes tersebut adalah 7 di mana semua butir telah dinyatakan valid (taraf signifikansi 5%).

D. Prosedur Kerja dan Alat Bantu

1. Indeks persetujuan dan indeks Kappa dengan Dua Pengadministrasian Tes

a. Kelompokkan kategori jawaban siswa berhasil dan gagal

b. Hitung nilai koefisien persetujuan po dan batas bawah dari koefisien persetujuan pchance

c. Hitung nilai koefisien kappa (K)

d. Interpretasikan hasil hitungan Anda dengan acuan yang ada diteori

2. Indeks persetujuan dan indeks Kappa dengan Satu Pengadministrasian Tes

a. Hitung nilai z-score dengan menggunakan rumus yang berlaku dimana skor penggalan mentah dari tes

tersebut adalah 7.

b. Gunakan Tabel 2 dan 3.

c. Interpretasikan hasil hitungan Anda dari tabel tersebut dengan acuan yang ada diteori untuk menghitung

koefisien persetujuan po dan koefisien kappa (K)

5

E. Analisis Data dengan Aplikasi Excel

1. Indeks persetujuan dan indeks Kappa dengan Dua Pengadministrasian Tes

𝒑𝒐 = ( 𝑨 + 𝑫)

𝑵

𝒑𝒄𝒉𝒂𝒏𝒄𝒆 = [( 𝑨 + 𝑩)(𝑨 + 𝑪) + ( 𝑪 + 𝑫)(𝑩 + 𝑫)]

𝑵𝟐

𝑲 = 𝒑𝒐 − 𝒑𝒄𝒉𝒂𝒏𝒄𝒆

𝟏 − 𝒑𝒄𝒉𝒂𝒏𝒄𝒆

2. Indeks persetujuan dan indeks Kappa dengan Satu Pengadministrasian Tes

|𝑧| =𝑐 − 0,5 − �̅�

𝑆𝐷

F. Kesimpulan

Berdasarkan hasil analisis tersebut, tuliskan kesimpulan yang dapat diperoleh.

Siswa Butir Pengujian 1 Pengujian 2 Kategori

1 1 0 1 C

2 1 1 A

3

Dst

10

1 2

2

3

Dst

10

Dst

1 5

2

3

Dst

10

Hasil Akhir A =

B =

C =

D =

PANDUAN PRAKTIKUM TEORI RESPON BUTIR

Analisis Butir dengan Pendekatan Klasik dan Modern

Dosen Pengampu: Didik Setyawarno, M.Pd

SEPTEMBER-DESEMBER, 2018 JURUSAN PENDIDIKAN IPA, FAKULTAS MATEMATIKA DAN

ILMU PENGETAHUAN ALAM

Kampus Pusat UNY, Jln Colombo No 1, Yogyakarta 55281

PRAKTIKUM 5

ANALISIS BUTIR DENGAN MENGGUNAKAN SPSS (PENDEKATAN KLASIK)

A. Tujuan

Mahasiswa mampu menganalisis butir soal (data dikotomi) dan angket (data politomi) serta menghiung

koefisien Kappa dengan menggunakan aplikasi SPSS untuk menentukan kualitas butir soal dan angket.

B. Aplikasi SPSS untuk Analisis Butir

Aplikasi statistika terapan dalam bidang evaluasi pembelajaran maupun penelitian yang dapat

digunakan sangatlah banyak, misalnya: SPSS, Iteman, AnBuso, Quest, dll. Aplikasi tersebut sangat familiar

dikalangan pendidik yang dapat digunakan untuk menganalisis butir soal, sehingga mengetahui kualitas butir

soal tersebut dan mampu meningkatkan mutu soal yang telah ditulis. Penelaahan soal secara kuantitatif

maksudnya adalah penelaahan butir soal didasarkan pada data empirik dari butir soal yang bersangkutan.

Data empirik ini diperoleh dari soal yang telah diujikan. Aspek yang di analisis dalam butir soal meliputi:

tingkat kesukaran butir, daya pembeda butir, dan penyebaran pilihan jawaban (untuk soal bentuk obyektif)

atau frekuensi jawaban pada setiap pilihan jawaban.

SPSS adalah aplikasi untuk melakukan analisis statistik. SPSS adalah singkatan dari Statistical Package

for the Social Sciences. SPSS software pertama kali dibuat dan dimiliki oleh perusahaan SPSS Inc. Namun

dalam perjalanannya pada tahun 2009 hingga sekarang, SPSS telah diakuisisi oleh perusahaan IBM. Maka

versi terbaru dari SPSS, sejak SPSS versi 20, namanya telah berubah menjadi IBM SPSS. Dalam hal ini pada

tahun 2017, versi terbaru dari SPSS adalah IBM SPSS versi 25. Kegunaan SPSS dalam penelitian adalah untuk

olah dan analisis statistik. Banyak sekali analisis yang dapat dikerjakan dengan aplikasi tersebut, antara lain:

Uji deskriptive, Regresi Linear, Regresi Logistik, Analisis Faktor, Uji Normalitas, Uji F dan Uji T, Independent T

Test, ANOVA, MANOVA, ANCOVA, Uji Non Parametris yang banyak sekali macamnya seperti Mann Whitney

U Test, wilcoxon signed rank test, spearman, kendall tau, dll. Bahkan dapat juga digunakan untuk pembuatan

grafik, seperti Histogram, Normal PP, Detrend PP, Boxplot, dll. Untuk uji instrumen atau uji validitas dan uji

reliabilitas, SPSS juga dapat melakukannya dengan fitur yang lengkap.

SPSS mempunyai user interface atau antar muka yang sangat user friendly alias mudah dipahami

pengguna, mudah digunakan dan hasilnya atau output SPSS sangatlah menarik dengan tampilan yang luar

biasa apabila dibandingkan dengan aplikasi statistik lainnya. Kelebihan SPSS yang lainnya adalah database.

Dimana SPSS memiliki sistem database tersendiri dan dapat dijalankan atau dihubungkan dengan aplikasi

lainnya, semisal aplikasi excel. Hal ini sangat dimungkinkan bagi para pengguna, sebab database SPSS

termasuk dalam golongan ODBC, sehingga dapat dijalankan perintahnya atau dihubungkan dengan berbagai

macam aplikasi yang berbasil SQL.

C. Data Butir Soal

Analisislah butir soal pilihan ganda dan angket sebagaimana terlampir.

D. Prosedur Analisis dengan SPSS

1. Uji Instrumen Angket (Data Politomi)

Validitas suatu butir pertanyaan dapat dilihat pada hasil output SPSS pada tabel dengan judul Item-

Total Statistic. Kevalidan masing-masing butir pertanyaan dapat dinilai dari Correlated Item-Total Correlation

masing-masing butir pertanyaan. Suatu variabel dikatakan valid apabila nilai r-hitung yang merupakan nilai

dari Correlated Item-total Correlation > dari r-tabel. Nilai r-tabel dapat diperoleh melalui df (degree of freedom)

= n – k, dimana n merupakan jumlah responden, dan k merupakan jumlah butir pertanyaan dalam suatu

variabel. Alpha yang dipergunakan dalam penelitian adalah 5%. Perhatikan hasil rekap data kuisioner

berikut.

Tabel Hasil Rekap Data Kuisioner

Responden

Motivasi Belajar

1 2 3 4 5 6

1 4 4 4 4 4 1

2 3 3 3 3 3 3

3 4 4 4 4 4 1

4 4 4 4 3 4 1

5 3 3 3 3 3 3

6 3 3 4 3 3 2

7 4 4 4 4 4 1

8 5 4 4 4 4 2

9 3 4 3 3 4 1

10 4 4 4 4 4 1

11 4 4 4 4 4 1

12 3 3 3 3 3 3

13 4 4 4 3 4 4

14 4 4 4 4 4 1

15 3 3 3 4 3 1

16 3 3 3 3 3 1

17 4 4 4 4 4 3

18 3 3 3 3 3 3

19 3 3 3 3 3 2

20 4 3 4 3 3 1

21 4 3 3 3 3 1

22 4 4 4 4 4 1

23 3 3 4 4 3 3

24 4 3 4 4 3 3

25 4 4 4 4 4 2

26 4 4 4 4 4 2

27 4 4 4 4 4 2

28 2 2 3 2 2 3

29 4 4 4 4 2 2

30 4 4 4 3 3 1

Penyelesaian

a. Buka aplikasi SPPS dan pilih variable view di bagian bawah kiri. Ketik A1 sampai dengan A6 pada

kolom name untuk pertanyaan kuisioner aspek motivasi belajar. Isikan pada kolom label yaitu

pertanyaan 1 sampai dengan pertanyaan 6.

b. Klik Data View dan masukkan data hasil kuisioner A1 sampai A6.

c. Klik menu Analyze, pilih Scale → Reliability Análisis.

d. Pindahkan seluruh Pertanyaan, mulai A1 sampai A6 ke kotak item melalui tombol tanda panah

diantaranya.

e. Klik tombol statistic, kemudian klik item, scale, dan scale if item deleted.

f. Selanjutnya klik continue dan Ok.

Hasil analisis dengan SPSS akan dihasilkan untuk validitas dapat di lihat di tabel item-total statistics

sebagai berikut.

Item-Total Statistics

Scale Mean if Item Deleted

Scale Variance if Item Deleted

Corrected Item-Total

Correlation

Cronbach's Alpha if Item

Deleted

pertanyaan 1 16.00 3.310 .678 .437 pertanyaan 2 16.10 3.403 .700 .440 pertanyaan 3 15.97 3.689 .699 .470 pertanyaan 4 16.13 3.568 .606 .478 pertanyaan 5 16.20 3.476 .573 .480 pertanyaan 6 17.77 5.909 -.347 .900

g. Menentukan nilai r-tabel dengan melihat nilai df (degree of freedom) = n – k, dimana k adalah jumlah

butir pertanyaan dalam suatu variabel, dan n merupakan jumlah responden. Maka df = 30-6 = 24.

Tabel r product – moment (two tailed test) menunjukkan bahwa pada df 24 dengan alpha 5%, diperoleh

r table sebesar 0,404.

h. Membandingkan nilai r hitung dengan r tabel sebagai berikut.

1) r hitung A1 sebesar 0,678 > r table 0,404, kesimpulan valid.

2) r hitung A2 sebesar 0,700 > r table 0,404, kesimpulan valid.

3) r hitung A3 sebesar 0,699 > r table 0,404, kesimpulan valid.

4) r hitung A4 sebesar 0,606 > r table 0,404, kesimpulan valid.

5) r hitung A5 sebesar 0,573 > r table 0,404, kesimpulan valid.

6) r hitung A6 sebesar -0,347 < r table 0,404, kesimpulan tidak valid.

i. Menghapus pertanyaan yang tidak valid (nomor 6) dari variable view di SPSS (klik kanan pilih clear).

j. Melakukan uji validitas kembali untuk pertanyaan yang valid, seperti langkah langkah diatas. Hasil uji

validitas untuk Item Total Statistics sebagai berikut.

Item-Total Statistics

Scale Mean if Item Deleted

Scale Variance if Item Deleted

Corrected Item-Total

Correlation

Cronbach's Alpha if Item

Deleted

pertanyaan 1 14.13 3.637 .808 .866 pertanyaan 2 14.23 3.702 .855 .855 pertanyaan 3 14.10 4.231 .734 .885

pertanyaan 4 14.27 3.995 .693 .891 pertanyaan 5 14.33 3.816 .695 .892

k. Menentukan nilai r-tabel dari pertanyaan yang valid melalui df (degree of freedom) = n – k, dimana

k merupakan jumlah butir pertanyaan dalam suatu variabel, dan n merupakan jumlah responden. Maka

df = 30-5 = 25. Tabel r product – moment (two tailed test) menunjukkan bahwa pada df 24 dengan

alpha 5%, diperoleh r table sebesar 0,396.

l. Membandingkan nilai r hitung dengan r tabel dari tabel hasil analisis terakhir sebagai berikut.

1) r hitung A2 sebesar 0,808 > r table 0,396, kesimpulan valid.

2) r hitung A5 sebesar 0,855 > r table 0,396, kesimpulan valid.

3) r hitung A6 sebesar 0,734 > r table 0,396, kesimpulan valid.

4) r hitung A7 sebesar 0,693 > r table 0,396, kesimpulan valid.

5) r hitung A8 sebesar 0,695 > r table 0,396, kesimpulan valid.

m. Menyimpulkan bahwa tujuh indikator pertanyaan variabel A yaitu motivasi dalam riset pembelajaran

IPA di SMP kelas 7 memiliki r hitung yang lebih besar dari nilai r table telah valid.

Langkah uji reliability sama dengan langkah uji validitas. Poin yang berbeda adalah output SPSS yang

menjadi dasar penilaian validitas dengan output SPSS yang menjadi dasar penilaian Reliabilitas. Uji validitas

dilakukan dengan memperhatikan output Item total statistik, sedangkan uji reliabilitas dengan memperhatikan

output Reliability Statistics pada kolom Cronbach’s Alpha. Reliabilitas suatu konstruk variabel dikatakan baik

jika memiliki nilai Cronbach’s Alpha > dari 0,60. Dengan menggunakan data pada contoh di atas maka

prosedur analisis reliabilitas instrumen sebagai berikut.

Penyelesaian

a. Buka aplikasi SPSS dan masukkan data variabel A yang sudah valid, seperti terdapat pada contoh di

atas.

b. Klik menu analyze pilih scale, kemudian klik realiability analysis.

c. Memindahkan seluruh pertanyaan ke kolom item dengan menggunakan tombol tanda panah yang

berada diantaranya.

d. Klik tombol statisitik, kemudian aktifkan item, scale, dan scale if item deleted.

e. Klik continue dan OK.

Hasil output SPSS dapat dilihat di tabel realibility statistics sebagai berikut.

Reliability Statistics

Cronbach's

Alpha N of Items

.900 5

Pengukuran yang reliabel akan menunjukkan instrumen yang dapat menghasilkan data yang dipercaya.

Reliabilitas suatu konstruk variabel dikatakan baik jika memiliki nilai Cronbach’s Alpha > dari 0,60. Maka

berdasarkan hasil ini dapat dilihat bahwa Cronbach’s Alpha 0.900 > dari 0,60. Hal ini berarti instrumen sudah

dapat dikatakan reliabel.

2. Data Dikotomi

Analisis butir soal tes berbentuk pilihan ganda (dengan benar skor 1 dan salah 0) merupakan cara untuk

mengetahui kualitas soal yang diujikan secara statistik. Analisis butir soal tes memiliki empat kriteria, yaitu:

a. Validitas

b. Reliabilitas

c. Tingkat Kesukaran

d. Daya Pembeda

Untuk mempermudah dalam analisis ini dapat dilakukan dengan menggunakan salah satu aplikasi komputer

SPSS for Windows. Berikut cara analisis menggunakan aplikasi SPSS tersebut.

a. Membuka aplikasi SPSS, klik Variable View dan isikan variable semua butir soal yang akan dianalisis.

b. Klik Data View, isikan hasil koreksian ke SPSS (Misal jawaban benar = 1, dan jawaban salah = 0,

jumlah = jumlah jawaban benar).

c. Uji Validitas:

1) Pilih menu Analyze --> Correlate --> Bivariate

2) Masukkan soal_1, soal_2, soal_3, soal_4, soal_5, soal_6, soal_7, soal_8, dan jumlah ke Kotak

“Variables”.

3) Klik Pearson, Two-tailed, dan Flag significant correlation

4) Klik OK

Berikut hasil analisis validitas butir soal pilihan ganda.

Correlations

soal_1 soal_2 soal_3 soal_4 soal_5 soal_6 soal_7 soal_8 jumlah

soal_1 Pearson Correlation 1 .000 .102 .250 .408 .327 .500 -.408 .430

Sig. (2-tailed) 1.000 .779 .486 .242 .356 .141 .242 .215

N 10 10 10 10 10 10 10 10 10

soal_2 Pearson Correlation .000 1 .000 .500 .000 .218 -.200 .408 .407

Sig. (2-tailed) 1.000 1.000 .141 1.000 .545 .580 .242 .243

N 10 10 10 10 10 10 10 10 10

soal_3 Pearson Correlation .102 .000 1 .408 .667* .535 .816** -.250 .702*

Sig. (2-tailed) .779 1.000 .242 .035 .111 .004 .486 .024

N 10 10 10 10 10 10 10 10 10

soal_4 Pearson Correlation .250 .500 .408 1 .612 .764* .500 -.102 .814**

Sig. (2-tailed) .486 .141 .242 .060 .010 .141 .779 .004

N 10 10 10 10 10 10 10 10 10

soal_5 Pearson Correlation .408 .000 .667* .612 1 .802** .816** -.167 .868**

Sig. (2-tailed) .242 1.000 .035 .060 .005 .004 .645 .001

N 10 10 10 10 10 10 10 10 10

soal_6 Pearson Correlation .327 .218 .535 .764* .802** 1 .655* -.356 .819**

Sig. (2-tailed) .356 .545 .111 .010 .005 .040 .312 .004

N 10 10 10 10 10 10 10 10 10

soal_7 Pearson Correlation .500 -.200 .816** .500 .816** .655* 1 -.408 .769**

Sig. (2-tailed) .141 .580 .004 .141 .004 .040 .242 .009

N 10 10 10 10 10 10 10 10 10

soal_8 Pearson Correlation -.408 .408 -.250 -.102 -.167 -.356 -.408 1 -.037

Sig. (2-tailed) .242 .242 .486 .779 .645 .312 .242 .919

N 10 10 10 10 10 10 10 10 10

jumlah Pearson Correlation .430 .407 .702* .814** .868** .819** .769** -.037 1

Sig. (2-tailed) .215 .243 .024 .004 .001 .004 .009 .919

N 10 10 10 10 10 10 10 10 10

*. Correlation is significant at the 0.05 level (2-tailed). **. Correlation is significant at the 0.01 level (2-tailed).

Analisis: Hasil pada kolom "Jumlah" jika nilai sig. (2-tailed) < ½ 0,05 atau sig. (2-tailed) < 0,025 menyatakan butir soal tersebut Valid. Contoh untuk soal nomor

1, nilai sig = 0,215, dimana nilai tersebut > 0,025, maka soal nomor 1 dinyatakan tidak valid. Soal nomor 5, nilai sig. (2-tailed) = 0,001, dimana nilai tersebut

<0,05, maka soal nomor 5 dinyatakan valid.

d. Uji Reliabilitas:

1) Pilih menu Analyze --> Scale --> Reliability Analysis.

2) Masukkan soal_1, soal_2, soal_3, soal_4, soal_5, soal_6, soal_7, dan soal_8, ke Kotak “Items”

3) Pada kolom Model pilih Alpha, klik Statistics, pilih Item, dan klik Continue.

4) Klik OK.

Hasil analisis uji reliabilitas dapat dilihat di tabel Reliability Statistic sebagai berikut.

Reliability Statistics

Cronbach's

Alpha N of Items

.734 8

Analisis: Berdasarkan nilai Cronbach's Alpha pada tabel Reliability Statistics diperoleh nilai 0,734

dimana nilai ini ditafsirkan dengan kriteria

0,800 - 1,000 = Sangat tinggi

0,600 - 0,799 = Tinggi

0,400 - 0,500 = Cukup

0,200 - 0,399 = Rendah

> 0,200 = Sangat rendah

Hasil analisis dapat disimpulkan tes ini memiliki tingkat reliabilitas tinggi.

e. Uji Tingkat Kesukaran

1) Pilih menu Analyze --> Descriptive Statistics --> Frequencies.

2) Masukkan soal_1, soal_2, soal_3, soal_4, soal_5, soal_6, soal_7, dan soal_8, ke Kotak

“Variable(s)”

3) Klik Statistics, Klik Mean, dan Klik Continue

4) Klik OK

Hasil analisis tingkat kesukaran sebagai berikut.

Statistics

soal_1 soal_2 soal_3 soal_4 soal_5 soal_6 soal_7 soal_8

N Valid 10 10 10 10 10 10 10 10

Missing 0 0 0 0 0 0 0 0 Mean .8000 .5000 .6000 .2000 .4000 .3000 .5000 .6000

Analisis : dari hasil yang ditunjukkan nilai MEAN pada tabel statistcs ditafsirkan pada rentang tingkat

kesukaran, yaitu

0.00 – 0.20 => Sangat Sukar

0.21 – 0.40 => Sukar

0.41 – 0.60 => Sedang

0.61 – 0.80 => Mudah

0.81 – 1.00 => Sangat Mudah

Misal soal nomor satu, diperoleh nilai Mean = 0,8000 yang berarti tingkat kesukaran soal nomor satu

adalah mudah. Soal nomor empat, diperoleh nilai Mean = 0,2000 yang berarti tingkat kesukaran

soal nomor satu adalah sangat sukar.

f. Uji Daya Pembeda

Untuk menentukan daya pembeda, maka nilai perhitungan yang digunakan adalah rhitung pada SPSS

yang dibandingkan dengan kriteria :

0.40 – 1.00 = Soal baik

0.30 – 0.39 = Soal diterima dan diperbaiki

0.20 – 0.29 = Soal diperbaiki

0.00 – 0.19 = Soal ditolak

R hitung dapat dilihat dari nilai Pearson Correlation pada uji validitas yang telah dilakukan sebelumnya.

Berikut tabel hasil analisis validitas butir soal untuk mengetahui daya beda butir soal pilihan ganda.

Correlations

soal_1 soal_2 soal_3 soal_4 soal_5 soal_6 soal_7 soal_8 jumlah

soal_1 Pearson Correlation 1 .000 .102 .250 .408 .327 .500 -.408 .430

Sig. (2-tailed) 1.000 .779 .486 .242 .356 .141 .242 .215

N 10 10 10 10 10 10 10 10 10

soal_2 Pearson Correlation .000 1 .000 .500 .000 .218 -.200 .408 .407

Sig. (2-tailed) 1.000 1.000 .141 1.000 .545 .580 .242 .243

N 10 10 10 10 10 10 10 10 10

soal_3 Pearson Correlation .102 .000 1 .408 .667* .535 .816** -.250 .702*

Sig. (2-tailed) .779 1.000 .242 .035 .111 .004 .486 .024

N 10 10 10 10 10 10 10 10 10

soal_4 Pearson Correlation .250 .500 .408 1 .612 .764* .500 -.102 .814**

Sig. (2-tailed) .486 .141 .242 .060 .010 .141 .779 .004

N 10 10 10 10 10 10 10 10 10

soal_5 Pearson Correlation .408 .000 .667* .612 1 .802** .816** -.167 .868**

Sig. (2-tailed) .242 1.000 .035 .060 .005 .004 .645 .001

N 10 10 10 10 10 10 10 10 10

soal_6 Pearson Correlation .327 .218 .535 .764* .802** 1 .655* -.356 .819**

Sig. (2-tailed) .356 .545 .111 .010 .005 .040 .312 .004

N 10 10 10 10 10 10 10 10 10

soal_7 Pearson Correlation .500 -.200 .816** .500 .816** .655* 1 -.408 .769**

Sig. (2-tailed) .141 .580 .004 .141 .004 .040 .242 .009

N 10 10 10 10 10 10 10 10 10

soal_8 Pearson Correlation -.408 .408 -.250 -.102 -.167 -.356 -.408 1 -.037

Sig. (2-tailed) .242 .242 .486 .779 .645 .312 .242 .919

N 10 10 10 10 10 10 10 10 10

jumlah Pearson Correlation .430 .407 .702* .814** .868** .819** .769** -.037 1

Sig. (2-tailed) .215 .243 .024 .004 .001 .004 .009 .919

N 10 10 10 10 10 10 10 10 10

*. Correlation is significant at the 0.05 level (2-tailed). **. Correlation is significant at the 0.01 level (2-tailed).

Analisis: Hasil yang diperoleh untuk soal nomor satu pada kolom jumlah adalah 0,430 yang berarti

soal baik.

3. Koefisien Kappa

Koefisien Kappa merupakan ukuran yang menyatakan konsistensi pengukuran yang dilakukan dua orang

penilai (Rater) atau konsistensi antar dua metode pengukuran atau dapat juga mengukur konsistensi antar dua

alat pengukuran.

Klasifikasi Penempuh Ujian di Dua Pelaksanaan Tes

Pelaksanaan Tes 2

Benar Salah

Pelaksanaan Tes 1 Benar A B (A + B)

Salah C D (C + D)

(A + C) (B + D) N

Langkah – langkah untuk mendapatkan koefisien Kappa dengan SPSS adalah sebagai berikut:

a. Definisikan data pada Variabel View. Disini akan dibuat tiga variabel, yaitu Tes 1 dan Tes 2. Skala data

untuk variabel Tes 1 dan Tes 2 adalah Scale. Berikan kode pada kolom Values.

Untuk variabel Tes 1 yang terdiri dari dua kategori

Benar = 2, Salah = 1

Untuk variabel Tes 2 yang terdiri dari dua kategori

Benar = 2, Salah = 1

Kategori ditetukan berdasarkan instrument yang digunakan oleh peneliti, memungkinkan terdiri dari tiga

atau lebih kategori.

Misal: Sangat Baik = 4, Baik = 3, Cukup = 2, Kurang = 1

b. Memasukan data kedalam SPSS

c. Pilih Anlyze, Descriptive Statistics, lalu klik Crosstabs

Kotak dialog Crosstabs, pindahkan Tes1 ke Row(s) dan Tes 2 ke Colum(s)

Klik Statistics, pada kotak dialog Crosstabs:Statistics yang muncul centang Kappa

d. Klik Cells, pada kotak dialog Crosstabs:Statistics yang muncul centang Total di bawah Percentages

tekan Continue

e. Klik Continue, lalu Ok

Output yang muncul sebagai berikut.

Tes_1 * Tes_2 Crosstabulation

Tes_2

Total Salah Benar

Tes_1 Salah Count 20 10 30

% of Total 40.0% 20.0% 60.0%

Benar Count 5 15 20

% of Total 10.0% 30.0% 40.0%

Total Count 25 25 50

% of Total 50.0% 50.0% 100.0%

Symmetric Measures

Value Asymptotic

Standard Errora Approximate Tb Approximate Significance

Measure of Agreement Kappa .400 .127 2.887 .004

N of Valid Cases 50 a. Not assuming the null hypothesis. b. Using the asymptotic standard error assuming the null hypothesis.

Dari output diatas diperoleh nilai koefisein cohen’s kappa sebesar 0,400. Ini berarti terdapat kesepakatan

yang lumayan/ fair Antara pelaksanaan Tes 1 dengan Tes 2 terhadap peserta. Nilai signfikansinya dapat

dilihat pada kolom Approx. Sig dengan nilai signifikansi sebesar 0,004. Karena nilai signifikansi kurang dari

taraf signifikansi yang digunakan 5 % (0,004<0,05), maka hipotesis awal dditerima sehingga dapat

disimpulkan terdapat kesepakatan yang signfikan antar pelaksanaan Tes 1 dan Tes 2 pada taraf signfikansi

5 %.

E. Kesimpulan

Buatlah interpretasi dari hasil keluaran Iteman dan berikan kesimpulan berdasarkan hasil analisis tersebut.

PANDUAN PRAKTIKUM TEORI RESPON BUTIR

Analisis Butir dengan Pendekatan Klasik dan Modern

Dosen Pengampu: Didik Setyawarno, M.Pd

SEPTEMBER-DESEMBER, 2018 JURUSAN PENDIDIKAN IPA, FAKULTAS MATEMATIKA DAN

ILMU PENGETAHUAN ALAM

Kampus Pusat UNY, Jln Colombo No 1, Yogyakarta 55281

PRAKTIKUM 6

ANALISIS BUTIR SOAL DENGAN MENGGUNAKAN ITEMAN 4.3

A. Tujuan

Mahasiswa mampu menganalisis butir soal dengan menggunakan aplikasi Iteman 4.3 untuk menentukan

kualitas butir soal

B. Iteman 4.3

ITEMAN (Item and Test Analysis) adalah perangkat lunak komputer (software) yang dibuat khusus untuk

menganalisa butir soal atau suatu tes yang dilakukan. ITEMAN merupakan analisis butir empirik dengan

model pendekatan klasik yang berguna untuk menentukan kualitas butir soal atau sebuah tes. Hasil dari

analisi butir soal meliputi tingkat kesukaran, daya beda, dan statistik penyebaran jawaban. Selain

menghasilkan statistik butir soal/tes, program ini juga menghasilkan statistik tes yang meliputi realibilitas

tes, kesalahan pengukuran atau standard error dan distribusi skor.

Beberapa istilah penting yang ada dihasil analisis dengan Iteman (Iteman 3) sebagai berikut.

a. Seq. No adalah nomor urut butir soal dalam file data.

b. Scala-item adalah nomor urut butir soal dalam skala (tes/subtes)

c. Prop. Correct adalah proporsi siswa( peserta tes) yang menjawab benar butir soal. Nilai ekstrim

(mendekati nol atau satu) menunjukan bahwa butir soal tersebut terlalu sukar atau terlalu mudah untuk

peserta tes. Indeks ini disebut juga indeks tigkat kesukaran soal secara klasikal.

d. Biser adalah indeks daya pembeda soal dengan menggunakan koefisien korelasi biserial. Nilai positif

menunjukan bahwa peserta tes yang menjawab benar butir soal, mempunyai skor yang relatif tinggi

dalam tes/skala tersebut. Sebaliknya nilai negatif menunjukan bahwa peserta tes yang menjawab

benar butir soal, memperoleh skor yang relatif rendah dalam tes/skala tersebut. Untuk statistik pilihan

jawaban (alternative) korelasi biserial negatif sangat tidak dikehendaki untuk kunci jawaban dan

sangat dikehendaki untuk pilihan jawaban yang lain (pengecoh).

e. Point-biser adalah juga indeks daya pembeda soal dan pilihan jawaban (alternatif) dengan

menggunakan koefisien korelasi point-biserial. Penafsirannya sama dengan statistik biserial.

f. Statistik pilihan jawaban (alternative) memberikan informasi yang sama dengan statistik butir soal.

Perbedaannya adalah bahwa statistik pilihan jawaban dihitung secara terpisah. Untuk setiap piihan

jawaban dan didasarkan pada dipilih tidaknya alternatif tersebut, bukan pada benarnya jawaban.

Tanda (*) yang muncul di sebelah kanan hasil analisis menunjukan kunci jawaban.

Istilah yang perlu dipahami untuk membaca hasil analisis sebagai berikut.

1. N of items adalah jumlah butir soal dalam tes.

2. N of examines adalah jumlah peserta tes yang digunakan dalam analisis.

3. Mean adalah skor rata-rata peserta tes.

4. Variance adalah varian dari distribusi skor peserta tes yang memberikan gambaran tentang sebaran

skor peserta tes.

5. Std. Dev adalah deviasi standar dari distribusi skor peserta tes.

6. Skew adalah kemiringan distribusi skor peserta tes yang memberikan gambaran tentang bentuk

distribusi skor peserta tes.

7. Kurtosis adalah puncak distribusi skor yang menggambarkan kelandaian distribusi skor dibanding

dengan distribusi normal.

8. Minimun adalah skor terendah peserta tes dalam tes/skala tersebut.

9. Maximum adalah skor tertinggi peserta tes dalam tes/skala tersebut.

10. Median adalah skor tengah dimana 50% skor berada pada atau lebih rendah dari skor tersebut.

11. Alpha adalah koefisien reliabilitas alpha untuk tes/skala tersebut yang merupakan indeks homogenitas

tes/skala. Koefisien alpha bergerak dari 0,0 sampai 1,0.

12. SEM adalah kesalahan pengukuran standar untuk setiap tes/skala. SEM merupakan estimit dari deviasi

standar kesalahan pengukuran dalam skor tes.

13. Mean P adalah rata-rata tingat kesukaran semua butir soal dalam tes secara klasikal dihitung dengan

cara mencari rata-rata proporsi peserta tes yang menjawab benar untuk semua butir soal dalam

tes/skala.

14. Mean item-Tot nilai rata-rata indeks daya pembeda dari semua soal dalam tes/skala yang diperoleh

dengan menghitung nilai rata-rata point biserial dari semua soal dalam tes/skala.

15. Mean-Biserial adalah juga nilai rata-rata indeks daya pembeda yang diperoleh dengan menghitung

nilai rata-rata korelasi biserial dari semua butir soal dalam tes/skala.

16. Scale intercorrelation adalah indeks korelasi antara skor-skor peserta tes yang diperoleh dari setiap

subtes/subskala.

C. Data Butir Soal

Analisislah butir soal pilihan ganda sebagaimana terlampir.

D. Prosedur Analisis dengan Iteman 4.3

1. Memasukan Butir Soal Pada Ms. Excel

Gambar 6.1 Entry Butir Soal

Silahkan Entry hasil jawaban soal pilihan ganda siswa, pada microsoft excel. Model entry dibuat seperti pada

tampilan gambar 6.1

a. Memasukan Hasil Butir Soal dari Ms. Excel menuju Notepad

Gambar 6.2 Cara Copy Butir Soal Pada Ms.Excel Langkah 1

Block area seperti pada gambar 6.2, kemudian klik kanan pada mouse, pilih menu “copy”

b. Buka aplikasi “notepad” di File Program anda, tampilan notepad seperti pada gambar 6.3 berikut,

Gambar 6.3 Aplikasi Notepad

c. Setelah aplikasi “Notepad” aktif. Klik cursor mouse pada area “Notepad”, selanjutnya klik kanan mouse dan

pilih menu “paste”. Sehingga entry data yang sudah di inputkan pada Ms.Excel muncul pada lembar kerja

“Notepad” . Tampilan “notepad” setelah di “paste” seperti pada gambar 6.4 berikut.

Gambar 6.4 Copy Paste dari Excel di Notepad

d. Mengatur “spasi” butir soal yang di entry di lembar kerja “Notepad” dilakukan dengan cara

melakukan “block” pada “spasi” butir soal seperti pada gambar 6.5.

Gambar 6.5 Memblock spasi pada Notepad

e. Selanjutnya arahkan cursor mouse pada area yang di “block”. Kemudian “klik” kanan mouse, dan pilih “copy”

Selanjutnya pada tool bar, terdapat menu “edit”, kemudian “klik” sehingga muncul pilihan menu “Replace”.

Pilihlah menu “Replace” tsb, sehingga muncul tampilan seperti pada gambar 6.6.

Gambar 6.6 Membuka menu replace

Pada menu “Replace” terdapat 2 kolom yang beridentitas “find what” dan ”Replace with” . selanjutnya,

letak kan cursor mouse pada kolom “find what”. Kemudian “klik” kanan mouse dan pilih menu “paste” atau

pakai “Ctrl+V”. tampilannya seperti pada gambar 6.7 berikut.

Gambar 6.7 Mengganti Ukuran Spasi Pada Notepad

f. Jika sudah di “paste”, selanjutnya pilih dan klik menu “Replace All”, sehingga spasi pada notepad akan

berubah menjadi lebih rapat seperti pada gambar 6.8. Untuk menghilangkan menu “Replace” pilihlah

menu “Cancel” atau tanda silang (X) Selanjutnya akan tampil seperti pada gambar 6.9.

Gambar 6.8 dan 6.9 Mengganti Ukuran Spasi dan Meluruskan Butir Soal

g. Selanjutnya meluruskan butir soal dalam satu kolom

Gambar 6.10 Meluruskan Butir Soal

h. Jika hasil entry sudah lurus dan rapi, maka simpan file anda dengan cara pilih dan klik menu “file” dan

pilih “Save As”. Beri nama lembar kerja notepad tsb (contoh: Butir Jawaban). Kemudian klik “Save”

dengan format “txt”.

2. Memasukan Kunci Jawaban Butir Soal dari Ms. Excel menuju Notepad

Formula identitas kunci jawaban software iteman 4.3

Item01 A 5 1 Y M

Keterangan:

Item01 = Nomor Butir Soal

A = Kunci Jawaban

5 = Alternatif opsi jawaban (A, B, C, D, E)

1 = Domain

Y = Ketentuan Perintah analisis masing-masing butir (Y= Yes; N=No)

M = Jenis analisis (M=multiple choice, R= Rating Scale, P= Partial Scale)

Gambar 6.11. Formula Kunci Jawaban di Excel

a. Pada gambar 6.11 merupakan tampilan formula kunci jawaban pada Ms.Excel. Kemudian “block”

formula jawaban tersebut seperti pada gambar 6.12, selanjutnya “klik” kanan mouse, pilih “copy” atau

“Ctrl+C”

Gambar 6.12. Formula Kunci Jawaban di Excel yang di Copy

b. Setelah formula kunci sukses di copy, maka silahkan buka sofware “notepad”, kemudian letakkan cursor

pada area/lembar kerja notepad. Selanjutnya Kemudian “klik” kanan mouse dan pilih menu “paste”

atau pakai “Ctrl+V”. Tampilan lembar kerja notepad akan seperti gambar 6.13

Gambar 6.13 Hasil entry Formula kunci jawaban pada notepad

c. Jika langkah memasukan formula kunci jawaban di software notepad telah selesai. Maka langkah

selanjutnya simpan file anda dengan cara pilih dan klik menu “file” dan pilih “Save As”. Beri nama lembar

kerja notepad tersebut (contoh: Kunci Jawaban), kemudian klik “Save” dengan format “txt”.

d. Periksa data yang telah disimpan dalam folder anda, jika penyimpanan sukses, terdapat 2 macam “file

Notepad” yaitu (file butir jawaban dan Kunci Jawaban). Tampilkan seperti pada gambar 6.14

Gambar 6.14 Penyimpanan File Notepad

3. Menganalisis menggunakan Software Iteman 4.3

a. Buka sofware Iteman 4.3

Gambar 6.15. Software Iteman 4.3

b. Lihat toolbar pada sisi atas tedapat pilihan menu toolbar (file ; input format; scoring options; output options). Pilih menu “input format”.

Sehingga Tampilannya seperti pada gambar 6.16

Gambar 6.16 Tampilan menu input format

c. Pada menu “input format” terdapat opsi “fixed width data” di bawahnya terdapat 3 buah kolom. Masing-

masing kolom beridentitas “Number of examinee ID columns ” , “Examinee Ids begin in column” dan “Item

response begin in column”. Ketiga kolom tersebut harus disesuaikan “nama subyek (nama siswa)”. misalnya

nama siswa terpanjang adalah “Gunawan”. Nama terpanjang tersebut menjadi patokan untuk input

“Number of examinee ID columns ” Nama ǀGǀuǀnǀaǀwǀaǀnǀ memiliki jumlah spasi sebanyak 8 (hitung tanda warna

merah), sehingga “Number of examinee ID columns ” diisi 8. Seperti pada gambar 6.17.

Gambar 6.17 Menghitung Spasi Nama Terpanjang

Selanjutnya kolom “Examinee Ids begin in column” merupakan jeda antara nama dengan jawaban siswa.

seperti pada gambar 6.18 berikut.

Gambar 6.18 Spasi Nama Terpanjang dengan Jawaban Sehingga kolom

Sehingga “Examinee Ids begin in column” diisi dengan 1

Gambar 6.19. Examinee Ids begin in column

Kemudian “Item response begin in column” merupakan spasi dimulainya input jawaban siswa, artinya “Item

response begin in column” merupakan jumlah dari “Number of examinee ID columns ”+ “Examinee Ids begin

in column”.

“Number of examinee ID columns ” + “Examinee Ids begin in column” = “Item response begin in column” atau (8+1= 9).

d. Pilih menu “File” pada software Iteman 4.3. seperti tampak pada gambar 6.20

Gambar 6.20. Menu File Pada Iteman 4.3

e. Klik icon pada “Data matrix file” pilih file notepad “butir Jawaban” yang telah dibuat dan disimpan

sebelumnya. Kemudian klik “Open” Lihat gambar 6.21.

Gambar 6.21. Memasukan Butir Jawaban pada Data Matrix File

Kemudian masukan kunci jawaban dengan memilih icon pada “Item control file”. Pilih kunci jawaban

yang telah dibuat dan disimpan. Kemudian klik “Open” lihat gambar 6.22.

Gambar 6.22. Memasukan Butir Jawaban pada Item control file

f. Langkah selanjutnya lihat menu “Output File”. Kemudian, beri nama identitas pada kolom “Output File”

sesuai dengan keinginan anda, nama output nantinya akan menjadi nama file. Lihat gambar 6.23.

Gambar 6.23 Pemberian Identitas Output File

g. Berikan identitas pada kolom “Run Title” (misalnya: Latihan analisis butir soal) Tampilanya seperti pada

gambar 6.24.

Gambar 6.24 Pemberian Identitas Run title

h. Jika semua data sukses terinput, maka siap dilakukan analisis. Dengan cara “Klik” icon “Run” Hasil yang

muncul pada folder, akan seperti pada gambar 6.25 berikut,

Gambar 6.25 Hasil Output Analisis Iteman 4.3

Berikut cara membaca atau menafsirkan hasil analisis butir soal dengan aplikasi Iteman 4.3.

a. Buka file hasil analisis Iteman format ms. word.

b. Terdapat hasil analisis secara keseluruhan dan setiap butir soal.

c. Analisis butir soal secara keseluruhan:

Summary statistics

Score Items Mean SD Min Score

Max Score

Mean P Mean Rpbis

Scored Items 25 14.281 2.965 7 23 0.571 0.097

Keterangan:

Item = jumlah butir soal

Mean = rata-rata skor yang diperoleh oleh peserta tes

SD = standard deviasi menunjukkan simpangan baku dari nilai rata-rata.

Min Score = skor terendah dari nilai peserta tes

Max Score= skor tertinggi yang diperoleh peserta tes

Mean P = rata-rata tingkat kesukaran butir soal.

Mean Rpbis= rata-rata daya pembeda butir soal.

Mean P menunjukkan tingkat kesukaran dari tes tersebut. Nilai 0.571 berarti secara keseluruhan soal

tergolong sedang. Mean Rpbis menunjukkan daya pembeda dari tes ini. Nilai 0.097 berarti secara

keseluruhan soal memiliki daya pembeda yang buruk.

Reliability

Score Alpha SEM Split-Half (Random)

Split-Half (First-Last)

Split-Half (Odd-Even)

S-B Random

S-B First-Last

S-B Odd-Even

Scored items 0.399 2.298 0.273 0.018 0.054 0.429 0.035 0.102

Keterangan:

Alpha = nilai koefisien reliabilitas butir soal secara keseluruhan menurut KR-20.

SEM = kesalahan pengukuran standar untuk setiap tes/skala.

Split-Half = nilai koefisien reliabilitas butir soal secara keseluruhan menurut Belah Tengah

(random, first-last, dan odd-even).

S-B = kesalahan pengukuran standar untuk setiap tes/skala (random, first-last, dan odd-

even).

Mengacu pada kriteria di atas, “Alpha (KR – 20)” menunjukkan reliabilitas dari tes ini. SEM adalah

kesalahan pengukuran standar untuk setiap tes/skala. Nilai 0,399 berarti secara

keseluruhan soal memiliki reliabilitas yang rendah

d. Analisis butir soal perbutir soal (misal butir nomor 1):

Item statistics

N P Total Rpbis Total Rbis Alpha w/o

32 0.969 -0.043 -0.106 0.404

P menunjukkan tingkat kesukaran dengan nilai 0.969 berarti soal tersebut sangat mudah. Rpbis

menunjukkan daya pembeda dengan menggunakan koefisien korelasi point-biserial. Nilai -0.043

berarti soal tersebut memiliki daya pembeda yang buruk. Rbis juga menunjukkan indeks daya

pembeda soal dengan menggunakan koefisien korelasi biserial Alpha w/o menunjukkan reliabilitas

dengan nilai 0.404 berarti soal tersebut memiliki reliabilitas sedang.

Option statistics

Option N Prop. Rpbis Rbis Mean SD Color

A 0 0.000 -- -- -- -- Maroon

B 1 0.031 0.043 0.106 14.000 0.000 Green

C 31 0.969 -0.043 -0.106 14.290 3.180 Blue **KEY**

D 0 0.000 -- -- -- -- Olive

E 0 0.000 -- -- -- -- Gray

Omit 0

Not Admin 0

Prop menunjukkan keberfungsian distraktor. Distraktor A, B, D, dan E dengan nilai < 5% berarti

distraktor tersebut tidak baik (ditolak) maka perlu diganti. Daya pembeda Rbis=(-0,106) dan Rpbis=(-

0,043) menunjukkan keduanya bernilai negatif. Hal ini dapat diartikan bahwa siswa yang kurang

pintar (memperoleh skor rendah) cenderung menjawab benar soal ini dan siswa yang pintar cenderung

menjawab salah soal ini.

Kesimpulan Butir Soal No. 1

Tingkat kesukaran soal ini adalah 0,969. Soal ini masuk kategori sangat mudah, yakni sekitar 97%

siswa dapat menjawab soal dengan benar, sehingga masuk kategori buruk. Dengan daya pembeda

Rpbis=(-0,043) dan Rbis=(-0,106) menunjukkan keduanya bernilai negatif. Hal ini dapat diartikan

bahwa siswa yang kurang pintar (memperoleh skor rendah) cenderung menjawab benar soal ini dan

siswa yang pintar cenderung menjawab salah soal ini. Karena alternatif jawaban C merupakan kunci,

maka tanda negatif ini menunjukkan bahwa kunci jawaban belum berfungsi sebagaimana mestinya.

Kesimpulannya butir soal ini perlu ditinjau lagi dan sekiranya akan digunakan maka perlu direvisi.

Oleh karena itu yang perlu dilakukan guna merevisis soal ini anthra lain dengan memeriksa kembali

kunci jawaban. Jika ternyata kunci jawaban salah maka lakukan kembali analisis soal. Jika ternyata

kunci jawaban sudah benar maka kemungkinan kesalahan terletak padakesalahan penguasaan konsep

oleh peserta didik.

E. Kesimpulan

Buatlah interpretasi dari hasil keluaran Iteman dan berikan kesimpulan untuk masing-masing butir terkait

dengan kualitasnya.

PANDUAN PRAKTIKUM TEORI RESPON BUTIR

Analisis Butir dengan Pendekatan Klasik dan Modern

Dosen Pengampu: Didik Setyawarno, M.Pd

SEPTEMBER-DESEMBER, 2018 JURUSAN PENDIDIKAN IPA, FAKULTAS MATEMATIKA DAN

ILMU PENGETAHUAN ALAM

Kampus Pusat UNY, Jln Colombo No 1, Yogyakarta 55281

PRAKTIKUM 7

ANALISIS BUTIR SOAL DENGAN MENGGUNAKAN ANBUSO (APLIKASI BERBASIS EXCEL)

A. Tujuan

Mahasiswa mampu menganalisis butir soal dengan menggunakan aplikasi ANBUSO untuk

menentukan kualitas butir soal

B. Anbuso

Aplikasi AnBuso (Analisis Butir Soal) merupakan program analisis butir soal yang dikembangkan

secara sederhana untuk membantu dalam membuat administrasi guru, khususnya yang terkait

dengan analisis butir soal. AnBuso dikembangkan dengan program Microsoft Excel sehingga

mempermudah guru dalam menggunakannya. Program ini dapat dibuka secara langsung dengan

menggunakan Microsoft Excel 2007 ke atas. Ada beberapa alasan mengapa perlu menggunakan

AnBuso, di antaranya adalah:

• Sederhana programnya

• Mudah menggunakannya

• Compatible

• Praktis penggunaannya

• Tersedia untuk tes objektif dan essay

• Ada pengelompokan remedial

• Hasil analisis dalam format laporan

• Hasil analisis grafik tersedia

• Tidak berbayar (Free of Charge)

AnBuso pertama kali dibuat pada tahun 2011 dan terus dikembangkan sesuai dengan tuntutan

dan kebutuhan guru dalam melakukan analisis butir soal. Pada AnBuso versi 8 ini yang dikeluarkan

pada tahun 2017, ada perubahan yang dilakukan yakni

1. Jumlah peserta tes yang pada versi sebelumnya hanya terbatas pada maksimal 50 ditambah

menjadi maksimal 200 orang. Dengan demikian aplikasi ini dapat dimanfaatkan tidak hanya

untuk analisis per kelas melainkan juga untuk gabungan dari beberapa kelas sekaligus.

2. Menambahkan informasi tentang daya serap siswa untuk masing-masing tes dan daya serap

keseluruhan.

AnBuso yang dikembangkan dengan Microsoft Excel terdiri atas beberapa menu yang pada

prinsipnya dikelompokkan ke dalam empat bagian, yaitu:

1. Input data, yang meliputi:

a. Identitas, yang berisi identitas umum dan identitas tes.

b. Jawaban, yang berisi jawaban siswa.

2. Data dan Nilai, yang meliputi:

a. Objektif: Data Jawaban Soal Objektif

b. Isian: Data Jawaban Soal Isian Singkat

c. Essay: Skor Jawaban Soal Essay

d. Nilai: Daftar Nilai Siswa

3. Hasil Analisis Soal, yang meliputi:

a. Objektif: Hasil Analisis Soal Pilihan Ganda

b. Sebaran: Sebaran Jawaban Soal Pilihan Ganda

c. Isian: Hasil Analisis Soal Isian Singkat

d. Essay: Hasil Analisis Soal Essay

4. Remedial, yang meliputi:

a. Materi: Materi Remedial Klasikal dan Individual

b. Kelompok: Jadwal Pengelompokan Peserta Remedial

5. Grafik, yang meliputi:

a. Soal: Distribusi Nilai dan Ketuntasan Belajar

b. Peserta: Proporsi Ketuntasan Belajar

Gambar 1. Tampilan AnBuso

Input Data

Pengisian data dalam AnBuso dapat dilakukan pada Menu Input Data. Menu input data terdiri atas

Identitas dan Jawaban. Berikut penjelasannya.

Data yang perlu dimasukkan dalam menu Identitas meliputi:

Identitas Umum

1. Satuan Pendidikan

2. Mata Pelajaran

3. Kelas/Program

4. Nama Tes

5. Pokok Bahasan/Sub

6. Nama Guru

7. NIP

8. Semester

9. Tahun Pelajaran

10. Tanggal Tes.

Isikan tanggal pelaksanaan tes, misalnya 10 Agustus 2014

11. Tanggal Diperiksa

Isikan tanggal pemeriksaan tes (boleh dikosongkan), misalnya 15 Agustus 2014

12. Nama Kepala Sekolah

13. NIP Kepala Sekolah

14. Tempat Laporan.

Isikan kota lokasi sekolah, misalnya Yogyakarta

15. Tanggal Laporan

Menu Identitas

Isikan tanggal dibuatnya laporan tersebut, misalnya 20 Agustus 2014

16. Skala Penilaian (4, 10 atau 100).

Isikan 4 jika penilaian yang digunakan berkisar antara 0-4

Isikan 10 jika penilaian yang digunakan berkisar antara 0-10

Isikan 100 jika penilaian yang digunakan berkisar antara 0-100

17. Nilai KKM.

Pengisian nilai KKM harus menyesuaikan dengan skala penilaian yang diisikan.

Gambar 2. Tampilan Menu Input Identitas

Jumlah dan Bobot Soal

• Jumlah soal pilihan ganda (Max 50)

Isikan jumlah soal pilihan ganda yang akan dianalisis. Jumlah maksimal soal yang disediakan adalah

50 soal. Jika soal yang dianalisis tidak terdapat soal pilihan ganda maka kolom ini tidak perlu diisi.

• Jumlah soal isian singkat (Max 20).

Isikan jumlah soal isian singkat yang akan dianalisis. Jumlah maksimal soal yang disediakan adalah

20 soal. Jika soal yang dianalisis tidak terdapat soal isian singkat maka kolom ini tidak perlu diisi.

• Jumlah soal essay (Max 10).

Isikan jumlah soal essay yang akan dianalisis. Jumlah maksimal soal yang disediakan adalah 10 soal.

Jika soal yang dianalisis tidak terdapat soal essay maka kolom ini tidak perlu diisi.

• Bobot soal pilihan ganda

Isikan bobot soal pilihan ganda yang akan diberikan pada analisis ini, misalnya 50%. Jika soal yang

dianalisis tidak terdapat soal pilihan ganda maka kolom ini tidak perlu diisi.

• Bobot soal isian singkat

Isikan bobot soal isian singkat yang akan diberikan pada analisis ini, misalnya 20%. Jika soal yang

dianalisis tidak terdapat soal essay maka kolom ini tidak perlu diisi.

• Bobot soal essay

Isikan bobot soal essay yang akan diberikan pada analisis ini, misalnya 30%. Jika soal yang dianalisis

tidak terdapat soal essay maka kolom ini tidak perlu diisi.

Keterangan:

Jumlah ketiga bobot tersebut harus 100%

Data Soal Pilihan Ganda dan Isian Singkat

• Jumlah Alternatif Jawaban:

– Isikan 4 jika alternatif jawabannya A, B, C, dan D

– Isikan 5 jika alternatif jawabannya A, B, C, D, dan E

– Dan sebagainya

• Skor Benar tiap Butir Soal

Isikan skor yang diperoleh peserta tes jika ia menjawab dengan benar pada setiap butir soal

tersebut

• Skor Salah tiap butir soal

Isikan skor yang diperoleh peserta tes jika ia menjawab salah pada setiap butir soal tersebut

• Kunci Jawaban

– Isikan kunci jawaban soal secara berurutan mulai nomor satu sampai yang terakhir dengan

format menggunakan huruf besar tanpa spasi. Misalnya DDADDCADBDDDBCBABDDD

– Jumlah soal maksimal 50 sehingga dalam penulisan kunci jawaban maksimal 50 karakter

• Kemampuan yang diukur untuk soal pilihan ganda dan isian singkat

– Isikan kompetensi yang diukur untuk masing-masing butir soal. Isian ini diperlukan untuk

menganalisis kompetensi mana yang belum dikuasai peserta tes guna merancang program

remedial baik klasikal maupun individual

Data Soal Essay

• Skor Maksimal Soal

Isikan skor maksimal yang dapat diperoleh peserta tes pada setiap butir soalnya. Skor tersebut bisa

berbeda-beda untuk setiap soalnya.

• Kemampuan yang diukur

Isikan kemampuan yang diukur untuk masing-masing butir soal essay.

Gambar 3. Tampilan Menu Input Jawaban

Data yang perlu dimasukkan dalam menu Jawaban meliputi:

1. Nama Peserta Tes

2. Jenis Kelamin (L = Laki-laki, P = Perempuan)

3. Jawaban Soal Pilihan Ganda

• Isikan jawaban peserta tes secara berurutan mulai nomor satu sampai yang terakhir

dengan format menggunakan huruf besar.

• Untuk jawaban kosong atau butir pertanyaan yang tidak bisa dijawab peserta tes dapat

diisikan spasi atau karakter lain selain alternatif jawaban misalnya 0.

4. Skor Jawaban Isian Singkat

• Isikan 1 jika peserta tes mampu menjawab dengan benar dan 0 jika jawabannya salah

untuk masing-masing butir soal isian singkat.

5. Skor Jawaban Essay

• Isikan skor yang diperoleh peserta tes untuk masing-masing butir soal.

Laporan Peserta

Jika semua data yang ada dalam menu Input Data sudah terisi maka output lainnya akan secara

otomatis terisi. Menu Laporan Peserta akan menghasilkan hal berikut ini.

Menu Laporan Objektif berisi Data Jawaban Soal Objektif yang siap dicetak. Data yang diberi

background warna merah menunjukkan jawaban siswa yang salah.

Menu Input Jawaban

Gambar 4. Tampilan Menu Laporan Objektif

Menu Laporan Isian berisi Data Jawaban Soal Isian Singkat yang siap dicetak. Data yang diberi

background warna merah menunjukkan jawaban siswa yang salah.

Gambar 5. Tampilan Menu Laporan Isian

Menu Laporan Isian

Menu Laporan Objektif

Menu Laporan Essay, yang berisi Skor Jawaban Soal Essay (Gambar 6) yang siap dicetak.

Gambar 6. Tampilan Menu Laporan Essay

Menu Laporan Nilai, berupa Daftar Nilai Siswa yang berisi tentang:

– Daftar peserta dan jenis kelaminnya

– Jumlah butir soal yang dijawab benar dan salah

– Skor dan nilai tes objektif dengan bobotnya

– Nilai tes essay dan bobotnya

– Nilai Akhir,

– Predikat. Penentuan predikat disesuaikan dengan nilai KKM yang ditentukan sekolah (Sesuai

dengan Permendikbud Nomor 53 Tahun 2015), sehingga rentangnya bisa berbeda-beda

tergantung nilai KKM. Contoh penentuan predikat dapat dilihat pada Tabel 1.

– Keterangan (Tuntas dan Tidak tuntas)

Tabel 1. Contoh Penentuan Predikat Penilaian

No

Rentang (Jika KKM = 60)

Predikat

1. 86,7 – 100,0 A

2. 73,4 – 86,6 B

3. 60,0 – 73,3 C

4. < 60,0 D

Menu Laporan Essay

Menu Laporan Nilai

Gambar 7. Tampilan Menu Laporan Nilai

– Keterangan lain yang terdiri dari jumlah peserta tes, Jumlah (persentase) peserta yang lulus

dan tidak lulus, serta nilai terendah, nilai tertinggi, nilai rata-rata dan standar deviasi

Hasil Analisis Soal

Menu ini menampilkan hasil analisis untuk kualitas soal objektif, sebaran jawaban peserta tes

dan kualitas soal essay.

Menu Hasil Soal Objektif, berupa Hasil Analisis Butir Soal Pilihan Ganda yang berisi tentang:

– Daya Beda butir soal

Kriteria Daya Beda Butir Soal yang baik adalah jika koefisien daya beda melebihi 0,3 (Nunnally &

Bernstein, 2009: 304; Kaplan & Saccuzzo, 2005: 176; Azwar, 2003: 153). Sementara itu koefisien

antara 0,20 – 0,29 dianggap cukup baik (Alagumalai & Curtis, 2005: 8) dan koefisien di bawah 0,2

dianggap tidak baik sehingga perlu dibuang (Ebel & Frisbie, 1991: 232; Crocker & Algina, 2006:

Menu Hasil Soal Objektif

315). Oleh karena itu kriteria daya beda yang digunakan seperti tertuang dalam Tabel 2.

Tabel 2. Kriteria Daya Beda Soal

Kategori Kriteria

Baik > 0,3

Cukup Baik 0,2 – 0,3

Tidak Baik < 0,2

– Tingkat Kesukaran

Kriteria tingkat kesukaran yang baik adalah berkisar antara 0,3 – 0,7 (Allen & Yen, 1979: 121;

Kaplan & Saccuzzo, 2005: 170; Sudjana, 2011: 137). Oleh karena itu dalam software ini digunakan

kriteria seperti pada Tabel 3.

Tabel 3. Kriteria Tingkat Kesulitan Soal

Kategori Kriteria

Mudah > 0,7

Sedang/baik 0,3 – 0,7

Sulit < 0,3

– Alternatif Jawaban tidak Efektif

Kriteria pengecoh alternatif butir soal yang baik adalah jika alternatif tersebut dijawab oleh

minimal 5% peserta tes, sehingga alternatif itu dianggap efektif.

– Kesimpulan Akhir

Kriteria yang digunakan adalah:

Baik jika daya bedanya baik/cukup baik, tingkat kesukarannya sedang dan semua

alternatif jawaban efektif

Revisi alternatif jawaban jika daya beda baik/cukup baik dan tingkat kesukarannya

sedang tetapi alternatif jawabannya ada yang tidak efektif

Cukup Baik jika daya beda baik/cukup baik tetapi tingkat kesukarannya mudah/sulit,

Tidak Baik jika daya beda tidak baik

Gambar 8. Tampilan Menu Hasil Soal Objektif

Menu Hasil Sebaran, berupa Sebaran Jawaban Soal Pilihan Ganda

• Menu ini berisi tentang Sebaran Jawaban Soal Pilihan Ganda yang berupa persentase peserta

tes yang menjawab alternatif jawaban yang tersedia.

Gambar 9. Tampilan Menu Hasil Sebaran

Menu Hasil Sebaran

Menu Hasil Isian berupa Hasil Analisis Soal Isin Singkat yang berisi:

– Daya Beda butir soal

Kriteria sama dengan soal objektif

– Tingkat Kesukaran

Kriteria sama dengan soal objektif

– Kesimpulan Akhir:

Baik jika daya beda baik/cukup baik dan tingkat kesukaran sedang

Cukup Baik jika salah satu di antara daya beda dan tingkat kesukaran tidak memenuhi

syarat

Tidak baik jika daya beda dan tingkat kesukaran tidak memenuhi persyaratan

Gambar 10. Tampilan Menu Hasil Essay

Menu Hasil Essay berupa Hasil Analisis Soal Essay yang berisi:

– Daya Beda butir soal

Kriteria sama dengan soal objektif

– Tingkat Kesukaran

Kriteria sama dengan soal objektif

– Kesimpulan Akhir:

Kriteria sama dengan soal isian singkat

Menu Hasil Isian

Menu Hasil Essay

Gambar 11. Tampilan Menu Hasil Essay

Remedial

Menu ini menampilkan hasil analisis peserta tes yang belum tuntas. Materi apa saja yang perlu

diremidi dan pengelompokan remedial.

Menu Materi Remedial berupa Laporan Materi Remedial Individual dan Klasikal yang

menggambarkan materi apa saja yang perlu diremidi untuk setiap peserta didik. Menu ini berisi

tentang:

– Kompetensi dasar/materi yang tidak dikuasai secara individual. Remedial individual diberikan

jika peserta hanya mampu menjawab maksimal 55%.

– Kompetensi dasar/materi yang tidak dikuasai secara klasikal. KD dianggap tidak dikuasai

secara klasikal jika peserta tes yang mampu menjawab dengan benar kurang dari 15%.

Menu Materi Remedial

Gambar 12. Tampilan Menu Materi Remedial

Menu Kelompok Remedial berupa Laporan Pengelompokan Peserta Remedial menurut kemampuan yang

diukur/materi. Dalam laporan tersebut terlihat daftar peserta yang belum menguasai untuk kemampuan

yang diukur tertentu.

Gambar 13. Tampilan Menu Kelompok Remedial

Menu Kelompok Remedial

Grafik

Menu ini berisi tentang grafik yang menggambarkan tentang kualitas soal tes dan kondisi peserta tes.

Menu Grafik Soal ini berisi kualitas soal objektif dan essay dilihat dari daya beda, tingkat kesulitan dan kualitas

soal. Grafik ditampilkan dalam bentuk diagram lingkaran yang menggambarkan proporsi soal yang baik,

cukup baik dan tidak baik.

Gambar 14. Tampilan Menu Grafik Soal

Menu Grafik Peserta ini berisi distribusi nilai menurut predikat dan ketuntasan belajar. Grafik ditampilkan

dalam bentuk diagram lingkaran, diagram batang dan diagram garis.

Gambar 15. Tampilan Menu Grafik Peserta

C. Data Butir Soal

Analisislah butir soal pilihan ganda sebagaimana terlampir.

D. Prosedur Analisis dengan Anbuso

Ikutilah panduan berdasarkan uraian diatas.

Menu Grafik Soal

Menu Grafik Peserta

E. Kesimpulan

Buatlah interpretasi dari hasil keluaran Iteman dan berikan kesimpulan untuk masing-masing butir terkait

dengan kualitasnya.