Post on 23-Jul-2015
DAYA PEMBEDA DAN INDEKS KESUKARAN
Daya Pembeda
Daya pembeda sebuah butir soal (DP) adalah kemampuan butir soal tersebut untuk
membedakan antara testi (siswa) yang pandai atau berkemampuan tinggi dengan siswa yang
bodoh. Hal ini dikemukakan berdasarkan asumsi Galton bahwa suatu perangkat alat tes yang
baik harus bisa membedakan siswa yang pandai, rata – rata dan yang bodoh, karena dalam
suatu kelas biasanya terdiri dari tiga kelompok tersebut.
Derajat daya pembeda suatu butir soal dinyatakan dengan Indeks Diskriminasi
(Discriminating Index) yang bernilai dari -1,00 sampai 1,00.
Jika Indeks Diskriminasi makin mendekati 1,00 berarti daya pembeda soal semakin
baik, sebaliknya jika semakin mendekati 0,00 maka daya pembeda soal tersebut
semakin buruk.
Jika Indeks Diskriminasi bernilai negative berarti kelompok siswa yang bodoh banyak
yang menjawab benar dan sebaliknya siswa yang pintar banyak menjawab salah pada
butir soal tersebut.
Jika Indeks Diskriminasi bernilai 0,00 berarti butir soal tersebut tidak memiliki daya
pembeda. Hal ini terjadi jika antara kelompok bodoh maupun pandai menjawab butir
soal tersebut benar semua atau sebaliknya.
Jika Indeks Diskriminasi bernilai 1,00 berarti daya pembedanya sangat baik, hal ini
terjadi jika semua kelompok pandai menjawab benar dan semua kelompok bodoh
menjawab salah.
Cara Menentukan Daya Pembeda
Dalam menentukan Daya Pembeda terdapat rumus yang dapat digunakan yaitu:
DP = JB A−JB BJS A
atau
DP = JB A−JB BJS B
Keterangan :
JBA = Jumlah siswa kelompok atas yang menjawab soal tersebut dengan benar.
JBB = Jumlah siswa kelompok bawah yang menjawab soal tersebut dengan benar.
JSA = Jumlah siswa kelompok atas.
JSB = Jumlah siswa kelompok rendah.
Kelompok atas adalah kelompok siswa pandai dengan skor tinggi dalam menempuh
evaluasi. Sedangkan kelompok rendah adalah kelompok siswa yang bodoh dengan skor
rendah (kecil).
Klasifikasi interpretasi untuk daya pembeda yang banyak digunakan adalah :
DP 0,00 sangat jelek
0,00 < DP 0,20 jelek
0,20 < DP 0,40 cukup
0,40 < DP 0,70 baik
0,70 < DP 1,00 sangat baik
Akan ditinjau beberapa kasus dari rumus tersebut, yaitu.
1. Jika DP = 1,00, akan diperoleh persamaan
100 = JB A−JB BJS A
Sehingga JSA = JSB = JBA - JBB
Kondisi di atas hanya dapat dipenuhi jika JBB= 0 sehingga JSA = JBA. ini berarti semua
siswa atas (pandai) menjawab benar dan semua kelompok bawah ( bodoh ) menjawab
salah. Dengan demikian soal yang mempunyai DP = 1,00 dapat dengan sangat baik dalam
membedakan kemampuan siswa pandai dan bodoh.
2. Jika DP > 0,00 maka pembilang pada rumus di muka, yaitu JBA - JBB akan bernilai positif
atau JBA - JBB > 0,00.
Karena JSA selalu positif atau JSA > 0,00 maka JBA > JBB atau jumlah siswa kelompok
pandai yang menjawab benar lebih banyak daripada jumlah siswa kelompok bawah.
Jika nilai JB A−JB BJS A
Makin menjauhi 0 dan mendekati 1,00 berarti selisih antara
JBA dan JBB akan lebih besar lagi, atau kelompok atas makin banyak yang menjawab
benar dan kelompok bawah makin banyak menjawab salah.
Sebaliknya jika nilai JB A−JB BJS A
mendekati 0, berarti siswa kelompok atas dan
kelompok bawah yang menjawab benar mendekati jumlah yang sama. Kondisi ini
mencerminkan soal itu belum bisa membedakan antara siswa yang pandai dengan siswa
yang bodoh.
3. Jika DP = 0,00 maka
JB A−JB BJS A
= 0,00
Karena JSA ≠ 0 maka JBA – JBB = 0,00 atau JBA = JBB.
Ini berarti jumlah siswa kelompok atas yang menjawab benar sama dengan jumlah siswa
kelompok bawah yang menjawab benar. Kondisi ini menyatakan bahwa soal tersebut
tidak bisa membedakan siswa pandai dan siswa bodoh.
4. Jika DP < 0,00 maka
JB A−JB BJS A
< 0,00
Ini berarti bahwa JBA – JBB < 0,00 atau JBA < JBB
Kondisi ini menyatakan siswa kelompok atas yang menjawab benar lebih sedikit dari
jumlah siswa kelompok bawah yang menjawab benar. Dengan kata lain siswa pandai
mendapat skor kecil sedangkan siswa bodoh mendapat skor besar. Soal tersebut
membedakan siswa secara keliru.
Proses perhitungan daya pembeda dibedakan antara untuk kelompok ( subjek ) kecil
dengan untuk kelompok besar. Biasanya kelompok subjek disebut kecil adalah untuk n ≤ 30,
untuk kelompok subjek dengan n > 30 disebut kelompok besar. Pembedaan ini rasionalnya
adalah untuk data yang sedikit, sebaiknya digunakan secara keseluruhan agar data tersebut
bersifat representatif. Sedangkan untuk data yang cukup banyak, cukup diambil sampelnya.
Sampel tersebut harus representatif, artinya mewakili setiap karakteristik populasi.
Berdasarkan beberapa pakar evaluasi, sampel diambil sebesar 27% untuk kelompok atas dan
27% untuk kelompok bawah. Sehingga jumlah seluruh sampel menjadi 54% dari populasi.
Proses penentuan kelompok atas dan kelompok bawah dengan cara mengurutkan skor setiap
testi dari skor tertinggi hingga skor terendah.
Agar lebih jelas terdapat beberapa contoh yaitu:
1. Untuk kelompok kecil
Tes yang diikuti oleh 10 subyek dengan jumlah butir soal sebanyak 15.
Tabel 1
Kelompok Atas dan Kelompok Bawah
Untuk hasil Tes Matematika
Kel. Atas Nomor Soal
Subjek
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
Total
A 1 1 1 0 1 1 1 1 0 1 1 1 0 1 1
B 1 1 0 1 0 1 1 0 1 0 0 1 1 1 0
C 1 1 1 0 0 0 1 1 1 1 1 0 1 1 0
D 1 1 0 0 1 1 0 1 1 0 1 0 1 1 0
E 0 1 0 1 0 1 1 0 1 1 0 0 0 1 1
12
10
10
9
8
Kel. Bawah F 1 1 0 0 0 1 0 1 0 0 0 0 1 1 0
G 1 1 0 0 0 0 1 0 1 0 0 0 1 0 0
H 1 1 0 0 0 1 0 0 0 0 0 0 0 1 1
I 0 1 1 0 0 0 0 0 0 0 1 0 0 0 1
J 0 1 0 1 0 0 0 0 0 0 0 1 0 0 1
7
5
5
4
4
JBA 4 5 2 2 2 4 4 3 4 3 3 2 3 5 2
JBB 3 5 1 1 0 2 1 1 1 0 1 1 2 2 3
Dari tabel diatas skor setiap siswa telah diurutkan dari skor tertinggi ke skor terendah.
Karena banyaknya 10 subyek maka data tersebut termasuk kelompok kecil dengan
menentukan kelompok atas dan kelompok bawah masing – masing 50%, yaitu 5
subyek kelompok atas dan 5 subyek kelompok bawah (JSA=JSB=5).
Dari data tersebut diambil beberapa butir soal sebagai contoh menghitung DP.
Misalkan butir soal nomor 2:
a. DPNo.2 = 5−5
5 = 0,00 ( sangat jelek)
Pada butir soal nomor 2 ini seluruh siswa baik kelompok atas maupun
kelompok bawah dapat menjawab soal dengan benar, sehingga soal tersebut
tidak dapat membedakan siswa sesuai dengan kemampuannya.
b. DPNo.14 = 5−2
5 = 0,60 ( baik )
Pada butir soal nomor 6 ini siswa kelompok atas lebih banyak menjawab benar
dibandingkan kelompok bawah, sehingga butir soal ini dapat membedakan
siswa yang pandai dan siswa yang bodoh dengan baik.
c. DPNo.15 = 2−3
5 = - 0,20 ( sangat jelek)
Pada butir soal nomor 15 ini menunjukkan jumlah siswa kelompok bawah
lebih banyak menjawab benar dibandingkan siswa kelompok atas, ini
menimbulkan kebalikan dan menimbulkan kesimpulan yang keliru. Sehingga
pembedanya bernilai negatif.
2. Untuk kelompok besar.
Misalkan diberikan soal sebanyak 25 butir soal pada 32 siswa (testi). Karena jumlah
siswa lebih dari 30 siswa maka kelompok ini termasuk kelompok besar. Karena itu
perhitungan daya pembeda yang diperlukan 27% yaitu 8 subyek kelompok atas dan 8
subyek kelompok bawah.
Dengan data dibawah ini dapat dihitung daya pembeda butir soal:
Tabel 2
Data Skor Terurut Hasil Tes matematika
High Group
A5 1 1 1 1 0 1 0 1 1 1 1 0 0 1 1 1 0 1 1 0 0 1 1 1 1 18
A3 1 0 1 1 1 1 0 0 0 1 1 1 1 0 0 1 1 1 0 0 1 1 1 1 1 17
A2 1 1 1 1 0 0 0 1 1 1 1 0 0 1 0 1 1 1 0 1 1 1 0 1 1 17
A7 1 0 0 0 0 1 1 1 0 1 0 1 0 0 1 0 1 1 1 1 1 1 1 1 1 16
A4 1 1 1 0 1 1 1 1 0 0 0 1 1 1 0 1 1 0 1 1 1 0 0 0 1 16
A10 1 1 0 0 0 1 1 1 1 1 1 1 0 0 0 0 1 1 1 1 0 1 1 0 0 15
A11 1 0 0 1 1 0 0 0 1 1 0 0 1 1 1 1 0 0 0 1 1 1 1 1 1 15
A25 0 1 0 0 0 1 1 1 1 1 1 1 0 0 0 0 1 1 1 1 0 1 0 0 0 15
Middle Group
A9 1 1 1 0 0 1 0 0 0 0 1 1 1 0 0 0 1 1 1 0 0 0 1 0 1 12
A6 1 0 0 1 1 0 0 1 1 1 1 1 0 1 1 1 0 0 0 0 1 0 0 0 0 12
A1 1 1 0 1 0 0 0 0 1 0 0 1 0 0 1 0 0 1 0 1 0 0 1 1 1 11
A12 0 0 1 0 1 0 0 0 1 1 1 0 0 0 0 1 1 0 1 1 0 0 0 0 1 11
A17 0 1 1 0 0 0 1 1 1 0 0 0 0 1 1 0 0 0 0 1 1 1 1 0 0 11
A14 1 0 0 0 1 1 1 0 0 0 1 1 1 1 0 0 0 0 0 0 1 1 0 0 0 10
A15 0 1 0 1 0 0 0 0 0 1 1 1 0 0 0 1 1 1 0 0 0 0 0 1 1 10
A13 1 1 1 0 0 0 0 1 0 0 0 1 1 0 1 0 0 0 1 1 1 0 0 0 0 10
A16 0 0 0 0 1 1 0 0 0 1 1 1 0 0 1 1 1 1 0 0 1 0 0 0 1 10
A18 0 1 0 0 0 1 0 1 0 0 1 0 0 1 0 0 0 0 1 0 1 0 1 0 1 9
A19 1 0 0 1 1 0 1 0 1 0 0 0 1 0 0 0 1 0 0 1 0 0 0 1 0 9
A27 1 1 0 0 0 1 0 0 0 1 0 1 0 0 1 0 0 0 1 0 0 1 1 0 0 9
A24 0 0 0 1 0 0 1 0 0 0 1 0 0 1 0 1 0 1 0 0 0 1 0 1 1 9
A22 1 0 1 0 1 0 0 0 1 0 0 1 0 0 0 0 1 0 0 0 1 0 1 0 0 8
A23 1 1 1 0 0 0 0 0 1 0 0 0 0 0 1 0 0 1 0 1 0 0 0 1 0 8
A20 1 0 0 0 1 1 0 0 0 1 0 0 1 0 0 0 1 0 1 0 0 1 0 0 0 8
Low Group
A8 1 1 0 1 0 0 0 0 0 1 0 0 0 1 0 0 1 0 0 0 0 0 1 0 0 7
A26 1 0 1 1 0 0 0 1 0 0 0 0 0 0 1 0 0 0 0 1 0 0 0 0 1 7
A21 1 0 1 1 0 0 1 0 0 0 0 0 0 0 1 0 0 0 0 0 0 1 0 1 0 7
A28 1 1 0 1 0 0 0 1 0 0 1 1 0 0 0 0 0 0 0 0 0 0 0 0 0 6
A29 1 0 1 1 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 1 0 0 0 1 6
A31 1 0 1 1 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 5
A32 1 0 0 0 1 1 0 0 0 0 0 0 0 1 0 0 0 0 1 0 0 0 0 0 0 5
A30 1 0 0 1 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 1 0 0 0 0 4
Pada kelompok besar ini dalam menghitung DP sama seperti pada kelompok kecil.
Yang membedakan kedua kelompok ini adalah jumlah testi.
Sebagai contoh dalam menentukan DP dari kelompok besar di atas, adalah sebagai
berikut.
a. DPNo.2 = 5−2
8 = 0,375 (cukup)
b. DPNo.4 = 4−7
8 = -0,375 (sangat jelek)
c. DPNo.25 = 6−2
8 = 0,50 (baik)
Perhitungan DP dengan menggunakan kelompok atas dan kelompok bawah sebagai
sampel, mempunyai kelemahan karena tidak melibatkan kelompok tengah (middle group)
sebanyak 46%. Untuk mengatasi hal ini, beberapa pakar evaluasi mengemukakan cara lain
yaitu dengan menggunakan teknik korelasi biserial titik (point biserial correlation). Rumus
yang digunakan untuk menghitung DP butir soal tes pilihan ganda dengan teknik tersebut
adalah :
rpbis = (x p−x t )s t √ pq
s t=√∑ ( X t−x t )q
CIK NGAE!!!!!
Keterangan: 2
xp = rata-rata skor testi yang menjawab benar pada butir soal yang bersangkutan.
x t = rata-rata skor total untuk semua testi.
st = simpangan baku skor total setiap testi.
p = proposisi testi yang dapat menjawab benar butir soal yang bersangkutan.
q = 1- p.
Dengan menggunakan data pada tabel 2, akan dicari daya pembeda dari beberapa butir soal,
yaitu:
rpbis No.1 = (x p−x t )s t √ pq
Untuk menguji signifikansi daya pembeda tersebut di atas dapat juga menggunakan
tabel r dengan menggunakan derajat kebebasan dk = n-2. Bilangan n menyatakan banyak testi
yang menjawab benar pada butir soal yang bersangkutan.
Pada contoh di atas, untuk daya pembeda butir soal nomor 1, n sama dengan 14
sehingga dk = 14 – 2 = 12. Dengan melihat tabel r pada daftar koefisien korelasi diperoleh
harga 0,532 (untuk taraf sifnifikasi 5%) dan 0,661 (untuk taraf signifikansi 1%). Karena nilai
rpbis No.1 =
Maka tidak signifikan. Ini berarti butir soal nomor 1 tidak bagus alias jelek.
Untuk daya pembeda butir soal nomor 30, harga n sama dengan 9 sehingga dk = 9-2 =
7. Dengan melihat tabel r tadi diperoleh harga 0,666 (untuk taraf signifikansi 0,05) dan 0,798
(untuk taraf signifikansi 0,01). Karena nilai
maka tidak signifikan. Ini berarti butir soal nomor 30 termasuk kategori tidak bagus.
Jika dikaitan dengan penggunaan kelompok atas dan kelompok bawah dalam mencari
daya pembeda, nampaknya memberikan hasil yang berlainan. Daya pembeda yang dicari
dengan cara koefisien korelasi biserial titik mempunyai makna seberapa jauh suatu butir soal
tersebut memuat factor yang setara dengan faktor yang termuat dalam butir-butir soal secara
keseluruhan, sehingga kemampuan ukur butir tersebut dapat setara dengan kemampuan ukur
seluruh butir tes. Makin tinggi daya pembeda suatu butir soal dan signifikan, makin besar
kesetaraan faktor yang termuat dalam butir soal ini dengan faktor yang termuat dalam tes
secara keseluruhan.
Seperti telah dikemukakan bahwa daya pembeda suatu butir soal adalah kemampuan
butir soal tersebut untuk dapat membedakan antara siswa yang pandai dan siswa yang bodoh
atau siswa yang berkemampuan tinggi dan siswa yang berkemampuan rendah. Dari rumus
untuk mencari daya pembeda, dapat kita simpulkan bahwa nilai DP berada pada kontinum
1,00 (paling tinggi) dan -1,00 (paling rendah). Nilai DP = 1,00 dicapai bila siswa kelompok
pandai semua dapat menjawab benar, sebaliknya siswa kelompok bodoh semua jawabannya
salah. Nilai DP = 0,00 diperoleh bila banyak siswa kelompok pandai dengan siswa kelompok
bodoh yang menjawab soal dengan benar sama jumlahnya dan soal tersebut tidak bisa
membedakan siswa yang pandai dan siswa yang bodoh. Nilai DP = -1,00 dicapai bila siswa
kelompok bodoh semuanya menjawab benar, sedangkan siswa kelompok pandai semuanya
menjawab salah. Kondisi ini menggambarkan sesuatu yang terbalik.
KOEFISIEN KORELASI YANG SIGNIFIKAN
DENGAN TARAF KEPERCAYAAN
5% (atas) DAN 1% (bawah)
Degrres
of
Freedem
Number of Variables
2 3 4 5 6 7 8
1
2
3
4
5
6
.997
1.000
.950
.990
.878
.959
.881
.917
.754
.874
.707
.834
.999
1.000
.975
.995
.930
.976
.881
.949
.836
.917
.795
.886
.999
1.000
.983
.997
.950
.983
.912
.962
.874
.937
.839
.911
1.000
1.000
.087
.998
.961
.987
.930
.970
.898
.949
.867
.927
1.000
1.000
.990
.998
.968
.990
.942
.975
.914
.957
.886
.938
1.000
1.000
.992
.998
.933
.991
.950
.979
.925
.963
.900
.946
1.000
1.000
.994
.999
.979
.993
.961
.984
.941
.971
.920
.957
7
8
9
10
11
12
13
14
15
16
17
.666
.798
.632
.765
.602
.735
.576
.708
.553
.684
.532
.661
.514
.641
.497
.623
.482
.606
.468
.590
.456
.575
.758
.855
.726
.827
.697
.800
.671
.776
.648
.753
.627
.732
.608
.712
.590
.694
.574
.677
.559
.662
.545
.648
.807
.885
.777
.860
.750
.836
.726
.824
.703
.793
.683
.773
.664
.755
.646
.737
.630
.721
.615
.706
.601
.691
.838
.904
.811
.882
.786
.861
.763
.840
.741
.821
.722
.802
.703
.785
.686
.768
.670
.752
.665
.738
.641
.724
.860
.918
.835
.898
.812
.878
.790
.859
.770
.841
.751
.824
.733
.807
.717
.792
.701
.776
.686
.762
.673
.749
.876
.928
.854
.909
.832
.891
.812
.874
.792
.857
.774
.841
.757
.825
.741
.810
.726
.796
.712
.782
.698
.769
.900
.942
.880
.926
.861
.911
.843
895
.826
.880
.809
.866
.794
.852
.779
.838
.765
.825
.751
.813
.738
.800
18
19
20
21
22
23
24
25
26
27
28
.444
.561
.433
.549
.423
.537
.413
.526
.404
.396
.505
.388
.496
.381
.487
.374
.478
.367
.470
.361
.463
.532
.633
.520
.620
.509
.608
.498
.596
.488
.585
.479
.574
.470
.565
.462
.555
.454
.546
.446
.538
.189
.530
.587
.678
.575
.665
.563
.652
.552
.641
.542
.630
.532
.619
.523
.609
.514
.600
.506
.590
.498
.582
.490
.573
.628
.710
.615
.698
.604
.685
.592
.674
.582
.663
.572
.652
.562
.642
.553
.633
.545
.624
.536
.615
.829
.808
.660
.730
.647
.723
.636
.712
.624
.700
.614
.690
.604
.679
.594
.669
.585
.660
.576
.651
.568
.642
.600
.834
.686
.750
.674
.744
.662
.793
.651
.722
.640
.712
.630
.701
.621
.692
.612
.682
.603
.673
.594
.664
.580
.858
.726
.789
.714
.778
.703
.767
.693
.756
.682
.746
.673
.736
.663
.727
.654
.718
.645
.709
.687
.701
.829
.892
29
30
35
40
45
50
60
70
80
90
100
.355
.456
.349
.449
.325
.418
.304
.393
.288
.272
.273
.354
.250
.325
.232
.302
.217
.283
.205
.267
.195
.254
.432
.522
.426
.514
.397
.481
.373
.454
.353
.430
.336
.410
.308
.377
.286
.351
.269
.330
.254
.312
.241
.297
.482
.565
.476
.558
.445
.523
.419
.494
.397
.470
.379
.449
.348
.414
.324
.386
.304
.362
.288
.343
.274
.327
.521
.598
.514
.591
.482
.556
.455
.526
.432
.501
.412
.479
.380
.442
.354
.413
.332
.389
.315
.368
.300
.351
.552
.625
.545
.818
.512
.582
.484
.552
.460
.527
.440
.504
.406
.466
.376
.436
.356
.411
.348
.390
.322
.372
.579
.648
.571
.640
.538
.605
.509
.575
.485
.549
.464
.526
.429
.488
.401
.456
.358
.431
.358
.409
.341
.390
.821
.685
.614
.677
.580
.642
.551
.612
.526
.586
.504
.562
.467
.523
.438
.491
.413
.464
.392
.441
.374
.421
125
150
200
300
400
500
1000
.174
.228
.159
.208
.138
.181
.113
.148
.098
.128
.088
.115
.062
.081
.216
.200
.198
.244
.172
.212
.141
.174
.122
.151
.109
.135
.077
.096
.246
.294
.225
.270
.196
.234
.160
.192
.139
.167
.124
.150
.088
.106
.269
.310
.247
.290
.215
.253
.176
.208
.153
.180
.137
.162
.097
.115
.290
.885
.266
.308
.231
.269
.190
.221
.165
.192
.148
.172
.105
.122
.307
.862
.282
.324
.246
.283
.202
.233
.176
.202
.157
.182
.112
.129
.
.338
.881
.310
.351
.271
.307
.223
.253
.194
.220
.174
.198
.124
.141
Pengertian Indeks Kesukaran
Sejalan dengan asumsi Galton mengenai kemampuan tertentu (karakteristik), dalam
hal ini kemampuan matematika dari sekelompok siswa yang dipilih secara random (acak)
akan berdistribusi normal, maka hasil evaluasi dari suatu perangkat tes yang baik akan
menghasilkan skor atau nilai yang membentuk distribusi normal. Hal ini mempunyai
implikasi bahwa soal yang baik akan menghasilkan skor yang berdistribusi normal, sehingga
sejalan dengan distribusi yang telah diuraikan pada pembicaraan mengenai daya pembeda.
Jika soal tersebut terlalu sukar, maka frekuensi distribusi yang paling banyak terletak
pada skor yang rendah karena sebagian besar siswa mendapat nilai yang jelek. Distribusinya
berbentuk condong ke kanan ( skewness positif ) seperti tampak pada gambar 1 di bawah ini!
Gambar 1
Jika soal seperti ini sering diberikan maka akan membuat siswa menjadi putus asa. Hal
ini bukan berarti soal tidak boleh sukar, karena jika sewaktu-waktu diberikan beberapa soal
yang sukar justru akan melatih siswa untuk berfikir lebih tinggi. Namun jika soal yang
diberikan terlalu mudah, maka frekuensi distribusi yang paling banyak berada pada skor yang
tinggi. Hal ini disebabkan sebagian besar siswa mendapat nilai yang baik. Distribusinya
berbentuk condong ke kiri ( skewness negatif ) seperti tampak pada gambar 2 di bawah ini!
Gambar 2
Jika hal ini terlalu sering dialami maka soal seperti ini akan kurang merangsang siswa untuk
berfikir tingkat tinggi sehingga kurang merangsang siswa utnuk meningkatkan motivasi
belajarnya.
Kedua kondisi di atas terkadang terjadi di sekolah. Ada guru yang bangga jika soal tes
yang dibuatnya dianggap sukar oleh siswanya, sehingga nilai rata-rata yang dicapainya sangat
rendah. Guru tersebut menganggap dirinya pandai dan murid tidak mungkin menyamainya.
Selain itu ada juga guru yang bangga jika soal tes yang dibuatnya dapat dengan mudah
dikerjakan oleh siswa, sehingga rata-rata nilai siswa kebanyakan baik. Ia bangga karena
merasa dirinya pandai mengajar padahal soal-soal yang diberikan hanya menuntut
kemampuan berfikir siswa yang rendah. Kondisi ini membuat siswa hafal dengan karakter
gurunya, sehingga muncul guru favorit dan guru yang tidak disukai oleh muridnya. Akibatnya
bukan mata pelajaran yang menjadi hal utama, melainkan gurunya. Istilah lain yang muncul
adalah bahwa seorang siswa yang mendapat nilai baik atau buruk, lulus atau tidak lulus ,
bukanlah dari mata pelajaran tertentu tetapi dari seorang guru. (dosen). Jadi, bukan baik atau
jelek, lulus atau tidak lulus yang mencerminkan materi pelajaran suatu materi pelajaran tetapi
lebih mencerminkan berkenan atau tidak berkenan dari guru atau dosennya.
Cara Menentukan Indeks Kesukaran
Derajat kesukaran atau butir soal dinyatakan dengan bilangan yang disebut Indeks Kesukaran (Difficulty Index). Bilangan tersebut adalah bilangan real pada interval (kontinum) 0,00 sampai dengan 1,00. Soal dengan indeks kesukaran mendekati 0,00 berarti indeks soal tersebut terlalu sukar, sebaliknya soal dengan indeks kesukaran 1,00 berarti soal tersebut terlalu mudah. Kontinum indeks kesukaran adalah seperti gambar 3 di bawah ini.
0,00 Gambar 3 1,00
<--------- sukar-mudah --------->
Hal itu diperoleh dari rumus untuk mementukan indeks kesukaran butir soal, yaitu:
IK = JB A+JB BJS A+JS B
Karena JSA = JSB = 27% dari jumlah subyek dalam populasi, rumus di atas dapat
diubah menjadi:
IK = JB A+JB B
2JS A
atau
IK = JB A+JB B
2JS B
dengan IK = Indeks Kesukaran dan untuk notasi lainnya sama dengan notasi untuk
daya pembeda.
Klasifikasi indeks kesukaran yang paling banyak digunakan adalah:
IK = 0,00 soal terlalu sukar
0,00 < IK ≤ 0,30 soal sukar
0,30 < IK ≤ 0,70 soal sedang
0,70 < IK < 1,00 soal mudah
IK = 1,00 soal terlalu mudah.
Seperti halnya dengan daya pembeda, akan ditinjau pula indeks kesukaran butir soal
untuk beberapa kasus.
i). Jika IK = 1,00 maka JB A+JB B
2JS A = 1,00 atau JBA + JBB = 2 JSA
Ini berarti semua siswa kelompok atas maupun kelompok bawah menjawab butir soal
yang bersangkutan dengan benar. Kondisi ini terjadi karena soal terlalu mudah,
sehingga semua siswa yang bodoh maupun bisa menjawabnya dengan benar.
ii). Jika IK =0,00 maka JB A+JB B
2JS A = 0,00 atau JBA + JBB = 0,00
Ini berarti semua siswa kelompok atas maupun kelompok bawah menjawab soal yang
bersangkutan dengan tidak benar, atau tidak seorangpun siswa yang menjawab soal tu
dengan benar. Kondisi ini terjadi jika soal terlalu sukar.
Dari kondisi (i) dan (ii) dapat disimpulkan bahwa jika IK mendekati nilai 1,00 maka
soal yang bersangkutan tergolong makin mudah. Sebaliknya jika ia mendekati 0,00 tergolong
makin sukar.
Sebagai contoh perhatikan kembali tabel 1 untuk data pada kelompok kecil.
Indeks Kesukaran untuk butir soal nomor 2.
IKNO.2 = 5+510
= 1,00 (sangat mudah).
Untuk butir soal nomor 2 tampak bahwa semua siswa kelmpok atas dan kelompok
bawah dapat menjawab soal dengan benar.
Indeks Kesukaran untuk butir soal nomor 5.
IKNO. 5 = 2+010
= 0,20 (sukar)
Untuk butir soal nomor 5 tampak bahwa dari 10 orang siswa yang dites, hanya 2 orang
dapat menjawab soal dengan benar.
Indeks Kesukaran untuk butir soal nomor 15.
IKNO. 15 = 2+310
= 0,50 (sedang)
Untuk butir soal nomor 15 tampak bahwa dari 10 orang siswa yang dites, hanya 5
orang dapat menjawab soal dengan benar.
Seperti halnya dengan daya pembeda, analisis derajat kesukaran dengan menggunakan
kelompok atas dan kelompok bawah mempunyai kelemahan karena untuk kelompok besar
tidak melibatkan siswa pada kelompok tengah, yaitu sebanyak 46%. Untuk mengurangi
kelemahan tersebut, dapat digunakan teknik analisis untuk derajat kesukaran dengan
menggunakan Teknik Frisbie. Derajat kesukaran setiap butir soal (untuk bentuk pilihan
berganda) dapat dihitung dengan menggunakan rumus:
RKRi = n (2P i−1 )−1
n−1
Keterangan:
RKRi = rasio kesukaran relatiff untuk butir soal ke-i,
n = banyak alternatif jawaban (option),
Pi = proporsi testi yang dapat menjawab benar untuk butir soal ke-i.
Sebagai contoh, perhatikan kembali data hasil tes pada tabel 2. Misalkan soal tersebut
merupakan soal tes matematika berbentuk pilihan ganda biasa dengan 4 option. Untuk
menentukan rasio kesukaran relatif untuk butir soal nomor 1 adalah:
RKRNO. 1 = n (2 p1−1 )−1
n−1
RKRNO. 1 = 4 (2 . (25 :32 )−1)−1
4−1
= 4 (2 . (0,78 )−1)−1
4−1
= 4.0,56−1
4−1
= 1,24
3
= 0,41
Ini berarti bahwa butir soal nomor 7 tersebut tergolong sedang. Maka tinggi nilai
RKR1 makin mudah butir soal yang bersangkutan.
Untuk menentukan indeks kesukaran tes secara keseluruhan dapat dihitung dengan
menggunakan rumus pada halaman berikut ini:
RKRx = 2n x−k (n+1)k (n−1)
Keterangan :
RKRx = rasio kesukaran relatif seluruh tes
x = rata-rata skor seluruh tes,
k = banyak seluruh butir tes, dan
n = banyak option
Untuk data hasil tes pada tabel 1 yang terdiri dari 15 butir tes (misalkan untuk tiap
butir tes memiliki 4 option), rasio kesukaran relatif seluruh tesnya adalah
RKRx = 2.4 (74 :10 )−15 (4+1)
15 (4−1)
= 59,2−75
45
= - 0,35
Nilai tersebut mendekati 0,00 sehingga kesukaran seluruh tes dikatagorikan ke dalam
soal yang sukar. Untuk data hasil tes matematika pada tabel 2 yang terdiri dari 25 butir soal
dengan 4 option, diperoleh:
RKRx = 2.4 (333 :32 )−32(4+1)
32(4−1)
= 2.4 (10,41 )−32(4+1)
32(4−1)
= 83,28−160
96
= - 0,799
Nilai tersebut, juga mendekati 0,00 sehingga perangkat soal tes tersebut tergolong
sukar. Makin kecil nilai RKR daripada 0,00 berarti tes soal tersebut makin sukar, sebaliknya
jika makin lebih besar daripada 0,00 berarti makin mudah.
Hubungan antara Daya Pembeda dan Indeks Kesukaran
Pada uraian mengenai daya pembeda dan indeks kesukaran tampak bahwa satu sama
lain erat kaitannya dan saling mempengaruhi. Dari rumus untuk menentukan daya pembeda
dan indeks kesukaran, yaitu:
DP = JB A−JB BJS A
dan IK = JB A+JB B
2JS A
atau
IK = 12
.JB A+JBBJS A
Seperti telah diuraikan tentang daya pembeda, jika DP = 1,00 maka JBA = JSA dan JBB = 0
sehingga diperoleh
IK = 12 .JB A+0JS A
= 0,50
Jika IK = 0,00 maka JBA + JBB = 0. Karena JBA dan JBB tidak negatif maka
JBA = JSA = 0
sehingga
DP = JB A−JB BJS A
= 0,00
Jika IK = 1,00 maka berarti JBA + JBB = 2JSA. Hal ini dipenuhi jika JBA = JBA =JSA = JSB
sehingga
DP = JB A−JB BJS A
= 0,00
Karena kesempatan pada rumus DP dan IK hubungannya linier, maka grafik fungsi
yang menyatakan hubungan tersebut berupa segmen garis lurus seperti tampak pada gambar
di bawah ini.
0 0.25 0.5 0.75 10
0.25
0.5
0.75
1
Gambar 4
Dari gambar di atas tampak hubungan antara IK dan DP. Untuk nilai 0,25 ≤IK ≤ 0,75
memberikan nilai DP ≥ 0,50. Soal-soal yyang memiliki kriteria tersebut tergolong butir soal
yang bagus. Sebaliknya untuk nilai IK > 0,75 dan IK < 0,25 yaitu butir soal yang cenderung
mudah atau sukar memberikan daya pembeda yang cenderung kurang baik.
Sebagai contoh, perhatikan kembali tabel 16. Butir soal no 1 memiliki IK = 1,00 yang
tergolong soal yang sangat mudah, nilai DP untuk butir soal itu adalah 0,00 yang berarti tidak
mempunyai daya pembeda atau tidak bisa membedakan siswa yang pandai dan siswwa yang
bodoh. Butir soal nomor 8 memiliki IK = 0,40 yang tergolong kategori soal sedang, nilai DP
untuk soal itu adalah 0,80 yang berarti daya pembedanya bagus.