BAB 1
PENDAHULUAN
A. Latar Belakang
Pada hakikatnya tes adalah suatu alat yang berisi
serangkaian tugas yang harus dikerjakan atau soal-soal
yang harus dijawab oleh peserta didik untuk mengukur
suatu aspek perilaku tertentu. Dengan demikian, fungsi
tes adalah sebagai alat ukur.
Analisis tes adalah salah satu kegiatan dalam
rangka mengkonstruksi tes untuk mendapatkan gambaran
tentang mutu tes, baik mutu keseluruhan tes maupun mutu
tiap buutir soal/tugas. Analisis dilakukan setelah tes
disusun dan dicobakan kepada sejumlah subyek dan
hasilnya menjadi umpan balik untuk
perbaikan/peningkatan mutu tes bersangkutan. Oleh
karena itu kegiatan analisis tes merupakan keharusan
dalam keseluruhan proses mengkonstruksi tes.
Soal yang baik akan mampu mengevaluasi sejauh mana
peserta didik menguasai indikator yang sudah ditentukan
oleh pengajar. Untuk itu, kemampuan menganalisis soal
setelah melakukan tes sangatlah dibutuhkan oleh
pendidik untuk melakukan evaluasi apakah alat ukur yang
digunakan tersebut sesuai apa tidak dengan apa yang
diinginkan antara lain dapat menentukan peserta didik
mana yang sudah atau belum menguasai materi yang
1
diajarkan guru dan juga bisa membantu meningkatkan tes
melalui revisi atau membuang soal yang tidak efektif,
serta untuk mengetahui informasi diagnostik pada siswa
apakah mereka sudah/belum memahami materi yang telah
diajarkan (Aiken, 1994: 63)
B. Rumusan Masalah
1. Apa yang dimaksud dengan analisis validitas
tes?
2. Bagaimana cara atau teknik menguji dan
menganalisis validitas dari seperangkat soal
tes?
3. Apa yang dimaksud dengan analisis reliabilitas
tes?
4. Bagaimana cara mengukur dan menganalisis
reliabilitas dari seperangkat soal?
5. Apa yang dimaksud dengan daya pembeda, tingkat
kesukaran dan distraktor?
6. Bagaimana cara menganalisis setiap item soal
dari aspek daya pembeda, tingkat kesukaran dan
distraktor?
2
1. Pengertian validitas
Menurut Azwar (1986) validitas berasal dari kata
validity yang mempunyai arti sejauh mana ketepatan dan
kecermatan suatu alat ukur dalam melakukan fungsi
ukurnya. Menurut Arikunto (1999) validitas adalah suatu
ukuran yang menunjukkan tingkat kesahihan suatu tes.
Menurut Nursalam (2003) validitas adalah suatu ukuran
yang menunjukkan tingkat kevalidan atau kesahihan suatu
instrumen.
Berdasarkan beberapa pendapat tentang pengertian
validitas di atas, maka dapat diambil kesimpulan bahwa
validitas adalah suatu standar ukuran yang menunjukkan
ketepatan dan kesahihan suatu instrumen.
Menurut Arikunto (1999) suatu tes dikatakan valid
apabila tes tersebut mengukur apa yang hendak diukur.
Tes memiliki validitas yang tinggi jika hasilnya sesuai
dengan kriteria, dalam arti memiliki kesejajaran antara
tes dan kriteria.
Sisi lain dari pengertian validitas adalah aspek
kecermatan pengukuran. Suatu alat ukur yang valid tidak
hanya mampu menghasilkan data yang tepat akan tetapi
juga harus memberikan gambaran yang cermat mengenai
data tersebut.
Cermat berarti bahwa pengukuran itu dapat
memberikan gambaran mengenai perbedaan yang sekecil-
kecilnya di antara subjek yang satu dengan yang lain.
4
Sebagai contoh, dalam bidang pengukuran aspek fisik,
bila kita hendak mengetahui berat sebuah cincin emas
maka kita harus menggunakan alat penimbang berat emas
agar hasil penimbangannnya valid, yaitu tepat dan
cermat. Sebuah alat penimbang badan memang mengukur
berat, akan tetapi tidaklah cukup cermat guna menimbang
berat cincin emas karena perbedaan berat yang sangat
kecil pada berat emas itu tidak akan terlihat pada alat
ukur berat badan.
Demikian pula kita ingin mengetahui waktu tempuh
yang diperlukan dalam perjalanan dari satu kota ke kota
lainnya, maka sebuah jam tangan biasa adalah cukup
cermat dan karenanya akan menghasikan pengukuran waktu
yang valid. Akan tetapi, jam tangan yang sama tentu
tidak dapat memberikan hasil ukur yang valid mengenai
waktu yang diperlukan seorang atlit pelari cepat dalam
menempuh jarak 100 meter dikarenakan dalam hal itu
diperlukan alat ukur yang dapat memberikan perbedaan
satuan waktu terkecil sampai kepada pecahan detik yaitu
stopwatch.
Menggunakan alat ukur yang dimaksudkan untuk
mengukur suatu aspek tertentu akan tetapi tidak dapat
memberikan hasil ukur yang cermat dan teliti akan
menimbulkan kesalahan atau eror. Alat ukur yang valid
akan memiliki tingkat kesalahan yang kecil sehingga
5
angka yang dihasilkannya dapat dipercaya sebagai angka
yang sebenarnya atau angka yang mendekati keadaan
sebenarnya.
2. Jenis-jenis dan teknik dalam menentukan validitas
Menurut Sudijono (2009) terdapat berbagai jenis
validitas, antara lain:
a. Pengujian Validitas Tes Secara Rasional
Validitas rasional adalah validitas yang
diperoleh atas dasar hasil pemikiran, validitas
yang diperoleh dengan berpikir secara logis.
a) Validitas Isi (Content Validity)
Validitas isi dari suatu tes hasil
belajar adalah validitas yang diperoleh
setelah dilakukan penganalisisan,
penelususran atau pengujian terhadap isi yang
terkandung dalam tes hasil belajar tersebut.
Validitas isi adalah yang ditilik dari segi
isi tes itu sendiri sebagai alat pengukur
hasil belajar yaitu: sejauh mana tes hasil
belajar sebagai alat pengukur hasil belajar
peserta didik, isisnya telah dapat mewakili
secara representatif terhadap keseluruhan
materi atau bahkan pelajaran yang seharusnya
diteskan (diujikan).
b) Validitas konstruksi (Construct Validity)
6
Validitas konstruksi dapat diartikan
sebagai validitas yang ditilik dari segi
susunan, kerangka atau rekaannya. Adapun
secara terminologis, suatu tes hasil belajar
dapat dinyatakan sebagai tes yang telah
memiliki validitas konstruksi, apabila tes
hasil belajar tersebut telalh dapat dengan
secara tepat mencerminkan suatu konstruksi
dalam teori psikologis.
b. Pengujian Validitas Tes Secara Empirik
Validitas empirik adalah ketepatan
mengukur yang didasarkan pada hasil analisis
yang bersifat empirik. Dengan kata lain,
validitas empirik adalah validitas yang
bersumber pada atau diperoleh atas dasar
pengamatan di lapangan.
a) Validitas ramalan (Predictive validity)
Validitas ramalan adalah suatu kondisi
yang menunjukkan seberapa jauhkah sebuah tes
telah dapat dengan secara tepat menunjukkan
kemampuannya untuk meramalkan apa yang bakal
terjadi pada masa mendatang.
Kriteria: 0,800 – 1,00 : sangat tinggi 0,600 – 0,79 : tinggi 0,400 – 0,59 : cukup 0,200 – 0,39 : rendah 0,000 – 0,19 : sangat rendah
7
b) Validitas bandingan (Concurrent Validity)
Tes sebagai alat pengukur dapat
dikatakan telah memiliki validitas bandingan
apabila tes tersebut dalam kurun waktu yang
sama dengan secara tepat mampu menunjukkan
adanya hubungan yang searah, antara tes
pertama dengan tes berikutnya.
B. Analisis Reliabilitas Tes
1. Pengertian reliabilitas
Menurut Sugiono (2005) Pengertian Reliabilitas
adalah serangkaian pengukuran atau serangkaian alat
ukur yang memiliki konsistensi bila pengukuran yang
dilakukan dengan alat ukur itu dilakukan secara
berulang. Reabilitas tes adalah tingkat keajegan
(konsitensi) suatu tes, yakni sejauh mana suatu tes
dapat dipercaya untuk menghasilkan skor yang ajeg,
relatif tidak berubah walaupun diteskan pada situasi
yang berbeda-beda. Menurut Sukadji (2000) reliabilitas
suatu tes adalah seberapa besar derajat tes mengukur
secara konsisten sasaran yang diukur. Reliabilitas
dinyatakan dalam bentuk angka, biasanya sebagai
koefisien. Koefisien tinggi berarti reliabilitas
tinggi. Menurut Nursalam (2003) Reliabilitas adalah
kesamaan hasil pengukuran atau pengamatan bila fakta
8
atau kenyataan hidup tadi diukur atau diamati berkali –
kali dalam waktu yang berlainan. Alat dan cara mengukur
atau mengamati sama – sama memegang peranan penting
dalam waktu yang bersamaan.
Berdasarkan beberapa pendapat tentang pengertian
reliabilitas di atas, maka dapat diambil kesimpulan
bahwa reliabilitas adalah suatu keajegan suatu tes
untuk mengukur atau mengamati sesuatu yang menjadi
objek ukur.
2. Jenis-jenis dan teknik dalam menentukan
reliabilitas
Ada tiga teknik pengujian realibilitas instrument
antara lain :
a. Teknik Paralel (Paralel Form atau Alternate
Form)
Teknik paralel disebut juga tenik ”double
test double trial”. Sejak awal peneliti harus
sudah menyusun dua perangkat instrument yang
parallel (ekuivalen), yaitu dua buah instrument
yang disusun berdasarkan satu buah kisi-kisi.
Setiap butir soal dari instrument yang satu
selalu harus dapat dicarikan pasangannya dari
instrumen kedua. Kedua instrumen tersebut
diujicobakan semua. Sesudah kedua uji coba
terlaksana, maka hasil instrumen tersebut
9
dihitung korelasinya dengan menggunakan rumus
product moment (korelasi Pearson).
b. Teknik Ulang (Test Re-test)
Disebut juga teknik ”single test double
trial”. Menggunakan sebuah instrument, namun
dites dua kali. Hasil atau skor pertama dan
kedua kemudian dikorelasikan untuk mengetahui
besarnya indeks reliabilitas.Teknik perhitungan
yang digunakan sama dengan yang digunakan pada
teknik pertama yaitu rumus korelasi Pearson.
Menurut Saifuddin Azwar, realibilitas tes-
retest adalah seberapa besat derajat skor tes
konsisten dari waktu ke waktu. Realibilitas
diukur dengan menentukan hubungan antara skor
hasil penyajian tes yang sama kepada kelompok
yang sama, pada waktu yang berbeda.
Metode pengujian reliabilitas stabilitas
yang paling umum dipakai adalah metode
pengujian tes-kembali (test-retest). Metode
test-retest menggunakan ukuran atau “test” yang
sama untuk variable tertentu pada satu saat
pengukuran yang diulang lagi pada saat yang
lain. Cara lain untuk menunjukkan reliabilitas
stabilitas, bila kita menggunakan survai,
adalah memasukkan pertanyaan yang sama di dua
bagian yang berbeda dari kuesioner atau
10
wawancara. Misalnya the Minnesota Multiphasic
Personality Inventory (MPPI) mengecek
reliabilitas test-retest dalam satu
kuesionernya dengan mengulang pertanyaan
tertentu di bagian-bagian yang berbeda dari
kuesioner yang panjang.
Kesulitan terbesar untuk menunjukkan
reliabilitas stabilitas adalah membuat asumsi
bahwa sifat/ variable yang akan diukur memang
benar-benar bersifat stabil sepanjang waktu.
Karena kemungkinan besar tidak ada ukuran yang
andal dan sahih yang tersedia. Satu-satunya
faktor yang dapat membuat asumsi-asumsi ini
adalah pengalaman, teori dan/atau putusdan
terbaik. Dalam setiap kejadian, asumsi ini
selalu ditantang dan sulit rasanya
mempertahankan asumsi tersebut atas dasar
pijakan yang obyektif.
c. Teknik Belah Dua (Split Halve Method)
Disebut juga tenik “single test single
trial”. Peneliti boleh hanya memiliki
seperangkat instrument saja dan hanya
diujicobakan satu kali, kemudian hasilnya
dianalisis, yaitu dengan cara membelah seluruh
instrument menjadi dua sama besar. Cara yang
diambil untuk membelah soal bisa dengan
11
membelah atas dasar nomor ganjil-genap, atas
dasar nomor awal-akhir, dan dengan cara undian.
Menurut Saifuddin Azwar, realibilitas ini
diukur dengan menentukan hubungan antara skor
dua paruh yang ekuivalen suatu tes, yang
disajikan kepada seluruh kelompok pada suatu
saat. Karena reliabilitas belah dua mewakili
reliabilitas hanya separuh tes yang sebenarnya,
rumus Spearman-Brown dapat digunakan untuk
mengoreksi koefisien yang didapat.
C. Analisis Item Soal
1. Daya Pembeda
Daya pembeda soal adalah kemampuan item tes untuk
membedakan peserta pandai dan peserta yang kurang
pandai. Kemampuan peserta tes menyelesaikan suatu soal
dengan benar memberikan gambaran akan kepandaiannya
yang tentu saja berbeda dengan peserta yang tidak mampu
menjawabnya dengan benar.
Apakah dapat membedakan siswa kelompok tinggi (U)
dan rendah (A)?
DP=BU−BANX
BU : jumlah jawaban benar kelompok unggul
BA : jumlah jawaban benar kelompok assor
Nx : jumlah siswa kelompok atas atau bawah
12
Seberapa baik sebuah butir soal mampu membedakan
kedua kelompok tersebut dapat dilihat pada besar
kecilnya indeks diskriminasi item (discriminatory power
disingkat D) sebagai berikut:INDEKS D KLASIFIKASI INTERPRETASI
0,70 – 1,00 Excellent Memiliki daya pembedayang sangat baik
0,40 – 0,70 Good Memiliki daya pembedayang baik
0,20 – 0,40 Satisfactory Memiliki daya pembedayang cukup/sedang
Kurang dari0,20 Poor Memiliki daya pembeda
yang lemah
Negatif - Kelompok atas banyakyang menjawab salah.
2. Tingkat Kesukaran
Soal yang ideal adalah soal yang sesuai dengan
kemampuan peserta tes. Dengan demikian soal yang
terlalu sulit bukan merupakan soal yang baik karena
hanya dapat dikerjakan oleh sedikit peserta, khususnya
kelompok atas (upper group) atau bahkan tidak ada
seorangpun yang mampu menyelesaikannya. Demikian pula
soal yang terlalu mudah sehingga dapat dikerjakan
dengan benar oleh seluruh peserta, sehingga tidak mampu
membedakan peserta yang pandai dan yang tidak pandai.
Kesimpulannya soal yang baik adalah yang berada pada
level sedang. Kondisi soal sebagaimana telah dijelaskan
disebut dengan tingkat kesukaran soal (difficulty
13
level). Tingkat kesukaran (TK) soal pada dasarnya
adalah perbandingan antara banyaknya peserta yang
menjawab benar dengan jumlah seluruh peserta, dan
dinyatakan dalam bentuk kuantitatif.
Beberapa ahli penilaian memberikan skala tingkat
kesukaran (TK) yang berbeda, namun yang banyak dipakai
di kalangan pendidikan adalah skala yang dikemukakan
oleh Thorndike dan Hagen (Measurement and Evaluation in
Psychology and Education) sebagai berikut :TINGKAT KESUKARAN (TK) atau
p
0,71 -1,00 : MUDAH (MD)
0,30 -0,70 : SEDANG (SD)
0,00 -0,29 : SUKAR (SK)
Sedangkan rumus untuk mencari derajat tingkat kesukaran
adalah :
TK = PB : JP
Ket :
TK = Tingkat kesukaran JP = Jumlah seluruh
peserta
14
PB = Peserta yang menjawab benar
Setelah setiap butir soal dianalisis pada tahap
ini, kita akan mengetahuii adanya tiga kelompok soal,
yaitu soal yang sukar (indeks kurang dari 0,30), soal
sedang (indeks 0,30 – 0,70) dan soal mudah (indeks 0,71
– 1,00). Tindak lanjut terhadap tiap-tiap kelompok soal
ini adalah :
INDEKS SOAL TINDAK LANJUT
Sukar
(0,00 – 0,29)
- Didrop (tidak digunakan pada tes mendatang)
- Dikaji ulang untuk menemukan penyebab soal
dianggap sukar (redaksi,pertanyaan, dll)
- Digunakan untuk tes tingkat tinggiSedang
(0,30 – 0,70)
- Dicatat pada bank soal dan dikeluarkan lagi
pada tes di waktu yang akan datang
Mudah
(0,71 – 1,00)
- Didrop (tidak digunakan pada tes mendatang)
- Dikaji ulang untuk menemukan penyebab soal
terlalu mudah dijawab
- Digunakan untuk tes yang tidak terlalu ketat
3. Distraktor (Pengecoh)
Distraktor adalah Setiap tes pilihan ganda yang
memiliki satu pertanyaan serta beberapa pilihan
jawaban. Diantara pilihan jawaban yang ada, hanya satu
yang benar. Selain jawaban yang benar tersebut, adalah
jawaban yang salah. Efektifitas distraktor adalah
seberapa baik pilihan yang salah tersebut dapat
mengecoh peserta tes yang memang tidak mengetahui kunci
15
jawaban yang tersedia. Semakin banyak peserta tes yang
memilih distraktor tersebut, maka distaktor itu dapat
menjalankan fungsinya dengan baik.
BAB 3
HASIL ANALISIS TES
A. VALIDITAS
1. Teknik Validitas Yang Digunakan
Teknik yang digunakan Validitas isi atau content
validity yaitu suatu tes yang mempermasalahkan seberapa
jauh suatu tes mengukur tingkat penguasaan terhadap isi
suatu materi tertentu yang seharusnya dikuasai sesuai
dengan tujuan pengajaran. Tujuan dari teknik ini yaitu
unntuk menunjukkan sejauh mana pertanyaan, tugas atau
butir dalam suatu tes atau instrumen mampu mewakili
secara keseluruhan dan proporsional perilaku sampel
16
yang dikenai tes tersebut. Artinya tes mencerminkan
keseluruhan konten atau materi yang diujikan atau yang
seharusnya dikuasai secara proporsional.
2. Hasil Pengujian Validitas
Untuk melihat validitas item soal dapat diperoleh
dengan menggunakan rumus:
rpbis= (mp−mt)
st x√pq
Dari hasil penafsiran uji validitas setiap butir
soal maka ada 7 butir soal yang tidak signifikan atau tidak
valid sehingga item soal no 83, 90, 92, 93, 94, 95, dan
96 harus direvisi karena termasuk kategori sangat buruk.
*Data Uji Validitas
B. RELIABILITAS
1. Teknik Reliabilitas Yang Digunakan
17
Teknik yang digunakan teknik reliabilitas split-half
method (metode belah dua). Teknik ini digunakan untuk
mengetahui korelasi antara soal ganjil dan genap. Dalam
teknik ini tes dibelah dua sehingga data memperoleh dua
macam skor, yakni skor yang diperoleh dari skor soal –
soal bernomor ganjil dan skor soal – soal bernomor
genap. Skor total diperoleh dengan menjumlahkan skor
ganjil dan genap. Selanjutnya skor ganjil dikorelasikan
dengan skor genap yang menghasilkan koefisien korelasi
rgg, atau koefisien korelasi ganjil-genap.
2. Hasil Pengujian Reliabilitas
Rumus untuk mencari korelasi antara soal ganjil dan
genap :
rxy = N(∑xy)–(∑x)(∑y)
√{N(∑x2)−(∑x)²}{N (∑y2 )−(∑y)² }
Setelah dihitung diperoleh :
N : 513 ∑ X : 2767 ∑ Y : 2559
∑ X2 :
16689∑ Y2 :
14431 ∑ XY :
14799
rxy = 513(14799)–(2767)(2559)
√{513(16689)−(2767)²}{513 (14431 )−(2559)²}
Jika menggunakan rumus dalam Microsoft Excel
yaitu =CORREL(Y6:Y518,AA6:AA518) yang menghasilkan
korelasi sebesar 0.58. Ini berarti reliabilitas skor
18
ganjil dan genap menunjukan korelasi sedang. Setelah
diketahui koefisien ganjil genap maka dicari
koefisien reliabilitasnya dengan menggunakan rumus:
rtt = 2rxy
1+rxy
Sehingga dihasilkan rtt = 1,74 Tinggi
Sehingga diketahui t hitung = 32,82
Sedangkan, t tabel = 1,965
Jadi, dapat disimpulkan bahwa t hitung > t
tabel = 32,82 > 1,965 maka signifikan atau
reliabel. Selanjutnya menghitung rentang rata-rata
dengan menggunakan rumus SEM atau sgp, yaitu:
SEM = st √1−rtt
Hasilnya SEM= 1.44 Kemudian dengan rata-rata
total 3,4 kita dapat menghitung rentang nilai rata-
rata:
Mt – sem mt +sem
3,4 – 1,44 3,4 + 1,441,80 4,68
Jadi, dapat ditafsirkan bahwa hasil analisis
susah untuk dipertanggung jawabkan karena rentangnya
19
jauh, yaitu rentang nilai rata-ratanya adalah antara
1,80 4,68.
C. ANALISIS ITEM SOAL
1. Daya Pembeda
Cara menghitung daya pembeda dicari terlebih
dahulu untuk 27% kelompok unggul dan assor setelah itu
baru menghitung uji daya pembedanya. Uji daya pembeda
ini dapat diinterpretasikan bahwa semakin besar nilai
daya pembeda pada soal, maka dapat dikatakan soal
semakin mampu untuk membedakan antara peserta didik
yang sudah menguasai dengan rumus kompetensi peserta
didik yang belum atau kurang menguasai kompetensi.
Adapun rumusnya:
DPn=∑ Bu−∑BaNuatauNa
20
Adapun hasil dari perhitungan uji daya pembeda
yang dihitung tiap butir soal dapat dihasilkan dan
diinterpretasikan sebagai berikut:
a. Uji daya pembeda butir soal nomor 77: 0,36 = 36%
menunjukkan kriteria baik.
b. Uji daya pembeda butir soal nomor 78: 0,25 = 25%
menunjukkan kriteria agak baik.
c. Uji daya pembeda butir soal nomor 79: 0,73 = 73%
menunjukkan kriteria sangat baik.
d. Uji daya pembeda butir soal nomor 80: 0,29 = 29%
menunjukkan kriteria agak baik.
e. Uji daya pembeda butir soal nomor 81: 0,46 = 46%
menunjukkan kriteria baik.
f. Uji daya pembeda butir soal nomor 82: 0,01 = 1%
menunjukkan kriteria sangat buruk.
g. Uji daya pembeda butir soal nomor 83: 0 = 0%
menunjukkan kriteria sangat buruk.
21
h. Uji daya pembeda butir soal nomor 84: 0,20 = 20%
menunjukkan kriteria buruk.
i. Uji daya pembeda butir soal nomor 85: 0,67 = 67%
menunjukkan kriteria sangat baik.
j. Uji daya pembeda butir soal nomor 86: 0,12 =12%
menunjukkan kriteria buruk.
k. Uji daya pembeda butir soal nomor 87: 0,31 = 31%
menunjukkan kriteria baik.
l. Uji daya pembeda butir soal nomor 88: 0,29 = 29%
menunjukkan kriteria agak baik.
m. Uji daya pembeda butir soal nomor 89: 0,12 = 12%
menunjukkan kriteria buruk.
n. Uji daya pembeda butir soal nomor 90: 0 = 0%
menunjukkan kriteria sangat buruk.
o. Uji daya pembeda butir soal nomor 91: 0,22 = 22%
menunjukkan kriteria agak baik.
p. Uji daya pembeda butir soal nomor 92: 0,4 = 4%
menunjukkan kriteria sangat buruk.
q. Uji daya pembeda butir soal nomor 93: 0,01 = 1%
menunjukkan kriteria soal sangat buruk.
r. Uji daya pembeda butir soal nomor 94: 0,02 = 2%
menunjukkan kriteria soal sangat buruk.
s. Uji daya pembeda butir soal nomor 95: 0.02 = 2%
menunjukkan kriteria soal sangat buruk.
t. Uji daya pembeda butir soal nomor 96: 0,01 = 1%
menunjukkan kriteria sangat buruk.
22
2. Tingkat Kesukaran
Untuk menguji TK (tingkat kesukaran) soal, yang
dihitung dengan menggunakan rumus:
TK=Bu+BaNu
x100%
Kita dapat menganalisis tingkat kesukaran seriap
butir soalnya dengan melihat kriteria yang telah
ditetapkan, semakin tinggi indeks tingkat kesukaran
maka semakin mudah soalnya dan sebaliknya, semakin
rendah tingkat kesukaran maka akan semakin sulit
soalnya. Adapun kriteria TK tersebut adalah:
1. 0 % - 15% : SS (Sangat Sukar) = sebaiknya
dibuang
2. 16% - 30% : SKr (Sukar)
3. 31% - 70% : SD (Sedang)
4. 71% - 85% : MD (Mudah)
5. 85% - 100% : SM (Sangat Mudah) = sebaiknnya
dibuang
Adapun hasil dari perhitungan (terlampir) TK
tersebut dapat diinterpretasikan:
a. TK butir soal nomor 77: 1.56 = 158% yang
menunjukkan kriteria soal memiliki tingkat
kesukaran soal Sukar (SKr)
23
b. TK butir soal nomor 78: 1.72 = 13% yang
menunjukkan kriteria soal memiliki tingkat
kesukaran soal Sangat Sukar (SS)
c. TK butir soal nomor 79: 0.75 = 37% yang
menunjukkan kriteria soal memiliki tingkat
kesukaran Sedang (SD)
d. TK butir soal nomor 80: 0,30 = 0.30% yang
menunjukkan kriteria soal yang memiliki tingkat
kesukaran Sangat Sukar (SS)
e. TK butir soal nomor 81: 0,48 = 48% yang
menunjukkan kriteria soal yang memiliki tingkat
kesukaran Sedang (SD)
f. TK butir soal nomor 82: 0.01 = 1% yang
menunjukkan kriteria soal yang memiliki tingkat
kesukaran Sangat Sukar (SS)
g. TK butir soal nomor 83: 0 = 0% yang menunjukkan
kriteria soal yang memiliki tingkat kesukaran
Sangat Sukar (SS)
h. TK butir soal nomor 84: 0,20 = 20% yang
menunjukkan kriteria soal yang memiliki tingkat
kesukaran Sangat Sukar (SS)
i. TK butir soal nomor 85: 0,86 = 86% yang
menunjukkan kriteria soal yang memiliki tingkat
kesukaran Sangat Mudah (SM)
24
j. TK butir soal nomor 86: 0,14 = 14% yang
menunjukkan kriteria soal yang memiliki tingkat
kesukaran Sangat Sukar (SS)
k. TK butir soal nomor 87: 0.31 = 31% yang
menunjukkan kriteria soal yang memiliki tingkat
kesukaran Sedang (SD)
l. TK butir soal nomor 88: 0.30 = 30% yang
menunjukkan kriteria soal yang memiliki tingkat
kesukaran Sukar (SS)
m. TK butir soal nomor 89: 0,12= 12% yang
menunjukkan kriteria soal yang memiliki tingkat
kesukaran Sangat Sukar (SS)
n. TK butir soal nomor 90: 0 = 0% yang menunjukkan
kriteria soal yang memiliki tingkat kesukaran
Sangat Sukar (SS)
o. TK butir soal nomor 91: 0.22 = 22% yang
menunjukkan kriteria soal yang memiliki tingkat
kesukaran Sukar (SKr)
p. TK butir soal nomor 92: 0.04 = 4% yang
menunjukkan kriteria soal yang memiliki tingkat
kesukaran Sangat Sukar (SS)
q. TK butir soal nomor 93: 0.01 = 1% yang
menunjukkan kriteria soal yang memiliki tingkat
kesukaran Sangat Sukar (SS)
25
r. TK butir soal nomor 94: 0,02 = 2% yang
menunjukkan kriteria soal yang memiliki tingkat
kesukaran Sangat Sukar (SS)
s. TK butir soal nomor 95: 0.02 = 2% yang
menunjukkan kriteria soal yang memiliki tingkat
kesukaran Sangat Sukar (SS)
t. TK butir soal nomor 96: 0.01 = 1% yang
menunjukkan kriteria soal yang memiliki tingkat
kesukaran Sangat Sukar (SS)
26