Post on 14-Apr-2016
description
PENGUKURAN DALAM PENDIDIKAN
PENGANTAR TEORI PENGUKURAN DALAM
PENDIDIKAN
Pengertian dan sejarah perkembangan instrumen pengukuran dalam
pendidikan Teori Klasik dan Item Response Theory
Oleh:
Eddy Fadillah Safardan (No.Reg 7816140554)
Gama Santosa (No.Reg 7816140550)
Maria Ulfah (No.Reg 7816140563)
Ryka Kaswati (No.Reg 7816140558)
Wulan Sukmawati (No.Reg 7816140551)
PROGRAM PASCASARJANA PENELITIAN DAN EVALUASI PENDIDIKAN
UNIVERSITAS NEGERI JAKARTA 2014/2015
KATA PENGANTAR
Puji syukur penulis panjatkan ke hadirat Allah Swt, Tuhan Yang Maha
Esa yang telah melimpahkan rahmat dan hidayah-Nya sehingga dapat menyusun
makalah ini.
Makalah ini berupa pembahasan mengenai Pengantar Teori
Pengukuran dalam Pendidikan: pengertian dan sejarah perkembangan instrumen
pengukuran dalam pendidikan Teori Klasik dan Item Response Theory (pengenalan).
Makalah ini disusun dalam rangka untuk memenuhi tugas mata kuliah Teori Tes
Klasik program pasca sarjana, program studi Penelitian dan Evaluasi Pendidikan
(PEP), Universitas Negeri Jakarta (UNJ).
Pembahasan dalam makalah ini penulis ambilkan dari berbagai sumber
antara lain: buku-buku yang disarankan, jurnal artikel dan materi-materi dari hasil
unduhan di media internet.
Penulis menyadari bahwa tersusunnya makalah ini atas bantuan
berbagai pihak dan masih sangat sederhana, oleh karena itu pada kesempatan ini
penulis menyampaikan penghargaan dan terima kasih kepada semua pihak yang
tidak dapat penulis sebutkan satu persatu dalam penulisan makalah ini dan semoga
semua amal baik mereka menjadikan pahala dihadapan Allah Swt. Untuk itu saran
dan kritik yang bersifat membangun sangat penulis harapkan guna
penyempurnaan.
Akhirnya penulis berharap semoga makalah ini bermanfaat dan dapat
memenuhi tugas dalam menempuh mata kuliah Pengukuran dalam Pendidikan.
BAB I
PENDAHULUAN
A. LATAR BELAKANG
Pengukuran dalam Pendidikan merupakan mata kuliah yang membahas teori,
konsep, dan metodologi pengukuran dalam pendidikan untuk memahami, melatih
keterampilan, mampu menggunakan dan mengembangkan pengetahuan serta
membentuk sikap positif mahasiswa dalam pengukuran dalam pendidikan. Ruang
lingkup pengukuran pendidikan meliputi pengukuran kognitif, nonkognitif/afektif
dan psikomotorik.
Menurut Morgan dan Brown dalam Erawan (2009) tujuan utama dari suatu
penilaian secara formatif adalah memberikan informasi kepada peserta tes tentang
kekuatan (strengths) dan kelemahan (weaknesses) mereka. Penilaian formatif
berfokus pada penyediaan umpan balik kepada peserta tes agar dapat memperbaiki
cara belajar dan kinerja mereka. Penilaian formatif memiliki kemampuan untuk
memperkaya pengalaman belajar serta memperbaiki kinerja peserta tes.
Penyusunan tes pada umumnya menggunakan teori tes klasik (CTT=Classical Test
Theory). Tetapi sejak awal tahun 1970 Item Response Theory (IRT) telah menggeser
popularitas CTT.. Pengukuran kemampuan dengan menggunakan metode IRT lebih
akurat dibandingkan dengan metode CTT karena tidak bergantung kepada
kemampuan sampel peserta tes.
B. TUJUAN
Makalah ini disusun memiliki tujuan antara lain sebagai berikut:
1. Untuk meningkatkan kompetensi menulis makalah bagi mahasiswa program
pascasarjana.
2. Untuk meningkatkan kompetensi bagi mahasiswa program pascasarjana
mengenai Pengantar Teori Pengukuran dalam Pendidikan
3. Untuk memenuhi tugas menyusun makalah mata kuliah Pengukuran dalam
Pendidikan program pascasarjana jurusan Penelitian dan Evaluasi Pendidikan
(PEP) Universitas Negeri Jakarta (UNJ)
BAB II
ISI
A. SEJARAH PENGUKURAN
Pada zaman dahulu orang menggunakan aanggota tubuh sebagai satuan
pengukuran, misalnya jari, hasta, kaki , jengkal , depa, langkah dan lain-lain. Satuan-
satuan tersebut bukan merupakan satuan baku, sehingga akan menyulitkan bila
digunakan dalam komunikasi. Contoh : Seorang A ingin memesan sebuah meja
kepada pengrajin B dengan panjang 3 hasta dan tinggi 1 kaki. Apakah panjang hasta
dan kaki pemesan A dan pengrajin B sama ?
Hasil pengukuran baru bermanfaat bila menggunakan satuan pengukuran
yang baku, yaitu satuan pengukuran yang nilainya tetaqp dan disepakati oleh
semua orang untuk dipakai sebagai pembanding.Contoh : galon, yard, inchi adalah
beberapa contoh satuan ukuran dalam sistem Inggris. Setelah tahun 1700,
sekelompok ilmuwan menggunakan sistem ukuran, dikenal dengan nama Sistem
Metrik. Pada tahun 1960, sistem Metrik dipergunakan dan diresmikan sebagai
Sistem Internasional (SI). Penamaan ini berasal dari bahasa Perancis Le Systeme
Internationale d’Unites.Dalam satuan SI setiap jenis ukuran memiliki satuan dasar,
contoh : panjang memiliki satuan dasar meter.
1. Sejarah Tes Intelegensi
Pada abad XIV, di cina, telah berlangsung usaha untuk mengukur
kompetensi para pelamar jabatan pegawai negara. Untuk dapat diterima sebagai
pegawai, para pelamar harus mengikuti ujian, ujian tertulis mengenai pengetahuan
konvusion klasik dan mengenai kemampuan menulis puisi. Ujian ini berlangsung
sehari semalam di tingkat distrik. Kurang dari 7% pelamar yang biasanya lulus
tingkat distrik kemudian harus mengikuti ujian berikutnya yang berupa menulis
prosa dan sajak. Dalam ujian ke 2 ini kurang dari 10% peserta yang lulus. Akhirnya
barulah ujian tingkat akhir diadakan di Peking dimana diantara para peserta
terakhir ini hanya lulus 3% saja. Lulusan ini kemudian diangkat menjadi mandarin
dan bekerja sebagai pegawai negara. Dengan demikian dari ke 3 tahap ujian
tersebut hanya 5 diantara 100.000 pelamar yang akhirnya menjadi mandarin.
Di Indonesia testing belum merupakan suatu gerakan nasional, testing
sebagai suatu gerakan nasional dicontohkan dengan baik di Amerika Serikat. Di
Amerika gerakan testing psikologis berkembang sejak awal abad 19, karena
kebutuhan untuk adanya instrumen pengukuran kemampuan orang sebagai akibat
dari perkembangan idustri. Dunia industri dan dunia usaha membutuhkan tenaga
terampil dengan bakat dan kemampuan yang cocok untuk menjalankan mesin-
mesin dan melakukan pekerjaan-pekerjaan usaha modern demi efisiensi dan
produktivitas. Perang dunia I juga memerlukan tenaga militer dengan kemampuan
yang diidentifikasi secara cepat untuk ditempatkan atau menjadi tenaga di bagian-
bagian yang ada seperti artileri, infantri, penerbang nakhoda, dan sebagainya.
Di Amerika, usaha pertama tersebut dimulai oleh tokoh pencetus istilah
“tes mental”, James Mckeen Cattell (1860-1944), yang menerbitkan bukunya
mental tes and measuremens di tahun 1890. buku ini berisi serangkaian tes
intelegensi yang terdiri atas 10 jenis ukuran. Ke 10 macam ukuran tersebut adalah:
1. Dinamo meter peasure, yaitu ukuran kekuatan tangan menekan pegas yang
dianggap sebagai indikator aspek psikofisiologis
2. Rate of movement, yaitu kecepatan gerak tangan dalam satuan waktu
tertentu yang dianggap memiliki komponen mental didalamnya.
3. Sensation areas, yaitu pengukuran jarak terkecil diantara 2 tempat yang
terpisah dikulit yang masih dapat dirasakan sebagai 2 titik berbeda.
4. Peasue caosing pain, yaitu pengukuran yamg dianggap berguna dalam
diaknosis terhadap penyakit saraf dan dalam mempelajari status kesadaran
abnormal.
5. Least noticabele difference in weight, yaitu pengukuran perbedaan berat
yang terkecil yang masih dapat dirasakan seseorang.
6. Reaction time for sound, yang mengukur waktu antara pemberian stimulus
dengan timbulnya reaksi tercepat.
7. Time for naming colors, yang dimaksudkan sebagai ukuran terhadap proses
yang. lebih”mental”daripada waktu-reaksi yang dianggap reflektif.
8. Bisection of a 50-cm line, yang dianggap sebagai suatu ukuran terhadap
akurasi “ space judgment’
9. Judgment of 10second time, yang dimaksudkan sebagai ukuran akurasi dalam
‘time judgment’( subyek diminta menghitung 10 detik tanpa bantuan
apapun).
10. Number of latters repeated upon once hearing, yang dimaksudkan sebagai
ukuran terhadap perhatian dan ingatan( subyek diminta mengulang huruf
yang sudah disebutkan 1x)
2. Latar Belakang Tes Intelegensi
1. E. Seguin (1812 – 1880) disebut sebagai pionir dalam bidang tes intelegensi
yang mengembangkan sebuah papan yang berbentuk sederhana untuk
menegakkan diagnosis keterbelakangan mental. Kemudian usaha ini
distandanisir oleh Henry H. Goddard (1906). E. Seguin digolongkan kepada
salah seorang yang mengkhususkan diri pada pendidikan anak terkebelakang
dan disebut juga bapak dari tes performansi.
2. Joseph Jasnow (1863 – 1944) adalah merupakan salah satu dari beberapa
orang yang pertama kali mengembangkan daftar norma-norma dalam
pengukuran psikologis.
3. G.C. Ferrari (1896) mempublikasikan tes yang bisa dipakai untuk
mendiagnosis keterbelakangan mental.
4. August Oehr mengadakan penelitian inhmetasi antara berbagai fungsi
psikologis (h. 14).
5. E. Kraepelin, seorang psikotes menyokong usaha ini, empat macam tes yang
dikembangkan, di antaranya yaitu: Koordinasi motoric , Asosiasi kata-kata ,
Fungsi persepsi , Ingatan
6. Dan E. Kraepelin juga mengembangkan tes intelegensi yang berkaiatan
dengan tes penataran aritmatik dan kalkulasi sederhana tahun 1895. Di
samping itu berkembang pula tes yang dipakai untuk kelompok (group). Hal
ini diawali dengan tes verbal untuk seleksi tentara (wajib militer) yang
disebut dengan Army Alpha. Untuk yang buta huruf atau tidak bisa berbicara
bahasa Inggris dipergunakan Army Beta sekitar tahun 1917 – 1918, tes ini
dipakai hampir dua juta orang.
B. DEFINISI PENGUKURAN, PENILAIAN DAN EVALUASI
Dalam praktek pendidikan saat ini masih sering terjadi kerancuan dalam
mendefinisikan istilah “evaluasi”, “ penilaian” dan “ pengukuran”. Hal ini terjadi
karena ketiga istilah tersebut memang terkait satu sama lain. Berikut ini penjelasan
mengenai evaluasi, penilaian dan pengukuran. 1. Pengukuran ( Measurement)
Pengukuran yang dalam bahasa inggir dikenal dengan measurement adalah
suatu kegiatan yang dilakukan untuk mengukur dalam arti memberi angka
terhadap sesuatu yang disebut objek pengukuran atau objek ukur. Mengukur
pada hakekatnya adalah pemasangan atau korespondensi 1-1 antara angka yang
diberikan dengan fakta dan diberi angka atau diukur (Djali, 2007). Dapat
diartikan juga sebagai proses memasang fakta – fakta suatu objek dengan
satuan- satuan ukuran tertentu. Secara konseptual angka-angka hasil
pengukuran pada dasarnya adalah kontinum yang bergerak dari satu kutub ke
kutub yang lain misalnya dari angka 0 sampai 100 atau dari negatif ke positif.
Evaluasi dan penilaian dapat bersifat kualitatif, maka pengukuran selalau
bersifat kuantitatif. Alat yang dipergunakan dalam pengukuran dapat berupa
alat yang baku secara internasional seperti meteran, timbangan dan sebagainya,
serta dapat pula berupa alat yang dibuat dan dikembangkan sendiri dengan
mengikuti proses pengembangan atau pembakuan instrumen.
2. Penilaian ( Assesment )
Penilaian merupakan suatu tindakan atau proses menentukan nilai suatu objek
yang dapat dilakukan berdasarkan hasil pengukuran atau dapat pula dipengaruhi
oleh hasil pengukuran. Penilaian adalah suatu proses membandingkan objek
atau gejala dengan menggunakan patokan-patokan tertentu seperti baik tidak
baik, memadai tidak memadai memenuhi syarat tidak memenuhi syarat dan
sebagainya ( Djali, 2007 )
3. Evaluasi ( Evaluation )
Menurut Gorlun dalam Djali (2007) evaluasi adalah suatu proses yang sistematis
untuk menentukan atau mengambil keputusan, sampai sejauh mana tujuan
program telah tercapai. Pendapat yang sama juga dikemukakan oleh Wringstone
dalam Djali ( 2007 ) bahwa evaluasi pendidikan adalah penaksiran terhadap
pertumbuhan dan kemajuan siswa ke arah tujuan atau nilai-nilai yang telah
ditetapkan kurikulum.
Evaluasi juga dapat di artikan sebagai proses menilai suatu berdasarkan kriteria
atau tujuan yang telah di tetapkan yang selanjutnya diikuti dengan pengambilan
keputusan atau objek yang dievaluasi ( Djali, 2007 ).
Berdasarkan beberapa pengertian evaluasi, penilaian dan pengukuran yang
dikemukakan secara rinci penjelasan mengenai perbedaan pengukuran,
penilaian dan evaluasi dapat dilihat dari tabel 1 berikut.
Tabel 1. Hasil Ujian Mata Kuliah Tes dan Pengukuran
Peserta Skor Nilai Keputusan
Lovi 87 A Lulus amat baik
Wanda 98 A Lulus amat baik
Gina 78 B Lulus baik
Amu 88 A Lulus amat baik
Keterangan
1. Skor merupakan hasil kegiatan pengukuran
2. Nilai adalah penilaian
3. Keputusan adalah hasil evaluasi
Objek-objek pengukuran dalam bidang pendidikan ialah
a. Prestasi atau hasil belajar
b. Sikap
c. Motivasi
d. Intelegensi
e. Bakat
f. Kecerdasan emosional
g. Minat
h. Kepribadian
PENGERTIAN DAN JENIS-JENIS INSTRUMEN
Secara umum instrumen adalah suatu alat yang memenuhi persyaratan
akademik, sehingga dapat dipergunakan sebagai alat untuk mengukur suatu objek
ukur atau mengumpulkan data mengenai suatu variabel. Dalam bidang pennelitian,
instrumen diartikan sebagai alat untuk mengumpulkan data mengenai variabel-
variabel penelitian untuk kebutuhan penelitian, sednagkan dalam bidang
pendidikan instrumen digunakan untuk mengukur prestasi belajar siswa, faktor-
faktor yang diduga mempunyai hubungan atau berpengaruh terhadap hasil belajar,
perkembangan hasil belajar siswa, keberhasilan proses belajar, perkembangan hasil
belajar siswa, keberhasilan proses belajar mengajar guru dan keberhasilan
pencapaian suatu program tertentu.
Pada dasarnya instrumen dapat dibagi dua yaitu tes dan non tes. 1. Tes
Secara umum tes diartikan sebagai alat yang dipergunakan untuk mengukur
atau penugasan objek ukur terhadap seperangkat konten dan materi tertentu.
Menurut sudijono (1996), tes adalah alat atau prosedur yang diperguanakan dalam
rangka pengukuran dan penilaian. Menurut Djali ( 2007 ) fungsi tes adalah sebgai
berikut : - sebagai alat ukur unutk mengukur prestasi belajar siswa
- motivator dalam pembelajaran
- untuk upaya perbaikan kualitas pembelajaran
- menentuka berhasil atau tidaknya siswa sebagai syarat untuk melanjutkan
pendidikan pada jenjang yang lebih tinggi
2. Non Tes
Instrumen non tes dapat berupa wawancara, observasi, angket, pemerikasaan
dokumen
C. TEORI TES KLASIK DAN TEORI RESPON BUTIR
Pengukuran dalam pendidikan tidak dapat dipisahkan dari pengukuran
kemampuan peserta didik. Kemampuan peserta didik dapat diukur dengan
menggunakan alat ukur (tes). Pengukuran dalam pendidikan meliputi pengukuran
kemampuan peserta tes dan pengukuran karakteristik alat ukur yang digunakan.
Ada dua teori pengukuran yang sampai saat ini masih dikembangkan, yaitu teori tes
klasik dan teori tes modern. Teori tes klasik disebut juga classical test theory (CTT) ,
sedang teori tes modern disebut juga item response theory (IRT) .
a. Teori tes klasik / classical test theory (CTT)
1. Definisi
Teori tes klasik atau yang dalam bahasa inggrisnya adalah Classical Test
Theory (CTT) disebut demikian karena unsur-unsur teori itu sudah
dikembangkan dan diaplikasikan sejak lama, namun tetap bertahan. Oleh
karena itu teori ini dianggapsebagai hasil karya klasik. Teori tes klasik tidak
tersusun sekali jadi, melainkan berkembang sedikit demi sedikit melalui
unsur-unsur yang kemudian secara akumulatif merupakan bangunan teori
yang utuh. Inti teori tes klasik itu berupa asumsi-asumsi yang dirumuskan
secara matematis. Modelnya disebut model skor murni (true score model).
Ada tujuh macam asumsi dalam teori tes klasik, seperti yang akan disajikan
secara ringkas berikut ini, disarikan dari Allen & Yen (1979).
2. Asumsi-asumsi dalam Teori Tes Klasik
Asumsi 1: �� = �∗ + ��.............................................................. (1)
Skor perolehan atau skor tampak (��) terdiri dari skor murni (�∗) dan skor
kesalahan (��). Jadi skor yang diperoleh dari sesuatu pengukuran pada
umumnya tidak menunjukkan keadaan yang sebenarnya. Skor perolehan
pada umumnya meleset dari menampilkan secara tepat besaran atribut
yang diukur. Melesetnya skor perolehan dari keadaan yang sebenarnya
yaitu skor murni merupakan kesalahan pengukuran (error of
measurement). Skor murni dianggap tetap, sedang skor kesalahan terjadi
secara rambang, baik ke atas maupun ke bawah. Sebenarnya yang
diperlukan adalah skor murni, yaitu skor yang mencerminkan secara tepat
besaran atribut yang diukur, namun pada umumnya tidak ada jalan untuk
mengetahui skor murni itu secara langsung. Skor murni hanya dapat
diketahui secara tidak langsung melalui galat (kesalahan) baku pengukuran
(standard error of measurement).
Asumsi 2: ε(��)= �∗.................................................................. (2)
Nilai harapan skor perolehan (ε(��)) sama dengan skor murni. Asumsi 2 ini
merupakan definisi skor murni (�∗). Skor murni itu adalah nilai rata-rata
skor perolehan teoretis sekiranya dilakukan pengukuran berulang-ulang
sampai tak terhingga terhadapseseorang dengan menggunakan alat ukur
yang sama. Syarat pokok dalam pengukuran ulang itu adalah hasil
pengukuran yang satu harus bebas dari hasil pengukuran yang lain.
Asumsi 3: ρ�.∗���0.............................................................. (3)
Skor murni dan skor kesalahan yang dicapai oleh suatu populasi subjek
pada suatu tes tidak berkorelasi satu sama lain. Jadi tidak ada hubungan
sistematik antara skor murni dan skor kesalahan. Subjek yang tinggi skor
murninya tidak mesti mempunyai skor kesalahan baik positif maupun
negatif yang lebih tinggi dibanding subjek yang rendah skor murninya.
Asumsi 4: ρx��x�� = 0.............................................................. (4)
Skor-skor kesalahan pada dua tes yang dimaksud untuk mengukur dua hal
yang sama, tidak saling berkorelasi. Asumsi ini akan tidak terpenuhi
sekiranya skor perolehan dipengaruhi oleh kondisi testing, seperti misalnya
kelelahan, efek latihan, suasana hati, atau faktor-faktor dari lingkungan.
Universitas Sumatera Utara
Asumsi 5: ρx��x∗� = 0 ............................................................... (5)
Jika ada dua tes yang dimaksudkan untuk mengukur atribut yang sama,
maka skor-skor kesalahan pada tes 1 (x��) tidak berkorelasi dengan skor-
skor murni pada tes 2 (x∗�).
Asumsi 6:
Jika dua perangkat tes yang dimaksudkan mengukur atribut yang sama
mempunyai skor perolehanx� dan x�′ yang memenuhi asumsi-asumsi 1
sampai 5, dan jika untuk setiap populasi subjek X*=X*’ danσ��,σ�
�� maka
kedua tes itu disebut tes paralel. Jadi dua perangkat tes akan merupakan
tes paralel jika skor-skor suatu populasi yang menempuh kedua tes itu skor
murninya sama (X*=X*’) dan varians skor-skor kesalahannya sama (σ��, σ�
��).
Asumsi 7:
Jika dua perangkat tes yang dimaksudkan untuk mengukur atribut yang
sama mempunyai skor-skor perolehan x�� dan x�� yang memenuhi
asumsi-asumsi 1 sampai 5, dan apabila untuk setiappopulasi subjek
x∗� = x∗�+ C��, dimana C�� adalah suatu konstanta, maka kedua
perangkat tes itu disebut tes-tes yang setara (equivalent test).
Pada pengukuran klasik ciri yang unik diperlihatkan dari kenyataan
bahwa kelompok butir tes atau kelompok angket (kuesioner) tidak dapat
dipisahkan dari kelompok peserta tes atau kelompok yang mengisi angket.
Artinya, kelompok butir tes/angket (kuesioner) yang sama harus dijawab
oleh kelompok peserta tes yang sama. Jika kelompok tes yang sama dijawab
kelompok peserta uji tes yang berbeda maka ciri karakteristik kelompok
butir itu akan berubah, sehingga taraf kesukaran dan daya pembeda
kelompok butir tes itu akan berubah semata-mata karena kelompok butir
tes tersebut ditanggapi oleh kelompok peserta yang berbeda. Menurut
Setiadi (1998: 6) bahwa dalam teori klasik, statistik soal, misalnya indeks
kesukaran soal tergantung pada sampel pengikut ujian. Kalau tes tersebut
dikerjakan oleh siswa yang pandai maka soal-soal itu sepertinya mudah
atau tingkat kesukaran soalnya menjadi besar, dan sebaliknya kalau
dikerjakan oleh siswa yang kurang pandai maka soal itu sepertinya sukar
atau tingkat kesukaran soal menjadi kecil. Jadi, soal-soal itu tidak konsisten
atau berubah-ubah tergantung pada kemampuan kelompok sampel siswa
yang menempuh ujian.
Kemampuan responden bergantung kepada taraf sukar butir. Mereka
yang mengerjakan butir sukar akan tampak berkemampuan rendah
sedangkan mereka yang mengerjakan butir mudah akan tampak
berkemampuan tinggi. Teori pengukuran klasik (teori ujian klasik) tidak
dapat digunakan untuk pencocokan kemampuan responden dengan taraf
sukar butir (karena mereka dependen). Pada teori klasik, terdapat
interdependensi di antara kemampuan responden dan taraf sukar butir.
3. Kelemahan dan Kelebihan Teori Klasik
Menurut para ahli, ada beberapa kelemahan yang ada pada pendekatan
teori klasik. Beberapa di antaranya adalah Hambleton, dkk (1991) dan Lord
(1980). Mereka menjelaskan bahwa kelemahan-kelemahan tes teori klasik
adalah:
(1) statistik butir tes sangat tergantung pada karakteristik subjek yang dites;
(2) taksiran kemampuan peserta tes sangat tergantung pada butir tes yang
diujikan;
(3) kesalahan baku penaksir skor berlaku untuk semua peserta tes, sehingga
kesalahan baku pengukuran tiap peserta dan butir soal tidak ada;
(4) informasi yang disajikan terbatas pada menjawab benar atau salah saja
tidak memperhatikan pola jawaban peserta tes; dan (5) asumsi tes paralel
susah dipenuhi.
Walaupun teoriklasik ini memiliki beberapa kelemahan namun masih
banyak yang menggunakan karena mempunyai kelebihan yaitu tidak
menuntut responden besar (lebih 100) dan mudah mengaplikasikannya
(melakukan analisis butir dengan pendekatan klasik ini). Oleh karenanya,
untuk pengukuran yang melibatkan responden kecil misal pada pengukuran
melalui tes harian pada bidang pendidikan, atau pengukuran pada bidang
psikologi pada umumnya masih menggunakan pendekatan teori tes klasik.
b. Teori tes modern / item response theory (IRT)
Untuk mengatasi kelemahan -kelemahan yang ada pada teori klasik, para ahli
pengukuran berusaha untuk mencari alternatif. Model yang diinginkan harus
mempunyai sifat-sifat:
(1) karakteristik butir tidak tergantung kepada kelompok peserta tes yang dikenai
butir soal tersebut,
(2) skor yang menyatakan kemampuan peserta tes tidak tergantung pada tes,
(3) model dinyatakan dalam tingkatan (level) butir soal, tidak dalam tingkatan tes,
(4) model tingkat tidak memerlukan tes paralel untuk menghitung koefisien
reliabilitas, dan
(5) model menyediakan ukuran yang tepat untuk setiap skor kemampuan
(Hambleton, Swaminathan, & Rogers, 1991: 5). Model alternatif yang dapat
mempunyai ciri-ciri itu adalah model pengukuran yang disebut teori respon butir (
Item Response Theory).
1. Definisi
Teori tes modern atau biasa disebut dengan teori respon butir ( item
response theory) dikembangkan oleh para ahli pengukuran bidang psikologi
dan pendidikansebagai upaya meminimalkan kekurangan -kekurangan yang
ada dalam teori tes klasik. Perhitungan dalam analisis butir berdasarkan teori
ini dapat dilakukan denganmenggunakan bantuan program komputer.
Sebagaimana halnya dalam teori klasik, dalam teori respon butir juga
didasarioleh postulat dasar. Ada dua postulat dasar dari teori tes modern
(Hambelton, Swaminathan &Rogers, 1991: 7), yaitu: (1) hasil kerja seorang
peserta tes pada suatubutir soal dapat diprediksikan (atau dijelaskan) dari
suatu jenis faktor -faktor yang disebut sifat-sifat, sifat –sifat laten, atau
kemampuan; (2) hubungan antara hasil kerja peserta tespada suatu butir tes
dengan sifat -sifat yang mendasarinya dapat dideskripsikan oleh fungsi yang
meningkat yang bersifat monotonic yang disebut dengan fungsi
karakteristikbutir (item characteristic function atau item charact eristic curve -
ICC). Fungsi inimenje1askan, jika taraf sifat -sifat (kemampuan) meningkat,
maka probabilitas menjawab benar pada suatu butir tes juga meningkat.
2. Asumsi-asumsi Teori Tes Modern
Sebagaimana halnya dalam teori tes klasik, dalam teori respon butir juga
mengandung asumsi-asumsi yang mendasarinya, yaitu: (a)
Unidemensionalitas, (b)Independensi lokal, dan (c) Fungsi karakteristik butir
menyatakan hubungan yang sebenarnya antara variabel yang tak terobservasi
(yaitu kemampuan) dengan variabel terobservasi (yaitu respon butir)
(Hambleton., Swaminathan, & Rogers, 1991: 9; Surabrata, 2000: 28). Asumsi
unidemensionalitas dan independensi lokal dapatdijelaskan sebagai berikut.
Asumsi unidemensionalitas menyatakan bahwa hanya satu kemampuan
yangdiukur oleh sekumpulan butir -butir soal dalam suatu tes. Asumsi ini pada
praktik sukar dipenuhi, sebab terdapat banyak faktor yang dapat
mempengaruhi hasil suatu tes. Faktor -faktor tersebut antara lain tingkat
motivasi, kecemasan, kemampuan untuk bekerja cepat, dan keterampilan
kognitif lain diluar kemampuan yang diukur oleh sekumpulan butir soal dalam
suatu tes. Hal yang dimaksud dengan unidemensionalitas dalam hal ini adalah
adanya faktor -faktor dominan yang mempengaruhi hasil suatu tes. Faktor -
faktor dominanitulah yang disebut kemampuan yang diukur oleh suatu tes.
Asumsi independensi lokal menyatakan bahwa sikap kemampuan
yangmempengaruhi suatu tes adalah konstan, maka respon peserta tes pada
setiap pasang butirsoal adalah independen secara statistik. Dengan kata lain,
asumsi independensi lokalmenyatakan bahwa tidak ada korelasi antara respon
peserta tes pada butir soal yangberbeda. Hal ini juga berarti bahwa
kemampuan yang dinyatakan dalam model adalahsatu-satunya faktor yang
mempengaruhi respon peserta tes pada butir-butir soal.
Untuk mengatasi kelemahan pada pengukuran klasik, penggunaan IRT
yakni untuk menganulir ketidakterpisahan antara kelompok peserta tes
dengan kelompok butir tes. Artinya, prinsip pengukuran modern adalah
penetapan ciri butir, walaupun ciri peserta tes berbeda. Dengan kata lain, ciri
dari kelompok butir adalah tetap walaupun dijawab peserta tes yang berbeda.
Dengan demikian berlaku pula bahwa ciri peserta akan tetap sama, walaupun
mereka menjawab butir tes yang berbeda. Pada IRT, peluang jawaban benar
yang diberikan siswa, ciri atau parameter butir, dan ciri atau parameter
peserta tes dihubungkan melalui suatu model formula yang harus ditaati baik
oleh kelompok butir tes maupun kelompok peserta tes (Hambleton & Rogers,
1991). Artinya, butir yang sama terhadap peserta tes yang berbeda harus
tunduk pada aturan rumus itu, atau peserta tes yang sama terhadap butir tes
yang berbeda juga harus patuh terhadap rumus tersebut. Dalam proses
semacam ini terjadilah apa yang disebut invariansi di antara butir tes dan
peserta tes. Pada pengukuran modern, taraf sukar butir tidak dikaitkan
langsung dengan kemampuan responden.
3. Kelemahan dan kelebihan Teori Modern
Teori tes modern sudah berkembang dibeberapa negara yang sudah
maju. Kemajuan teknologi seperti ditemukannya komputer telah memberikan
dampak dalam pengembangan teori tes modern. Kelebihannya antara lain :
1. Proses penghitungan hasil penskoran peserta tes dengan menggunakan
teori tes modern lebih kompleks dari pada menggunakan tes klasik.
2. IRT merupakan teori pengukuran yang dikembangkan untuk
menjelaskan secara lebih lengkap mengenai bagaimana gambaran
fungsi dari sebuah aitem
Berbeda dengan pendekatan teori tes klasik, kelemahan IRT adalah
membutuhkan jumlah data yang besar dan sampel yang beragam dalam
menerapkan model matematikanya untuk mengestimasi aitem (Embretson
& Reise dalam Anastasi & Urbina, 2007).Hal ini menunjukkan kelemahan
dari IRT yang tidak praktis dan model matematiknya rumit dibandingkan
dengan teori tes klasik.
BAB III
KESIMPULAN
Pengukuran (measurement) adalah suatu kegiatan yang dilakukan untuk
mengukur dalam arti memberi angka terhadap sesuatu yang disebut objek
pengukuran atau objek ukur.
Penilaian merupakan suatu tindakan atau proses menentukan nilai suatu objek
yang dapat dilakukan berdasarkan hasil pengukuran atau dapat pula dipengaruhi
oleh hasil pengukuran.
Evaluasi adalah suatu proses yang sistematis untuk menentukan atau
mengambil keputusan, sampai sejauh mana tujuan program telah tercapai.
instrumen adalah suatu alat yang memenuhi persyaratan akademik, sehingga
dapat dipergunakan sebagai alat untuk mengukur suatu objek ukur atau
mengumpulkan data mengenai suatu variabel. Instrumen dapat dibedakan
menjadi tes dan non tes
Inti teori tes klasik itu berupa asumsi-asumsi yang dirumuskan secara
matematis. Modelnya disebut model skor murni (true score model).
Untuk mengatasi kelemahan pada pengukuran klasik, penggunaan IRT yakni
untuk menganulir ketidakterpisahan antara kelompok peserta tes dengan
kelompok butir tes.
Daftar Pustaka
Allen, M.J. & Yen, W.M. 1979. Introduction to measurement theory. Monterey, CA: Brooks/Cole Publishing Company.
Badrun Kartowagiran. 2002. Pengantar Teori Klasik . Makalah. Disampaikan pada Pelatihan penulisan analisis butir dengan pendekatan TTK dan TRB, di UNY Yogyakarta, 11-12 April 2009.
Djali dan Muljono. 2007. Pengukuran dalam Bidang Pendidikan . Jakarta: Grasindo.
Erawan, Lalang dan Santosa, Stefanus. Teknologi Informasi, Computer – Adaptive Test Dengan Pendekatan Item Response Theory Satu Parameter, Jurnal Teknologi Informasi Volume 5 Nomor 2, ISSN 1414-9999, 2009.
Gronlund, Norman. E. 1985. Measurement and Evaluation in Teaching. New York: Macmillan Publishing Company.
Hambleton, Ronald K; Swaminathan, H; dan Jane Rogers, H. 1991. Fundamentals of Item Response Theory. London: SagePublications.
Purnomo, Bambang. 2011. Teori Tes Klasik. Artikel. Sumber : http://karyatulisilmiahguru.blogspot.com/2011/11/teori-tes-klasik.html/ tanggal 19 September 2014
Sudaryono. 2013. Implementasi Teori Responsi Butir (Item Response Theory) Pada Penilaian Hasil Belajar Akhir di Sekolah. Artikel. Sumber : http://sudaryono.ilearning.me/2013/01/18/implementasi-teori-responsi-butir-item-response-theory-pada-penilaian-hasil-belajar-akhir-di-sekolah/ tanggal 19 September 2014.