Kelompok 1 Pengantar Teori Klasik Dan Item Response Theory

PENGUKURAN DALAM PENDIDIKAN

PENGANTAR TEORI PENGUKURAN DALAM

PENDIDIKAN

Pengertian dan sejarah perkembangan instrumen pengukuran dalam

pendidikan Teori Klasik dan Item Response Theory

Oleh:

Eddy Fadillah Safardan (No.Reg 7816140554)

Gama Santosa (No.Reg 7816140550)

Maria Ulfah (No.Reg 7816140563)

Ryka Kaswati (No.Reg 7816140558)

Wulan Sukmawati (No.Reg 7816140551)

PROGRAM PASCASARJANA PENELITIAN DAN EVALUASI PENDIDIKAN

UNIVERSITAS NEGERI JAKARTA 2014/2015

KATA PENGANTAR

Puji syukur penulis panjatkan ke hadirat Allah Swt, Tuhan Yang Maha

Esa yang telah melimpahkan rahmat dan hidayah-Nya sehingga dapat menyusun

makalah ini.

Makalah ini berupa pembahasan mengenai Pengantar Teori

Pengukuran dalam Pendidikan: pengertian dan sejarah perkembangan instrumen

pengukuran dalam pendidikan Teori Klasik dan Item Response Theory (pengenalan).

Makalah ini disusun dalam rangka untuk memenuhi tugas mata kuliah Teori Tes

Klasik program pasca sarjana, program studi Penelitian dan Evaluasi Pendidikan

(PEP), Universitas Negeri Jakarta (UNJ).

Pembahasan dalam makalah ini penulis ambilkan dari berbagai sumber

antara lain: buku-buku yang disarankan, jurnal artikel dan materi-materi dari hasil

unduhan di media internet.

Penulis menyadari bahwa tersusunnya makalah ini atas bantuan

berbagai pihak dan masih sangat sederhana, oleh karena itu pada kesempatan ini

penulis menyampaikan penghargaan dan terima kasih kepada semua pihak yang

tidak dapat penulis sebutkan satu persatu dalam penulisan makalah ini dan semoga

semua amal baik mereka menjadikan pahala dihadapan Allah Swt. Untuk itu saran

dan kritik yang bersifat membangun sangat penulis harapkan guna

penyempurnaan.

Akhirnya penulis berharap semoga makalah ini bermanfaat dan dapat

memenuhi tugas dalam menempuh mata kuliah Pengukuran dalam Pendidikan.

BAB I

PENDAHULUAN

A. LATAR BELAKANG

Pengukuran dalam Pendidikan merupakan mata kuliah yang membahas teori,

konsep, dan metodologi pengukuran dalam pendidikan untuk memahami, melatih

keterampilan, mampu menggunakan dan mengembangkan pengetahuan serta

membentuk sikap positif mahasiswa dalam pengukuran dalam pendidikan. Ruang

lingkup pengukuran pendidikan meliputi pengukuran kognitif, nonkognitif/afektif

dan psikomotorik.

Menurut Morgan dan Brown dalam Erawan (2009) tujuan utama dari suatu

penilaian secara formatif adalah memberikan informasi kepada peserta tes tentang

kekuatan (strengths) dan kelemahan (weaknesses) mereka. Penilaian formatif

berfokus pada penyediaan umpan balik kepada peserta tes agar dapat memperbaiki

cara belajar dan kinerja mereka. Penilaian formatif memiliki kemampuan untuk

memperkaya pengalaman belajar serta memperbaiki kinerja peserta tes.

Penyusunan tes pada umumnya menggunakan teori tes klasik (CTT=Classical Test

Theory). Tetapi sejak awal tahun 1970 Item Response Theory (IRT) telah menggeser

popularitas CTT.. Pengukuran kemampuan dengan menggunakan metode IRT lebih

akurat dibandingkan dengan metode CTT karena tidak bergantung kepada

kemampuan sampel peserta tes.

B. TUJUAN

Makalah ini disusun memiliki tujuan antara lain sebagai berikut:

1. Untuk meningkatkan kompetensi menulis makalah bagi mahasiswa program

pascasarjana.

2. Untuk meningkatkan kompetensi bagi mahasiswa program pascasarjana

mengenai Pengantar Teori Pengukuran dalam Pendidikan

3. Untuk memenuhi tugas menyusun makalah mata kuliah Pengukuran dalam

Pendidikan program pascasarjana jurusan Penelitian dan Evaluasi Pendidikan

(PEP) Universitas Negeri Jakarta (UNJ)

BAB II

ISI

A. SEJARAH PENGUKURAN

Pada zaman dahulu orang menggunakan aanggota tubuh sebagai satuan

pengukuran, misalnya jari, hasta, kaki , jengkal , depa, langkah dan lain-lain. Satuan-

satuan tersebut bukan merupakan satuan baku, sehingga akan menyulitkan bila

digunakan dalam komunikasi. Contoh : Seorang A ingin memesan sebuah meja

kepada pengrajin B dengan panjang 3 hasta dan tinggi 1 kaki. Apakah panjang hasta

dan kaki pemesan A dan pengrajin B sama ?

Hasil pengukuran baru bermanfaat bila menggunakan satuan pengukuran

yang baku, yaitu satuan pengukuran yang nilainya tetaqp dan disepakati oleh

semua orang untuk dipakai sebagai pembanding.Contoh : galon, yard, inchi adalah

beberapa contoh satuan ukuran dalam sistem Inggris. Setelah tahun 1700,

sekelompok ilmuwan menggunakan sistem ukuran, dikenal dengan nama Sistem

Metrik. Pada tahun 1960, sistem Metrik dipergunakan dan diresmikan sebagai

Sistem Internasional (SI). Penamaan ini berasal dari bahasa Perancis Le Systeme

Internationale d’Unites.Dalam satuan SI setiap jenis ukuran memiliki satuan dasar,

contoh : panjang memiliki satuan dasar meter.

1. Sejarah Tes Intelegensi

Pada abad XIV, di cina, telah berlangsung usaha untuk mengukur

kompetensi para pelamar jabatan pegawai negara. Untuk dapat diterima sebagai

pegawai, para pelamar harus mengikuti ujian, ujian tertulis mengenai pengetahuan

konvusion klasik dan mengenai kemampuan menulis puisi. Ujian ini berlangsung

sehari semalam di tingkat distrik. Kurang dari 7% pelamar yang biasanya lulus

tingkat distrik kemudian harus mengikuti ujian berikutnya yang berupa menulis

prosa dan sajak. Dalam ujian ke 2 ini kurang dari 10% peserta yang lulus. Akhirnya

barulah ujian tingkat akhir diadakan di Peking dimana diantara para peserta

terakhir ini hanya lulus 3% saja. Lulusan ini kemudian diangkat menjadi mandarin

dan bekerja sebagai pegawai negara. Dengan demikian dari ke 3 tahap ujian

tersebut hanya 5 diantara 100.000 pelamar yang akhirnya menjadi mandarin.

Di Indonesia testing belum merupakan suatu gerakan nasional, testing

sebagai suatu gerakan nasional dicontohkan dengan baik di Amerika Serikat. Di

Amerika gerakan testing psikologis berkembang sejak awal abad 19, karena

kebutuhan untuk adanya instrumen pengukuran kemampuan orang sebagai akibat

dari perkembangan idustri. Dunia industri dan dunia usaha membutuhkan tenaga

terampil dengan bakat dan kemampuan yang cocok untuk menjalankan mesin-

http://kuliahdi.blogspot.com/search/label/Negara

http://dahlanforum.wordpress.com/tag/industri/

mesin dan melakukan pekerjaan-pekerjaan usaha modern demi efisiensi dan

produktivitas. Perang dunia I juga memerlukan tenaga militer dengan kemampuan

yang diidentifikasi secara cepat untuk ditempatkan atau menjadi tenaga di bagian-

bagian yang ada seperti artileri, infantri, penerbang nakhoda, dan sebagainya.

Di Amerika, usaha pertama tersebut dimulai oleh tokoh pencetus istilah

“tes mental”, James Mckeen Cattell (1860-1944), yang menerbitkan bukunya

mental tes and measuremens di tahun 1890. buku ini berisi serangkaian tes

intelegensi yang terdiri atas 10 jenis ukuran. Ke 10 macam ukuran tersebut adalah:

1. Dinamo meter peasure, yaitu ukuran kekuatan tangan menekan pegas yang

dianggap sebagai indikator aspek psikofisiologis

2. Rate of movement, yaitu kecepatan gerak tangan dalam satuan waktu

tertentu yang dianggap memiliki komponen mental didalamnya.

3. Sensation areas, yaitu pengukuran jarak terkecil diantara 2 tempat yang

terpisah dikulit yang masih dapat dirasakan sebagai 2 titik berbeda.

4. Peasue caosing pain, yaitu pengukuran yamg dianggap berguna dalam

diaknosis terhadap penyakit saraf dan dalam mempelajari status kesadaran

abnormal.

5. Least noticabele difference in weight, yaitu pengukuran perbedaan berat

yang terkecil yang masih dapat dirasakan seseorang.

6. Reaction time for sound, yang mengukur waktu antara pemberian stimulus

dengan timbulnya reaksi tercepat.

7. Time for naming colors, yang dimaksudkan sebagai ukuran terhadap proses

yang. lebih”mental”daripada waktu-reaksi yang dianggap reflektif.

8. Bisection of a 50-cm line, yang dianggap sebagai suatu ukuran terhadap

akurasi “ space judgment’

9. Judgment of 10second time, yang dimaksudkan sebagai ukuran akurasi dalam

‘time judgment’( subyek diminta menghitung 10 detik tanpa bantuan

apapun).

10. Number of latters repeated upon once hearing, yang dimaksudkan sebagai

ukuran terhadap perhatian dan ingatan( subyek diminta mengulang huruf

yang sudah disebutkan 1x)

2. Latar Belakang Tes Intelegensi

1. E. Seguin (1812 – 1880) disebut sebagai pionir dalam bidang tes intelegensi

yang mengembangkan sebuah papan yang berbentuk sederhana untuk

menegakkan diagnosis keterbelakangan mental. Kemudian usaha ini

distandanisir oleh Henry H. Goddard (1906). E. Seguin digolongkan kepada

salah seorang yang mengkhususkan diri pada pendidikan anak terkebelakang

dan disebut juga bapak dari tes performansi.

2. Joseph Jasnow (1863 – 1944) adalah merupakan salah satu dari beberapa

orang yang pertama kali mengembangkan daftar norma-norma dalam

pengukuran psikologis.

3. G.C. Ferrari (1896) mempublikasikan tes yang bisa dipakai untuk

mendiagnosis keterbelakangan mental.

4. August Oehr mengadakan penelitian inhmetasi antara berbagai fungsi

psikologis (h. 14).

5. E. Kraepelin, seorang psikotes menyokong usaha ini, empat macam tes yang

dikembangkan, di antaranya yaitu: Koordinasi motoric , Asosiasi kata-kata ,

Fungsi persepsi , Ingatan

6. Dan E. Kraepelin juga mengembangkan tes intelegensi yang berkaiatan

dengan tes penataran aritmatik dan kalkulasi sederhana tahun 1895. Di

samping itu berkembang pula tes yang dipakai untuk kelompok (group). Hal

ini diawali dengan tes verbal untuk seleksi tentara (wajib militer) yang

disebut dengan Army Alpha. Untuk yang buta huruf atau tidak bisa berbicara

bahasa Inggris dipergunakan Army Beta sekitar tahun 1917 – 1918, tes ini

dipakai hampir dua juta orang.

B. DEFINISI PENGUKURAN, PENILAIAN DAN EVALUASI

Dalam praktek pendidikan saat ini masih sering terjadi kerancuan dalam

mendefinisikan istilah “evaluasi”, “ penilaian” dan “ pengukuran”. Hal ini terjadi

karena ketiga istilah tersebut memang terkait satu sama lain. Berikut ini penjelasan

mengenai evaluasi, penilaian dan pengukuran. 1. Pengukuran ( Measurement)

Pengukuran yang dalam bahasa inggir dikenal dengan measurement adalah

suatu kegiatan yang dilakukan untuk mengukur dalam arti memberi angka

terhadap sesuatu yang disebut objek pengukuran atau objek ukur. Mengukur

pada hakekatnya adalah pemasangan atau korespondensi 1-1 antara angka yang

diberikan dengan fakta dan diberi angka atau diukur (Djali, 2007). Dapat

diartikan juga sebagai proses memasang fakta – fakta suatu objek dengan

satuan- satuan ukuran tertentu. Secara konseptual angka-angka hasil

pengukuran pada dasarnya adalah kontinum yang bergerak dari satu kutub ke

kutub yang lain misalnya dari angka 0 sampai 100 atau dari negatif ke positif.

Evaluasi dan penilaian dapat bersifat kualitatif, maka pengukuran selalau

bersifat kuantitatif. Alat yang dipergunakan dalam pengukuran dapat berupa

alat yang baku secara internasional seperti meteran, timbangan dan sebagainya,

serta dapat pula berupa alat yang dibuat dan dikembangkan sendiri dengan

mengikuti proses pengembangan atau pembakuan instrumen.

2. Penilaian ( Assesment )

Penilaian merupakan suatu tindakan atau proses menentukan nilai suatu objek

yang dapat dilakukan berdasarkan hasil pengukuran atau dapat pula dipengaruhi

oleh hasil pengukuran. Penilaian adalah suatu proses membandingkan objek

atau gejala dengan menggunakan patokan-patokan tertentu seperti baik tidak

baik, memadai tidak memadai memenuhi syarat tidak memenuhi syarat dan

sebagainya ( Djali, 2007 )

3. Evaluasi ( Evaluation )

Menurut Gorlun dalam Djali (2007) evaluasi adalah suatu proses yang sistematis

untuk menentukan atau mengambil keputusan, sampai sejauh mana tujuan

program telah tercapai. Pendapat yang sama juga dikemukakan oleh Wringstone

dalam Djali ( 2007 ) bahwa evaluasi pendidikan adalah penaksiran terhadap

pertumbuhan dan kemajuan siswa ke arah tujuan atau nilai-nilai yang telah

ditetapkan kurikulum.

Evaluasi juga dapat di artikan sebagai proses menilai suatu berdasarkan kriteria

atau tujuan yang telah di tetapkan yang selanjutnya diikuti dengan pengambilan

keputusan atau objek yang dievaluasi ( Djali, 2007 ).

Berdasarkan beberapa pengertian evaluasi, penilaian dan pengukuran yang

dikemukakan secara rinci penjelasan mengenai perbedaan pengukuran,

penilaian dan evaluasi dapat dilihat dari tabel 1 berikut.

Tabel 1. Hasil Ujian Mata Kuliah Tes dan Pengukuran

Peserta Skor Nilai Keputusan

Lovi 87 A Lulus amat baik

Wanda 98 A Lulus amat baik

Gina 78 B Lulus baik

Amu 88 A Lulus amat baik

Keterangan

1. Skor merupakan hasil kegiatan pengukuran

2. Nilai adalah penilaian

3. Keputusan adalah hasil evaluasi

Objek-objek pengukuran dalam bidang pendidikan ialah

a. Prestasi atau hasil belajar

b. Sikap

c. Motivasi

d. Intelegensi

e. Bakat

f. Kecerdasan emosional

g. Minat

h. Kepribadian

PENGERTIAN DAN JENIS-JENIS INSTRUMEN

Secara umum instrumen adalah suatu alat yang memenuhi persyaratan

akademik, sehingga dapat dipergunakan sebagai alat untuk mengukur suatu objek

ukur atau mengumpulkan data mengenai suatu variabel. Dalam bidang pennelitian,

instrumen diartikan sebagai alat untuk mengumpulkan data mengenai variabel-

variabel penelitian untuk kebutuhan penelitian, sednagkan dalam bidang

pendidikan instrumen digunakan untuk mengukur prestasi belajar siswa, faktor-

faktor yang diduga mempunyai hubungan atau berpengaruh terhadap hasil belajar,

perkembangan hasil belajar siswa, keberhasilan proses belajar, perkembangan hasil

belajar siswa, keberhasilan proses belajar mengajar guru dan keberhasilan

pencapaian suatu program tertentu.

Pada dasarnya instrumen dapat dibagi dua yaitu tes dan non tes. 1. Tes

Secara umum tes diartikan sebagai alat yang dipergunakan untuk mengukur

atau penugasan objek ukur terhadap seperangkat konten dan materi tertentu.

Menurut sudijono (1996), tes adalah alat atau prosedur yang diperguanakan dalam

rangka pengukuran dan penilaian. Menurut Djali ( 2007 ) fungsi tes adalah sebgai

berikut : - sebagai alat ukur unutk mengukur prestasi belajar siswa

- motivator dalam pembelajaran

- untuk upaya perbaikan kualitas pembelajaran

- menentuka berhasil atau tidaknya siswa sebagai syarat untuk melanjutkan

pendidikan pada jenjang yang lebih tinggi

2. Non Tes

Instrumen non tes dapat berupa wawancara, observasi, angket, pemerikasaan

dokumen

C. TEORI TES KLASIK DAN TEORI RESPON BUTIR

Pengukuran dalam pendidikan tidak dapat dipisahkan dari pengukuran

kemampuan peserta didik. Kemampuan peserta didik dapat diukur dengan

menggunakan alat ukur (tes). Pengukuran dalam pendidikan meliputi pengukuran

kemampuan peserta tes dan pengukuran karakteristik alat ukur yang digunakan.

Ada dua teori pengukuran yang sampai saat ini masih dikembangkan, yaitu teori tes

klasik dan teori tes modern. Teori tes klasik disebut juga classical test theory (CTT) ,

sedang teori tes modern disebut juga item response theory (IRT) .

a. Teori tes klasik / classical test theory (CTT)

1. Definisi

Teori tes klasik atau yang dalam bahasa inggrisnya adalah Classical Test

Theory (CTT) disebut demikian karena unsur-unsur teori itu sudah

dikembangkan dan diaplikasikan sejak lama, namun tetap bertahan. Oleh

karena itu teori ini dianggapsebagai hasil karya klasik. Teori tes klasik tidak

tersusun sekali jadi, melainkan berkembang sedikit demi sedikit melalui

unsur-unsur yang kemudian secara akumulatif merupakan bangunan teori

yang utuh. Inti teori tes klasik itu berupa asumsi-asumsi yang dirumuskan

secara matematis. Modelnya disebut model skor murni (true score model).

Ada tujuh macam asumsi dalam teori tes klasik, seperti yang akan disajikan

secara ringkas berikut ini, disarikan dari Allen & Yen (1979).

2. Asumsi-asumsi dalam Teori Tes Klasik

Asumsi 1: �� = �∗ + ��.............................................................. (1)

Skor perolehan atau skor tampak (��) terdiri dari skor murni (�∗) dan skor

kesalahan (��). Jadi skor yang diperoleh dari sesuatu pengukuran pada

umumnya tidak menunjukkan keadaan yang sebenarnya. Skor perolehan

pada umumnya meleset dari menampilkan secara tepat besaran atribut

yang diukur. Melesetnya skor perolehan dari keadaan yang sebenarnya

yaitu skor murni merupakan kesalahan pengukuran (error of

measurement). Skor murni dianggap tetap, sedang skor kesalahan terjadi

secara rambang, baik ke atas maupun ke bawah. Sebenarnya yang

diperlukan adalah skor murni, yaitu skor yang mencerminkan secara tepat

besaran atribut yang diukur, namun pada umumnya tidak ada jalan untuk

mengetahui skor murni itu secara langsung. Skor murni hanya dapat

diketahui secara tidak langsung melalui galat (kesalahan) baku pengukuran

(standard error of measurement).

Asumsi 2: ε(��)= �∗.................................................................. (2)

Nilai harapan skor perolehan (ε(��)) sama dengan skor murni. Asumsi 2 ini

merupakan definisi skor murni (�∗). Skor murni itu adalah nilai rata-rata

skor perolehan teoretis sekiranya dilakukan pengukuran berulang-ulang

sampai tak terhingga terhadapseseorang dengan menggunakan alat ukur

yang sama. Syarat pokok dalam pengukuran ulang itu adalah hasil

pengukuran yang satu harus bebas dari hasil pengukuran yang lain.

Asumsi 3: ρ�.∗��0.............................................................. (3)

Skor murni dan skor kesalahan yang dicapai oleh suatu populasi subjek

pada suatu tes tidak berkorelasi satu sama lain. Jadi tidak ada hubungan

sistematik antara skor murni dan skor kesalahan. Subjek yang tinggi skor

murninya tidak mesti mempunyai skor kesalahan baik positif maupun

negatif yang lebih tinggi dibanding subjek yang rendah skor murninya.

Asumsi 4: ρx��x�� = 0.............................................................. (4)

Skor-skor kesalahan pada dua tes yang dimaksud untuk mengukur dua hal

yang sama, tidak saling berkorelasi. Asumsi ini akan tidak terpenuhi

sekiranya skor perolehan dipengaruhi oleh kondisi testing, seperti misalnya

kelelahan, efek latihan, suasana hati, atau faktor-faktor dari lingkungan.

Universitas Sumatera Utara

Asumsi 5: ρx��x∗� = 0 ............................................................... (5)

Jika ada dua tes yang dimaksudkan untuk mengukur atribut yang sama,

maka skor-skor kesalahan pada tes 1 (x��) tidak berkorelasi dengan skor-

skor murni pada tes 2 (x∗�).

Asumsi 6:

Jika dua perangkat tes yang dimaksudkan mengukur atribut yang sama

mempunyai skor perolehanx� dan x�′ yang memenuhi asumsi-asumsi 1

sampai 5, dan jika untuk setiap populasi subjek X*=X*’ danσ��,σ�

�� maka

kedua tes itu disebut tes paralel. Jadi dua perangkat tes akan merupakan

tes paralel jika skor-skor suatu populasi yang menempuh kedua tes itu skor

murninya sama (X*=X*’) dan varians skor-skor kesalahannya sama (σ��, σ�

��).

Asumsi 7:

Jika dua perangkat tes yang dimaksudkan untuk mengukur atribut yang

sama mempunyai skor-skor perolehan x�� dan x�� yang memenuhi

asumsi-asumsi 1 sampai 5, dan apabila untuk setiappopulasi subjek

x∗� = x∗�+ C��, dimana C�� adalah suatu konstanta, maka kedua

perangkat tes itu disebut tes-tes yang setara (equivalent test).

Pada pengukuran klasik ciri yang unik diperlihatkan dari kenyataan

bahwa kelompok butir tes atau kelompok angket (kuesioner) tidak dapat

dipisahkan dari kelompok peserta tes atau kelompok yang mengisi angket.

Artinya, kelompok butir tes/angket (kuesioner) yang sama harus dijawab

oleh kelompok peserta tes yang sama. Jika kelompok tes yang sama dijawab

kelompok peserta uji tes yang berbeda maka ciri karakteristik kelompok

butir itu akan berubah, sehingga taraf kesukaran dan daya pembeda

kelompok butir tes itu akan berubah semata-mata karena kelompok butir

tes tersebut ditanggapi oleh kelompok peserta yang berbeda. Menurut

Setiadi (1998: 6) bahwa dalam teori klasik, statistik soal, misalnya indeks

kesukaran soal tergantung pada sampel pengikut ujian. Kalau tes tersebut

dikerjakan oleh siswa yang pandai maka soal-soal itu sepertinya mudah

atau tingkat kesukaran soalnya menjadi besar, dan sebaliknya kalau

dikerjakan oleh siswa yang kurang pandai maka soal itu sepertinya sukar

atau tingkat kesukaran soal menjadi kecil. Jadi, soal-soal itu tidak konsisten

atau berubah-ubah tergantung pada kemampuan kelompok sampel siswa

yang menempuh ujian.

Kemampuan responden bergantung kepada taraf sukar butir. Mereka

yang mengerjakan butir sukar akan tampak berkemampuan rendah

sedangkan mereka yang mengerjakan butir mudah akan tampak

berkemampuan tinggi. Teori pengukuran klasik (teori ujian klasik) tidak

dapat digunakan untuk pencocokan kemampuan responden dengan taraf

sukar butir (karena mereka dependen). Pada teori klasik, terdapat

interdependensi di antara kemampuan responden dan taraf sukar butir.

3. Kelemahan dan Kelebihan Teori Klasik

Menurut para ahli, ada beberapa kelemahan yang ada pada pendekatan

teori klasik. Beberapa di antaranya adalah Hambleton, dkk (1991) dan Lord

(1980). Mereka menjelaskan bahwa kelemahan-kelemahan tes teori klasik

adalah:

(1) statistik butir tes sangat tergantung pada karakteristik subjek yang dites;

(2) taksiran kemampuan peserta tes sangat tergantung pada butir tes yang

diujikan;

(3) kesalahan baku penaksir skor berlaku untuk semua peserta tes, sehingga

kesalahan baku pengukuran tiap peserta dan butir soal tidak ada;

(4) informasi yang disajikan terbatas pada menjawab benar atau salah saja

tidak memperhatikan pola jawaban peserta tes; dan (5) asumsi tes paralel

susah dipenuhi.

Walaupun teoriklasik ini memiliki beberapa kelemahan namun masih

banyak yang menggunakan karena mempunyai kelebihan yaitu tidak

menuntut responden besar (lebih 100) dan mudah mengaplikasikannya

(melakukan analisis butir dengan pendekatan klasik ini). Oleh karenanya,

untuk pengukuran yang melibatkan responden kecil misal pada pengukuran

melalui tes harian pada bidang pendidikan, atau pengukuran pada bidang

psikologi pada umumnya masih menggunakan pendekatan teori tes klasik.

b. Teori tes modern / item response theory (IRT)

Untuk mengatasi kelemahan -kelemahan yang ada pada teori klasik, para ahli

pengukuran berusaha untuk mencari alternatif. Model yang diinginkan harus

mempunyai sifat-sifat:

(1) karakteristik butir tidak tergantung kepada kelompok peserta tes yang dikenai

butir soal tersebut,

(2) skor yang menyatakan kemampuan peserta tes tidak tergantung pada tes,

(3) model dinyatakan dalam tingkatan (level) butir soal, tidak dalam tingkatan tes,

(4) model tingkat tidak memerlukan tes paralel untuk menghitung koefisien

reliabilitas, dan

(5) model menyediakan ukuran yang tepat untuk setiap skor kemampuan

(Hambleton, Swaminathan, & Rogers, 1991: 5). Model alternatif yang dapat

mempunyai ciri-ciri itu adalah model pengukuran yang disebut teori respon butir (

Item Response Theory).

1. Definisi

Teori tes modern atau biasa disebut dengan teori respon butir ( item

response theory) dikembangkan oleh para ahli pengukuran bidang psikologi

dan pendidikansebagai upaya meminimalkan kekurangan -kekurangan yang

ada dalam teori tes klasik. Perhitungan dalam analisis butir berdasarkan teori

ini dapat dilakukan denganmenggunakan bantuan program komputer.

Sebagaimana halnya dalam teori klasik, dalam teori respon butir juga

didasarioleh postulat dasar. Ada dua postulat dasar dari teori tes modern

(Hambelton, Swaminathan &Rogers, 1991: 7), yaitu: (1) hasil kerja seorang

peserta tes pada suatubutir soal dapat diprediksikan (atau dijelaskan) dari

suatu jenis faktor -faktor yang disebut sifat-sifat, sifat –sifat laten, atau

kemampuan; (2) hubungan antara hasil kerja peserta tespada suatu butir tes

dengan sifat -sifat yang mendasarinya dapat dideskripsikan oleh fungsi yang

meningkat yang bersifat monotonic yang disebut dengan fungsi

karakteristikbutir (item characteristic function atau item charact eristic curve -

ICC). Fungsi inimenje1askan, jika taraf sifat -sifat (kemampuan) meningkat,

maka probabilitas menjawab benar pada suatu butir tes juga meningkat.

2. Asumsi-asumsi Teori Tes Modern

Sebagaimana halnya dalam teori tes klasik, dalam teori respon butir juga

mengandung asumsi-asumsi yang mendasarinya, yaitu: (a)

Unidemensionalitas, (b)Independensi lokal, dan (c) Fungsi karakteristik butir

menyatakan hubungan yang sebenarnya antara variabel yang tak terobservasi

(yaitu kemampuan) dengan variabel terobservasi (yaitu respon butir)

(Hambleton., Swaminathan, & Rogers, 1991: 9; Surabrata, 2000: 28). Asumsi

unidemensionalitas dan independensi lokal dapatdijelaskan sebagai berikut.

Asumsi unidemensionalitas menyatakan bahwa hanya satu kemampuan

yangdiukur oleh sekumpulan butir -butir soal dalam suatu tes. Asumsi ini pada

praktik sukar dipenuhi, sebab terdapat banyak faktor yang dapat

mempengaruhi hasil suatu tes. Faktor -faktor tersebut antara lain tingkat

motivasi, kecemasan, kemampuan untuk bekerja cepat, dan keterampilan

kognitif lain diluar kemampuan yang diukur oleh sekumpulan butir soal dalam

suatu tes. Hal yang dimaksud dengan unidemensionalitas dalam hal ini adalah

adanya faktor -faktor dominan yang mempengaruhi hasil suatu tes. Faktor -

faktor dominanitulah yang disebut kemampuan yang diukur oleh suatu tes.

Asumsi independensi lokal menyatakan bahwa sikap kemampuan

yangmempengaruhi suatu tes adalah konstan, maka respon peserta tes pada

setiap pasang butirsoal adalah independen secara statistik. Dengan kata lain,

asumsi independensi lokalmenyatakan bahwa tidak ada korelasi antara respon

peserta tes pada butir soal yangberbeda. Hal ini juga berarti bahwa

kemampuan yang dinyatakan dalam model adalahsatu-satunya faktor yang

mempengaruhi respon peserta tes pada butir-butir soal.

Untuk mengatasi kelemahan pada pengukuran klasik, penggunaan IRT

yakni untuk menganulir ketidakterpisahan antara kelompok peserta tes

dengan kelompok butir tes. Artinya, prinsip pengukuran modern adalah

penetapan ciri butir, walaupun ciri peserta tes berbeda. Dengan kata lain, ciri

dari kelompok butir adalah tetap walaupun dijawab peserta tes yang berbeda.

Dengan demikian berlaku pula bahwa ciri peserta akan tetap sama, walaupun

mereka menjawab butir tes yang berbeda. Pada IRT, peluang jawaban benar

yang diberikan siswa, ciri atau parameter butir, dan ciri atau parameter

peserta tes dihubungkan melalui suatu model formula yang harus ditaati baik

oleh kelompok butir tes maupun kelompok peserta tes (Hambleton & Rogers,

1991). Artinya, butir yang sama terhadap peserta tes yang berbeda harus

tunduk pada aturan rumus itu, atau peserta tes yang sama terhadap butir tes

yang berbeda juga harus patuh terhadap rumus tersebut. Dalam proses

semacam ini terjadilah apa yang disebut invariansi di antara butir tes dan

peserta tes. Pada pengukuran modern, taraf sukar butir tidak dikaitkan

langsung dengan kemampuan responden.

3. Kelemahan dan kelebihan Teori Modern

Teori tes modern sudah berkembang dibeberapa negara yang sudah

maju. Kemajuan teknologi seperti ditemukannya komputer telah memberikan

dampak dalam pengembangan teori tes modern. Kelebihannya antara lain :

1. Proses penghitungan hasil penskoran peserta tes dengan menggunakan

teori tes modern lebih kompleks dari pada menggunakan tes klasik.

2. IRT merupakan teori pengukuran yang dikembangkan untuk

menjelaskan secara lebih lengkap mengenai bagaimana gambaran

fungsi dari sebuah aitem

Berbeda dengan pendekatan teori tes klasik, kelemahan IRT adalah

membutuhkan jumlah data yang besar dan sampel yang beragam dalam

menerapkan model matematikanya untuk mengestimasi aitem (Embretson

& Reise dalam Anastasi & Urbina, 2007).Hal ini menunjukkan kelemahan

dari IRT yang tidak praktis dan model matematiknya rumit dibandingkan

dengan teori tes klasik.

BAB III

KESIMPULAN

Pengukuran (measurement) adalah suatu kegiatan yang dilakukan untuk

mengukur dalam arti memberi angka terhadap sesuatu yang disebut objek

pengukuran atau objek ukur.

Penilaian merupakan suatu tindakan atau proses menentukan nilai suatu objek

yang dapat dilakukan berdasarkan hasil pengukuran atau dapat pula dipengaruhi

oleh hasil pengukuran.

Evaluasi adalah suatu proses yang sistematis untuk menentukan atau

mengambil keputusan, sampai sejauh mana tujuan program telah tercapai.

instrumen adalah suatu alat yang memenuhi persyaratan akademik, sehingga

dapat dipergunakan sebagai alat untuk mengukur suatu objek ukur atau

mengumpulkan data mengenai suatu variabel. Instrumen dapat dibedakan

menjadi tes dan non tes

Inti teori tes klasik itu berupa asumsi-asumsi yang dirumuskan secara

matematis. Modelnya disebut model skor murni (true score model).

Untuk mengatasi kelemahan pada pengukuran klasik, penggunaan IRT yakni

untuk menganulir ketidakterpisahan antara kelompok peserta tes dengan

kelompok butir tes.

Daftar Pustaka

Allen, M.J. & Yen, W.M. 1979. Introduction to measurement theory. Monterey, CA: Brooks/Cole Publishing Company.

Badrun Kartowagiran. 2002. Pengantar Teori Klasik . Makalah. Disampaikan pada Pelatihan penulisan analisis butir dengan pendekatan TTK dan TRB, di UNY Yogyakarta, 11-12 April 2009.

Djali dan Muljono. 2007. Pengukuran dalam Bidang Pendidikan . Jakarta: Grasindo.

Erawan, Lalang dan Santosa, Stefanus. Teknologi Informasi, Computer – Adaptive Test Dengan Pendekatan Item Response Theory Satu Parameter, Jurnal Teknologi Informasi Volume 5 Nomor 2, ISSN 1414-9999, 2009.

Gronlund, Norman. E. 1985. Measurement and Evaluation in Teaching. New York: Macmillan Publishing Company.

Hambleton, Ronald K; Swaminathan, H; dan Jane Rogers, H. 1991. Fundamentals of Item Response Theory. London: SagePublications.

Purnomo, Bambang. 2011. Teori Tes Klasik. Artikel. Sumber : http://karyatulisilmiahguru.blogspot.com/2011/11/teori-tes-klasik.html/ tanggal 19 September 2014

Sudaryono. 2013. Implementasi Teori Responsi Butir (Item Response Theory) Pada Penilaian Hasil Belajar Akhir di Sekolah. Artikel. Sumber : http://sudaryono.ilearning.me/2013/01/18/implementasi-teori-responsi-butir-item-response-theory-pada-penilaian-hasil-belajar-akhir-di-sekolah/ tanggal 19 September 2014.

http://karyatulisilmiahguru.blogspot.com/2011/11/teori-tes-klasik.html/

http://sudaryono.ilearning.me/2013/01/18/implementasi-teori-responsi-butir-item-response-theory-pada-penilaian-hasil-belajar-akhir-di-sekolah/

http://sudaryono.ilearning.me/2013/01/18/implementasi-teori-responsi-butir-item-response-theory-pada-penilaian-hasil-belajar-akhir-di-sekolah/

Kelompok 1 Pengantar Teori Klasik Dan Item Response Theory

Documents

Transcript of Kelompok 1 Pengantar Teori Klasik Dan Item Response Theory