Penyetaraan Peranmengkat Tes Matematika Smp

47
KATA PENGANTAR Segala puji dan syukur penulis panjatkan ke hadirat Allah Subhanahuwata’ala yang telah melimpahkan taufiq dan hidayah-Nya sehingga penulisan tesis ini dapat diselesaikan dalam waktu yang tepat, sesuai dengan jadwal yang direncanakan. Tesis ini ditulis untuk memenuhi sebagian persyaratan dalam rangka penyelesaian study dan mendapat-kan gelar magister pendidikan, pada Program Pascasarjana IKIP Yogyakarta. Dalam penelitian dan penulisan tesis ini penelitian banyak mendapat bantuan dan sumbangan pemikiran dari berbagai pihak. Untuk itu, pada kesempatan ini dengan setulus hati penulis menyampaikan ucapan terima kasih dan penghargaan yang setinggi-tingginya kepada : 1. Bapak DR. Djemari Mardapi dan Bapak DR. Moh. Amien, selaku tim komisi pembimbing, yang dengan kesungguhan dan kesabaran serta penuh kerelaan telah memberikan bimbingan dan arahan yang sangat berharga dan berguna bagi peniliti, dalam rangka pelaksanaan penelitian dan penulisan tesis ini hingga selesai. 2. Bapak rektor dan bapak Ketua Program Pascasarjana IKIP Yogyakarta beserta staff akademik dan administrasi, yang telah memberikan berbagai kemudahan dalam urusan administrasi dan penggunaan fasilitas, sehingga segala persoalan yang menyangkut pelaksanaan penelitian dan penyusunan tesis ini dapat berjalan dengan lancar tanpa mengalami kendala yang berarti. 3. Bapak Kakanwil Depdikbud Propinsi Daerah Istimewa Aceh, yang telah memberi izin untuk mengadakan penelitian di SMP Negeri dalam wilayah Kotamadya Banda Aceh; Bapak Kakandep Dikbup Kotamadya Banda Aceh dan Kepala-kepala sekolah beserta guru- guru matematika pada sekolah SMP Negeri yang terpilih sebagai sampel, yang telah memberikan bantuan dan kemudahan, sehingga pelaksanaan pengumpulan data penelitian di setiap

Transcript of Penyetaraan Peranmengkat Tes Matematika Smp

Page 1: Penyetaraan Peranmengkat Tes Matematika Smp

KATA PENGANTARSegala puji dan syukur penulis panjatkan ke hadirat Allah Subhanahuwata’ala yang telah melimpahkan taufiq dan hidayah-Nya sehingga penulisan tesis ini dapat diselesaikan dalam waktu yang tepat, sesuai dengan jadwal yang direncanakan.

Tesis ini ditulis untuk memenuhi sebagian persyaratan dalam rangka penyelesaian study dan mendapat-kan gelar magister pendidikan, pada Program Pascasarjana IKIP Yogyakarta. Dalam penelitian dan penulisan tesis ini penelitian banyak mendapat bantuan dan sumbangan pemikiran dari berbagai pihak. Untuk itu, pada kesempatan ini dengan setulus hati penulis menyampaikan ucapan terima kasih dan penghargaan yang setinggi-tingginya kepada :

1. Bapak DR. Djemari Mardapi dan Bapak DR. Moh. Amien, selaku tim komisi pembimbing, yang dengan kesungguhan dan kesabaran serta penuh kerelaan telah memberikan bimbingan dan arahan yang sangat berharga dan berguna bagi peniliti, dalam rangka pelaksanaan penelitian dan penulisan tesis ini hingga selesai.

2. Bapak rektor dan bapak Ketua Program Pascasarjana IKIP Yogyakarta beserta staff akademik dan administrasi, yang telah memberikan berbagai kemudahan dalam urusan administrasi dan penggunaan fasilitas, sehingga segala persoalan yang menyangkut pelaksanaan penelitian dan penyusunan tesis ini dapat berjalan dengan lancar tanpa mengalami kendala yang berarti.

3. Bapak Kakanwil Depdikbud Propinsi Daerah Istimewa Aceh, yang telah memberi izin untuk mengadakan penelitian di SMP Negeri dalam wilayah Kotamadya Banda Aceh; Bapak Kakandep Dikbup Kotamadya Banda Aceh dan Kepala-kepala sekolah beserta guru-guru matematika pada sekolah SMP Negeri yang terpilih sebagai sampel, yang telah memberikan bantuan dan kemudahan, sehingga pelaksanaan pengumpulan data penelitian di setiap sekolah dapat berjalan dengan baik dan lancar sesuai dengan yang diharapkan.

4. Bapak Dosen, dan rekan-rekan mahasiswa Program Pascasarjana IKIP Yogyakarta (terutama dalam forum seminar proposal persiapan tesis), yang telah ikut memberi sumbangan pikiran dalam rangka penyempurnaan ide yang berkaitan dengan penelitian ini.

5. Istri tersayang Azwinar dan anak-anak tercinta Asrizal Luthfi, Asrul Sidiq, dan Trisna Mulyati, yang senantiasa dan tiada jemu-jemunya memberikan dorongan dan berbagai pengorbanan; juga saudara dan seluruh anggota keluarga, teristimewa orang tua peneliti, yang telah ikut memberikan motivasi dan doa restu dalam rangka penyelesaian studi.

6. Kepada semua pihak lainnya yang tidak dapat disebutkan satu persatu, yang telah ikut memberi bantuan dan sumbangan dalam berbagai bentuk, dalam rangka pelaksanaan dan penulisan hasil penelitian hingga terwujudnya tesis ini.

Page 2: Penyetaraan Peranmengkat Tes Matematika Smp

Penulis tidak dapat memberi balasan atas segala bentuk bantuan yang telah diberikan oleh semua pihak. Segalanya penulis serahkan kepada yang Maha Kuasa, semoga semua jasa baik yang telah diberikan, mendapat balasan yang setimpal daripada-Nya. Semoga hasil penelitian ini dapat bermanfaat, dalam rangka peningkatan mutu pendidikan dan pengajaran serta pengembangan sumber daya manusia, demi kemajuan masa depan bangsa yang penuh tantangan.

Yogyakarta, September 1996 Penelitian

Salasi R.

DAFTAR ISI

Page 3: Penyetaraan Peranmengkat Tes Matematika Smp

A B S T R A K ………………………………………………………………………………. iA B S T R A C T …………………………………………………………………………….. iiLEMBARAN PERSETUJUAN ……………………………………………………………... vKATA PENGANTAR ……………………………………………………………………….. viDAFTAR ISI …………………....…………………………………………………………… ixDAFTAR TABEL …………………………………………………………………………... xiDAFTAR GAMBAR ………………………………………………………………………... xiDAFTAR LAMPIRAN ……………………………………………………………………... xiv

BAB I. PENDAHULUAN ………………………………………………………………… 1A. Latar Belakang Penelitian …………………………………………………….. 1B. Identifikasi Masalah …………………………………………………………... 9C. Pembatasan Masalah …………………………………………………………... 11D. Rumusan Masalah ……………………………………………………………… 12E. Tujuan Penelitian ………………………………………………………………. 13F. Manfaat Penelitian ……………………………………………………………... 13

BAB II. KAJIAN TEORI DAN KERANGKA PEMIKIRAN ………………………… 15A. Kajian Teori ……………..…………………………………………………….. 15

1. Pengukuran dan Penilaian ………………………………………………… 152. Tes Hasil Belajar ………………………………………………………….. 18

a. Prinsip dasar tes hasil belajar …………………………………………. 18b. Bentuk dan macam-macam tes ………………………………………... 23c. Analisis butir soal ……………………………………………………… 27

3. Penyetaraan Perangkat Tes ………………………………………………... 37a. Pengertian penyetaraan ………………………………………………… 37b. Syarat-syarat penyetaraan ……………………………………………… 39c. Macam-macam penyetaraan …………………………………………… 40d. Prosedur penyetaraan …………………………………………………... 41e. Penyetaraan metode linear ……………………………………………... 43f. Standar kesalahan penyetaraan …………………………………………. 55

4. Pengajaran Matematika di SMP ……………………………………………. 57B. Kerangka Pemikiran …………………………………………………………….. 64C. Pertanyaan Penelian ……………………………………………………………... 66

BAB III. METODOLOGI PENELITIAN ………………………………………………… . 67A. Tujuan Khusus Penelitian ……………………………………………………….. 67B. Tempat dan Waktu Penelitian …………………………………………………… 67C. Populasi dan Sampel Penelitian …………………………………………………. 68

Page 4: Penyetaraan Peranmengkat Tes Matematika Smp

D. Jenis Penelitian …………………………………………………………............... 70E. Teknik Pengumpulan Data .……………………………………………………... 70F. Instrumen penelitian ……………………………………………………………... 71G. Teknik Analisis Data …………………………………………………………….. 72H. Prosedur Penelitian ………………………………………………………………. 74

BAB IV. HASIL PENELITIAN DAN PEMBAHASAN …………………………………. 77A. Hasil-hasil Penelitian …………………………………………………………….. 77

1. Hasil Ujicoba Perangkat Tes ………………………………………………… 772. Penyetaraan Perangkat Tes ………………………………………………….. 90

a. Penyeteraan perangkat tes kelas I ……………………………………….. 91b. Penyeteraan perangkat tes kelas II …………………………………….... 94c. Kesalahan pengukuran penyeteraan …………………………………….. 97

3. Kemampuan Matematika siswa SMP Kota madya Banda Aceh …………... 103B. Pembahasan Hasil Penelitian …………………………………………………… 106 C. Keterbukaan penelitian …………………………………………………………. 116

BAB V. KESIMPULAN IMPLIKASI DAN SARAN …………………………………… 118A. kesimpulan ………………………………………………………………………118B. Implikasi dan Hasil Penelitian ……………………………………………….… 121C. Saran-saran …………………….……………………………………………….. 125

DAFTAR PUSTAKA ………………………………………………………………………… 126LAMPIRAN-LAMPIRAN …………………………………………………………………… 131

DAFTAR TABEL

Page 5: Penyetaraan Peranmengkat Tes Matematika Smp

Tabel 01. Kriteria Standar Kesalahan Pengukuran dalam Menyeleksi Butir Soal Tes ……………………………………………. 36

Tabel 02. Gambaran dan Perbandingan Teknik Pelaksanaan Penyetaraan Tes pada Berbagai Rancangan …………………………… 43

Tabel 03. Angka-angka Statistik yang Diperlukan pada penyetaraan Perangkat Tes Rancangan C (TesAnchor)………………… 54

Tabel 04. Perincian Sampel Siswa dari berbagai . lh9 SMP dalam Wilayah Kotamadya Banda Aceh …………………..……………… 69

Tabel 05. Hasil Analisis Butir Soal Perangkat Tes Matematika SMP Kelas I Tipe A ………………………..…………………………… 78

Tabel 06. Hasil Analisis Butir Soal Perangkat Tes Matematika SMP Kelas I Tipe A ………………………..…………………………… 79Tabel 07. Hasil Analisis Butir Soal Perangkat Tes Matematika SMP Kelas I Tipe B ………………………..…………………………… 80Tabel 08. Hasil Analisis Butir Soal Perangkat Tes Matematika SMP Kelas II Tipe A ………………………..…………………………… 81Tabel 09. Rangkuman Hasil Analisis Butir Soal Tes Matematika SMP

Kelas I …..………………..………………………….…… 84Tabel 10. Rangkuman Hasil Analisis Butir Soal Tes Matematika SMP Kelas II ……………………..…………………………… 84Tabel 11. Perbandingan dan Perbedaan Distribusi Butir Soal pada Perangkat

X, Y, dan Z Tes Matematika Kelas I SMP ……………… 85Tabel 12. Perbandingan dan Perbedaan Distribusi Butir Soal pada Perangkat

X, Y, dan Z Tes Matematika Kelas II SMP …………… 86Tabel 13. Data Statistik Sektor Matematika Siswa Kelas I SMP Negeri

Kotamadya Banda Aceh ………………………………… 92Tabel 14. Data Statistik Sektor Matematika Siswa Kelas II SMP Negeri

Kotamadya Banda Aceh ………………………………… 95Tabel 15. Data Statistik untuk Menentukan Kesalahan Pengukuran

Penyetaraan Perangkat X dan Perangkat Y ...…………… 98Tabel 16. Kesalahan Pengukuran Penyetaraan dari Perangkat X ke

Perangkat Y Tes Matematika Kelas I ....…....…………… 99Tabel 17. Kesalahan Pengukuran Penyetaraan dari Perangkat Y ke

Perangkat Y Tes Matematika Kelas I ....…....…………… 100Tabel 18. Kesalahan Pengukuran Penyetaraan dari Perangkat X ke

Perangkat Y Tes Matematika Kelas II ...…....…………… 101

Tabel 19. Kesalahan Pengukuran Penyetaraan dari Perangkat Y ke Perangkat X Tes Matematika Kelas II …....…………… 102

Tabel 20. Data Sektor Matematika Siswa kelas I pada Beberapa SMP Negeri Kotamadya Banda Aceh ……………….... 104

Page 6: Penyetaraan Peranmengkat Tes Matematika Smp

Tabel 21. Data Sektor Matematika Siswa kelas II pada Beberapa SMP Negeri Kotamadya Banda Aceh ……………….... 105

DAFTAR GAMBAR

Gambar 1. Sketsa regresi sector perangkat Z terhadap X (a), dan sektor perangkat Z terhadap Y (b)……….... 52

Page 7: Penyetaraan Peranmengkat Tes Matematika Smp

Gambar 2. Skema manfaat dari penerapan beberapa perangkat tes yang telah disetarakan …………...……….... 65

Gambar 3. Grafik garis regresi dan distribusi pasangan sektor perangkat X dan Y hasil penyetaraan tes matematika SMP kelas I …………………………….…….... 93

Gambar 4. Grafik garis regresi dan distribusi pasangan sektor perangkat X dan Y hasil penyetaraan tes matematika SMP kelas II ...………………………….…….... 96

DAFTAR LAMPIRAN

Lampiran 01. Kisi-kisi Tes Matematika Kelas I SMP (SLTP) …………………..……… 131Lampiran 02. Kisi-kisi Tes Matematika Kelas II SMP (SLTP) ………………..……… 135Lampiran 03. Hasil Analisis Butir Soal pada Uji coba perangkat

Tes Matematika SMP Kelas I Tipe A (1A) …….………………..……… 140

Page 8: Penyetaraan Peranmengkat Tes Matematika Smp

Lampiran 04. Hasil Analisis Butir Soal pada Uji coba Perangkat Tes Matematika SMP Kelas I Tipe B (1B) …….………………..……… 147

Lampiran 05. Hasil Analisis Butir Soal pada Uji coba Perangkat Tes Matematika SMP Kelas II Tipe A …...…….………………..……… 154

Lampiran 06. Hasil Analisis Butir Soal pada Uji coba Perangkat Tes Matematika SMP Kelas II Tipe B …...…….………………..……… 161

Lampiran 07. Data sektor Matematika Siswa Kelas I SMP Negeri Kota Madya Banda Aceh yang mengerjakan Perangkat Tes Tipe A ………………………………………………………………. 168

Lampiran 08. Data sektor Matematika Siswa Kelas I SMP Negeri Kota Madya Banda Aceh yang mengerjakan Perangkat Tes Tipe B ………………………………………………………………. 171

Lampiran 09. Data sektor Matematika Siswa Kelas II SMP Negeri Kota Madya Banda Aceh yang mengerjakan Perangkat Tes Tipe A ………………………………………………………………. 174

Lampiran 10. Data sektor Matematika Siswa Kelas II SMP Negeri Kota Madya Banda Aceh yang mengerjakan perangkat Tes Tipe B ………………………………………………………………. 177

Lampiran 11. Daftar Koferensi Sektor pada Penyetaraan Perangkat Tes Matematika kelas I SMP ……………………………..…………………. 180

Lampiran 12. Daftar Koferensi Sektor pada Penyetaraan Perangkat Tes Matematika kelas II SMP ……………………………..…………………. 181

Lampiran 13. Surat-surat pengantar izin dan bukti mengadakan penelitian ……………. 182

BAB I

PENDAHULUAN

A. Latar Belakang Masalah

Page 9: Penyetaraan Peranmengkat Tes Matematika Smp

Mutu pendidikan merupakan suatu permasalahan yang sangat mendasar, yang dapat dijadikan sebagai tolok ukur tingkat kemajuan dari suatu bangsa. Pembangunan dalam bidang pendidikan di Indonesia terus mendapat perhatian yang sungguh-sungguh dari pemerintah, dengan menempuh berbagai upaya seperti membangun gedung, mengangkat tenaga pengajar (guru), penyempurnaan kurikulum, pengadaan buku dan fasilitas pengajaran, memberikan penataan atau pendidikan tambahan bagi tenaga pengajar, diberlakukan wajib belajar Sembilan tahun, serta di galakkannya sekolah unggul di berbagai daerah. Upaya-upaya yang telah dan sedang dilakukan tersebut bertujuan untuk meningkatkan mutu pendidikan dan pengajaran di setiap jenjang pendidikan, dalam rangka menciptakan sumber daya manusia Indonesia yang berkualitas.

Kemajuan dalam bidang pendidikan telah banyak dirasakan hasilnya, namun belum cukup menggembirakan. Kabalitbang Depdikbud (Wirjomartono, 1995) dalam laporannya menyatakan, bahwa dilihat dari hasil Nilai Ebtanas Murni (NEM) siswa, kualitas pendidikan di Indonesia masih memprihatinkan. Rata-rata SD, SMP dan SMA tahun pelajaran 1994/1995, untuk mata pelajaran matematika masing-masing 5,42; 3,69 dan 4,72; rata-rata NEM IPA SD dan SMP masing-masing 5,60; dan 4,80; rata-rata NEM Bahasa Inggris untuk SMP dan SMA masing-masing 4,69 dan 5,22; sedangkan rata-rata NEM fisika, kimia dan biologi ( khusus untuk SMA ) masing-masing 4,70 4,37 dan 5,53. Akhmad (1996), menyatakan bahwa rata-rata NEM SMP tahun 1994/1995 dalam keseluruhan mata pelajaran (yang di ebtanaskan) sebesar 5,27; dengan rata-rata NEM tertinggi adalah Propinsi Daerah Istimewa Aceh, rata-rata NEM sebesar 5,47. Walaupun NEM bukan merupakan satu-satunya indikator kualitas pendidikan, namun angka-angka seperti dikemukakan tersebut dapat memberi gambaran bahwa mutu pendidikan dan pengajaran di Indonesia masih cukup memprihatinkan.

Selanjutnya, Nasution (1996) menyatakan, bahwa hasil belajar rata-rata nasional amat rendah. Ia mengemukakan fakta tentang penyebaran semua ukuran pencapaian hasil belajar (NEM dan sektor total suatu ujian) di Indonesia selalu berbentuk menjulur ke kanan. Artinya, kebanyakan nilai yang dicapai siswa adalah rendah, sedang siswa yang mencapai nilai tinggi hanya sedikit. Berdasarkan data, dari semua lulusan SMA hanya kira-kira seperempatnya yang dapat dipertanggungjawabkan menjadi mahasiswa di perguruan tinggi. Nasution menegaskan pula, rendahnya tingkat pemahaman siswa disebabkan oleh tingkat pemahaman guru yang rendah (ada guru yang mengajar bukan bidangnya), dan juga disebabkan sistem seleksi (penilaian akademik) yang sangat longgar dan belum tepat.

Sehubungan dengan rendahnya mutu pendidikan seperti dikemukakan di atas, sorotan atau kritikan dari berbagai kalangan masyarakat terus bermunculan. Sorotan yang dilontarkan berkaitan dengan faktor-faktor yang menyebabkan rendahnya mutu pendidikan, seperti kualitas tenaga pengajar (guru) yang belum memadai, kurikulum yang kurang relevan, serta sistem pelaksanaan pengujian dan penilaian dirasakan masih memiliki kelemahan.

Pelaksanaan penilaian did ala kegiatan belajar mengajar, dimaksudkan untuk mendapatkan informasi tentang sejauh mana keberhasilan guru dalam menyajikan bahan pelajaran, serta sejauh mana peserta didik dapat menyerah materi yang diajarkan. Objektivitas penilaian hasil belajar yang dilakukan sangat tergantung pada kualitas dari alat ukur (tes) yang

Page 10: Penyetaraan Peranmengkat Tes Matematika Smp

digunakan. Umar (1991) menyatakan, bahwa hanya penilaian yang didasarkan kepada hasil pengukuran yang dapat dipercaya sajalah yang dapat dijadikan sebagai landasan yang kuat bagi pengambil keputusan tentang pendidikan di segala tingkatan. Selanjutnya, Thorndike & Hagen (1977) menegaskan, bahwa keputusan akan lebih sempurna apabila untuk mendapatkan informasi tersebut digunakan alat ukur yang baik, sehingga informasi yang diperoleh betul-betul objektif dan tidak bias.

Kenyataan menunjukan, bahwa seringkali terjadi pemberian nilai terhadap hasil belajar siswa tidak mencerminkan prestasi yang sebenarnya. Hal ini disebabkan terutama tes yang digunakan dalam penilaian tersebut tidak mencerminkan alat ukur yang benar-benar dapat dipercaya. Alat ukur yang digunakan kemungkinan tidak cocok, sehingga nilai yang diberikan kepada siswa lebih tinggi atau lebih rendah dari prestasi sebenarnya. Kelemahan dan ketidaktahuan guru dalam menyusun dan melaksanakan tes untuk kepentingan penilaian hasil belajar sungguh memprihatinkan. Berkaitan dengan ini, Gulliksen (1986) mengemukakan bahwa hampir 35-40 tahun belakangan ini tes buatan guru untuk kelasnya sendiri pada umumnya merosot dibandingkan membaik. Hal lain yang sering kali terjadi adalah dalam menafsirkan hasil pengukuran, dua atau beberapa perangkat tes sering diperlakukan sama, tanpa memperhatikan tingkat kesukaran perangkat tes yang digunakan. Tindakan demikian, adalah menyimpang dari teori pengukuran. Hal ini sesuai dengan pendapat Hambleton & Swaminathan (1985) yang menyatakan bahwa, sebenarnya tidak pernah dua perangkat tes mempunyai butir soal yang sama tingkat kesukarannya.

Pada teori tes klasik, besarnya skor pada perangkat tes adalah relatif, bergantung pada karakteristik peserta butir yang digunakan dan karakteristik peserta tes (Mardapi, 1991). Crocker & Algina (1986) mengemukakan, bila beberapa peserta tes diuji dengan alat ukur yang berbeda untuk mengukur kemampuan yang sama, bila distribusi skor tidak sama perlu ditentukan bentuk skor ekuivalen. Suryabrata (1987) mengatakan, bahwa dalam pelaksanaan evaluasi yang menggunakan beberapa perangkat tes perlu dilakukan penyetaraan dari beberapa perangkat tes tersebut, karena dengan penyetaraan dapat dijamain keadilan bagi peserta tes dan dapat diketahui kualitas proses belajar mengajar. Selanjutnya, Hambleton dan Swaminathan (1985), menegaskan pula bahwa sekalipun perangkat tes yang disusun berdasarkan kisi-kisi yang sama, namun jarang sekali bahkan hampir tidak pernah ditemukan perangkat tes yang benar-benar setara dalam sebaran serta peringkat indeks kesukaran. Dengan demikian, menjadi suatu keharusan bagi para pengembang tes atau lembaga pengembang tes untuk melakukan penyetaraan terhadap perangkat tes yang digunakan.

Kebutuhan terhadap pentingnya penyetaraan tes telah lama disadari, namun pemikiran dan penilitian para ahli di Indonesia masih sangat terbatas. Beberapa penilitian yang telah dilakukan terbatas pada penemuan persamaan konversi dari beberapa perangkat yang telah diterapkan, dan belum menyentuh tentang penyiapan dan pengembangan beberapa perangkat tes untuk kepentingan penyetaraan secara lebih mendalam. Surapranata (1993) hasil penilitiannya, ditemukan suatu formulasi equating dari dua perangkat tes ebtanas SMP tahun pelajaran 1991/1992 di DKI Jakarta yang digunakan pada subrayon yang berbeda. Selanjutnya, snulling (1993) hasil penilitian menunjukan, bahwa semua perangkat tes SD yang digunakan di Sumatera

Page 11: Penyetaraan Peranmengkat Tes Matematika Smp

Selatan pada Ebtanas tahun 1991/1992 tidak paralel dibandingkan dengan perangkat tes yang dipakai di Kotamadya Palembang. Kedua hasil penilitian tersebut menunjukan bahwa skor pada perangkat tes yang berbeda tidak dapat disamakan atau dibandingkan langsung, tetapi harus melalui proses penyetaraan terhadap perangkat tes yang digunakan.

Melalui penyetaraan diperoleh dua komponen pokok, yaitu (1) dimungkinkannya penggunaan perangkat tes yang berbeda terhadap kelompok yang berbeda sesuai dengan tingkat kemampuannya, sehingga skor yang diperoleh dapat dibandingkan dan peserta tes tidak merasa dirugikan atau diuntungkan karena mereka kebetulan mengambil perangkat tes yang lebih sukar atau lebih mudah; dan (2) bila terjadi kebocoran soal dari suatu perangkat tes lain yang telah tersedia. Penyetaraan perangkat tes sangat dirasakan kegunaannya mengingat mutu pendidikan yang belum merata, dan keadaan geografif wilayah Indonesia sebagai negara kepulauan yang cukup luas. Mutu pendidikan di daerah pedesaan jauh tertinggal dibandingkan dengan mutu pendidikan di daerah perkotaan, dan tidak dapat disamakan. Hal ini dikarenakan sekolah di perkotaan didukung oleh fasilitas yang cukup memadai, sedangkan dipedesaan faktor pendukungnya relatif kurang. Dalam kasus demikian, tidaklah bijaksana bila untuk mengukur kemampuan siswa pada sekolah yang mutunya sangat berbeda diberikan perangkat tes yang sama. Kita akan lebih adil bila prestasi hasil belajar siswa pada sekolah atau daerah yang berbeda diukur dengan perangkat tes yang berbeda pula, dengan mempertimbangkan tingkat kemampuan mereka.

Penerapan beberapa perangkat tes yang disetarakan dalam berbagai bidang ilmu pada setiap jenjang pendidikan (sekolah) masih sangat langka, malah dapat dikatakan belum dilaksanakan di Indonesia. Penyetaraan yang selama ini dilakukan hanya baru pada taraf teoritas saja, yaitu membuat beberapa perangkat tes dengan menggunakan satu kisi-kisi. Perangkat-perangkat tes tersebut ditaksir memiliki tingkat kesukaran, daya beda dan realibilitas yang sama. Namun, dalam kenyataan beberapa perangkat tes yang disusun berdasarkan satu kisi-kisi yang sama, hampir tidak pernah memiliki tingkat kesukaran, daya beda dan reliabilitas yang sama.

Matematika sebagai bidang ilmu, diajarkan di hampir setiap jenis dan jenjang pendidikan, sejak dari sekolah dasar hingga perguruan tinggi. Peranan dan pentingnya mmatematika dalam berbagai bidang ilmu pengetahuan (sains) dan teknologi (IPTEK) tidak akan dapat dipelajari dengan baik tanpa menguasai matematika secara memadai. Tanpa matematika perkembangan ilmu pengetahuan dan kemajuan teknologi mustahil akan berjalan dengan baik dan lancar. Untuk mempelajari atau menguasai secara mendalam tentang ilmu fisika, kimia, biologi, astronomi, elektronika, mekanika, kedokteran, pertanian, ekonomi, dan juga hampir semua bidang ilmu lainnya, membutuhkan bantuan dari matematika. Mengingat begitu pentingnya matematika, sepantasnyalah upaya terhadap peningkatan mutu pengajaran matematika perlu mendapat perhatian dan pemikiran yang sungguh-sungguh.

Uraian di atas memberi gambaran bahwa penyetaraan perangkat tes sebagai salah satu upaya pengembangan alat ukur dalam mengevaluasi hasil belajar siswa perlu dikembangkan dalam berbagai mata pelajaran atau bidang ilmu, terutama pada tingkat pendidikan dasar dan menegah. Matematika termasuk salah satu mata pelajaran yang perlu mendapat prioritas utama,

Page 12: Penyetaraan Peranmengkat Tes Matematika Smp

sesuai dengan peranannya untuk kepentingan mempelajari bidang ilmu lain dan juga dalam kehidupan sehari-hari. Dengan demikian, penyetaraan perangkat tes dalam mata pelajaran matematika pada sekolah lanjutan tingkat pertama (SMP) merupakan persoalan yang perlu di kaji dan sangat pantas untuk dijadikan sebagai topik

B. Identifikasi Masalah

Hasil penelitian terhadap keberhasilan belajar anak didik (siswa) sering menimbulkan permasalahan, misalnya antara lain; nilai rapor siswa pada sekolah yang berbeda sukar untuk dibandingkan, dan nilai ebtanas murni (NEM) yang selama ini digunakan sebagai ukuran dalam berbagai seleksi sudah dirasakan kekurangannya. Nilai rapor dan NEM seseorang tidak dapat menjamin dapat memberikan informasi maksimal tentang kemampuan siswa tersebut. Hal ini terutama dikarenakan perangkat tes yang digunakan di berbagai daerah malah di setiap rayon tidak sama, sehingga dapat menimbulkan kecurigaan terhadap keadilan nilai yang diberikan kepada peserta yang mengikuti perangkat tes yang berbeda.

Penggunaan satu perangkat tes pada satu sistem ujian memiliki kekurangan antara lain, bilamana tes yang hanya satu perangkat tersebut di suatu daerah bocor maka perlu diadakannya penggantian perangkat tes di seluruh daerah itu. Penggunaan beberapa perangkat tes yang berbeda, keuntungan adalah apabila terjadi kebocoran soal tes pada suatu daerah langsung dapat ditukar dengan perangkat tes yang lain yang telah disisipkan; sedangkan kekurangannya adalah, beberapa perangkat tes yang digunakan memiliki tingkat kesukaran yang berbeda sehingga tidak dapat bertindak adil dalam penentuan nilai siswa. Untuk menutupi kekurangan tersebut seharusnya dilakukan penyetaraan skor dari beberapa perangkat tes yang digunakan.

Berdasarkan uraian di atas, masalah yang muncul dapat diidentifikasi; (1) bagaimana cara memberikan butir perangkat tes kepada peserta tes sehingga fungsi informasinya maksimum; (2) bagaimana menciptakan perangkat tes yang standar untuk mengukur ciri atau kemampuan belajar siswa pada suatu jenjang tertentu; (3) bagaimana caranya memilih butir tes untuk peserta tes tertentu agar tingkat kesukaran butir pada perangkat tes itu cocok dengan tingkat kemampuan peserta tes (perangkat tes yang adaptif); (4) bagaimana membandingkan dua skor dari dua perangkat tes yang berbeda tetapi mengukur ciri atau kemampuan yang sama; (5) bagaimana cara mendapatkan dua atau beberapa perangkat tes yang memiliki nilai kesetaraan, sehingga siswa yang mengikuti perangkat tes yang berbeda tidak merasa dirugikan atau diuntungkan karena mengerjakan perangkat tes yang lebih sulit atau lebih mudah. C. Pembatasan Masalah

Sasaran utama penelitian ini adalah penyetaraan dua perangkat tes mata pelajaran matematika pada sekolah menengah pertama (SMP), yang disusun berdasarkan kisi-kisi yang sama. Hasil pelaksanaan penyetaraan diperoleh dua perangkat yang memiliki nilai kesetaraan tertentu, sehingga dapat digunakan sebagai alat ukur yang baik dan adil dalam penilaian hasil belajar siswa.

Page 13: Penyetaraan Peranmengkat Tes Matematika Smp

Penyetaraan tes, secara garis besar dibedakan antara metode penyetaraan horizontal dan metode penyetaraan vertikal. Peyetaraan horizontal dibagi lagi atas dua macam, yaitu metode linear dan metode ekuipersentil. Mengingat luasnya teori atau metode penyetaraan, pada penelitian ini hanya dibatasi pada penyetaraan horizontal dengan menggunakan metode linear. Penyetaraan horizontal dimaksudkan untuk menyetarakan dua skor yang masing-masing diperoleh dari dua perangkat tes yang berbeda akan tetapi mengukur hal yang sama. Sedangkan pemdekatan linear dimaksudkan proses penyetaraan skor beberapa perangkat tes berhubungan dengan fungsi dengan regresi linear.

Dua perangkat tes (X dan Y) yang disetarakan mengukur ciri yang sama, yaitu tentang kemampuan matematika pada tingkat SMP. Perangkat tes X dan tes Y diujicobakan terlebih dahulu, untuk mendapatkan perangkat tes yang relative standar, yang selanjutnya digunakan untuk kepentingan penyetaraan skor dan mendapatkan gambaran kemampuan matematika siswa. Mengingat kurikulum 1994 pada saat penelitian dilakukan baru berlaku untuk kelas I dan kelas II, maka penyetaraan perangkat tes matematika dalam penelitian ini hanya dilakukan pada kelas I dan kelas II SMP saja, melalui metode penyetaraan horizontal dengan pendekatan linear.

D. Rumusan Masalah

Berdasarkan latar belakang dan pembatasan masalah, dapat dikemukakan rumusan masalah, seperti berikut :

1. Bagaimana menciptakan atau mendapatkan perangkat tes matematika SMP yang standar sehingga dapat berfungsi secara optimal; atau informasi tentang kemampuan belajar siswa dari hasil pengukuran (tes) dapat diperoleh secara optimal dan akurat.

2. Bagaimana mendapatkan dua perangkat tes matematika SMP yang memiliki nilai kesetaraan tertentu, agar skor pada kedua perangkat tes tersebut dapat dibandingkan, sehingga siswa yang mengikuti perangkat tes yang berbeda tidak merasa dirugikan atau diuntungkan. Dengan kata lain, bagaimana menciptakan perangkat tes yang cocok untuk kelompok atau peserta tes tertentu, sesuai dengan tingkat kemampuannya.

E. Tujuan Penelitian

Tujuan umum penelitian ini adalah untuk mendapatkan gambaran tentang pentingnya menyeleksi butir soal dan menyetarakan perangkat tes, sehingga dapat dihasilkan dua perangkat tes yang memiliki nilai kesetaraan tertentu. Dua perangkat tes yang dihasilkan, memenuhi syarat sebagai alat ukur yang baik, dan skor hasil tes pada kedua perangkat dapat dibandingkan. Dengan demikian, penilaian terhadap prestasi, belajar matematika siswa di SMP dapat dilakukan secara akurat dan adil.

F. Manfaat penelitian

Penelitian ini dilakukan bertolak dari kenyataan bahwa, masih langkanya penelitian yang mengarah pada pengembangan tes dalam penilaian hasil belajar, terutama menyangkut

Page 14: Penyetaraan Peranmengkat Tes Matematika Smp

penyetaraan perangkat tes. Hasil penelitian ini diharapkan dapat bermanfaat, baik untuk kepentingan teoritis maupun kepentingan praktis. Secara teoritis temuan hasil penelitian ini akan menambah khasanah empirik dalam rangka pengembangan teori yang berkaitan dengan evaluasi dan tes hasil belajar, terutama menyangkut penyetaraan perangkat tes. Secara praktis, temuan penelitian ini dapat menjadi bahan masukan bagi pihak-pihak yang terlibat dalam pengembangan dan pelaksanaan tes dan evaluasi hasil belajar, terutama menyangkut penyetaraan perangkat tes.

Dengan diperolehnya beberapa perangkat tes standar yang memiliki nilai kesetaraan tertentu, dapat digunakan sebagai alat ukur yang akurat dan handal, serta adil dalam menilai hasil belajar siswa. Pengembangan tes sebagai alat ukur dalam penilaian hasil belajar merupakan suatu upaya yang sangat penting, dalam rangka meningkatkan suatu pendidikan dan pengajaran, terutama dalam mata pelajaran matematika di SMP.

BAB II

KAJIAN TEORI DAN KERANGKA PEMIKIRAN

A. Kajian Teori

1. Pengukuran dan PenelitianUntuk mengetahui sejauh mana keberhasilan suatu program atau kegiatan dalam berbagai

bidang, perlu dilakukan penilaian. Setiap penilaian umumnya memerlukan data yang diperoleh dari hasil pengukuran. Depdikbud (1987), pengukuran diartikan sebagai suatu kegiatan untuk mendapatkan informasi atau data secara kuantitatif.

Pada dasarnya pengukuran itu bersifat kuantitatif dan deskriptif. Pengukuran dapat berupa pengumpulan data tentang objek yang akan diteliti, yang dinyatakatan dalam angka dan uraian. Angka atau uraian tersebut menyatakan tentang kenyataan atau gejala yang

Page 15: Penyetaraan Peranmengkat Tes Matematika Smp

menggambarkan derajat kuantitas dan kualitas, serta eksistensi dari sesuatu yang diukur. Namun demikian, tidak semua pengukuran menghasilkan data kuantitatif atau data kualitatif yang akurat. Hal ini sangat tergantung kepada alat ukur yang digunakan. Pengukuran yang baik dilakukan dengan menggunakan alat ukur yang berkualitas sesuai persyaratan yang diperlukan, serta melalui prosedur yang jelas dan benar.

Penilaian merupakan suatu kegiatan untuk mengetahui apakah suatu program telah berhasil dengan efisien atau tidak, yang selanjutnya dapat digunakan baik untuk tujuan pertanggungjawab maupun untuk pengambilan berbagai keputusan. Menurut Gay (1979), penilaian adalah suatu proses pengumpulan dan analisis data yang sistematis, yang dilakukan untuk membuat suatu keputusan. Menurut Purwanto (1985), penilaian adalah suatu proses di mana data yang diperoleh secara kuantitatif dari hasil suatu pengukuran diubah menjadi gambaran kualitatif yang dapat dinyatakan dengan simbol-simbol yang berupa angka atau huruf. Sedangkan masrum (1979) menyatakan, evaluasi atau penilaian mempunyai arti yang lebih luas dari pada pengukuran. Pengukuran merupakan suatu tindakan yang perlu diambil untuk melaksanakan penilaian. Pengukuran pada dasarnya bersifat deskriptif atau kuantitatif, yang hasilnya diwujudkan dalam bentuk angka. Penilaian pada dasarnya merupakan interpretasi terhadap informasi atau data yang bersifat kuantitatif yang diperoleh dari hasil pengukuran.

Berdasarkan beberapa pendapat tersebut, dapat dikatakan bahwa penilaian merupakan suatu kegiatan dalam membuat keputusan tentang baik tidaknya atau tepat tidaknya sesuatu berdasarkan hasil pengukuran. Pengambilan keputusan atau kebijakan yang baik oleh seseorang atau lembaga, memerlukan hasil penilaian yang baik terhadap situasi yang ada. Dengan demikian, penekanan penilaian adalah pada penggunaan data atau informasi yang diperoleh melalui pengukuran, untuk pengambilan keputusan atau menentukan suatu kebijakan. Baik buruknya serta tepat tidaknya suatu hasil penilaian sangat bergantung kepada hasil pengukuran. Hasil pengukuran yang cermat akan menghasilkan penilaian yang akurat. Sebaliknya, pengukuran yang tidak cermat akan menghasilkan penilaian yang tidak tepat dan menimbulkan bias yang relatif besar, sehingga mengakibatkan pengambilan keputusan atau kebijakan yang tidak tepat.

Dalam kurikulum Sekolah Lanjutan Tingkat Pertama 1994 (Depdikbud, 1993) dinyatakan bahwa, penilaian kegiatan dan kemajuan belajar adalah upaya pengumpulan informasi tentang kemampuan belajar siswa, dan bertujuan untuk keperluan perbaikan dan peningkatan kegiatan belajar siswa dan untuk memperoleh umpan balik bagi perbaikan pelaksanaan kegiatan belajar-mengajar. Sedangkan penilaian hasil belajar adalah upaya mengumpulkan informasi untuk mengetahui seberapa jauh pengetahuan dan kemampuan telah dicapai oleh siswa pada akhir setiap caturwulan, akhir tahun ajaran atau akhir pendidikan SLTP. Hasil penilaian pada akhir caturwulan ketiga kelas III SLTP dapat dijadikan sebagai salah satu bahan pertimbangan untuk memasuki pendidikan menengah. Penilaian hasil belajar yang didasarkan atas ukuran yang ditetapkan secara nasional dilakukan sewaktu-waktu bila diperlukan untuk memperoleh keterangan tentang mutu hasil pendidikan dasar (SD dan SLTP).

Dalam buku pedoman penilaian kurikulum SLTP tahun 1994 (Depdikbud, 1993) dinyatakan, bahwa penilaian terdiri atas : (a) penilaian formatif, (b) penilaian subsumatif, dan (c)

Page 16: Penyetaraan Peranmengkat Tes Matematika Smp

penilaian sumatif. Penilaian formatif dilakukan pada waktu proses belajar mengajar atau pada akhir setiap satuan pelajaran, yang berguna untuk mengetahui sejauh mana tujuan pembelajaran telah tercapai. Penilaian formatif ini dapat dipakai sebagai umpan balik bagi guru maupun bagi peserta didik. Penilaian subsumatif dilakukan setelah sejumlah satuan pelajaran selesai disampaikan. Penilaian subsummatif ini merupakan tindak lanjut dari penilaian formatif dan hasilnya dijadikan bahan untuk nilai rapor. Sedangkan penilaian sumatif, dilakukan pada setiap akhir semester, yang kegunaannya untuk melihat sejauh mana program pengajaran dalam satu semester atau program untuk jangka waktu tertentu telah tercapai. Hasil dari penilaian sumatif ini dijadikan bahan untuk menentukan nilai rapor.

2. Tes Hasil Belajara. Prinsip dasar tes hasil belajar

belajar dapat dipandang sebagai produk, sebagai proses, dan sebagai sebuah fungsi (surachmad, 1982). Sebagai produk, terutama yang dilihat adalah bentuk hasil akhir dari berbagai pengalaman interaksi edukatif, sepertinya nampaknya sifat dan tanda-tanda tingkah laku dalam membentuk keterampilan, konsep, dan sikap. Belajar sebagai proses, terutama yang dilihat adalah apa yang terjadi selama murid mengalami pengalaman-pengalaman edukatif untuk mencapai suatu tujuan, seperti adanya pola-pola perubahan tingkah laku selama pengalaman belajar itu berlangsung. Sedangkan belajar sebagai sebuah fungsi, ditujukan kepada aspek-aspek yang menentukan atau yang memungkinkan terjadinya perubahan tingkah laku anak didik dalam pengalaman edukatif.

Cronbach (1970) menyatakan, bahwa belajar itu ditunjukan dengan perubahan perilaku sebagai akibat dari pengalaman. Perubahan yang dimaksudkan adalah relatif permanen yang terjadi sebagai akibat dari praktek yang diberi penguatan, dan mengacu pada perubahan perilaku yang dapat diobservasi dan dapat diukur. Perubahan tingkah laku yang dimaksudkan di sini tidak hanya menyangkut penambahan pengetahuan saja, akan tetapi juga menyangkut berbagai aspek yang menyangkut ranah kognitif, efektif, dan psikomotor.

Apabila dikaitkan antara belajar dan pengukuran, dapat dikatakan bahwa proses belajar itu pada prinsipnya bertumpu pada struktur kognitif, sehingga aspek-aspek kognitif membentuk satu kesatuan yang memiliki makna bagisubjek didik yang dapat mempengaruhi perkembangan efektif dan psikomotor. Dengan demikian, pada prinsipnya belajar itu merupakan perubahan tingkah laku yang dapat diobservasi dan dapat diukur, yang bertumpuh pada ranah kognitif. Hal ini diperkuat dengan apa yang kita alami sampai sekarang dalam berbagai ujian atau tes yang dilaksanakan umumnya mengacu pada kisi-kisi ranah kognitif saja.

Penelitian tes hasil belajar dikemukakan oleh berbagai pada para ahli secara berbeda-beda pula, namun defenisi yang ajukan mengandung sasaran makna yang sama. Cronbach (1970), memberikan pengertian tes sebagai suatu prosedur yang sistematis untuk mengamati perilaku seseorang peserta didik dan mendeskripsikan kedalam skala numeric atau system kategori. Goodenough (Suryabrata, 1990), tes didenifisikan sebagai sehimpunan pertanyaan yang harus dijawab, atau sehimpunan pertanyaan yang harus dipilih atau direaksi, atau tugas-tugas yang harus dilakukan oleh seseorang peserta didik dengan tujuan untuk mengukur sesuatu aspek

Page 17: Penyetaraan Peranmengkat Tes Matematika Smp

perilaku dari peserta tes tersebut. Nunnaly (1972), tes diartikan sebagai alat yang digunakan untuk mendapatkan gambaran sejauh mana seseorang telah menguasai dan memiliki kecakapan dan pengetahuan dari sesuatu yang sudah dipelajari. Brown (1970) memberikan batasan yang singkat tentang tes, yaitu suatu prosedur yang sistematis guna mengukur sampel penelitian perilaku seseorang. Selanjutnya, umar (1991) mengemukakan, bahwa yang disebut dengan tes adalah sekumpulan butir soal yang bertujuan untuk mengukur tingkat sejauhmana seseorang telah menguasai bahan atau materi pelajaran yang telah diajarkan.

Berdasarkan beberapa definisi di atas, dapat dikatakan bahwa tes hasil belajar merupakan salah satu alat yang sistematis untuk mengukur sejauhmana penguasaan materi yang telah diajarkan. Selain sebagai alat ukur, tes juga diharapkan dapat berpengaruh terhadap proses belajar siswa, seperti membangkitkan semangat belajar, ingatan (retensi) dan transfer belajar, maupun membantu siswa dalam pemahaman diri.

Ada beberapa prinsip yang mendasari penyusunan perangkat tes. Menurut Gronlund (1982), prinsip dasar dalam penyusunan tes adalah (1) hendaknya mengukur hasil belajar yang telah ditentukan dengan jelas dan sesuai dengan tujuan pengajaran, (2) mengukur sampel yang representatif dari hasil belajar dan materi yang tercakup dalam pelajaran, (3) mencakup jenis-jenis pertanyaan yang paling sesuai untuk mengukur hasil belajar yang diinginkan, (4) direncanakan agar hasilnya sesuai dengan hasil yang digunakan secara khusus, (5) dibuat dengan koefisien reliabilitas yang setinggi-tingginya dan kemudian ditafsirkan dengan hati-hati, dan (6) dapat dipakai untuk memperbaiki hasil belajar.

Sebagai alat ukur, tes akan berfungsi dengan baik apabila memenuhi beberapa persyaratan. Suryabrata (1991) mengemukakan, tes yang baik itu harus memenuhi persyaratan yaitu (1) valid, (2) reliable, (3) distandardisasikan, (4) objektif, (5) diskriminatif, (6) komprehensif, dan (7) sudah digunakan. Menurut umar (1991), syarat tes yang baik adalah mengukur satu dimensi saja, dan (2) mempunyai reliabilitas yang tinggi, yang meliputi ketepatan dan kecermatan hasil pengukuran. Sedangkan Anastasi (1988) mengemukakan syarat tes yaitu (1) memiliki vadilitas yang tinggi, (2) memiliki reliabilitas yang tinggi, (3) bersifat objektif, (4) bersifat baku, dan (5) memiliki efisiensi yang tinggi.

Dengan memperhatikan syarat-syarat disebutkan diatas, bagi penyusun tes dituntut untuk mentaati pedoman penyusun tes (butir soal). Sebelum menyusun tes (alat ukur) diharuskan membuat kisi-kisi yang memuat ruang lingkup materi yang akan diujikan, agar jangan terjadi duplikasi materi atau ada materi yang belum diajarkan dimasukkan didalam kis-kisi tes. Untuk itu perlu diadakan pemilihan atau menyeleksi pokok bahasan atau subpokok bahasan yang dianggap penting. Kriteria pemilihan pokok bahasan atau subpokok bahasan adalah, (1) Merupakan pokok bahasan atau subpokok bahasan lanjutan yang merupakan pendalaman materi dari satu atau lebih pokok bahasan yang telah diajarkan, (2) Pokok bahasan atau subpokok bahasan yang seharusnya dikuasai oleh siswa, (3) Pokok bahasan yang diperlukan untuk mempelajari bidang studi lain, (4) Merupakan kesinambungan dari pokok bahasan atau subpokok bahasan sebelumnya, dan (5) pokok bahasan atau subpokok bahasan yang memiliki aplikasi tinggi.

Page 18: Penyetaraan Peranmengkat Tes Matematika Smp

Setelah butir soal (tes) tersusun, dilanjutkan dengan ujicoba tes dan analisis butir, sehingga akan dapat diketahui mana butir soal yang baik dan mana butir soal yang kurang baik atau jelek. Melalui analisis butir soal ini akan diperoleh gambaran tentang kualitas tes, yaitu menyangkut tingkat kesukaran, daya pembedah dan analisis pengecoh (distruktor). Hasil analisis butir akan memperlihatkan dan dapat ditentukan butir soal yang baik, yang bisa dipakai sebagai bank soal. Butir soal yang kurang baik perlu dilakukan perbaikan (direvisi), dan butir soal yang jelek dapat didrop atau dibuang.

b. Bentuk dan Macam-macam tessecara garis besar bentuk tes hasil belajar dibedakan menjadi dua bagian, yaitu bentuk

soal objektif dan uraian. Perbedaan antara kedua bentuk tes tersebut terletak pada tingkat objektivitas dalam memberikan skor dan cara siswa menjawab butir soal. Bentuk soal objektif dibedakan antara lain; pilihan ganda biasa, hubungan antar hal, analisis kasus, pilihan ganda kompleks, dan membaca diagram. Soal objektif yang sering digunakan dalam pengukuran hasil belajar adalah bentuk soal objektif pilihan ganda biasa. Pemakaian soal bentuk pilihan ganda ini sering digunakan, disebabkan dapat mencakup sampel kurikulum yang luas, dapat mencaku peserta tes yang banyak serta pemberian skor dapat dilakukan dengan cepat dan objektif.

Bentuk soal uraian, peserta tes dituntut untuk memberikan jawaban secara bebas. Bentuk tes ini dibagi menjadi dua jenis, yaitu tes uraian berstruktur (uraian objektif) dan tes uraian tak berstruktur (uraian nonobjektif). Tes uraian objektif, yaitu bentuk tes uraian yang butir soalnya memiliki sehimpunan jawaban dengan rumusan yang pasti sehingga penskorannya dapat dilakukan secara objektif. Pada tes ini dapat dibuat kunci jawabannya dan pedoman penskorannya, sehingga jawaban siswa yang bervariasi tetap dapat diperiksa oleh orang yang berbeda-beda dengan menghasilkan skor yang sama. Sedangkan tes uraian yang nonobjektif, merupakan bentuk tes uraian yang menuntut siswa untuk memberikan jawaban berdasarkan pendapat, pikiran, atau pandangan pribadinya. Tes bentuk ini tidak dapat dibuat kunci jawabannya, sehingga hasil penskoran juga cenderung dipengaruhi oleh pertimbangan dan pendapat pribadi dari pemikiran pemeriksanya. Namun untuk mengurangi faktor subjektivitas pemeriksa, dirumuskan kriteria jawaban sebagai pedoman untuk melakukan penskoran dan penilaian. Sehingga dengan adanya arahan kriteria jawaban tersebut, diharapkan pemeriksa yang berbeda akan menghasilkan skor yang relatif sama.

Bentuk tes objektif dan bentuk tes uraian keduannya memiliki kelemahan masing-masing. Keunggulan tes bentuk objektif antara lain adalah hasil penilaiannya betul-betul objektif meskipun diperiksa oleh orang yang berbeda, mudah memberikan hasil tes, dan dapat digunakan untuk jumlah peserta tes yang banyak. Sedangkan kelemahannya, yaitu memerlukan keterampilan tersendiri dalam menyusun butir soal, dan peserta tes mempunyai peluang menjawab benar dengan menebak.

Tes uraian, keunggulan antara lain: mudah menyusun butir soalnya dibandingkan dengan tes objektif, dapat melatih siswa untuk menyatakan gagasannya sehingga dapat diketahui kedalaman materi yang telah diserap oleh siswa, serta dapat mendorong siswa untuk belajar secara lebih baik karena adanya tuntutan penguasaan materi yang lebih tinggi dan kompleks.

Page 19: Penyetaraan Peranmengkat Tes Matematika Smp

Sedangkan, kelemahannya, tes bentuk uraian hanya menyediakan ruang lingkup materi yang terbatas, penelitiannya sulit, hanya dapat diperiksa oleh guru yang bersangkutan dan memerlukan waktu yang lama, kalau diperiksa oleh lebih dari satu orang ada kecenderungan menghasilkan skor yang berbeda.

Dengan memahami keunggulan dan kelemahan kedua bentuk tes, maka untuk memilih bentuk tes yang tepat dalam pengukuran atau penilaian hasil belajar sangat memperlukan pertimmbangan dan kebijaksanaan yang sungguh-sungguh. Untuk kepentingan yang lebih luas, objektivitas penilaian dan keakuratan pengukuran sewajarnya mendapat prioritas. Oleh karena demikian, bentuk tes objektif lebih tepat digunakan, terutama untuk kepentingan mengukur dan mendapatkan gambaran kemampuan atau daya serap siswa dalam mata pelajaran tertentu dalam sekop yang luas.

Ditinjau dari segi kegunaannya untuk mengukur kemampuan hasil belajar siswa, tes dapat dibedakan atas tiga macam, yaitu (1) Tes diagnostik, (2) Tes formatif, dan (3) Tes sumatif (Arikunto, 1993). Tes diagnostik digunakan untuk mengetahui kelemahan siswa, sehingga berdasarkan kelemahan tersebut dapat dilakukan pemberian perlakuan yang tepat. Tes formatif, dimaksudkan untuk mengetahui sejauh mana tujuan pembelajaran khusus (TKP) sedah tercapai. Dengan demikian, tes formatif diberikan pada waktu proses belajar mengajar atau pada akhir pelaksanaan program pengajaran. Sedangkan tes sumatif, dimaksudkan untuk mengetahui hasil yang diperoleh setelah mengikuti beberapa program pengajaran. Dengan demikian, tes sumatif ini dapat diartikan ujian pada akhir semester atau caturwulan, malah juga ujian kenaikan kelas dan ujian akhir sekolah.

Sebagai para ahli mengklasifikasikan tes secara berbeda-beda menurut pendapatnya masing-masing. Mehrens & Lehman (1974) mengklasifikasikan tes menjadi tiga yaitu (1) tes bakat, (2) tes prestasi dan (3) tes minat, tes kepribadian dan tes sikap. Kaplan (1982) juga mengklasifikasikan tes menjadi tiga bagian yaitu, (1) tes kemampuan (achievement test), (2)tes kepribadian (attitude test), dan (3) tes intelegensi (intelegence test). Selanjutnya, Azwar (1987) mengklasifikasikan tes menjadi empat bagian, yaitu (1) tes yang mengukur intelegensi umum, yang biasa dikenal dengan tes IQ. (2) tes yang mengukur kemampuan khusus, yang juga disebut dengan tes bakat dan dimaksudkan untuk mengungkap kemampuan potensial atau kemampuan yang muncul pada diri subjek, (3) tes yang mengukur prestasi, dimaksudkan untuk mengungkap kemampuan aktual sebagai hasil belajar, dan (4) tes yang mengungkap aspek kepribadian.

c. Analisis Butir SoalSeperti telah disebutkan sebelumnya bahwa penyusunan tes sangat mempengaruhi

kualitas butir soal yang dihasilkan. Dengan melihat beberapa persyaratan yang harus dipenuhi, penyusun tes dituntut untuk mentaati pedoman penyusunan tes, dan dilanjutkan pula dengan melakukan uji coba dan analisis butir untuk memperoleh gambaran tentang mutu soal menyeleksi butir soal yang memenuhi syarat sebagai alat ukur yang baik. Zainul (1993), membedakan dua istilah yang berkenaan dengan analisis butir soal, yaitu karakteristik butir soal dan spesifikasi butir soal. Karakteristik butir soal ialah parameter kuantitatif butir soal, sedangkan spesifikasi butir soal merupakan parameter kualitatif butir soal yang ditentukan atas

Page 20: Penyetaraan Peranmengkat Tes Matematika Smp

dasar penilaian ahli (expert judgemen). Selanjutnya, Sukesti (1990) menyatakan bahwa analisis butir soal mencakup telaah soal atau analisis kualitatif, dan analisis terhadap data empirik hasil ujicoba atau analisis kuantitatif.

Analisis butir soal secara kualitatif merupakan suatu kegiatan yang merupakan langkah awal untuk melihat sejauh mana soal tersebut sudah memenuhi kriteria yang ditentukan, yang berkaitan dengan kriteria dalam penulisan soal. Oleh sebab itu seorang penelaah soal juga harus menguasai teknik penulisan soal, dan beberapa kemampuan lain yaitu: keahlian dalam bidang studi yang diuji, keahlian dalam pengukuran, dan keahlian membahasakan gagasan (Suryabrata, 1987). Analisis mutu soal secara kualitatif menekan penilaian dari segi materi, konstruksi dan bahasa. Depdikbud (dalam sukesti, 1990) mengajukan sejumlah kaidah dalam telaah soal, yaitu dari segi materi: (1) soal sudah sesuai dengan indikator, (2) pengecoh sudah berfungsi, (3) hanya ada satu kunci jawaban; dari segi konstruksi: (4) pokok soal (stem) dirumuskan dengan jelas dan tegas, (5) pokok soal tidak memberi petunjuk ke kunci jawaban, (6) pokok soal bebas dari pernyataan yang bersifat negatif ganda, (7) gambar/grafik/table/diagram dan sejenisnya pada soal jelas dan logis, (8) pilihan jawaban homogeny dan logis, (9) panjang pendeknya alternatif jawaban relatif sama, (10) pilihan jawaban tidak menggunakan pernyataan yang berbunyi: pilihan jawaban di atas salah satu atau semua pilihan benar, (11) pilihan jawaban yang berbentuk angka disusun dari yang kecil ke angka yang besar atau sebaliknya, (12) butir soal tidak tergantung dari jawaban sebelumnya; dari segi bahasa: (13) soal menggunakan bahasa yang sesuai dengan kaidah bahasa Indonesia, (14) menggunakan bahasa komunikatif, (15) soal tidak menggunakan bahasa yang berlaku setempat, dan (16) pilihan jawaban tidak mengulang kata yang sama.

Analisis butir soal secara kuantitatif dilakukan berdasarkan data-data yang diperoleh secara empiris melalui proses ujicoba dari suatu perangkat tes. Analisis kuantitatif atau sering disebut analisis butir ini, antara lain meliputi tingkat kesukaran soal, daya beda soal, distribusi jawaban pada setiap option (pengecoh dan kunci) setiap butir, serta reliabilitas dan kesalahan pengukuran suatu perangkat tes.

(1) Tingkat kesukaranTingkat kesukaran (difficult level) suatu butir soal didefinisikan sebagai proporsi atau

persentase subjek yang menjawab item tes itu dengan benar (Suryabrata, 1987). Sedangkan angka yang menunjukan sukar atau mudahnya suatu butir soal disebut indeks kesukaran, yang dilambangkan dengan P, dengan nilai P ini berkisar antara 0 dan 1. Depdikbud (1987), butir soal yang memiliki tingkat kesukaran 0,21 – 0,40 termasuk sukar, 0,41 – 0,70 sedang, dan butir soal yang memiliki tingkat kesukaran 0,71 dan 0,90 termasuk soal yang mudah. Sedangkan Suryabrata (1987) & Allen dan Yen (1979) menyatakan bahwa, indeks kesukaran yang sedang berkisar antara 0,30 sampai dengan 0,70. Pakpahan (1990), menyatakan bahwa indeks kesukaran (P) : 0,30 < P < 0,70 terima; P < 0,10 dan P> 0,90 ditolak; dan 0,10 < P < 0,29 dan 0,71 < P < 0,90 perlu revisi. Berbagai kriteria tersebut, ada kecenderungan bahwa butir soal yang memiliki indeks kesukaran kurang dari 0,10 dan lebih dari 0,90 sebaiknya dihindari atau tidak digunakan,

Page 21: Penyetaraan Peranmengkat Tes Matematika Smp

disebabkan butir soal yang demikian terlalu sulit atau terlalu mudah, sehingga kurang mencerminkan alat ukur yang baik.

(2) Daya bedaDaya beda soal adalah kemampuan suatu soal untuk membedakan antara siswa yang pandai

(prestasi tinggi) dengan siswa yang kurang pandai (prestasi rendah). Masrun (1975) menyatakan, tujuan pokok mencari daya beda ialah untuk menentukan apakah butir soal tersebut memiliki kemampuan membedakan kelompok dalam aspek yang diukur, sesuai dengan perbedaan yang ada pada kelompok tersebut. Daya beda butir soal yang sering digunakan dalam tes hasil belajar adalah dengan cara menggunakan indeks kolerasi antara skor butir dengan skor totalnya. Daya beda dengan cara ini sering disebut validitas internal, karena korelasi diperoleh dari dalam tes itu sendiri. Teknik kolerasi yang sering digunakan untuk menghitung daya beda adalah teknik point biserial dan teknik biserial. Perbedaan dari kedua teknik ini, yaitu: kolerasi point biserial masih dipengaruhi oleh tingkat kesukaran soal, sehingga mempunyai indeks yang lebih kecil dibandingan dengan korelasi biserial. Korelasi biserial dan kolerasi point biserial merupakan korelasi product moment yang diterapkan pada data-data yang satu bersifat dikotomi dan yang lainnya bersifat non dikotomi.

Koefisien daya beda bergerak dari -1 sampai +1. Apabila suatu item memiliki korelasi negatif dapat dikatakan item tersebut menyesatkan, karena subjek yang terdiri dari kelompok pandai lebih menjawab salah daripada subyek yang termasuk kelompok kurang pandai, atau siswa kelompok pintar lebih sedikit menjawab benar dibandingkan dengan kelompok siswa yang kurang pintar. Dengan demikian butir soal yang memiliki daya beda yang negatif harus didrop. Sebaliknya butir soal yang mempunyai korelasi positif serta tinggi menunjukan butir soal tersebut mempunyai daya beda yang bagus. Crocker & Algina (1986) menyatakan, kriteria besarnya koefisien daya beda yaitu: 0,40 sampai 1,00 baik, 0,30 sampai 0,39 dapat diterima (tidak perlu direvisi), 0,20 sampai 0,29 perlu direvisi, dan -1,00 sampai 0,19 buruk atau tidak berfungsi. Suryabrata (1987), butir soal akan memiliki daya beda yang memenuhi syarat apabila mempunyai korelasi minimal 0,30 dan bila korelasinya kurang dari 0,30 dianggap kurang memenuhi syarat. Sedangkan Fernandes (1984) mengemukakan bahwa butir soal yang mempunyai indeks beda 0,20 atau lebih besar maka butir soal itu sudah baik. Sedangkan Pakpahan (1990) menyatakan bahwa daya beda (B) ≥ 0,30 diterima, 0,10 < B < 0,29 perlu direvisi, dan B < 0,10 ditolak.

(3) Distribusi jawabanDilihat dari strukturnya butir soal terdiri dari dua bagian, yaitu pokok soal (stem) dan

alternatif jawaban (option). Alternatif jawaban juga terdiri dua bagian, yaitu kunci jawaban dan pengecoh (distraktor). Pengecoh dikatakan berfungsi apabila, semakin rendah tingkat kemampuan siswa semakin banyak memilih pengecoh, atau semakin tinggi tingkat kemampuan siswa akan semakin sedikit memilih pengecoh. Hal demikian akan ditunjukkan adanya korelasi yang tinggi, rendah atau negatif pada hasil analisis butir yang menggunakan Program Iteman. Apabila proporsi siswa yang menjawab dengan salah atau memilih suatu pengecoh kurang dari

Page 22: Penyetaraan Peranmengkat Tes Matematika Smp

0,05 maka pengecoh tersebut harus direvisi, dan untuk pengecoh yang ditolak apabila tidak ada yang memilih atau proporsinya 0,00 (Depdikbud, 1987). Sedangkan Pakpahan (1990) menyatakan proporsi jawaban yang < 0,03 perlu direvisi.

Selain memperhatikan fungsi daya tarik untuk dipilih oleh siswa dari suatu pengecoh suatu soal, juga perlu diperhatikan pula daya beda yang ditunjukan oleh masing-masing alternatif jawaban. Setiap pengecoh diharapkan memiliki daya beda yang negatif; artinya, suatu pengecoh diharkan lebih sedikit dipilih oleh kelompok pandai dibandingkan dengan kelompok rendah. Atau, paling tidak daya beda pengecoh itu tidak akan lebih besar dari daya beda kunci jawaban (daya beda tiap butir soal). Bila daya beda butir soal (daya beda kunci jawaban) tidak lebih besar dari daya beda setiap pengecoh, maka kunci jawaban butir soal tes yang demikian harus ditinjau ulang untuk direvisi secara menyeluruh atau diganti (didrop).(4) Reliabilitas

Selain tingkat kesukaran, daya beda, dan distribusi jawaban serta kunci, kualitas tes secara keseluruhan dapat dilihat besarnya koefisien reliabilitas perangkat tes (alpha). Reliabilitas dapat diartikan dengan tingkat kepercayaan dari suatu alat ukur. Artinya, sampai seberapa jauh pengukuran yang dilakukan berulang-ulang terhadap subjek atau sekelompok subjek yang sama memberikan hasil yang relatif sama atau tetap.

Ukuran besarnya reliabilitas tes yang dikemukakan para ahli berbeda-beda. Ebel (1972) menyatakan, bahwa alat ukur yang mempunyai angka reliabilitas 0,80 sudah baik. Menurut Nunnaly (1978), untuk tes uraian reliabilitasnya 0,60 – 0,70; dan untuk tes objektif reliabilitasnya 0,75 – 0,90. Menurut Masrun (1979), tes yang disebut reliabel itu apabila reliabilitasnya menimal 0,70. Gronlund (1982), besarnya reliabilitas suatu alat ukur khususnya pada pengukuran pendidikan seperti tes buatan guru sekitar 0,60 sampai dengan 0,85. Selanjutnya, Azwar (1992) menyatakan, bahwa khusus alat ukur untuk tujuan prediksi dituntut memiliki reliabilitas yang tinggi, yaitu minimal 0,90. Cara mengestimasi bentuk tes yang dikotomi, menurut Cronbach (1970) menggunakan koefisien Alpha dengan mengambil formula KR-20.

Berdasarkan tujuan dari penelitian ini, yang fokus utamanya menyangkut penyetaraan dua perangkat tes (bukan pembakuan tes), maka kriteria yang dipakai dalam menyeleksi butir soal untuk kepentingan penyetaraan, adalah (1) indeks atau tingkat kesukaran butir soal yang diambil adalah 0,21 sampai dengan 0,90 (2) daya beda butir soal diambil minimal 0,20; (3) indeks daya tarik pengecoh minimal 0,03; dan daya beda pengecoh tidak lebih besar dari daya beda kunci jawabannya; dan (4) koefisien reliabilitas (alpha) minimal 0,70.(5) Kesalahan pengukuran

Unsur lain yang yang berkaitan langsung dengan reliabilitas tes adalah kesalahan baku pengukuran atau Standard Error Measurement (SEM). Kesalahan pengukuran dalam tes disebabkan oleh: kesalahan pengambilan sampel peserta tes (samling error), dan kesalahan pelaksana tes itu sendiri (measurement error). Besar standar kesalahan pengukuran suatu perangkat tes, Hopkins, K.D, Stanley, J.C dan Hopkins, B.R. (1990) mengemukakan rumus:

Page 23: Penyetaraan Peranmengkat Tes Matematika Smp

σ e=σ √1−ρ xx

σ e = kesalahan baku pengukuran

σ = simpangan baku skor tes

ρ xx = koefisien reliabilitas tes

Pada analisis butir program iteman, nilai standar kesalahan (SEM) langsung dicetak pada bagian akhir hasil analisis. Untuk menentukan standar kesalahan pengukuran, nilai SEM yang diperoleh dari hasil-hasil analisis data empiris, dibandingkan dengan standar kesalahan pengukuran suatu perangkat tes berdasarkan panjang tes atau banyak butir yang menyusun tes tersebut. Perkiraan yang akurat (accurate estimate) dari standar kesalahan pengukuran, Hopkinset et al. (1990) mengemukakan rumus :

σ e=¿ 0,43 √k ; atau σ e% = 43/√k

Keterangan :

σ e=¿ perkiraan yang akurat standar kesalahan pengukuran;

√k = panjang tes (banyak butir soal)Berdasarkan rumus, untuk perangkat tes yang tersusun dari 32 butir soal (k = 32), besar perkiraan yang akurat kesalahan pengukuran adalah σ e = 2, 4324. Untuk k = 40, besar σ e =

2,7195; untuk k = 100, besar σ e = 4,3000; dan sebagainya. Angka-angka tersebut menunjukan, bahwa kriteria besarnya kesalahan pengukuran maksimal suatu perangkat tes, bergantung pada banyaknya butir soal atau panjang tes yang dikembangkan. Semakin banyak butir soal suatu perangkat tes yang diujicobakan, semakin besar pula persyaratan maksimal kesalahan yang harus dipenuhi. 3. Penyetaraan Perangkat Tesa. Pengertian Penyetaraan Tes

Gullisken (1986) menyatakan bahwa, dua perangkat tes dianggap setara atau paralel apabila konversi kedalam skala yang sama, rerata, simpangan baku dan kolerasinya dengan kriteria luar adalah sama. Menurut Crocker dan Algina (1986), dua perangkat tes dikatakan sama yaitu apabila kita hendak menguating secara linear, maka perangkat tes tersebut memiliki rerata, standar deviasi, dan distribusi skor yang sama. Tjokrowinoto (1981), Suryabrata (1987), dan Hambleton & Swaminathan (1985) menegaskan bahwa, sekalipun perangkat yang ditulis berdasarkan kisi-kisi yang sama, namun jarang sekali ditemukan, bahkan hampir tidak pernah ditemukan perangkat tes yang benar-benar setara dalam sebaran serta peringkat tarap kesukaran.

Page 24: Penyetaraan Peranmengkat Tes Matematika Smp

Dengan demikian, menjadi suatu keharusan bagi pengembang tes atau lembaga tes untuk menyetarakan perangkat tes tersebut.

Menurut Angoff (dalam Hollan & Rubin, 1982) penyetaraan adalah proses konversi dari sistem unit tes yang satu ke sistem unit tes yang lain, agar skor-skor yang berasal dari dua perangkat tes setelah dikonversi adalah sama. Crocker & Algina (1986) menyatakan bahwa penyetaraan adalah dua skor, yang satu perangkat tes X dan lainnya perangkat tes Y dianggap ekuivalen, jika perangkat tes X dan perangkat tes Y mengukur ciri yang sama dengan dengan reliabilitas yang sama, serta peringkat persentil yang sepadan dengan sebaran skor. Selanjutnya, Peterson, N.S., Marco, G.L., dan Stewart, E.E (dalam Hollan & Rubin, 1982) menyatakan, penyetaraan adalah suatu prosedur empiris yang diperlukan untuk mentranformasi dari skor tes yang satu ke skor tes yang lain. Dengan demikian, penyetaraan adalah suatu cara untuk merubah skor-skor dari perangkat tes yang berbeda dalam rerata tingkat kesukaran dan rerata daya beda butir di antara dua atau lebih perangkat tes, agar menjadi sama setelah dilakukannya penyetaraan.

Berdasarkan beberapa pengertian yang telah dikemukakan diatas, dapat dikatakan bahwa penyetaraan atau equating merupakan suatu prosedur yang empiris dalam rangka menyetarakan skor dari perangkat tes yang satu ke perangkat tes yang lain. Melalui proses penyetaraan yang dilakukan dengan benar, dapat diukur perkembangan dan memetakan berbagai kecenderungan, serta mendapatkan dan menggabungkan informasi dari perangkat tes yang berbada. Hasil penyetaraan memungkinkan kita melakukan perbandingan atau konversi secara langsung hasil-hasil tes individu yang mengikuti perangkat tes yang berbeda.

b. Syarat-syarat penyetaraansyarat utama agar supaya skor dari dua perangkat tes dapat disetarakan adalah kedua

perangkat tes tersebut berasal dari kisi-kisi yang sama. Persyaratan lain yang juga harus dipenuhi adalah kedua perangkat tes yang disetarakan memiliki reliabilitas yang sama. Namun demikian, Angoff (dalam Hollan & Rubin, 1982) menyatakan bahwa skor dari dua perangkat tes yang memiliki reliabilitas tidak sama juga dapat disetarakan. Menurut Peterson et al. (dalam Hollan & Rubin, 1982) menyatakan, skor-skor dari perangkat tes X dan Y dapat disetarakan jika terpenuhi empat syarat, yaitu (1) kedua tes harus mengukur hal yang sama, (2) kemampuan peserta tes harus sama, (3) transformasinya harus invariant, (4) transformasinya harus simetris.

Persyaratan invariasi populasi dan juga berawal dari tujuan penyetaraan, yaitu untuk menghasilkan ekuivalen antar skor yang berasal dari dua atau lebih perangkat tes. Jika skor-skor pada dua perangkat tes itu ekuivalen, maka ada keadilan antara dua perangkat tes tersebut. Dengan demikian, konversi memerlukan transformasi yang dapat dibalik, yaitu jika skor Y0 pada perangkat tes Y disetarakan dengan skor X0 pada perangkat tes X harus dapat disetarakan dengan Y0 pada perangkat tes Y.

c. Macam-macam Penyetaraanditinjau dari segi peserta tes, penyetaraan dibedakan atas dua macam, yaitu penyetaraan

horizontal dan penyetaraan vertikal (Naga, 1992). Penyetaraan horizontal dimaksudkan untuk

Page 25: Penyetaraan Peranmengkat Tes Matematika Smp

menyetarakan dua skor yang masing-masing diperoleh dari dua perangkat tes yang berbeda, tetapi mengukur hal yang sama. Misalnya, disekolah dasar mengenal system ujian pada akhir tahun ajaran bahkan pada akhir caturwulan, atau juga ujian akhir. Kita dapat memperkaya perangkat tes yang telah ada, atau menggantikannya dengan perangkat tes yang baru, yang mempunyai kedudukan yang sama dengan perangkat tes yang telah ada itu.

Penyetaraan vertikal dimaksudkan untuk menentukan padanan skor-skor yang diperoleh dari dua kelompok peserta tes dalam tingkat atau jenjang pendidikan yang berbeda, akan tetapi dikenakan perangkat tes yang sama. Penyetaraan vertikal dilakukan untuk mengetahui perkembangan kemampuan peserta didik. Misalnya, ditemukan peserta tes dari kelas empat sekolah dasar, karena sesuatu hal peserta itu cukup terbelakang sehingga tidak mampu mengikuti ujian (tes) dari kelasnya sendiri. Kalau dipaksakan juga, maka peserta itu tidak dapat menjawab dengan benar hampir semua butir dalam perangkat tes yang disediakan, sehingga hasil perangkat tes itu akan memiliki informasi yang sangat rendah. Untuk memperoleh informasi yang cukup, kepada peserta (murid) yang terbelakang itu diberikan perangkat tes dari kelas yang lebih rendah, misalnya dari kelas tiga. Kemudian skor hasil perangkat tersebut perlu dikembalikan ke skor kelas empat. Oleh karena demikian, di tingkat sekolah dasar diperlukan tersedianya perangkat tes yang dapat digunakan untuk tingkat kelas yang berbeda.

d. Prosedur Penyetaraanpenyetaraan dilakukan dengan cara mengkonversikan sistem unit suatu perangkat tes ke

sistem unit perangkat tes lain, dari tes yang mengukur kemampuan yang sama. Misalnya, dari liter ke kilogram, dari derajat Fahrenheit ke derajat Celsius, dan sebagainya. Penyetaraan perangkat tes merupakan pembuatan sejumlah keputusan dari skor yang diperoleh pada sebuah perangkat tes untuk disesuaikan ke bentuk yang berbeda dalam tingkat kesukarannya. Berarti, nilai yang dapat dari tes yang lebih sulit akan lebih berharga dari nilai yang didapat dari tes yang lebih mudah (Suryabrata, 1987).

Menurut Peterson et al. (dalam Holland & Rubin, 1982), masalah penyetaraan tidak sederhana seperti masalah regresi, karena metode penyetaraan adalah sebuah prosedur empiris yang melibatkan sebuah desain untuk pengumpulan data dan sebuah aturan atau hukum untuk menetapkan transformasi. Lord (1980) mengemukakan tiga desain dasar untuk mengumpulkan data adalah (1) metode kelompok tunggal, (2) metode kelompok ekuivalen, dan (3) metode anchor tes; dan terdapat tiga aturan untuk menetapkan transformasi adalah (1) penyetaraan persentil, (2) penyetaraan linear, (3) kurva karakteristik soal. Angoff (dalam Holland & Rubin, 1982) dan Hambleton, R.K., Swaminathan, H., dan Roger, H.J. (1991) mengemukakan bahwa, pada teori tes klasik dikenal dua macam metode penyetaraan, yaitu metode penyetaraan linear, dan metode penyetaraan ekuipersentil. Metode penyetaraan linear akan menghubungkan skor konversi dengan skor asalnya melalui suatu fungsi linear, yang didasarkan kedua nilai baku. Sedangkan metode penyetaraan ekuipersentil, mengkonversi skor berdasarkan jenjang persentil yang sama.

Crocker & Algina (1986), Hambleton & Swaminathan (1985); Peterson et al. (dalam Holland & Rubin, 1982) menemukan tiga jenis rancangan dalam penyetaraan skor di antara

Page 26: Penyetaraan Peranmengkat Tes Matematika Smp

beberapa perangkat tes yang berbeda, yaitu rancangan A, rancangan B, rancangan C. Metode yang paling sederhana dalam pembahasan ini dibatasi pada dua perangkat tes yaitu perangkat X dan perangkat Y, demikian pula peserta tes dibatasi pada dua kelompok yaitu kelompok G1 dan G2. Untuk lebih jelasnya dapat diberikan skema tentang rancangan penyetaraan dari ketiga jenis rancangan A, B, dan C. Gambaran dan perbandingan dari ketiga jenis rancangan tersebut dapat dilihat pada tabel 2 berikut.

Tabel 2. Skema Gambaran dan Perbandingan Teknik Pelaksanaan Penyetaraan Tes pada Berbagai Rancangan

Jenis rancangan Kelompok Peserta TesG1 G2

A

B

C

X

X,Y

(X+Z)

Y

Y,Z

(Y+Z)

Keterangan: diadaptasi dari Algina, 1986

Pada rancangan A, peserta dibagi secara acak kedalam dua kelompok, yaitu G1 dan G2. Dengan keacakan itu dimaksudkan agar G1 dan G2 adalah setara yakni mereka memiliki kemampuan yang sama dengan variansi yang sama pula. Setelah itu kelompok G1 mengerjakan perangkat tes X dan kelompok G2 mengerjakan perangkat tes Y, seperti tampak pada tabel 2 diatas.

Pada rancangan B, secara acak, peserta dibagi juga kedalam dua kelompok (kelompok G1

dan kelompok G2). Cara acak ini dimaksudkan agar kedua kelompok setara yakni mereka memiliki kemampuan yang sama dengan variansi yang juga sama. Setelah itu, seperti tampak pada tabel diatas, kelompok G1 mengerjakan perangkat tes X dan kemudian perangkat tes Y, serta kelompok G2 mengerjakan perangkat tes Y dan kemudian perangkat tes X. jadi setiap kelompok mengerjakan dua perangkat tes dalam urutan yang terbalik. Selanjutnya dari hasil uji tes itu, kita menemukan patokan konversi.

Pada rancangan C, kita tidak perlu secara acak membagi dua kelompok peserta seperti halnya pada rancangan A dan B; sudah cukup kalau kita mempunyai dua kelompok peserta G1 dan G2. Sekalipun demikian, rancangan ini tidak menolak penggunaan kelompok yang setara yakni kelompok peserta seperti pada rancangan A dan B. Selanjutnya, perangkat tes X ditambah dengan sejumlah butir yang biasanya dinamakan dengan tes anchor atau tes jangkar (z), serta perangkat tes Z yang sama itu ditambahkan juga ke perangkat tes Y, sehingga bersama tambahan itu, terdapat perangakat (X+Z) dan perangkat tes (Y+Z). setelah itu, seperti tampak pada tabel,

Page 27: Penyetaraan Peranmengkat Tes Matematika Smp

kelompok G1 mengerjakan perangkat tes (X+Z) dan kelompok G2 mengerjakan perangkat tes (Y+Z), yang akhirnya dapat ditemukan patokan konversi.

Jika ketiga rancangan di atas dibandingkan, maka ditemukan beberapa hal. Dilihat dari segi kemantapan, rancangan B adalah yang paling mantap karena setiap kelompok mengerjakan semua perangkat tes yakni mereka mengerjakan perangkat tes yang sama secara keseluruhan. Berikutnya adalah rancangan C karena setiap kelompok megerjakan sebagian perangkat tes yang sama. Sedangkan yang terakhir adalah rancangan A karena rancangan ini hanya bertopang kepada kesetaraan peserta di dalam kedua kelompok peserta itu. Tetapi kalau kita mempunyai banyak peserta sedangkan perangkat tesnya adalah panjang, maka rancangan A adalah yang paling praktis karena setiap kelompok hanya mengerjakan satu perangkat tes. Berikutnya adalah rancangan C karena bagian sama yang harus dikerjakan oleh kedua kelompok hanyalah sebagian dari perangkat tes itu. Dan yang terakhir adalah rancangan B karena peserta yang banyak itu masing-masing harus mengerjakan dua perangkat tes yang panjang. Dilihat dari penyiapan peserta tes, rancangan C adalah yang paling praktis, karena rancangan ini tidak mensyaratkan kesetaraan di antara kelompok peserta. Berikutnya adalah rancangan A dan B yang sama-sama memerlukan kesetaraan di antara kelompok peserta.

Dengan demikian, dapat dipahami bahwa rancangan C terletak di tengah-tengah baik dilihat dari segi kemantapan serta dari segi lamanya tes itu berlangsung. Dari segi penyiapan peserta tes, rancangan C adalah yang paling praktis, dan dari segi keamanan atau kerahasiaan naskah tes sebelum penyelenggaraan tes, sekali rancangan C terletak di tengah-tengah. Karena itu, banyak kegiatan penyamaan atau penyetaraan skor tes memilih menggunakan rancangan C. Atas dasar berbagai pertimbangan terutama dari segi kepraktisan dan juga kesesuaian dengan juga permasalahan, maka dalam penelitian ini desain untuk pengumpulan data dipilih metode anchor tes (rancangan C). Peterson et al. (dalam Holland & Rubin, 1982) menyatakan bahwa metode anchor ini memiliki kebaikan dari metode-metode lainnya, karena dengan menggunakan anchor tes dapat menghilangkan bias penyetaraan yang ditimbulkan oleh perbedaan kemampuan dua kelompok peserta tes.

Peserta penyetaraan boleh dipandang sebagai suatu prosedur untuk menetapkan konversi skor yang berasal dari perangkat tes yang berbeda. Jika dua perangkat tes, X dan Y telah disetarakan dan seseorang mengambil tes X, skor x dapat di ekuivalensi pada skal skor dari tes Y. fungsi hubungan skor X untuk setara dengan skor Y dinyatakan melalui persamaan Y=f (X). skor tes seseorang yang mengambil X dapat dibandingkan dengan skor seseorang yang mengambil tes Y melalui persamaan transformasi.

Dalam pelaksanaannya, kita mengenal dua macam cara penyetaraan yakni cara linear dan ekuipersenti. Sesuai dengan namanya, cara linear akan menghubungkan skor konversi dengan skor asalnya melalui suatu fungsi linear, sedangkan cara ekuipersentil akan mengkonversi skor berdasarkan persentil yang sama. Selanjutnya, akan dibatasi pada penyetaraan dengan cara linear saja.

e. Penyetaraan metode linear

Page 28: Penyetaraan Peranmengkat Tes Matematika Smp

Metode penyetaraan linear dapat dilakukan dengan suatu prosedur regresi linear. Konversi skor perangkat tes X ke skor perangkat tes Y adalah skor Y*, dan sebaliknya konversi skor perangkat tes Y ke skor perangkat tes X adalah skor X*. pada konversi metode linear, skor Y* merupakan fungsi linear dari skor tes Y. kalau diperhatikan salah satu di antara konversi timbal balik ini, maka hubungan linear skor perangkat Y* dan skor perangkat X, menurut Croacker & Algina (1986), dapat dirumuskan seperti berikut:

Y* = a (x - c) + d ………………. (2.1)

Dengan a,c, dan d bergantung kepada rancangan penyetaraan yang digunakan. Dengan jalan yang sama, kita dapat menyusun rumus serupa untuk konversi sebaliknya yakni diantara skor X* dan skor Y.

(1) Penyetaraan pada rancangan APada rancangan A, kita menggunakan dua perangkat tes X dan Y serta dua kelompok

peserta yakni kelompok G1 dan G2 yang dianggap memiliki kemampuan yang sama. Kelompok G1 mengerjakan perangkat tes X dan kelompok G2 mengerjakan perangkat tes Y. kedua perangkat tes itu menghasilkan rerata dan simpangan baku: μx dan σ xserta μY dan σ Y.

Penyetaraan linear pada rancangan A ini memerlukan kesamaan distribusi probabilitas di antara skor X dan skor Y. dengan distribusi probabilitas di antara skor X dan skor Y. Dengan distribusi probabilitas yang sama, skornya memiliki rerata dan simpangan baku yang berbeda yang dapat digunakan untuk mentransformasi nilai dari satu distribusi probabilitas ke distribusi probabilitas berikutnya. Dengan demikian, dasar penyetaraan skor dua perangkat tes adalah nilai baku dari kedua perangkat tes tersebut. Kedua skor itu dinilai sama apabila nilai baku kedua perangkat tes adalah sama, yaitu

X−μx

σx =

X−μ y

σ y ………………… (2.2)

Keterangan: μx = rerata skor perangkat Xμy = rerata skor perangkat Yσ x = simpangan baku skor perangkat Xσ y = simpangan baku skor perangkat YX = skor perangkat XY = skor perangkat Y

Dari persamaan (2.2) dan persamaan (2.1) dapat ditentukan nilai a, c dan d (Croacker & Algina, 1986), yaitu:

Page 29: Penyetaraan Peranmengkat Tes Matematika Smp

a = σ Y

σ X ; c = μx ; dan d = μy …………….. (2.3)

Demikian pula, rumus penyetaraan konversi skor perangkat tes Y ke X* (kebalikannya), yaitu

X* = σ X

σ Y ( Y - μy) + μx …………….. (2.4)

(2) Penyetaraan pada rancangan BPada rancangan B, ada dua perangkat tes yakni perangkat tes X dan perangkat tes Y, dan

ada dua kelompok peserta yang ekuivalen, yakni kelompok G1 dan kelompok G2. kelompok G1 mula-mula mengerjakan perangkat tes X dan kemudian mengerjakan pula perangkat tes Y, kelompok G2 mula-mula mengerjakan perangkat tes Y dan setelah itu mengerjakan perangkat tes X. Kedua perangkat tes dikerjakan oleh kedua kelompok dalam waktu yang berbeda. Seperti halnya pada rancangan A, penyetaraan skor pada perangkat X dan perangkat Y dilakukan melalui kesamaan nilai baku. Skor adalah sama bila nilai bakunya sama. Namun berbeda dengan rancangan A, pada rancangan B ini, ditemukan skor gabungan pada perangkat X dan skor gabungan pada perangkat Y, yang masing-masing berasal dari kelompok peserta G1 dan kelompok peserta G2. Dengan demikian, dari kedua perangkat tes tersebut diperoleh rerata gabungan dan simbangan baku gabungan. Selanjutnya, diperoleh kesamaan nilai baku dari kedua perangkat tes sebagai berikut:

X - μ X1+μX 2

2Y -

μY 1+μY 2

2

Berdasarkan rumus (2.5) dan (2.1), maka setelah dijabarkan diperoleh a, c dan d (Crocker & Algina, 1986), yaitu :

Sehingga persamaan konversi skor dari perangkat X ke perangkat Y, dapat dinyatakan dengan rumus :

Page 30: Penyetaraan Peranmengkat Tes Matematika Smp

(3) Penyetaraan pada rancangan CPada rancangan C ini, kelompok peserta G1 mengerjakan perangkat tes X dan Z, sedangkan kelompok peserta G2 mengerjakan perangkat tes Y dan Z. Dengan demikian, perangkat tes Z dikerjakan oleh kedua kelompok itu. Perangkat tes Z yang dikerjakan oleh kelompok peserta G1 menghasilkan skor Z1 dengan rerata skor μZ1 dan simpangan baku