sipeg.unj.ac.idsipeg.unj.ac.id/repository/upload/laporan/ilovepdf... · 2020. 12. 3. · ada...
Transcript of sipeg.unj.ac.idsipeg.unj.ac.id/repository/upload/laporan/ilovepdf... · 2020. 12. 3. · ada...
-
SINOPSIS DISERTASI
METODE SIMPLIFIED CIRCLE ARC DAN NOMINAL WEIGHT
MEAN EQUATING UNTUK PENYETARAN SKOR
PADA SAMPEL KECIL
DENI IRIYADI
Penelitian dan Evaluasi Pendidikan
7817167400
Diajukan Kepada Pascasarjana Universitas Negeri Jakarta
Dalam Rangka Memenuhi Persyaratan memperoleh Gelar Doktor
PASCASARJANA
UNIVERSITAS NEGERI JAKARTA
2019
-
KOMISI PROMOTOR*
Prof. Dr. Dali Santun Naga, MMSI.
Guru Besar Tetap Universitas Tarumanagara
Dr. Wardani Rahayu, M.Si.
Dosen Tetap Universitas Negeri Jakarta
PANITIA UJIAN DOKTOR
KETUA
Prof. Intan Ahmad, Ph.D.
Plt. Rektor Universitas Negeri Jakarta
SEKRETARIS
Prof. Dr. Ilza Mayuni, M.A.
Guru Besar Tetap Universitas Negeri Jakarta
Plt. Direktur Pascasarjana Universitas Negeri Jakarta
Dr. Wardani Rahayu, M.Si.
Koordinator Program Studi S3 Penelitian dan Evaluasi Pendidikan
PENGUJI
Prof. Dr. Yetti Supriyati, M.Si.
Guru Besar Tetap Universitas Negeri Jakarta
Dr. Yuliatri Sastrawijaya, M.Pd.
Dosen Tetap Universitas Negeri Jakarta
Dr. Achmad Ridwan, M.Si.
Dosen Tetap Universitas Negeri Jakarta
PENGUJI LUAR
Prof. Djemari Mardapi, Ph.D.
Guru Besar Tetap Universitas Negeri Yogykarta
*Komisi Promotor Merangkap sebagai Anggota Panitia Ujian Doktor
-
1
Sinopsis Metode Simplified Circle Arc dan Nominal Weight Mean Equating untuk
Penyetaraan Skor pada Sampel Kecil
Deni Iriyadi
SIMPLIFIED CIRCLE ARC AND NOMINAL WEIGHT MEAN EQUATING
METHOD FOR EQUATING ON SMALL SAMPLE
Abstract
This study aims to determine the equating method that can be used in small samples in
terms of the form of data distribution. This study uses the 2015 National Exam questions
in mathematics from the Education Assessment Center (PUSPENDIK) for the DKI Jakarta
and Tangerang areas. The results showed that in the sample size 36 with the number of
items 20, the equalization results using the Simplified Circle Arc method and the Nominal
Weight Mean Equating method had the same precision in the form of normal data
distribution, positive skewness data distribution, and negative skewness data distribution.
Whereas for sample size 36 with the number of items 30 and 40, the equalization results
using the Simplified Circle Arc method are more accurate than the Nominal Weight Mean
Equating method in the form of normal data distribution, positive skewness data
distribution, and negative skewness data distribution. While in the condition of sample size
50 and 100 with the number of items 20, 30 and 40, the equalization results using the
Simplified Circle Arc method are more accurate than the Nominal Weight Mean Equating
method in the form of normal data distribution, positive skewness data distribution, and
negative skewness data distribution. From the results of the research that has been done,
the use of the Simplified Circle Arc aquating method can be applied to small samples with
various variations in the number of grains. However, in the condition of sample size 36
with the number of items 20, the use of the Nominal Weight Mean Equating method can
be used as an alternative method of aquating. The use of number 20 gives the possibility
of using a more flexible aquating method with the condition of sample size according to
KEMDIKBUD rules regarding the maximum number of samples in the class. The sample
size and item will affect the use of the equating method.
Keywords: equating, simpified circle arc, nominal weight mean equating, small sample
-
2
Sinopsis Metode Simplified Circle Arc dan Nominal Weight Mean Equating untuk
Penyetaraan Skor pada Sampel Kecil
Deni Iriyadi
METODE SIMPLIFIED CIRCLE ARC DAN NOMINAL WEIGHT MEAN
EQUATING UNTUK PENYETARAAN SEKOR
PADA SAMPEL KECIL
Abstrak
Penelitian ini bertujuan untuk menentukan metode penyetaraan yang dapat digunakan
pada sampel kecil dengan ditinjau dari bentuk distribusi datanya. Penelitian ini
menggunakan perangkat tes Ujian Nasional Tahun 2015 pada mata pelajaran matematika
dari Pusat Penilaian Pendidikan (PUSPENDIK) untuk daerah DKI Jakarta dan Tangerang.
Hasil penelitian menunjukkan bahwa pada kondisi ukuran sampel 36 dengan jumlah butir
20, hasil penyetaraan dengan menggunakan metode Simplified Circle Arc dan metode
Nominal Weight Mean Equating memiliki kecermatan yang sama pada bentuk distribusi
data normal, distribusi data skewness positif, dan distribusi data skewness negatif.
Sedangkan untuk ukuran sampel 36 dengan jumlah butir 30 dan 40. Hasil penyetaraan
dengan menggunakan metode Simplified Circle Arc lebih cermat daripada metode
Nominal Weight Mean Equating pada bentuk distribusi data normal, distribusi data
skewness positif, dan distribusi data skewness negatif. Sedangkan pada kondisi ukuran
sampel 50 dan 100 dengan jumlah butir 20, 30 dan 40, hasil penyetaraan dengan
menggunakan metode Simplified Circle Arc lebih cermat daripada metode Nominal
Weight Mean Equating pada bentuk distribusi data normal, distribusi data skewness
positif, dan distribusi data skewness negatif. Dari hasil penelitian yang diperoleh, maka
penggunaan metode penyetaraan Simplified Circle Arc dapat diterapkan pada sampel kecil
dengan berbagai variasi jumlah butir. Namun pada kondisi ukuran sampel 36 dengan
jumlah butir 20, penggunaan metode Nominal Weight Mean Equating dapat dijadikan
sebagai salah satu alternatif metode penyetaraan sekor. Penggunaan jumlah butir 20
memberikan kemungkinan penggunaan metode penyetaraan yang lebih fleksibel dengan
kondisi ukuran sampel sesuai aturan KEMDIKBUD mengenai jumlah sampel maksimal
dalam kelas. Ukuran sampel dan butir akan mempengaruhi penggunaan metode
penyetaraan.
Kata Kunci: penyetaraan sekor, simpified circle arc, nominal weight mean
equating. sampel kecil
-
3
Sinopsis Metode Simplified Circle Arc dan Nominal Weight Mean Equating untuk
Penyetaraan Skor pada Sampel Kecil
Deni Iriyadi
PENDAHULUAN
Latar Belakang
Salah satu kunci dalam meningkatkan
mutu pendidikan secara nasional yakni
dengan meningkatkan mutu pendidikan di
tingkat sekolah. Peningkatan tersebut
berkaitan dengan sarana dan prasarana,
kompetensi guru, proses pembelajaran,
dan sebagainya. Dalam melakukan
pembelajaran di kelas, banyak hal yang
menjadi perhatian seorang guru. Salah
satu di antaranya melakukan penilaian.
Selain sebagai bahan evaluasi, hasil dari
penilaian tersebut dijadikan sebagai tolak
ukur untuk melihat kualitas dari
pendidikan peserta didik dalam suatu
satuan Pendidikan (Antara & Bastari,
2015). Penilaian yang dilakukan oleh guru
tidak lepas dari alat ukur yang berupa tes.
Bentuk penilaian yang umum digunakan
yakni bentuk tes pilihan ganda karena
bentuk tes ini dapat dengan mudah
digunakan untuk mengukur beberapa
aspek sekaligus (Ebel & Frisbie, 1991).
Penyusunan butir-butir tersebut selalu
didasarkan pada kisi-kisi. Baik guru
maupun pemerintah melakukan hal
tersebut. Sering dijumpai dalam satu
sekolah terdapat kelas paralel yang diajar
oleh dua atau lebih guru mata pelajaran
yang sama. Setiap guru memiliki
karakteristik mengajar yang berbeda,
namun dalam memberikan tes kepada
peserta didik, guru hanya berdasar pada
kisi-kisi yang ada. Ini akan menghasilkan
perangkat tes yang berbeda. Sering
dijumpai dalam satu sekolah terdapat
kelas paralel yang diajar oleh dua atau
lebih guru mata pelajaran yang sama.
Setiap guru memiliki karakteristik
mengajar yang berbeda, namun dalam
memberikan tes kepada peserta didik, guru
hanya berdasar pada kisi-kisi yang ada. Ini
akan menghasilkan perangkat tes yang
berbeda. Menyusun tes yang benar-benar
paralel tidaklah mudah. Membuat
perangkat tes yang sama tidak akan secara
sempurna saling paralel sehingga sekor
mereka tidak dapat dibandingkan secara
langsung (Gronlund, 1985). Kisi-kisi yang
ada menjadi rujukan utama dalam
menyusun setiap butir pada sekolah dan
daerah yang berbeda. Alat ukur dalam hal
ini perangkat tes yang digunakan untuk
menilai kemampuan akademik anak di
perkotaan tentu tidak adil jika juga
diterapkan di daerah pelosok. Olehnya itu,
ketika sumber acuannya sama tentunya
sekor perolehan dari butir dibuat dapat
disetarakan.
Hasil penilaian dari perangkat tes yang
berbeda diperlakukan sama tanpa
memperhatikan beberapa aspek misalnya
tingkat kesukarannya. Ini dapat
menguntungkan maupun merugikan
beberapa peserta didik. Menjadi suatu hal
yang tidak adil bagi peserta didik. Yang
menjadi permasalahan utama yakni
bagaimana menginterpetasikan hasil dari
perolehan para peserta didik yang telah
mengerjakan perangkat tes yang berbeda
agar tidak terjadi diskriminasi.
Dilakukanlah suatu proses untuk
menghilangkan diskriminasi tersebut
berupa penyetaraan sekor. Penyetaraan ini
dinilai cukup adil dilakukan. Pada
dasarnya yang dilakukan hanya
melakukan penskalaan umum agar sekor
dari berbagai perangkat tes dapat
dibandingkan. Setelah hal tersebut
-
4
Sinopsis Metode Simplified Circle Arc dan Nominal Weight Mean Equating untuk
Penyetaraan Skor pada Sampel Kecil
Deni Iriyadi
dilakukan maka sekor dari perangkat tes X
dan sekor perangkat tes Y berapada pada
skala yang sama. Proses penyetaraan sekor
tersebut secara statistik disebut Equating.
(Kilmen & Demirtasli (2012) menyatakan
bahwa equating merupakan metode
statisktik yang dapat digunakan untuk
melakukan konversi nilai dari tes yang
berbeda dengan konstuk yang sama Hal
tersebut dilakukan untuk menentukan
hubungan antara dari dua tes atau lebih
(Kolen & Brennan, 2004). Penyetaraan
pada sekor perolehan peserta didik dapat
diartikan sebagai pengonversian nilai dari
suatu sekor mentah suatu butir ke butir
lainnya. Ini dilakukan untuk melihat
hubungan antar skala sekor dari dua atau
lebih perangkat tes agar sekor tersebut
dapat diperlakukan secara adil.
Penelitian ini bertujuan untuk
mengetahui metode yang baik untuk
digunakan untuk penyetaraan sekor pada
sampel kecil. Selain itu, bentuk distribusi
sekor juga menjadi fokus penelitian.
Bentuk distribusi tersebut tidak lepas dari
sekor perolehan siswa atas jawaban dari
butir yang diberikan antara lain distribusi
normal, distribusi skewness positif, dan
distribusi skewness negatif. Pada
penelitian ini dilakukan pembandingan
terhadap bentuk distribusi sekor dan
metode penyetaraan sehingga nantinya
dapat diperoleh metode penyetaraan yang
baik untuk kondisi sampel kecil serta
jumlha butir yang berbeda dengan
distribusi sekor yang berbeda.
Rumusan Masalah
Berdasarakan latar belakang,
identifikasi masalah, dan batasan masalah
yang telah dikemukakan di atas, maka
dibuat rumusan masalah sebagai berikut:
1. Manakah yang memiliki variansi hasil penyetaraan yang lebih kecil dengan
distribusi data normal menggunakan
metode Simplified Circle Arc atau
dengan menggunakan metode
Nominal Weight Mean Equating pada
kondisi ukuran sampel 36, 50, dan 100
dengan jumlah butir 20, 30, dan 40?
2. Manakah yang memiliki variansi hasil penyetaraan yang lebih kecil dengan
distribusi data skewness positif
menggunakan metode Simplified
Circle Arc atau dengan menggunakan
metode Nominal Weight Mean
Equating pada kondisi ukuran sampel
36, 50, dan 100 dengan jumlah butir
20, 30, dan 40?
3. Manakah yang memiliki variansi hasil penyetaraan yang lebih kecil dengan
distribusi data skewness negatif
menggunakan metode Simplified
Circle Arc atau dengan menggunakan
metode Nominal Weight Mean
Equating pada kondisi ukuran sampel
36, 50, dan 100 dengan jumlah butir
20, 30, dan 40?
Kebaruan Penelitian (State of the art)
Berbagai metode penyetaraan yang
berdasarkan metode klasik telah
dipaparkan oleh beberapa ahli. Aminah
(2012) dalam penelitiannya
membandingkan metode Linear (Tucker
dan Levine) dengan Equipercentil
(Braund-Holland dan Chained), Skaggs
(2005) yang membandingkan metode
Linear, Mean, Unsmootied, dan Log-
Linear, Ozdemir (2017) membandingkan
-
5
Sinopsis Metode Simplified Circle Arc dan Nominal Weight Mean Equating untuk
Penyetaraan Skor pada Sampel Kecil
Deni Iriyadi
metode Equipercentil dengan Circle Arc,
Aşiret & Sünbül (2016) yang
membandingkan metode Idenetity, Mean,
Linear, Circle Arc dan Presmooted,
Livingston & Kim (2008) yang
membandingkan metode Circle Arc dan
Linear, serta Babcock, Albano, &
Raymond (2012) yang membandingkan
Nominal Weight Mean, Chained, Linear,
Circle Arc, Identity dan Synthetic.
Berdasarkan metode-metode tersebut
dapat dibuat suatu perbandingan baru
dengan harapan memberikan pilihan yang
terbaik untuk penggunaan metode
equating yang efektif. Livingston & Kim
(2010b) melakukan penelitian dengan
membandingkan metode Simetryc dan
Simplified Circle Arc dengan beberapa
metode lainnya namun tidak
membandingkan keakuratan antara kedua
metode Circle Arc tersebut. Ozdemir
(2017) menyatakan bahwa metode Circle
Arc memiliki hasil yang lebih unggul
dibanding dengan metode equipercentil di
mana kedua metode tersebut tergolong
sebagai metode nonlinear yang berbasis
metode klasik. Livingston dan Kim
melakukan modifikasi terhadap metode
Circle Arc yang telah ada sebelumnya dan
membagi metode tersebut menjadi dua
bentuk, satu berbasis linear sedangkan
satunya mengandung unsur nonlinear
meskipun tetap ada unsur linearnya
(Livingston & Kim, 2008). Lebih lanjut
dalam penelitian lainnya, Livingston
menggunakan metode ini dalam
melakukan penyetaran dengan beberapa
kondisi yang berbeda termasuk ukuran
sampel dan menunjukkan hasil bahwa
metode ini memberikan hasil yang akurat
(Livingston & Kim, 2009, 2010b).
Penelitian yang dilakukan oleh Aşiret &
Sünbül (2016) menyatakan bahwa metode
Circle Arc mengasilkan eror penyetaraan
yang lebih rendah dibanding metode
lainnya pada penggunaan sampel kecil.
Babcock et al. (2012) menemukan suatu
metode yang tergolong baru yang dapat
digunakan untuk sampel yag tergolong
kecil. Mereka menyebutnya Nominal
Weight Mean Equating. Dalam
penelitiannya, Bancock, Albano, dan
Raymond membandingkan metode ini
dengan metode Circle Arc namun tidak
secara spesifik terhadap metode Circle
Arc 1 (Symetric Circel Arc) atau metode
Circle Arc 2 (Simplified Circle Arc).
Hasilnya menunjukkan bahwa metode
Nominal Weight Mean Equaitng setelah
dibandingkan dengan beberapa metode
lainnya memberikan hasil yang paling
efektif.
Dari penjelasan di atas dapat dibuat
suatu perbandingan mengenai metode
equating yakni menggunakan Metode
Simplified Circle Arc dan Nominal Weight
Mean Equating. Kedua metode tersebut
pada dasarnya merupakan metode klasik
yang memiliki kesamaan yakni
penggunaannya pada sampel kecil. Hal
yang berbeda dari keduanya yakni metode
Nominal Weight Mean Equating bersifat
linear sedangkan metode Simplified Circle
Arc bersifat nonlinear meskipun di
dalamnya juga terdapat unsur linear.
Bentuk distribusi juga memiliki andil
dalam proses penyetaraan. Menurut
Naiman, Zirkel, & Rosenfeld (1986)
bahwa akurasi pada setiap aplikasi
statistik tergantung dari dua faktor utama
-
6
Sinopsis Metode Simplified Circle Arc dan Nominal Weight Mean Equating untuk
Penyetaraan Skor pada Sampel Kecil
Deni Iriyadi
yaitu ukuran sampel dan bentuk asli
distribusi populasi. Sejalan dengan hal
tersebut, penelitan Uysal & Kilmen (2016)
mengemukakan bahwa distribusi
kemampuan juga berpengaruh terhadap
hasil penyetaraan. Penelitian tersebut
menggunakan pendekatan teori modern
sehingga melakukan estimasi terhadap
kemampuan responden. Lebih lanjut
Uysal dan Kilmen membagi 3 distribusi
tersebut yakni Normal, Skewness Positif,
dan Skewness negatif. Hasil penelitian
sebelumnya juga menyatakan bahwa
distribusi kemampuan juga memiliki
pengaruh terhadap hasil equating (Uysal
& Kilmen, 2016). Yang menjadi pembeda
yakni mengenai distibusi yang digunakan
yang sebelumnya melihat distribusi
kemampuan, penelitian ini menggunakan
distibusi data raw score mengingat
metode penyetaraan yang digunakan
merupakan metode klasik.
Dalam beberapa penelitian yang
menggunakan sampel kecil memberikan
beragam variasi ukuran sampel.
Sementara Aşiret & Sünbül (2016)
menyebutkan bahwa ukuran sampel 50
atau lebih memberikan hasil yang baik
berdasarkan nilai RMSE. S. Kim,
Livingston, & Lewis (2011) melakukan
penelitian pada sampel kecil yakni 10
hingga 200 responden. Albano (2015)
melakukan penelitian tentang metode
linear dengan menggunakan sampel 30,
50, 100, dan 300. S. Kim & Livingston
(2010) melakukan penelitian dengan
menggunakan sampel kecil dengan 10, 25,
50, dan 100. Penelitiannya menunjukkan
bahwa sampel dengan rentang 25 hingga
50 memberikan hasil yang lebih akurat.
Puhan (2011) melakukan penelitian
dengan ukuran sampel 25, 50, 100, dan
500 (ukuran sampel 500 pada dasaranya
tidak dapat dipertimbangkan sebagai
sampel kecil). Babcock et al. (2012)
menggunakan ukuran sampel 20, 50, dan
80. Berdasakan beberapa hasil penelitian
di atas, pada umumnya rentang
penggunaan sampel kecil mulai 20 hingga
200. Oleh karena itu, penelitian ini
menggunakan sampel sebesar 36, 50, dan
100 responen. Pemilihan ukuran sampel
36 didasari pada kondisi jumlah siswa
yang diperbolehkan oleh Kemdikbud
sesuai dengan Peraturan Menteri
Pendidikan Dan Kebudayaan Republik
Indonesia Nomor 17 Tahun 2017 Tentang
Penerimaan Peserta Didik Baru Pada Pasal
24 yakni jumlah maksimal pada siswa
dalam satu kelas maksimal 36 orang
(Kemendikbud, 2017). Ukuran sampel
tersebut juga masih tergolong sampel kecil
berdasarkan beberapa penelitian yang
terlah diuraikan sebelumnya.
Panjang tes yang digunakan pada
penelitian ini mengacu pada jumlah butir
maksimal yang diujikan pada Ujian
Nasional (UN) yakni sebanyak 40 butir.
Untuk panjang tes yang lain merupakan
ketetapan peneliti dengan beralasan bahwa
beberapa materi ajar memiliki lingkup
materi yang tidak begitu luas sehingga
jumlah butir soal yang diperlukan juga
relatif sedikit. Dengan demikian pada
penelitina ini menggunakan panjang tes
20, 30 , dan 40 bentuk variasi dari panjang
tes dengan kelipatan 10.
-
7
Sinopsis Metode Simplified Circle Arc dan Nominal Weight Mean Equating untuk
Penyetaraan Skor pada Sampel Kecil
Deni Iriyadi
KAJIAN TEORI
Distribusi Sekor
Data penelitian akan selalu membentuk
suatu sebaran distribusi. Hal tersebut
disebabkan oleh perolehan sekor yang
dimiliki peserta didik. Beberapa kondisi
menjadikan distribusi tersebut sebagai
suatu prasyarat. Sama halnya untuk proses
penyetaraan yang dipengaruhi oleh
distibusi dari kedua kelompok responden.
Hasil belajar tersebut diharapkan
berbentuk distribusi normal. Namun
demikian tidak dapat sertamerta hal
tersebut dapat diperoleh begitu saja.
Kenyataannya terdapat beberapa bentuk
distribusi yang mungkin terjadi.
Distribusi Probabilitas Normal
Ketika melakukan perhitungan
terhadap suatu kelompok data, terkadang
bentuk distribusi dari kelompok tersebut
menjadi hal yang diperhatikan. Distribusi
normal adalah salah satu distribusi
probabilitas kontinu yang paling penting
dan banyak digunakan dalam statistik dan
bidang ilmu lainnya. Distribusi normal
termasuk distribusi dengan variabel
kontinum (Ahsanullah, Kibria, & Shakil,
2014).
Salah satu cara yang mudah untuk
mengecek distribusi normal suatu data
yakni dengan melihat grafik/kurva. Salah
satu yang umum dan efektif digunakan
yakni Q-Q Plot. Selain itu terdapat
beberapa model grafik lainnya yang juga
dapat digunakan yakni histogram, box-
plot, dan stem and leaf (Razali & Wah,
2011). Meskipun metode grafis dapat
berfungsi sebagai alat yang berguna untuk
memeriksa normalitas sampel, namun
metode ini masih belum cukup untuk
memberikan bukti konklusif untuk asumsi
normal berlaku.
Beberapa peneliti biasa menggunakan
uji normalitas seperti Shapiro-Wilk atau
Kolmogorov-Smirnov. Lebih lanjut Razali
& Wah (2011) menggunakan 4 jenis tes
formal untuk menentukan normalitas
yakni: Shapiro-Wilk, Kolmogorov-
Smirnov, Lilliefors, dan Anderson-
Darling. Hasil dari formula-formula
tersebut dapat menjadi dasar untuk
menyatakan kenormalan suatu data.
Skewness Distribusi
Ketika data tersebut tidak berdistribusi
normal, maka kita harus mengecek
ketidaknormalan tersebut. Salah satu cara
yakni dengan mengukur skewness (Dorić,
Nikolić-Dorić, Jevremović, & Mališić,
2009). Agresti dan Finlay menyatakan
bahwa dalam distribusi skewness, nilai
rerata terletak pada arah miring (ekor yang
lebih panjang) relatif terhadap median
(Agresri & Finlay, 2009). Distribusi tidak
normal yang dipandang dari nilai
skewnessnya dibagi menjadi 2 yakni: (1)
skeweness poisitif dan (2) skeweness
negatif. Skewness adalah ukuran simetri
dalam suatu distribusi. Data simetris akan
memiliki kemiringan sama dengan 0. Jadi,
distribusi normal akan memiliki
kemiringan 0. Secara konseptual,
skewness menggambarkan sisi distribusi
mana yang memiliki ekor yang lebih
panjang (Paul Von, 2010). Skewness pada
dasarnya mengukur ukuran relatif dari dua
ekor berupa ukuran asimetri suatu
distribusi.
-
8
Sinopsis Metode Simplified Circle Arc dan Nominal Weight Mean Equating untuk
Penyetaraan Skor pada Sampel Kecil
Deni Iriyadi
Sama halnya dengan distribusi normal,
skeweness positif (kanan) dan skeweness
negatif (kiri) juga memiliki beberapa
ketentuan. Skewness positif (kanan)
memiliki rasio rerata terhadap median
lebih dari 1 karena pada distribusi ini nilai
rerata biasanya akan lebih besar dari pada
median (Tabor, 2010). Skewness juga
dapat dihitung dengan menggunakan
formula. Tabor menyatakan bahwa
skewness positif (kanan) dapat ditentukan
melalui nilai kuartil berupa rasio dari
kuarti 1 (Q1) dan kuartil 3 (Q3) yang
dirumuskan (𝑚𝑎𝑥 − 𝑄3)/(𝑄1 − 𝑚𝑖𝑛) dimana ketika nilainya lebih dari 1 maka
dapat disimpulkan bahwa data tersebut
memiliki sebaran skewness positif (kanan)
(Tabor, 2010). Nilai negatif untuk
skewness menunjukkan data dengan ekor
yang miring ke kiri dan nilai positif untuk
skewness menunjukkan data dengan ekor
yang miring kanan. Skewness kiri
menyatakan bahwa ekor kiri relatif lebih
panjang daripada ekor kanan. Demikian
pula, skewness kanan berarti ekor kanan
relatif panjang dengan ekor kiri. Jika ekor
panjang ada di sebelah kanan, maka garis
miringnya ke kanan atau positif. Jika ekor
panjang ada di sebelah kiri, maka
kemiringannya adalah ke kiri atau negatif
(Doane & Seward, 2011; Paul Von, 2010).
Denga demikian, kita dapat
mengidentifikasi dengan mudah bentuk
dari suatu distribusi data hanya dengan
melihat arah distribusinya.
Panjang Tes
Jumlah butir dalam suatu tes dalam
dunia psikometri lebih dikenal dengan
istilah panjang tes. Hal ini sejalan dengan
pendapat Ebel & Frisbie (1991) bahwa
jumlah butir soal dalam suatu perangkat
tes ditentukan berdasarkan ketersediaan
waktu pelaksanaan tes. Beberapa tes
dibatasi sampai 50 menit, terkadang lebih
atau kurang, hal ini disesuaikan dengan
jumlah waktu dalam pertemuan di kelas.
Jumlah butir dalam suatu tes yang dapat
dijawab oleh peserta tes setiap menit
tergantung pada jenis pertanyaan yang
digunakan, kesulitan proses berpikir yang
digunakan untuk menjawab butir soal, dan
kebiasaan pengerjaan soal yang dimiliki
oleh peserta tes. Sehingga pada akhirnya,
jumlah butir soal yang digunakan dalam
suatu tes juga tergantung pada
keseluruhan cakupan materi (Ebel &
Frisbie, 1991). Panjang tes juga pada
akhirnya akan berpengaruh pada tingkat
reliabilitas tes tersebut. Hal ini sejalan
dengan pendapat Gunawan (2015) bahwa
semakin banyak jumlah butir tes yang
digunakan akan semakin tinggi reliabilitas
tes tersebut.
Panjang tes dengan 40 butir soal di
dalam penelitian ini adalah seperangkat
pertanyaan dengan bentuk pilihan ganda
biasa yang terdiri atas 40 butir pertanyaan.
Hal ini mengacu kepada Standar
Kompetensi Lulusan (SKL) yang
diterbitkan oleh Badan Standar Nasional
Pendidikan (BSNP) dan akan digunakan
dalam penyusunan soal Ujian Nasional.
Sementara untuk panjang tes yang lain
disesuaikan dengan kodisi jenis tes yang
diberikan. Misalnya untuk soal yang
jenisnya berupa bentuk perhitungan
manual jumlah tes yang diberikan umunya
lebih seidikit (20 butir) jika dibanding
dengan bentuk tes lainnya untuk
-
9
Sinopsis Metode Simplified Circle Arc dan Nominal Weight Mean Equating untuk
Penyetaraan Skor pada Sampel Kecil
Deni Iriyadi
memberikan cukup waktu kepada yang
mengerjakan tes dapat menyelesaikannya.
Panjang tes yang relatif kecil sering
digunkan pada jenjang pendidikan yang
rendah (Fitzpatrick & Yen, 2001). Hal
tersebut menjadi dalah satu alasan dalam
penggunaan panjang tes yang beragam.
Dengan demikian tidak hanya jenjang
pendidikan tinggi saja penelitian ini dapat
diterapkan, namun juga pada jenjang
pendidikan rendah. Lebih lanjut
Fitzpatrick & Yen (2010) menyatakan
bahwa akurasi yang lebih baik diperoleh
dengan meningkatkan jumlah item.
Dengan demikian dilakukan penyesuaian
tehadap panjang tes maksimum yang
dilakukan pada ujian di Indonesia untuk
menjamin reliabilitas intrumen yang baik.
Pada pedoman penilaian untuk kurikulum
2013 tidak dijelaskan mengenai jumlah
minimun dam maksimum butir soal yang
dapat diujikan. Hal tersebut hanya
berdasar pada materi ajar yang akan
diujikan serta jenis penilaian yang akan
diberikan.
Seperti yang telah dijelaskan
sebelumnya bahwa panjang tes identik
dengan nilai reliabilitas. Semakin panjang
suatu tes maka akan semakin reliabel tes
tersebut. Sebagai jumlah panjang tes
standar yang digunakan yaitu 40. Jumlah
tersebut mengacu pada jumlah panjang tes
yang digunakan pada Ujian Nasional.
Sementara untuk panjang tes 20
merupakan estimasi panjang tes yang
dianggap tidak sedikit dan pada umumnya
dapat digunakan di tingkat kelas untuk
melaksanakan beberapa jenis ujian.
Jumlah butir tes yang kecil pada umunya
digunakan pada jenjang pendidikan
rendah (Fitzpatrick & Yen, 2001). Selain
itu ditentukan dengan pertimbangan
bahwa jumlah butir yang sedikit akan
rentang terhadap kesalahan pengukuran
(Kruyen, Emons, & Sijtsma, 2012).
Jumlah soal yang demikian sering
digunakan pada beberapa mata pelajaran
yang disesuaikan dengan jumlah pokok
bahasan atau materi aja yang akan
diujikan. Sementara untuk jumlah panjang
tes 30 merupakan ketetapan dari peneliti
sebagai bentuk variasi dari panjang tes
yang ada (20, 30, dan 40) dengan kelipatan
10.
Penyetaraan Sekor (Equating)
Equating merupakan suatu cara yang
dapat digunakan untuk melakukan proses
penyetaraan sekor dari hasil tes dengan
menggunakan metode statistika dan
psikometrika sehingga kedua sekor dari
perangkat tes tersebut dapat dibandingkan
(Kolen & Brennan, 2014). Equating
digunakan untuk memberikan suatu skala
sekor yang sama sehingga sekor perangat
tes yang disetarakan dapat dipertukarkan
atau dibandingkan satu sama. Beberapa
ahli menyatakan bahwa metode equating
dapat menjadikan sekor dari perangkat tes
yang berbeda dapat dipertukarkan dengan
pengkonversian nilai dari tes yang berbeda
namun mengukur konstruk yang sama
(Hanlbleton, Swaminathan, Rogers, &
Hambleton, 1991; Kilmen & Demirtasli,
2012; S. Kim, von Davier, & Haberman,
2006; Ozdemir, 2017). Perangkat tes yang
akan disetarakan harus memuat konten
yang sama, tingkat kesulitan, dan
reliabilitas yang relatif serupa. Crocker &
Alglna (2008) menyatakan bahwa
-
10
Sinopsis Metode Simplified Circle Arc dan Nominal Weight Mean Equating untuk
Penyetaraan Skor pada Sampel Kecil
Deni Iriyadi
equating merupakan suatu proses yang
menyamakan nilai pada dua instrumen tes.
Instrumen X dan instrumen Y dianggap
setara jika X dan Y mengukur sifat yang
sama dengan reliabilitas yang sama. Untuk
dapat dilakukan penyetaraan sekor,
perangkat tes harus disusun berdasarkan
konten dan konstruk yang sama serta
spesifikasi yang sama.
Sekor yang disetarakan memiliki arti
yang sama terlepas dari kepada siapa dan
kapan tes tersebut diberikan (Herkusumo,
2011). Equating tidak bermaksud hanya
untuk menyesuaikan perbedaan sekor,
tetapi harus diterapkan hanya pada tes
yang dirancang untuk spesifikasi yang
sama. Sekor tes yang diperoleh melalui
penyetaraan antara perangkat tes, nilai
yang diperoleh dapat dipertukarkan.
Dari pendapat di atas dapat
disimpulkan bahwa equating merupakan
prosedur statistika yang digunakan untuk
melakukan transformasi sekor dari suatu
perangkat tes terhadap perangkat tes
lainnya yang mengukur konstruk yang
sama. Pada penelitian ini, peneliti
menggunakan metode klasik sebagai dasar
pemilihan metode equating dengan
pertimbangan bahwa metode tersebut
lebih familiar, rasional, dan mudah untuk
diterapkan (Livingston, 2004). Beberapa
peneliti kemudian membuat beberapa
bentuk perbandingan metode equating.
Metode Penyetaraan Nominal Weight
Mean Equating (NWME)
Beberapa metode penyetaraan
dikembangkan berdasarkan metode
penyetaraan yang telah ada sebelumnya.
Metode tersebut dibuat sebagai bentuk
perbaikan atas kelemahan dari metode
sebelumnya. Salah satu di antaranya yakni
metode Nominal Weight Mean Equating
(NWME). Metode ini merupakan salah
satu bentuk metode penyetaraan linear
pengembangan dari Tucker Method yang
ditujukan untuk penyetaraan dengan
sampel kecil (Babcock et al., 2012;
LaFlair, Isbell, May, Arvizu, & Jamieson,
2017). persamaan (1) untuk metode
Nominal Weight Mean Equating:
………(1)
𝑌𝑁𝑊𝑀𝐸∗ menunjukkan hasil penyetaraan
sekor dari perangkat tes Y ke perangkat tes
X. Seluruh nilai yang terdapat pada
perangkat tes X ketika disubtitusi pada
persamaan di atas, akan diperoleh nilai
penyetaraan perangkat tes Y.
Metode Penyetaraan Simplified Circle
Arc (SCA)
Metode Circle Arc merupakan salah
satu metode nonlinear yang menjelaskan
hubungan nonlinear antara sekor
(Ozdemir, 2017). Livingston dan Kim
menjelaskan bahwa metode ini merupakan
metode penyetaran nonlinier (S. Kim &
Livingston, 2010; Livingston & Kim,
2009). Metode ini dapat melakukan
penyetaraan dengan mereduksi jumlah
parameter untuk mengestimasi hubungan
penyetaraan dengan sampel kecil (Aşiret
& Sünbül, 2016). Hal penting pada metode
ini yakni menentukan dua titik ekstrim
-
11
Sinopsis Metode Simplified Circle Arc dan Nominal Weight Mean Equating untuk
Penyetaraan Skor pada Sampel Kecil
Deni Iriyadi
(maksimum dan minimum) dan titik
tengah yang diperoleh dari data, kemudian
membatasi kurva penyetaraan untuk
melewati titik-titik tersebut. Titik
maksimum (Xmax,Ymax) ditentukan oleh
sekor maksimum dari setiap perangkat tes
sedangkan untuk titik minimum (Xmin,Ymin)
ditentukan oleh sekor minimum dari setiap
perangkat tes. Titik tengah merupakan
hasil dari persamaan (2):
𝑌𝐶𝐿𝐸∗ = 𝜇(𝑌) +
𝜎(𝑌)
𝜎(𝑍𝑌)(𝜇(𝑍𝑋) − 𝜇(𝑍𝑌))
di mana 𝜇(𝑌) yang dapat dituliskan menjadi (𝜇(𝑋), 𝜇(𝑌)) dikarenakan penelitian ini menggunakan anchor item
(Aşiret & Sünbül, 2016; Livingston &
Kim, 2008, 2009, 2010a, 2010b; Ozdemir,
2017). Persamaan untuk penyetaraan
sekor dengan menggunakan metode
Simplified Circle Arc untuk komponen
linear komponen curve sebagai berikut:
𝑌𝑆𝐶𝐴1
∗ = 𝐿𝑖𝑛𝑒𝑎𝑟 + 𝐶𝑢𝑟𝑣𝑒
𝑌𝑆𝐶𝐴1∗ = [𝑌𝑚𝑖𝑛 + +
𝑌𝑚𝑎𝑥−𝑌𝑚𝑖𝑛
𝑋𝑚𝑎𝑥−𝑋𝑚𝑖𝑛(𝑋 − 𝑋𝑚𝑖𝑛)] + [𝑌𝑐(𝑆𝐶𝐴) + √𝑟𝑆𝐶𝐴
2 − (𝑋 − 𝑋𝑐(𝑆𝐶𝐴))2]
𝑌𝑆𝐶𝐴1∗ = 𝑌𝑚𝑖𝑛 + 𝑌𝑐(𝑆𝐶𝐴) +
𝑌𝑚𝑎𝑥−𝑌𝑚𝑖𝑛
𝑋𝑚𝑎𝑥−𝑋𝑚𝑖𝑛(𝑋 − 𝑋𝑚𝑖𝑛) + √𝑟𝑆𝐶𝐴
2 − (𝑋 − 𝑋𝑐(𝑆𝐶𝐴))2
atau
𝑌𝑆𝐶𝐴2∗ = 𝐿𝑖𝑛𝑒𝑎𝑟 + 𝐶𝑢𝑟𝑣𝑒
𝑌𝑆𝐶𝐴2∗ = [𝑌𝑚𝑖𝑛 + +
𝑌𝑚𝑎𝑥−𝑌𝑚𝑖𝑛
𝑋𝑚𝑎𝑥−𝑋𝑚𝑖𝑛(𝑋 − 𝑋𝑚𝑖𝑛)] + [𝑌𝑐(𝑆𝐶𝐴) − √𝑟𝑆𝐶𝐴
2 − (𝑋 − 𝑋𝑐(𝑆𝐶𝐴))2]
𝑌𝑆𝐶𝐴2∗ = 𝑌𝑚𝑖𝑛 + 𝑌𝑐(𝑆𝐶𝐴) +
𝑌𝑚𝑎𝑥−𝑌𝑚𝑖𝑛
𝑋𝑚𝑎𝑥−𝑋𝑚𝑖𝑛(𝑋 − 𝑋𝑚𝑖𝑛) − √𝑟𝑆𝐶𝐴
2 − (𝑋 − 𝑋𝑐(𝑆𝐶𝐴))2
Persamaan (3) digunakan ketika titik
tengah berada di atas garis yang
menghubungkan titik minimum dan titik
maksimum sedangkan persamaan (4)
digunakan ketika titik tengah berada di
bawah garis yang menghubungkan titik
minimum dan titik maksimum.
Penelitian yang Relevan
Penelitian relevan yang pernah
dilakukan dengan menggunakan beberapa
variabel pada penelitian ini adalah sebagai
berikut:
1. Ozdemir (2017) melakukan penelitan dengan membandingkan metode yang
masuk dalam kategori nonlinear yakni
metode Equipersentil dan Circle Arc.
Penelitian ini bertujuan untuk
melakukan penyetaraan terhadap data
TIMSS 2011 dan TIMSS 2007 dengan
menggunakan anchor item. Hasil
penelitian yang diperoleh berdasarkan
Root Mean Square Error (RMSE) dan
Mean of Bootstrap Standard Error
(MBSE) menunjukkan bahwa metode
Circle Arc lebih baik dari metode
Equipercentile dengan Presmoothing.
…..(2)
…..(3)
…..(4)
-
12
Sinopsis Metode Simplified Circle Arc dan Nominal Weight Mean Equating untuk
Penyetaraan Skor pada Sampel Kecil
Deni Iriyadi
2. Aşiret & Sünbül (2016) melakukan penelitian dengan membandingkan
beberapa metode penyetaraan sekor
serta ukuran sampel. Penelitian
tersebut menggunkan Root Mean
Square Error (RMSE) sebagai kriteria
dalam mengevaluasi hasil penyetaraan
tersebut. Hasil penelitiannya
menunjukkan bahwa metode Circle
Arc dan Mean pada ukuran sampel 50
atau lebih (dalam penelitiannya
menggunakan sampel 10, 25, 75, 100,
150, dan 200) dengan tingkat
kesukaran yang berbeda memberikan
Equating Error yang lebih rendah dari
metode penyetaraan lainnya.
3. Livingston & Kim (2009) melakukan penelitian dengan membandingkan
metode Chained, Levine, Tucker,
Mean, Circle Arc, dan Identity.
Penelitian tersebut menggunakan
sampel kecil serta menggunakan Root
Mean Square Error (RMSE) dan bias
sebagai alat untuk mengevaluasi hasil
penyetaraan. Hasil penelitian yang
dilakukan menunjukkan bahwa metode
Circle Arc memberikan nilai RMSE
dan bias yang rendah dibanding dengan
metode lainnya.
4. Babcock et al., (2012) melakukan penelitian dengan menggunakan
metode Nominal Weight Mean
Equating pada sampel kecil (20, 50,
dan 80). Hasil penelitian ini
menunjukkan bahwa metode NWME
merupakan metode yang efektif untuk
berbagai kondisi.
5. Caglak (2016) melakukan penelitian dengan membadingkan beberapa
metode penyetaraan berdasarkan
desain Non-Equivalent Groups
Anchor-Test (NEAT). Hasil
penelitiannya menunjukkan bahwa
metode Nominal Weight Mean
menghasilkan error equating yang
lebih rendah daripada metode lainnya
untuk sampel yang berukuran kecil.
6. Uysal & Kilmen (2016) melakukan penelitian tentang distribusi
kemampuan yang terbagi atas tiga
yaitu distribusi normal, distribusi
skewness positif, dan distribusi
skeweness negatif. Hasil penelitian
tersebut menunjukkan bahwa
kelompok yang memiliki distribusi
kemampuan yang sama (distribusi
normal dengan distribusi normal,
distribusi skewness positif dengan
distribusi skewness positif, dan
distribusi skewness negatif dengan
distribusi skewness negatif)
mengasilkan Error Equating yang
rendah jika dibandingkan dengan
kelompok yang memiliki distribusi
kemampuan yang saling berbeda.
METODOLOGI PENELTIAN
Penelitian ini termasuk penelitian
eksperimen. Penelitian ini menitik-
beratkan bentuk komparatif terhadap
variabelnya. Perlakuan yang dilakukan
dalam penelitian yakni berupa metode
penyetaraan sekor dan distribusi data yang
dilakukan pada kedua kelompok.
Penelitian ini menggunakan dua
kelompok. Variabel terikat dalam
penelitian ini yaitu variansi hasil dari
penyetaraan sekor. Sedangkan untuk
variabel bebasnya yakni metode
-
13
Sinopsis Metode Simplified Circle Arc dan Nominal Weight Mean Equating untuk
Penyetaraan Skor pada Sampel Kecil
Deni Iriyadi
penyetaraan, distribusi data, ukuran
sampel, dan jumlah butir.
Populasi pada penelitian ini yaitu
seluruh siswa SMP Negeri di DKI Jakarta
dan Kota Tengerang tahun 2015 untuk
paket soal POC5530 dan POC1101. Untuk
sampel penelitian dipilih acak sebanyak
36, 50, dan 100 responden untuk setiap
daerah yang masing-masing mengerjakan
perangkat tes X dan perangkat tes Y.
Pemilihan kedua tempat tersebut
dilakukan berdasarkan karakteristik soal
UN pada keduanya yang memilki
kesamaan pada beberapa soal (anchor
item) sesuai dengan desain penelitian yang
telah ditentukan yakni penyetaraan pada
perangkat tes yang memilki anchor item.
Peneliti menggunakan 2 jenis
perangkat tes dengan anchor item serta
memiliki 4 pilihan jawaban. Perangkat tes
yang digunakan dalam penelitian ini yakni
soal Ujian Nasional (UN) mata pelajaran
matematika tahun 2015 dengan kode soal
POC5530 sebagai perangkat tes X dan
kode soal POC1101 sebagai perangkat tes
Y. Intrumen yang digunakan merupakan
soal UN yang dikembangkan oleh Pusat
Penilaian Pendidikan (PUSPENDIK).
Dengan demikian seluruh unsur dari
parameter butir pada intrumen tersebut
telah memenuhi seluruh kriteria. Dengan
menggunakan asumsi tersebut
memberikan jaminan mengenai intrumen
yang digunakan baik.
Lebih lanjut bahwa untuk mengetahui
tingkat kesukaran soal dapat meilihat
tingkat kognitif pada soal tersebut. Dalam
ranah kognitif, terdapat beberapa
tingkatan kesukaran yang menjadikan
butir-butir soal yang dikembangkan
berada pada level-level tertentu. Level
taksonomi tersebut dikenal dengan
taksonomi Bloom yang direvisi oleh
Anderson yaitu: (1) mengingat, (2)
mamahami, (3) menerapkan, (4)
menganalisi, (5) menilai, dan (6)
menciptakan. Setiap level pengetahuan itu
memiliki level kesukaran yang berbeda.
Dimulai pada level yang mudah hingga ke
level yang sulit. Dari setiap butir-butir
yang ada pada kedua instrumen tersebut
(POC5530 dan POC1101) tentu memiliki
level yang berbeda yang dapat
menunjukkan tingkat kesukaran untuk
setiap butir soalnya.
HASIL PENELITIAN DAN
PEMBAHASAN
Deskripsi Data Penelitian
Dalam penelitian ini, data terbagi
menjadi tiga kelompok data yaitu: (1) data
responden yang berdistribusi normal, (2)
data responden yang berdistribusi
distribusi skewness positif, dan (3) data
responden yang berdistribusi distribusi
skewness negatif.
Deskripsi Data Kelompok
Berdistribusi Normal
Berikut boxplot dan stem and leaf
untuk dapat melihat distribusi data secara
visual untuk 30 butir soal dengan ukuran
sampel 50 seperti pada Gambar 1 dan
Gambar 2.
-
14
Sinopsis Metode Simplified Circle Arc dan Nominal Weight Mean Equating untuk
Penyetaraan Skor pada Sampel Kecil
Deni Iriyadi
Perangkat Tes X Perangkat Tes Y
Gambar 1. Boxplot Kelompok Siswa
dengan Distribusi Data Normal
Perangkat Tes X
Perangkat Tes Y
Gambar 2. Stem and Leaf Kelompok Siswa
dengan Distribusi Data Normal
Pada Gambar 1 dan Gambar 2, nampak
bahwa data tersebut dapat dikategorikan
berdistribusi normal jika dilihat secara
visual. Kedudukan grafik yang menyebar
dan berkumpul di tengah menunjukkan
bahwa data tersebut berdistribusi normal.
Hal ini didukung dengan gambar boxplot
yang menunjukkan gasir wishker yang
memiliki panjang antara bagian atas dan
bawah sama. Selain itu dari boxplot juga
menunjukkan bahwa pada kelompok
tersebut tidak terdapat data outlier. Pada
diagram Stem and Leaf nampak data pada
umumnya berkumpul di tengah. Sekor
responden yang bernilai rendah dan tinggi
memiliki jumlah yang jauh lebih sedikit
dari responden yang bernilai sedang.
Secara statistik juga menunjukkan bahwa
nilai Liliefors (Dhitung) masing-masing
sebesar 0,103 dan 0,096 lebih kecil dari
nilai tabel (Dtabel = 0,125). Dari hasil
tersebut maka dapat disimpulkan bahwa
data berdistribusi normal.
Deskripsi Data Kelompok Berdistribusi
Skewness Positif
Berikut boxplot dan stem and leaf
untuk dapat melihat distribusi data secara
visual untuk 30 butir soal dengan ukuran
sampel 50 seperti pada Gambar 3 dan
Gambar 4.
-
15
Sinopsis Metode Simplified Circle Arc dan Nominal Weight Mean Equating untuk
Penyetaraan Skor pada Sampel Kecil
Deni Iriyadi
Perangkat Tes X Perangkat Tes Y
Gambar 3. Boxplot Kelompok Siswa dengan
Distribusi Data Skewness Positif
Perangkat Tes X
Perangkat Tes Y
Gambar 4. Stem and Leaf Kelompok Siswa
dengan Distribusi Data Skewness Positif
Pada Gambar 3 dan Gambar 4, nampak
bahwa data tersebut dapat dikategorikan
berdistribusi skewness positif jika dilihat
secara visual. Kedudukan grafik yang
menyebar dan berkumpul di pada interval
nilai yang memiliki sekor rendah
menunjukkan bahwa data tersebut
berdistribusi skewness positif. Hal ini
didukung dengan gambar boxplot yang
menunjukkan gasir wishker yang memiliki
panjang antara bagian atas dan bawah
yang tidak sama di mana garis atas lebih
panjang dari garis bawah. Selain itu,
boxplot juga menunjukkan bahwa pada
kelompok tersebut tidak terdapat data
outlier. Pada diagram Stem and Leaf
nampak data pada umumnya berkumpul
pada nilai rendah. Sekor responden yang
bernilai rendah memiliki jumlah yang
tinggi daripada responden yang bernilai
tinggi. Secara statistik juga menunjukkan
bahwa nilai Liliefors (Dhitung) masing-
masing sebesar 0,171 dan 0,169 yang
nilainya lebih besar dari nilai tabel (Dtabel
= 0,125). Dengan demikian ke dua
kelompok tersebut tidak berdistribusi
normal
Secara matematis, nilai skewness yang
dijelaskan oleh Tabor menunjukkan
bahwa nilai kuartil berupa rasio “(𝑚𝑎𝑥 −𝑄3)/(𝑄1 − 𝑚𝑖𝑛)” untuk perangkat tes X sebesar 8,25 dan perangkat tes Y sebesar
2,78 yang berarti bahwa kelompok data
tersebut memiliki sebaran skewness positif
berdasarkan kriteria bahwa nilai skewnya
lebih dari 1. Sedangkan berdasarkan
persamaan skewness oleh Bowley, nilai
Fisher Pearson Standardized moment
coefficient diperoleh nilai skewness
sebesar 0,467 untuk perangkat tes X dan
0,572 untuk perangkat tes Y seperti pada
Tabel 4.5.
-
16
Sinopsis Metode Simplified Circle Arc dan Nominal Weight Mean Equating untuk
Penyetaraan Skor pada Sampel Kecil
Deni Iriyadi
Nilai positif menunjukkan bahwa data
berdistribusi skewness positif. Dari
beberapa kriteria tersebut dapat dikatakan
bahwa data tersebut berdistribusi skewness
positif. Dengan demikian data pada
kelompok tersebut tergolong pada
distribusi skewness positif.
Tabel 1 Rekapitulasi Nilai Skewness
Deskripsi Data Kelompok Berdistribusi
Skewness Negatif
Berikut boxplot dan stem and leaf
untuk dapat melihat distribusi data secara
visual untuk 30 butir soal dengan ukuran
sampel 50 seperti pada Gambar 5 dan
Gambar 6.
Perangkat Tes X Perangkat Tes Y
Gambar 5. Boxplot Kelompok Siswa dengan
Distribusi Data Skewness Negatif
Perangkat Tes X
Perangkat Tes Y
Gambar 6. Stem and Leaf Kelompok Siswa
dengan Distribusi Data Skewness Negatif
Pada Gambar 5 dan Gambar 6, nampak
bahwa data tersebut dapat dikategorikan
berdistribusi skewness negatif jika dilihat
secara visual. Kedudukan grafik yang
menyebar dan berkumpul di pada interval
nilai yang memiliki sekor tinggi
menunjukkan bahwa data tersebut
berdistribusi skewness negatif. Hal ini
didukung dengan gambar boxplot yang
menunjukkan gasir wishker yang memiliki
panjang antara bagian atas dan bawah
yang tidak sama di mana garis bawah lebih
panjang dari garis atas. Selain itu, boxplot
juga menunjukkan bahwa pada kelompok
-
17
Sinopsis Metode Simplified Circle Arc dan Nominal Weight Mean Equating untuk
Penyetaraan Skor pada Sampel Kecil
Deni Iriyadi
tersebut tidak terdapat data outlier. Pada
diagram Stem and Leaf nampak data pada
umumnya berkumpul pada nilai tinggi.
Sekor responden yang bernilai tinggi
memiliki jumlah yang banyak daripada
responden yang bernilai rendah. Secara
statistik juga menunjukkan bahwa nilai
Liliefors (Dhitung) masing-masing sebesar
0,147 dan 0,139 yang nilainya lebih besar
dari nilai tabel (Dtabel = 0,125). Dengan
demikian ke dua kelompok tersebut tidak
berdistribusi normal
Secara matematis, nilai skewness yang
dijelaskan oleh Tabor menunjukkan
bahwa nilai kuartil berupa rasio “(𝑚𝑎𝑥 −𝑄3)/(𝑄1 − 𝑚𝑖𝑛)” untuk perangkat tes X sebesar 0,167 dan perangkat tes Y sebesar
0,125 menunjukkan bahwa kelompok data
tersebut memiliki sebaran skewness
negatif berdasarkan kriteria bahwa nilai
skewnya kurang dari 1. Sedangkan
berdasarkan persamaan skewness oleh
Bowley, nilai Fisher Pearson
Standardized moment coefficient
diperoleh nilai skewness sebesar -0,716
untuk perangkat tes X dan -0,682 untuk
perangkat tes Y seperti pada Tabel 2.
Tabel 2. Rekapitulasi Nilai Skewness Negatif
Nilai negatif menunjukkan bahwa data
berdistribusi skewness negatif. Dari
beberapa kriteria tersebut dapat dikatakan
bahwa data tersebut berdistribusi skewness
negatif. Dengan demikian data pada
kelompok tersebut tergolong pada
distribusi skewness negatif.
Pengujian Hipotesis
Uji Normalitas
Pada penelitian ini, data akan diuji
dengan menggunakan analisis perbedaan
variansi dua kelompok. Berdasarkan hasil
perhitungan yang dilakukan, maka
diperoleh hasil uji normalitas Dhitung Dari hasil anaslisis menunjukkan
bahwa hanya bentuk distribusi data awal
normal yang memenuhi kriteria variasi
hasil penyetaraan yang berdistribusi
normal baik yang menggunakan metode
Simplified Circle Arc, metode Nominal
Weight Mean Equting, ukuran sampel 36
hingga 100, serta jumlah butir 20 hingga
40 dengan kriteria nilai Dhitung (untuk
ukuran sampel 36 berkisar dari 0,90 –
0,148; untuk ukuran sampel 50 berkisar
dari 0,076 – 0,115; dan untuk ukuran
sampel 100 berkisar dari 0,060 – 0,080)
lebih kecil dari nilai Dtabel (untuk ukuran
sampel 36 sebesar 0,148; untuk ukuran
sampel 50 sebesar 0,125; dan untuk
ukuran sampel 100 sebesar 0,089).
Seluruh kondisi tersebut memenuhi
kriteria normalitas. Untuk kondisi lainnya,
variansi hasil penyetaraan tidak memenuhi
kriteria normalitas dengan nilai Dhitung
lebih besar dari nilai Dtabel.
Berdasarkan teorema limit pusat
bahwa tidak menjadi masalah apapun
bentuk dari distribusi populasinya,
estimasi terhadap ukuran sampel tetap
akan berdistribusi sama (berdistribusi
normal) untuk n ≥ 30 (Agresri & Finlay, 2009; Berenson, Levine, & Krehbiel,
2012; Lind, Marchal, & Wather, 2012).
-
18
Sinopsis Metode Simplified Circle Arc dan Nominal Weight Mean Equating untuk
Penyetaraan Skor pada Sampel Kecil
Deni Iriyadi
Hal tersebut dapat dijadikan sebagai
landasan untuk mempertimbangkan
prasyarat normalitas. Dengan demikian
berdasarkan penjenjelasan di atas, maka
proses analisis dapat diteruskan untuk
dilakukan analisis inferensi.
Pengujian Hipotesis
Pengujian hipotesis pada penelitian ini
dilakukan dengan menguji hipotesis nol
untuk melihat perbedaan variansi hasil
penyetaraan sekor dengan menggunakan
metode penyetaraan yang berbeda serta
distribusi sekor awal, ukuran sampel, dan
jumlah butir soal yang berbeda pula.
Sesuai dengan penjelasan sebelumnya
mengenai uji prasyarat normalitas, maka
untuk dua puluh tujuh hipotesis yang ada
dapat diuji menggunakan uji perbedaan
variansi dua kelompok.
Tabel 3. Rekapitulasi Pengujian Hipotesis
Pembahasan Hasil Penelitian
Pengujian hipotetsis penelitian tentang
perbedaan variansi hasil penyetaraan
sekor dengan menggunakan metode
penyetaraan Simplified Circle Arc (SCA)
dan Nominal Weight Mean Equating
(NWME) pada tiga jenis distribusi data,
jumlah sam menunjukkan kedua puluh
tujuh hipotesis nol (H0) ditolak atau
hipotesis penelitian (H1) diterima.
Pengujian tersebut dilakukan dengan
memperhatikan pasangan distribusi sekor
yang memilki distribusi yang sama.
Hipotesis Dengan Ukuran Sampel 36
dengan Butir 20, 30, dan 40
Pada pengujuan hipotesis yang telah
dilakukan sebelumnya menunjukkan
bahwa terdapat 3 hipotesis yang ditolak
yang terjadi pada ukuran sampel 36
dengan jumlah butir 20 pada hipotesis
pertama yakni perbandingan variansi hasil
penyetaraan sekor dengan distribusi data
normal menggunakan metode Simplified
Circle Arc dan metode Nominal Weight
Mean Equating dengan ukuran sampel 36
dan jumlah butir 20, kesepuluh yakni
perbandingan variansi hasil penyetaraan
sekor dengan distribusi data skewness
positif menggunakan metode Simplified
Circle Arc dan metode Nominal Weight
Mean Equating dengan ukuran sampel 36
dan jumlah butir 20 dan hipotesis
kesembilan belas yakni penyetaraan sekor
-
19
Sinopsis Metode Simplified Circle Arc dan Nominal Weight Mean Equating untuk
Penyetaraan Skor pada Sampel Kecil
Deni Iriyadi
dengan distribusi data skewness negatif
menggunakan metode Simplified Circle
Arc dan metode Nominal Weight Mean
Equating dengan ukuran sampel 36 dan
jumlah butir 20. Ketiga hipotesis tersebut
ditolak yang berarti bahwa untuk bentuk
distribusi data normal, distribusi data
skewness positif, dan distribusi data
skewness negatif kecermatan hasil
penyetaraan dengan menggunakan metode
Simplified Circle Arc tidak memilik
perbedaan dengan kecermatan hasil
penyetaraan dengan menggunakan metode
Nominal Weight Mean Equating. Hasil
tersebut diperoleh berdasarkan pengujian
perbandingan variansi serta perbandingan
rerata RMSE hasil 30 replikasi. Kedua uji
inferensi tersebut meyakinkan akan hasil
dari pengujian hipotesis yang dilakukan
Jika ditinjau dari besaranya nilai
variansi yang dihasilkan menunjukkan
bahwa variansi dari metode Nominal
Weight Mean Equating lebih besar dari
variansi metode Simplified Circle Arc
dengan perbedaan yang tidak signifikan.
Hal tersebut diakibatkan dari ukuran
sampel dan butir yang tergolong kecil
sebagai mana kita ketahui bahwa metode
Nominal Weight Mean Equating
dikembangkan untuk penyetaraan dengan
ukuran sampel yang sangat kecil (Babcock
et al., 2012). Selain itu jumlah butir yang
tergolong kecil juga akan berpengaruh
terhadap hasil penyetaraannya. Dengan
demikian hasil penyetaraan tersebut dapat
digunakan untuk membandingkan nilai
dari kelompok yang disetarakan.
Ukuran sampel 36 dan butir 20
menjadikan sekor hasil penyetaraan
dengan menggunakan kedua metode
tersebut menjadi cermat. Ini disebabkan
ukuran sampel dan jumlah butir yang
“kecil”. Jumlah tersebut menjadikan
kemungkinan sekor perolehan dari peserta
didik memiliki nilai yang cenderung
homogen ditambah lagi dengan tingkat
kesukaran dari kedua perangkat tes yang
diberikan cenderung sama. Sementara
untuk metode Simplified Circle Arc hal
tersebut bukanlah suatu yang
berpengaruh. Dengan ukuran sampel dan
butir yang kecil makan akan menghasilkan
variansi yang kecil pula. Ketika nilai
parameter yang kita peroleh melalui
estimasi mengadung variansi yang besar,
maka itu berarti bahwa nilai parameter
yang diperoleh adalah kurang tajam atau
kurang cermat. Sebaliknya, jika nilai
parameter yang kita peroleh melalui
estimasi mengandung variansi yang kecil,
maka itu berarti nilai parameter yang kita
peroleh cukup tajam atau cukup cermat
(Naga, 1992). Dari hasil penelitian yang
dilakukan ini dapat memberikan alternatif
bagi guru baik dalam hal menentukan
metode penyetaraan yang cocok untuk
diterapkan juga mengenani jumlah butir
yang dapat digunakan. Untuk ukuran
sampel khusus pada tingkat kelas pada
umumnya telah mengikuti aturan jumlah
maksimal peserta didik sesui Peraturan
Menteri Pendidikan dan Kebudayaan
Nomor 17 tahun 2017 Pasal 24. Baik
KEMNDIKBUD maupun PUSPENDIK
tidak menentukan jumlah butir minimal
dalam penyusunan suatu instrumen
penilaian. Jumlah tersebut didasarkan
pada materi ajar dan jenis tes yang
dikembangkan. Jumlah butir 20
merupakan jumlah butir yang umun
-
20
Sinopsis Metode Simplified Circle Arc dan Nominal Weight Mean Equating untuk
Penyetaraan Skor pada Sampel Kecil
Deni Iriyadi
digunakan dalam penyusunan beberapa
perangkat tes dengan cakupan materi
sedang. Jenjang pendidikan juga
mempengaruhi penyusunan jumlah butir
tes tersebut. Pada pemberian ulangan
harian pada tingkat sekolah dasar akan
berbeda dengan sekolah menengah
pertama maupun sekolah menengah atas.
Selain itu kemampuan guru dalam dalam
menyampaikan materi ajar serta
mneyusun butir soal juga akan
mempengaruhi kualitas butir soal dan
kemampuan anak dalam menjawab. Hal
tersebut tentu menjadi suatu perhatian
mengenai sekor perolehan mereka. Pada
metode penyetaraan Simplified Circle Arc
dan Nominal Weight Mean Equating
dengan kondisi tersebut tetap dapat
diterapkan untuk menjadi “alat” dalam
melakukan penyetaraan sekor. Meskipun
tidak dapat dipungkiri bahwa tingkat
kesukaran butir soal akan mempengaruhi
hasil penyetaraan sekor.
Pada ukuran sampel 36 dengan butir 30
dan 40 hipotesis untuk masing-masing
bentuk distribusi data diterima. Hipotesis
untuk bentuk distribusi nomal antara lain
hipotesis kedua dan ketiga yakni masing-
masing perbandingan variansi hasil
penyetaraan sekor dengan distribusi data
normal menggunakan metode Simplified
Circle Arc dengan metode Nominal
Weight Mean Equating dengan ukuran
sampel 36 dan jumlah butir 30 dan jumlah
butir 40. Hipotesis untuk bentuk distribusi
skewness positif antara lain hipotesis
kesebelas dan kedua belas yakni masing-
masing perbandingan variansi hasil
penyetaraan sekor dengan distribusi data
skewness positif menggunakan metode
Simplified Circle Arc dengan metode
Nominal Weight Mean Equating dengan
ukuran sampel 36 dan jumlah butir 30 dan
jumlah butir 40. Hipotesis untuk bentuk
distribusi skewness negatif antara lain
hipotesis kedua puluh dan kedua puluh
satu yakni perbandingan variansi hasil
penyetaraan sekor dengan distribusi data
skewness negatif menggunakan metode
Simplified Circle Arc dengan metode
Nominal Weight Mean Equating dengan
ukuran sampel 36 dan jumlah butir 40.
Nilai variansi yang kecil menunjukkan
bahwa data pada kelompok tersebut
memiliki range yang kecil terhadap nilai
rerata serta data yang cenderung homogen.
Ketika nilai parameter yang kita peroleh
melalui estimasi mengadung variansi yang
besar, maka itu berarti bahwa nilai
parameter yang diperoleh adalah kurang
tajam atau kurang cermat. Jumlah butir
yang semakin banyak, maka kemungkinan
variasi nilai yang dihasilkan juga akan
semakin banyak. Variasi yang banyak
akan berimplikasi pada beragamnya nilai
sehingga variansinya juga akan semakin
besar. Hal ini menjadi salah satu alasan
mengapa RMSE pada penyetaraan dengan
metode Nominal Weight Mean Equating
akan menjadi lebih besar dari metode
Simplified Circle Arc. Selain itu, metode
Simplified Circle Arc baik ukuran sampel
maupun ukuran sampel tidak menjadi
suatu permasalah karena pada metode ini
nilai maksimum dan minimumlah yang
menjadi faktor penting sebagai dua titik
ekstrim mengingat metode ini
menggunakan prinsip persamaan busur
lingkaran.
-
21
Sinopsis Metode Simplified Circle Arc dan Nominal Weight Mean Equating untuk
Penyetaraan Skor pada Sampel Kecil
Deni Iriyadi
Secara grafik hasil penyetaraan dapat
terlihat bahwa untuk metode Simplified
Circle Arc akan berbentuk curve yang
mengindikasikan jika sebaran nilai hasil
penyetaraan memiliki selisih yang kecil
terhadap reratanya. Metode Nominal
Weight Mean Equating pada dasarnya
berbasis linear begitupun pada metode
Simplified Circle Arc yang mengandung
unsur linear meskipun dikombinasikan
dengan komponen curve. Formula yang
diberikan oleh kedua metode tersebut
memperlihatkan beberapa kemiripan
khususnya pada kompenen linear yang
terdapat pada metode Simplified Circle
Arc. Meskipun demikian terdapat
beberapa hal yang dapat mempengaruhi di
antarnya jumlah anchor item dan jawaban
dari responden. Pada metode Nominal
Weight Mean Equating kedudukan anchor
item menjadi bagian dari formula untuk
menghitung hasil penyetaraan sekor
sedangkan pada metode Simplified Circle
Arc kedudukan anchor item digunakan
untuk hanya untuk menentukan titik
tengah saja. Selain itu, metode Simplified
Circle Arc memiliki fleksibilitas mengenai
kondis dari parameter butirnya. Albano
menyatakan bahwa metode Circle Arc
dapat digunakan dengan tingkat kesukaran
yang berbeda (Albano, 2015). Sejalan
dengan itu, Livingston dan Kim
menyatakan bahwa metode Circle Arc
menghasilkan nilai error yang rendah
daripada metode penyetaran dengan
menggunakan sampel kecil pada berbagai
kondisi (Livingston & Kim, 2009, 2010b,
2010a). Dengan demikian metode ini lebih
fleksibel dalam penggunanaannya.
Sedangkan untuk metode Nominal Weight
Mean Equating (metode linear) meskipun
tidak terlalu menekankan pada kesamaan
pada tingkat kesukaran, namun hal
tersebut tetap mempengaruhi hasil
penyetaraan sekor.
Pada penyetaraan dengan distribusi
data skewness positif, nilai variansi hasil
penyetaraan akan bernilai keci ketika pada
komponen curve untuk metode Simplified
Circle Arc menggunakan persamaan
𝑌2∗ = 𝑌𝑐(𝑆𝐶𝐴) − √𝑟𝑆𝐶𝐴
2 − (𝑋 − 𝑋𝑐(𝑆𝐶𝐴))2 ……(5)
Ini terjadi karena pada distribusi
skewness positif data berada cenderung
berada pada nilai yang rendah. Rerata data
akan bernilai kecil. Ketika data tersebut
dimasukkan ke dalam persamaan (5) maka
nilai reratanya semakin kecil. Rerata yang
kecil berarti data pada kelompok tersebut
pada umumnya kecil (seperti kondisi
skewness positif). Dalam kaitannya
dengan variansi yang merupakan jarak
antara data dengan nilai rerata, maka akan
menghasilkan nilai variansi yang kecil
pula sebagai akibat dari kerapatan data
dengan reratanya.
Hipotesis Dengan Ukuran Sampel 50
dengan Butir 20, 30, dan 40
Dari pengujian hipotesis yang telah
dilakukan sebelumnya menunjukkan
bahwa untuk ukuran sampel 50 seluruh
hipotesis yang diajukan diterima.
Hipotesis untuk distribusi normal yakni
hipotesis keempat, kelima, dan keenam
tentang perbandingan variansi hasil
penyetaraan sekor dengan distribusi data
normal menggunakan metode Simplified
Circle Arc dengan metode Nominal
Weight Mean Equating dengan ukuran
-
22
Sinopsis Metode Simplified Circle Arc dan Nominal Weight Mean Equating untuk
Penyetaraan Skor pada Sampel Kecil
Deni Iriyadi
sampel 50 dan masing-masing jumlah
butir 20, 30, dan 40. Untuk Hipotesis
tentang distribusi skewness positif yakni
hipotesis ketiga belas, keempat belas, dan
kelima belas tentang perbandingan
variansi hasil penyetaraan sekor dengan
distribusi data skewness positif
menggunakan metode Simplified Circle
Arc dengan metode Nominal Weight Mean
Equating dengan ukuran sampel 50 dan
masing-masing jumlah butir 20, 30, dan
40. Sementara untuk Hipotesis tentang
distribusi skewness negatif yakni hipotesis
kedua puluh dua, kedua puluh tiga, dan
kedua puluh empat tentang perbandingan
variansi hasil penyetaraan sekor dengan
distribusi data skewness negatif
menggunakan metode Simplified Circle
Arc dengan metode Nominal Weight Mean
Equating dengan ukuran sampel 50 dan
masing-masing jumlah butir 20, 30, dan
40. Dari seluruh hipotesis tersebut
menunjukkan bahwa metode penyetaraan
Simplified Circle Arc lebih cermat
daripada metode penyetaraan Nominal
Weight Mean Equating pada kondisi
ukuran sampel 50 dengan butir 20, 30, dan
40.
Ukuran sampel menjadi salah satu
alasan mengapa metode Simplified Circle
Arc lebih cermat dari metode Nominal
Weight Mean Equating meskipun jumlah
butirnya hanya 20. Ukuran sampel 50
menjadikan kemungkinan jawaban peserta
didik pada kelompok tersebut menjadi
beragam. Seperti yang telah dijelaskan
sebelumnya bahwa pada kondisi ukuran
sampel 36 dengan butir 20 menjadikan
kecermatan kedua metode sama, namun
pada kondisi ukuran sampel 50 hal
tersebut tidak terjadi. Metode penyetaran
Simplified Circle Arc memberikan hasil
yang lebih cermat. Ini dikarenakan ukuran
sampelnya. Selain itu, Aşiret & Sünbül
(2016) menyakan bahwa metode Circle
Arc akurat ketika sampel berada pada
ukuran sampel 50 atau lebih. Nilai
keakuratan tersebut diukur dari nilai
variansi yang kecil. Lebih lanjut
dijelaskan bahwa ketika perbedaan tingkat
kesukaran antara perangkat tes, metode
Circle Arc tetap memberikan hasil yang
baik. Hal ini menjadikan metode Circle
Arc lebih fleksibel dalam penggunaannya.
Livingston & Kim (2010a) melakukan
penelitian mengenai ukuran sampel dari
50 hingga 400 dengan kelompok yang
equivalen menunjukkan bahwa metode
Circle Arc menghasilkan akurasi yang
baik dari sampel yang dikondisikan
tersebut. Pada penelitian tersebut tidak
secara jelas mengenai metode Simplified
Circle Arc yang merupakan pembagian
dari metode Circle Arc. Namun dalam
penelitian tersebut disimpulkan secara
umum jika metode Cirlce Arc
memberikan estimasi yang baik. Ukuran
sampel dan butir menjadi salah satu alasan
mengapa metode Simplified Circle Arc
lebih cermat dari metode Nominal Weight
Mean Equatin. Sejalan dngan hal tersebut,
Aşiret & Sünbül (2016) menyakan bahwa
metode Circle Arc akurat ketika sampel
berada pada ukuran sampel 50 atau lebih.
Nilai keakuratan tersebut diukur dari nilai
RMSE yang kecil. Lebih lanjut dijelaskan
bahwa ketika perbedaan tingkat kesukaran
antara perangkat tes, metode Circle Arc
tetap memberikan hasil yang baik. Hal ini
-
23
Sinopsis Metode Simplified Circle Arc dan Nominal Weight Mean Equating untuk
Penyetaraan Skor pada Sampel Kecil
Deni Iriyadi
menjadikan metode Circle Arc lebih
fleksibel dalam penggunaannya.
Dalam penyetaraan sekor, model yang
paling umum digunakan adalah model
persamaan linear, namun metode ini
memilik asumsi dasarnya bahwa dalam
populasi target, distribusi skor pada
perangkat tes X dan pada perangkat tes Y
hanya berbeda pada rerata dan standar
deviasinya (tidak memperhitungkan
distribusi data). Berkaca dengan hal ini,
asumsi tersebut susah untuk diterima
mengingat bahwa dalam penyusunan
perangkat tes hanya berpedoman pada satu
kisi-kisi yang sama. Ketika Namun, ketika
bentuk tes berbeda tingkat kesulitan,
hubungan penyetaraan di antara mereka
biasanya tidak linear. Metode nonlinear
baik digunakan ketika asumsi tingkat
kesukaran antara perangkat tes X dan
perangkat tes Y berbeda (Albano, 2015).
Tidak tekecuali dengan metode Circle Arc
yang mendefinisikan hubungan nonlinear
antara skala sekor.
Pada penyetaraan dengan distribusi
data skewness negatif, nilai variansi hasil
penyetaraan akan bernilai keci ketika pada
komponen curve untuk metode Simplified
Circle Arc menggunakan persamaan
𝑌2∗ = 𝑌𝑐(𝑆𝐶𝐴) + √𝑟𝑆𝐶𝐴
2 − (𝑋 − 𝑋𝑐(𝑆𝐶𝐴))2 …... (6)
Ini terjadi karena pada distribusi
skewness negatif data berada cenderung
berada pada nilai yang tinggi. Kurva
penyetaraan akan melengkung terbuka ke
bawah (positif). Jika diliat dari persamaan
untuk variansi nampak bahwa selisih
antara nilai penyetaran dengan nilai rerata
hasil penyetaraan tersebut. Tentu untuk
metode Simplified Circle Arc nilai tersebut
akan kecil. Sama halnya dengan bentuk
data skewness positif, pada bentuk data
skewness negatif kelompok data umumnya
berkumpul pada nilai tinggi dijumlahkan
dengan sebuah nilai yang berbentuk curve
maka akan menjadikan kelompok nilai
tersebut memiliki range yang semakin
kecil sehingga variansinya juga akan
semakin kecil. Persamaan (6) inilah yang
menjadikan hasil penyetaraan sekor pada
metode Simplified Circle Arc untuk
bentuk data awal yang berdistribusi
skewness negatif akan menghasilkan
variasi kecil sehingga khusus pada bentuk
data skwness negatif metode penyetaraan
yang cermat digunakan yakni Simplified
Circel Arc dengan persamaan curve (6).
Berbeda ketika kelompok nilai yang
berdistribusi skewness negatif
diperkurangkan dengan kelompok data
yang berbentuk curve maka range nilai
yang dihasilkan akan semakin besar
begitupun dengan variasi yang dihasilkan.
Hipotesis Dengan Ukuran Sampel 100
dengan Butir 20, 30, dan 40
Dari pengujian hipotesis yang telah
dilakukan sebelumnya menunjukkan
bahwa untuk ukuran sampel 100 seluruh
hipotesis yang diajukan diterima.
Hipotesis untuk distribusi normal yakni
hipotesis ketujuh, kedelapan, dan
kesembilan tentang perbandingan variansi
hasil penyetaraan sekor dengan distribusi
data normal menggunakan metode
Simplified Circle Arc dengan metode
Nominal Weight Mean Equating dengan
ukuran sampel 100 dan masing-masing
jumlah butir 20, 30, dan 40. Untuk
hipotesis tentang distribusi skewness
-
24
Sinopsis Metode Simplified Circle Arc dan Nominal Weight Mean Equating untuk
Penyetaraan Skor pada Sampel Kecil
Deni Iriyadi
positif yakni hipotesis keenam belas,
ketujuh belas, dan kedepan belas tentang
perbandingan variansi hasil penyetaraan
sekor dengan distribusi data skewness
positif menggunakan metode Simplified
Circle Arc dengan metode Nominal
Weight Mean Equating dengan ukuran
sampel 100 dan masing-masing jumlah
butir 20, 30, dan 40. Sementara untuk
Hipotesis tentang distribusi skewness
negatif yakni hipotesis kedua puluh lima,
kedua puluh enam, dan kedua puluh tujuh
tentang perbandingan variansi hasil
penyetaraan sekor dengan distribusi data
skewness negatif menggunakan metode
Simplified Circle Arc dengan metode
Nominal Weight Mean Equating dengan
ukuran sampel 100 dan masing-masing
jumlah butir 20, 30, dan 40. Dari seluruh
hipotesis tersebut menunjukkan bahwa
metode penyetaraan Simplified Circle Arc
lebih cermat daripada metode penyetaraan
Nominal Weight Mean Equating pada
kondisi ukuran sampel 100 dengan butir
20, 30, dan 40.
Sama halnya pada ukuran sampel 50,
pada ukuran sampel 100 metode
penyetaraan Simplified Circle Arc
memberikan hasil penyetaran yang lebih
cermat. Ukuran sampel menjadikan hal
tersebut terjadi meskipun pada kondisi
jumlah butir 20. Pada penyetaraan klasik,
kemampuan responden akan dipengaruhi
oleh karakteristik dari perangkat soal yang
dikerjakan oleh responden. Keduanya
saling berkaitan satu sama lain. Kilmen
dan Demirtasli mengatakan bahwa dalam
melakukan penyetaraan ketika distribusi
kemampuan responden sama akan
menghasilkan keakurasian penyetaraan
yang tinggi dibanding penyetaraan yang
memilki distribusi kemampuan yang
berbeda (Kilmen & Demirtasli, 2012).
Hasil kecermatan penyetaraan yang
diberikanpun benar demikian adanya.
Ketika pasangan distribusi data yang sama
disetarakan akan memberikan nilai
variansi yang kecil. Dengan jumlah
ukuran sampel 100 memberikan
kemungkinan untuk keberagaman sekor
menjadi lebih beragam. Seperti yang telah
dijelaskan sebelumnya bahwa metode
Nominal Weight Mean Equating
dikembangkan atas dasar kemampuan
untuk melakukan penyetaraan pada
sampel kecil dengan menggantikan
variansi dan kovariansi menjadi jumlah
butir dan sampel. Dengan demikian
metode tersebut akan cermat dalam
menghasilkan sekor penyetaraan. Berbeda
dengan metode Simplified Circle Arc yang
lebih flesibel untuk digunakan pada
sampel kecil.
Secara umum metode Circle Arc
memeberikan hasil penyetaraan yang lebih
baik daripada metode linear (Livingston &
Kim, 2010b). Bersama dengan itu, metode
Nominal Weight Mean Equating
merupakan salah satu metode linear
dengan demikian secara tidak langsung
metode Circle Arc lebih baik dalam hal
kecermatan hasil penyetaraan daripada
metode Nominal Weight Mean Equating.
(S. Kim & Livingston, 2010; Livingston &
Kim, 2009) menyatakan bahwa metode
Circle Arc lebih baik dari metode
penyetaraan sekor tradisonal untuk
ukuran sampel hingga 100. Sementara
(Babcock et al., 2012) mengkhususkan
pada sampel kecil dengan lebih spesifik
-
25
Sinopsis Metode Simplified Circle Arc dan Nominal Weight Mean Equating untuk
Penyetaraan Skor pada Sampel Kecil
Deni Iriyadi
jumlah ukuran sampel yang sangat kecil
(10). Dalam penelitiannya, (Babcock et
al., 2012) menjelaskan bahwa metode
Nominal Weight Mean Equating
merupakan pengembangan dari metode
Tucker untuk mengatasi kelemahan
terhadap ukuran sampel yang sangat kecil.
Dengan demikian pada ukuran ukuran
sampel 100 metode Simplified Circle Arc
lebih cermat dari metode Nominal Weight
Mean Equating.
Ketika bentuk tes berbeda tingkat
kesulitan, hubungan penyetaraan di antara
mereka biasanya tidak linear. Metode
nonlinear baik digunakan ketika asumsi
tingkat kesukaran antara perangkat tes X
dan perangkat tes Y berbeda (Albano,
2015). Tidak tekecuali dengan metode
Circle Arc yang mendefinisikan hubungan
nonlinear antara skala sekor. Meskipun
tingkat kesukaran dari perangkat tes yang
diberikan dapat diperhitungkan, namun
ketika diberikan ke peserta didik hasil dari
kedua intrumen tersebut akan berbeda
mengingat kemampuan dari peserta didik
yang heterogen. Dengan ukuran
sampel200 dan dengan kemampuan
responden yang heterogen menjadikan
kemungkina sekor yang dihasilkan akna
sangat beragam. Ini akan mempengaruhi
hasil penyetaraan termasuk kecermatan
dari suatu metode penyetaraan. Metode
Simplified Circle Arc dengan komponen
curvenya tidak menjadi suatu persoalan
yang berarti bagi kondisi tersebut.
Sehingga metode tersebut akan tetap
memberikan penyetaraan yag lebih cermat
daripada metode penyetaraan Nominal
Weight Mean Equating
Keterbatasan Penelitian
Beberapa keterbatasan dalam
penelitian ini antara lain:
1. Penelitian ini dilakukan dengan menggunakan data yang diperoleh dari
Pusat Penilaian Pendidikan
(PUSPENDIK) sehingga validitas dan
reliabilitas instrumen tersebut
diasumsikan telah memenuhi kriteria
reliabel. 2. Taraf sukar dari setiap butir soal di
asumsikan telah memenuhi kriteria
taraf sukar yang layak untuk digunakan
mengingat intrumen tersebut disusun
oleh Lembaga yang berkompeten
(Badan Standar Nasional Pendidikan)
dan digunakan sebagai standar untuk
menilai kelulusan peserta didik. 3. Instrumen yang digunakan merupakan
soal UN yang berjumlah 40 butir.
Penelitian terbagi atas tiga bentuk
jumlah butir yakni 20, 30, dan 40.
Penyusunan instrumen dengan jumlah
butir masing-masing 20 dan 30
menggunakan acuan dari kisi-kisi di
mana setiap Kompetensi Dasar (KD)
diwakili oleh minimal 1 butir soal.
Sebagai mana diketahui bahwa setiap
KD terdiri beberapa indikator dengan
demikian terdapat beberapa indikator
yang tidak terwakili dalam soal
tersebut khususnya pada perangkat tes
dengan 20 butir.
Kesimpulan
Berdasarkan hasil pengujian hipotesis
yang telah dilakukan pada BAB IV, maka
dapat ditarik beberapa kesimpulan di
ataranya:
-
26
Sinopsis Metode Simplified Circle Arc dan Nominal Weight Mean Equating untuk
Penyetaraan Skor pada Sampel Kecil
Deni Iriyadi
1. Pada kondisi ukuran sampel 36 dengan jumlah butir 20, hasil penyetaraan
dengan menggunakan metode
Simplified Circle Arc dan metode
Nominal Weight Mean Equating
memiliki kecermatan yang sama pada
bentuk distribusi data normal,
distribusi data skewness positif, dan
distribusi data skewness negatif.
Sedangkan untuk ukuran sampel
dengan jumlah butir 30 dan 40, hasil
penyetaraan dengan menggunakan
metode Simplified Circle Arc lebih
cermat daripada metode Nominal
Weight Mean Equating pada bentuk
distribusi data normal, distribusi data
skewness positif, dan distribusi data
skewness negatif.
2. Pada kondisi ukuran sampel 50 dan 100 dengan jumlah butir 20, 30 dan 40,
hasil penyetaraan dengan
menggunakan metode Simplified
Circle Arc lebih cermat daripada
metode Nominal Weight Mean
Equating pada bentuk distribusi data
normal, distribusi data skewness
positif, dan distribusi data skewness
negatif.
3. Penyetaraan sekor dengan menggunakan metode Simplified Cirle
Arc lebih baik digunakan
dibandingkan dengan metode
Nominal Weight Mean Equating
untuk berbagai distibusi sekor
respenden yang berbeda (distribusi
normal, distribusi skewness positif,
dan distribusi skewness negatif).
Namun pada kondisi ukuran sampel
36 dengan jumlah butir 20,
penggunaan metode Nominal Weight
Mean Equating dapat dijadikan
sebagai salah satu alternatif metode
penyetaraan sekor.
4. Penggunaan jumlah butir 20
memberikan kemungkinan
penggunaan metode penyetaraan yang
lebih fleksibel dengan kondisi ukuran
sampel sesuai aturan KEMDIKBUD
mengenai jumlah sampel maksimal
dalam kelas.
5. Ukuran sampel dan butir akan mempengaruhi penggunaan metode
penyetaraan.
Implikasi
Berdasarkan kesimpulan penelitian di
atas menunjukkan bahwa Simplified
Circle Arc lebih cermat dari metode
Nominal Weight Mean Equating pada
kondisi ukuran sampel dan 100 sedangkan
ukuran sampel 50 kedua metode
memberikan kecermatan yang sama
dengan berbagai kondisi jumlah butir.
Pemilihan metode Nominal Weight Mean
Equating dapat digunakan dengan alasan
kepraktisan khusus pada ukuran sampel
36 dengan butir 20 karena kecermatannya
sama dengan metode Simplified Circle
Arc. Kedua metode penyetaraan ini dapat
dijadikan guru sebagai alat untuk
menyetaraan sekor peserta didik pada
jenjang yang sama dengan perangkat tes
yang berbeda.
Saran
Berdasarkan kesimpulan dan implikasi
penelitian yang di atas, maka dapat
diajukan beberapa saran sebagai berikut:
1. Untuk penelitian selanjutnya disarankan menggunakan gabungan
-
27
Sinopsis Metode Simplified Circle Arc dan Nominal Weight Mean Equating untuk
Penyetaraan Skor pada Sampel Kecil
Deni Iriyadi
bentuk pilihan ganda dengan soal esai
atau isian mengingat dalam
pelaksanaan ujian di sekolah
memungkinkan dilakukan hal seperti
itu dalam pemberian ujian.
2. Bagi instansi pemerintah yang bergerak di bidang penilaian
pendidikan sekiranya dapat
menggunakan metode Simplified Cirle
Arc sebagai salah satu metode
alternatif yang dapat digunakan untuk
melakukan penyetaraan sekor pad
tingkat kelas.
3. Untuk jumlah butir yang kecil (≤ 20) dengan ukuran sampel yang juga kecil
( ≤ 36), maka dapat menggunakan metode penyetaraan Nominal Weight
Mean Equating sebagai alat bantu
dalam melakukan penyetaraan sekor.
4. Untuk ukuran sampel selain yang disebutkan pada point tiga di atas
dapat menggunakan metode
penyetaraan Simplified Circel Arc
untuk bergai bentuk distribusi data.
5. Penyetaraan sekor dengan menggunakan metode Simplified
Circle Arc maupun Nominal Weight
Mean Equating dapat diterapkan pada
berbagai kondisi distribusi data yang
mungkin terjadi (normal, skewness
positif, dan skewness negatif).
6. Mempertimbangkan untuk menggunakan jumlah butir 20 untuk
ukuran sampel kecil (≤ 36) sebagai komponen penilaian di kelas dengan
merujuk pada kemampuan guru dalam
menyapaikan materi ajar dan
menyusun soal.
7. Pada kondisi di mana kemampuan guru dalam menyusun tes tidak sama,
maka dapat menggunakan metode
penyetaraan Simplified Circle Arc
sebagai metode penyetaraan sekor
mengingat metode tersebut tidak
terlalu dipengaruhi oleh tingkat
kesukaran soal.
DAFTAR PUSTAKA Agresri, A., & Finlay, B. (2009). Statistical
Methods for the Social Sciences. USA:
Pearson.
Ahsanullah, M., Kibria, B. M. G., & Shakil, M.
(2014). Normal and Student ’ s t
Distributions and Their Applications.
(C. P. Tsokos, Ed.) (4th ed.). Prancis:
Atlantis Press.
https://doi.org/10.2991/978-94-6239-
061-4
Albano, A. D. (2015). A General Linear
Method for Equating With Small
Samples. Journal of Educational
Measurement, 52(1), 55–69.
Aminah, N. S. (2012). Karakteristik metode
penyetaraan skor tes untuk data
dikotomos. Jurnal Penelitian Dan
Evaluasi Pendidikan, 16(Special Issue
for UNY’s 48th Dies-Natalis), 88–101.
https://doi.org/10.21831/pep.v16i0.110
7
Antara, A. A. P., & Bastari, B. (2015).
Penyetaraan Vertikal Dengan
Pendekatan Klasik Dan Item Response
Theory Pada Siswa Sekolah Dasar.
Jurnal Penelitian Dan Evaluasi
Pendidikan, 19(1), 13–24.
https://doi.org/10.21831/pep.v19i1.455
1
Aşiret, S., & Sünbül, S. Ö. (2016).
Investigating test equating methods in
small samples through various factors.
Kuram ve Uygulamada Egitim Bilimleri,
-
28
Sinopsis Metode Simplified Circle Arc dan Nominal Weight Mean Equating untuk
Penyetaraan Skor pada Sampel Kecil
Deni Iriyadi
16(2), 647–668.
https://doi.org/10.12738/estp.2016.2.27
62
Babcock, B., Albano, A., & Raymond, M.
(2012). Nominal Weights Mean
Equating: A Method for Very Small
Samples. Educational and
Psychological Measurement, 72(4),
608–628.
https://doi.org/10.1177/0013164411428
609
Berenson, M. L., Levine, D. M., & Krehbiel,
T. C. (2012). Basic Business Statistics:
Concepts and Applications. (Eric
Svendsen, Ed.) (Twelfth Ed). New
Jersey: Prentice Hall.
Caglak, S. (2016). Comparison of Several
Small Sample Equating Methods under
the NEAT Design. Turkish Journal of
Education, 5(3), 96.
https://doi.org/10.19128/turje.16916
Crocker, L., & Alglna, J. (2008). Introduction
to Classical and Modern Test Theory.
(M. Stranz, Ed.), Harcourt Brace
Jovanovich College Publishers. USA:
Cengage Learning.
Doane, D. P., & Seward, L. E. (2011).
Measuring skewnes