Validitas Dan Reliabilitas Pengukuran

35
VALIDITAS DAN RELIABILITAS PENGUKURAN MAKALAH UNTUK MEMENUHI TUGAS MATAKULIAH Evaluasi Pendidikan yang dibina oleh Bpk. Eddy Sutadji oleh Buyung Tri Nasution (130513605994) Dirga Agus Susanto (130513605988)

description

evaluasi pendidikan

Transcript of Validitas Dan Reliabilitas Pengukuran

Page 1: Validitas Dan Reliabilitas Pengukuran

VALIDITAS DAN RELIABILITAS PENGUKURAN

MAKALAH

UNTUK MEMENUHI TUGAS MATAKULIAH

Evaluasi Pendidikan

yang dibina oleh Bpk. Eddy Sutadji

oleh

Buyung Tri Nasution (130513605994)

Dirga Agus Susanto (130513605988)

UNIVERSITAS NEGERI MALANG

FAKULTAS TEKNIK

Page 2: Validitas Dan Reliabilitas Pengukuran

JURUSAN PENDIDIKAN TEKNIK OTOMOTIF

Februari 2015

Page 3: Validitas Dan Reliabilitas Pengukuran

BAB I

A. Latar Belakang

Analisis kualitas tes merupakan sebuah tahap yang harus ditempuh untuk mengetahui

kualitas suatu tes, baik tes secara keseluruhan maupun butir soal yang menjadi bagian dari tes

tersebut. Dalam penilaian suatu pembelajaran, tes diharapkan dapat menjadi suatu sempel perilaku

dan menghasilkan nilai yang obyektif dan akurat. Oleh sebab itu ,tes yang digunakan guru harus

memiliki kualitas yang lebih baik dilihat dari berbagai segi. Tes hendaknya disusun dengan susunan

yang pas dan akurat, untuk menilai hal tersebut, maka perlu dilakukan analisis kualitas tes.

Analisis kualitas tes berkaitan dengan pernyataan apakah tes sebagai alat ukur yang

sebagaimana mestinya dapay mengukur suatu yang benar – benar diukur ? sampai mana tes tersebut

sampai saat ini dapat diandalkan untuk mengukur ? pertanyaan tersebut menunjuk ke dalam hal

pokok,yaitu validitas dan reliabilitas.

B. Rumusan Masalah

1. Apakah pengrtian validitas?

2. Sebutkan macam-macam validitas?

3. Apakah pengertian reliabilitas?

4. Sebutkan macam-macam reliabilita?

C. Tujuan

1. Untuk mengetahui pengertian validitas

2. Untuk mengetahui macam-macam dari validitas

3. Untuk mengetahui pengertian reliabilitas

4. Untuk mengetahui macam-macam dari reliabilitas

Page 4: Validitas Dan Reliabilitas Pengukuran

BAB II

PEMBAHASAN

VALIDITAS

Pengertian Validitas

Menurut Azwar (1986) validitas berasal dari kata validity yang mempunyai arti sejauh

mana ketepatan dan kecermatan suatu alat ukur dalam melakukan fungsi ukurnya. Menurut

Arikunto (1999) validitas adalah suatu ukuran yang menunjukkan tingkat kesahihan suatu tes.

Menurut Nursalam (2003) validitas adalah suatu ukuran yang menunjukkan tingkat kevalidan

atau kesahihan suatu instrumen.

Berdasarkan beberapa pendapat tentang pengertian validitas di atas, maka dapat

diambil kesimpulan bahwa validitas adalah suatu standar ukuran yang menunjukkan

ketepatan dan kesahihan suatu instrumen.

Menurut Arikunto (1999) suatu tes dikatakan valid apabila tes tersebut mengukur apa

yang hendak diukur. Tes memiliki validitas yang tinggi jika hasilnya sesuai dengan kriteria,

dalam arti memiliki kesejajaran antara tes dan kriteria.

Sisi lain dari pengertian validitas adalah aspek kecermatan pengukuran. Suatu alat

ukur yang valid tidak hanya mampu menghasilkan data yang tepat akan tetapi juga harus

memberikan gambaran yang cermat mengenai data tersebut. Cermat berarti bahwa

pengukuran itu dapat memberikan gambaran mengenai perbedaan yang sekecil- kecilnya di

antara subjek yang satu dengan yang lain. Sebagai contoh, dalam bidang pengukuran

aspek fisik, bila kita hendak mengetahui berat sebuah cincin emas maka kita harus

menggunakan alat penimbang berat emas agar hasil penimbangannnya valid, yaitu tepat dan

cermat. Sebuah alat penimbang badan memang mengukur berat, akan tetapi tidaklah cukup

cermat guna menimbang berat cincin emas karena perbedaan berat yang sangat kecil pada

berat emas itu tidak akan terlihat pada alat ukur berat badan.

Menggunakan alat ukur yang dimaksudkan untuk mengukur suatu aspek tertentu akan

tetapi tidak dapat memberikan hasil ukur yang cermat dan teliti akan menimbulkan kesalahan

Page 5: Validitas Dan Reliabilitas Pengukuran

atau eror. Alat ukur yang valid akan memiliki tingkat kesalahan yang kecil sehingga angka

yang dihasilkannya dapat dipercaya sebagai angka yang sebenarnya atau angka yang

mendekati keadaan sebenarnya.

Macam-macam validitas

Ada dua unsur penting dalam validitas. Pertama, validitas menunjukan suatu derajat ada yang

sempurna ada yang sedang dan ada pula yang rendah. Kedua, validitas selalu dihubungkan dengan suatu

putusan atau tujuan yang spesifik. Gronlund (1985) mengemukakan ada tiga faktor yang mempengaruhi

validitas hasil tes, yaitu “faktor instrumen evaluasi, faktor administrasi evaluasi dan penskoran, dan faktor

dari jawaban peserta didik.

1. Faktor instrumentasi evaluasi

Mengembangkan instrumen evaluasi memeng tidaklah mudah, apalagi jika seorang

evaluator tidak atau kurang memahami prosedur dan teknik evaluasi itu sendiri. Dalam

mengembangkan instrumentasi evaluasi seorang evaluator harus memperhatikan hal-hal

yang mempengaruhi validitas instrumen dan berkaitan dengan prosedur penyusunan

instrumen, seperti silabus, kisi-kisi soal, petunjuk mengerjakan soal dan pengisian lembar

jawaban, kunci jawaban, penggunaan kalimat efektif, bentuk alternatif jawaban, tingkat

kesukaran, daya pembeda, dan sebagainya.

2. faktor administrasi evaluasi dan penskoran

dalam administrasi evaluasi penskoranbanyak sekali terjadi penyimpangan atau kekeliruan,

seperti alokasi waktu untuk pengerjaan soal yang tidak prporsional, memberikan bantuan

kepada peserta didik dengan berbagai cara, pesrta didik saling mrncontek ketika ujian,

kesalahan penskoran, termasuk kondisi fisik dan psikis didik yang kurang menguntungkan.

3. faktor dari jawaban peserta didik

dalam praktiknya faktoe jawaban peserta didik justru lebih banyak berpengaruhdari pada

dua faktor sebelumnya. Faktor ini meliputi kecenderungan peserta didik untuk menjawab

secara cepat, tetapi tidak tepat, keinginan melakukan coba-coba, dan penggunaan gaya

bahasa tertentu dalam menjawab soal bentuk urian.

Selanjutnya, kerlinger (1986) mengemukakan, “validitas instrumen tidak cukup ditentukan oleh

derajat ketetapan instrumen untuk mengukur apa yang seharusnya diukur, tetapi juga perlu dilihat

dari tiga kriteria yang lain, yaitu appropriatness, meaningfullness, dan usefullness.”.

Appropriatness menunjukan kelayakan dari tes sebagai instrumen, yaitu seberapa jauh instrumen

Page 6: Validitas Dan Reliabilitas Pengukuran

depat menjangkau keragam aspek perilaku peserta didik. Meaningfullness menunjukan kemampuan

instrumen dalam memberikan keseimbangan sosal-soal pengukurannya berdasar tingkat

kepentingan dari setiap fenomena. Usefullness to inferences menunjukan sensitif tidaknya ketelitian

yang ditunjukan dalam membuat kesimpulan.

Dalam literatur medern tentang evaluasi banyak dikemukakan tentang jenis-jenis validitas,

antara lain validitas permukaan (face validity), validitas isi (content validity), validitas empiris

(empirical validity), dan validitas konstruk (construct validity), dan validitas faktor ( faktorial

validity).

1. Validitas permukaan

Validitas ini menggunakan kriteria yang sangat sederhana, karena hanya melihat dari sisi

muka atau tampang dari instrumen itu sendiri. Artinya, jika suatu tes secara sepintas telah

dianggap baik untuk mengungkapkan fenomena yang akan diukur maka tes tersebut sudah dapat

dikatakan memenuhi syarat validitas permukaan, sehingga tidak perlu lagi adanya judgement

yang mendalam.

2. Validias isi

Validitas isi sering digunakan dalam penilaian hasil belajar. Tujuan utamanya adalah untuk

mengetahui sejauh mana peserta didik menguasi materi pelajaran yang telah disampaikan, dan

perubahan-perubahan psikologis apa yang timbul pada diri peserta didik tersebut setelah

mengalami proses pembelajaran tertentu. Jika dilihat dari segi kegunaannya dalam penilaian

hasil belajar, validitas isi sering disebut juga validitas kurikuler dan validitas perumusan.

Validtas kurikuler berkenaan dengan pertanyaan apakah materi tes relevan dengan

kurikulum yang sudah ditentukan. Pertanyaan ini timbul karena sering terjadi materi tes tidak

mencakup keseluruhan aspek yang akan diukur, baik aspek kognitif, afektif, maupun

psikomotorik, tetapi hanya pengetahuan yang bersifat fakta-fakta pelajaran tertentu.

Validitas perumusan berkenaan dengan pertanyaan apakah aspek-aspek dalam soal-soal itu

betul-betul tercakup dalam perumusan tentang apa yang hendak diukur. Sebagaiman yang telah

dikemukakan oleh R.L Thorndike dan H.P Hagen (1977) bahwa “scientific analysis is

essentially a rotasional and judgemental one, this is sometimes spoken of as rational or logocal

Page 7: Validitas Dan Reliabilitas Pengukuran

validity”. Pernyataan ini ada benarnya, karena pengujian validitas harus dilakukan secara

rasional dan logis sehingga suatu tes hasil belajar dapat memiliki validitas yang sempurna.

3. Validitas empiris

Validitas ini biasanya menggunakan teknik statistik, yaitu analisis korelasi. Hal ini

disebabkan validitas empiris mencari hubungan antara skor tes dengan suatu kriteria tertentu

yang merupakan suatu tolok ukur di luar ters yang bersangkjutan. Namun, kriteria itu harus

relevan dengan apa yang diukur. Validitas empiris disebut juga validitas yang dihubungkan

dengan kriteria atau validitas statistik. Ada tiga macam validitas empiris, yaitu:

a) Validitas prediktif

b) Validitas kongkuren

c) Validitas sejenis

Validitas prediktif adalah jika kriteria standart yang digunakan adalah untuk meramalkan

prestasi belajar murid masa yang akan datang. Dengan kata lain, validitas prediktif

bermaksud melihat hingga mana suatu tes dapat memperkirakan perilaku peserta didik pada

masa yang akan datang. Sedangkan validitas kongkuren adalah jika kriteria standarnya

belainan. Misalnya, skor tes dalam matapelajaran bahasa indonesia dikorelasikan dengan

skor tes bahasa inggris. Sebaliknya, jika validitas sejenis. Misalnya, bahasa indonesia

dengan bahasa indonesia.

Dalam mengukur validitas suatu tes hendaknya yang menjadi kriteria sudah betul-

betul valid sehingga dapat diandalkan kemampuannya dan dapat dianggap sebagai tes

standar. Sebaliknya, bila kriteria tidak valid, maka tes-tes lain yang dianggap divaliditasi

menjadi kurang atautidak meyakinkan. Suatau tes akan mempunyai koefisien validitas yang

tinggi jika tes itu betul-betul dapat mengukur apa yang hendak diukur dari pesrta ddik

tertentu.

Ada beberapa hal yang harus diperhatikan dalam menginterprensikan koefisien

validitas, antara lain data mengenai karakteristik sampel validitas, prosedur-prosedur dalam

pengukuran validitas, dan pola kriteria khusus yang dikorelasikan dengan hasil tes itu.

Anastasi dalam Conny Semiawan Stamboel (1986), mengemukakan ada delapan kriteria

sebagai bahan bandingan untuk merumuskan apa yang hendak diselidiki oleh suatu tes, yaitu

“diferensiasi umur, kemajuan akademis, kriteria dalam pelaksaan latihan khusus, kriteria

Page 8: Validitas Dan Reliabilitas Pengukuran

dalam pelaksanaan kerja, penilaian, kelompok yang dipertentangkan, korelasi dengan tes

lain, dan konsistensi internal”.

a) Diferensiasi umur

Kriteria yang paling utama dalam validitas tes inteligensi adalah umur. Kebanyakan tes

inteligensi pra-sekolah senantiasa dibandingkan dengan umur kronologis untuk

menentukan apakah angka bertambah dengan bertambahnya umur.

b) Kemajuan akademis

Pada umumnya tes inteligensi divalidkan dengan kemajuan akademis. Juga sering

dikatakan bahwa semakin lama seseprang belajar disekolah, semakin tinggi

pendidikannya, semakin tinggi pula kemajuan akademisnya. Padahal, setiap jenis

jenjang pendidikan itu bersifat selektif. Bagi peserta didik yang tak sanggup

meneruskan, biasanya termasuk droupout. Namun, banyak pula faktor non-intelektual

yang ikut mempengaruhi keberhasilan pendidikan seorang peserta didik. Dengan kata

lain, berhasil tidaknya pendidikan seseorang tidak hanya dilihat dari faktor intelektual,

tetapi faktor non-intelektual.

c) Kriteria dalam pelaksanaan pelatihan khusus

Corak kriteria dalam pengembangan tes bakat khusus didasarkan atas prestasi dalam

latihan tertentu secara khusus. Bberapa tes bakat profesi telah divalidkan dengan tes

hasil belajar bidang-bidang tersebut. Misalnya, memasuki profesi kedokteran, hukum,

dan sbagainya. Ada beberapa tes untuk memasuki profesi tertentu yang disebut tailor-

made test, yaitu tes yang telah dibuat khusus keperluan tersebut.

d) Kriteria dalam pelaksanaan kerja

Dalam validitas tes kepribadian dan validitas tes bakat khusus banyak digunakan kriteria

yang didasarkan atas kinerja dalam pelaksanaan kerja. Mengingat setiap pekerjaan

memiliki kekhasan sendiri dan berbeda-beda tingkat, bentuk, maupun coraknya, maka

untuk setiap pekerjaan diciptakan tes yang terkenal dengan istilah tailor-made test.

e) Penilaian

Pengertian penilaian disini adalah teknik untuk memperoleh informasi tentang kemajuan

belajar peserta didik di sekolah.

f) Kelompok yang dipertentangkan

Page 9: Validitas Dan Reliabilitas Pengukuran

Konsep in i melalui kelompok yang dipertentangkan menyelidiki pengaruh kehidupan

sehari-hari yang tak disengaja. Misalnya, suatau tes bakat musik dicobakan di sekolah

musik maupun di sekolah umum. Kriteria ini didasarkan atas faktor yang mencolok,

yang diperoleh dari hasil nilai kedua kelompok tersebut dalam menjalankan tes itu.

g) Korelasi dengan tes lain

Korelasi antara tes baru dengan tes lama merupakan perbandingan kriteria dalam

menyelidiki perilaku yang sama. Untuk mengukur apakah suatu tes yang baru memiliki

validitas dan bebas pengaruh faktor lain, maka dipergunakan tes jenis lain dalam

membandingkannya. Jadi, kadang-kadang tes kebribadian dikorelasikan dengan tes

internal atau tes prestasi belajar.

h) Konsistensi internal

Kriteria konsistensi internal adalah skor total yang diperoleh peserta didik dalam suatu

tes. Kadang-kadang untuk keperluan ini juga digunakan percobaan tes dengan dua

kelompok, yaitu antara kelompok berhasil dan kelompok kurang beerhasil. Skor setiap

soal tes dari kelompok yang berhasil dibandingkan dengan skor setiap soal tes dari

kelompok yang kurang berhasil.kriteria konsistensi internal ini menghasilkan indeks

homoginitas soal, tetapi tidak dapat dianggap sepenuhnya sebagai pengganti validitas.

Untuk menguji validitas empiris dapat digunakan jenis statika korelasi product-moment, korelasi

perbedaan peringkat, atau korelasi diagram pancar. Berikut ini akan dikemukakan beberapa contoh

perhitungan korelasi.

a. Korelasi product-moment dengan angka simpangan

Rumus rxy =∑ x

y

√(∑ x2¿)¿¿¿

Keterangan : r = koefisien korelasi

∑ xy = jumlah produk x dan y

Contoh :

10 orang peserta didik kelas 11 SMA mendapat nilai dalam mata pelajaran Bahasa Indonesia dan

Bahasa Inggris seperti berikut :

Page 10: Validitas Dan Reliabilitas Pengukuran

Tabel 10.1

Nilai Pelajaran Bahasa Indonesia dan Bahasa Inggris

no Nama B.Indonesia B.Inggris

1. A. 5 6

2. B. 7 8

3. C. 8 7

4. D. 5 5

5. E. 6 7

6. F. 7 7

7. G. 4 5

8. H. 5 7

9. I. 8 8

10. J. 6 6

Langkah-langkah penyelesaian:

1) Membuat tabel persiapan seperti berikut:

No x y X y X2 Y2 xy

2) Masukan nilai masing-masing mata pelajaran, di mana nilai Bahasa Indonesia sebgai

variabel X dan nilai Bahasa Inggirs sebagai variabel Y.

3) Jumlahkan semua nilai yang ada dalam variabel X dan variabel Y, kemudian hitung rata-rata

X dan rata-rata Y.

Page 11: Validitas Dan Reliabilitas Pengukuran

4) Cari nilai pada kolom x dengan jalan nilai tiap-tiap peserta didik dalam kolom x dikurangi

dengan rata-rata x.

5) Cari nilai pada kolom y dengan jalan nilai tiap-tiap peserta didik dalam kolom x dikurangi

dengan rata-rata y.

6) Cari nilai pada kolom x2 dengan jalan mengudratkan masing-masing nilai dalam kolom x.

7) Cari nilai pada kolom y2 dengan jalan mengudratkan masing-masing nilai dalam kolom y.

8) Cari nilai pada kolom xy dengan jalan mengalikan tiap-tiap nilai dalam kolom x dengan

nilia-nilai dalam kolom y.

Berdasarkan langkah-langkah di atas dapat dihutung koefisien korelasi product-moment sebagai

berikut.

Tabel 10.2

Perhitungan Korelasi Product-Moment dengan Angka Simpangan

No. Nilai

B.Ind

(x)

Nilai

B.Ing

(y)

X y X2 Y2 xy

1. 5 6 -1,1 -0,6 1,21 0,36 0,66

2. 7 8 -0,9 1,4 0,81 1,96 1,26

3. 8 7 1,9 0,4 3,61 0,16 0,76

4. 5 5 -1,1 -1,6 1,21 2,56 1,76

5. 6 7 -0,1 0,4 0,01 0,16 -0,04

6. 7 7 0,9 0,4 0,81 0,16 0,36

7. 4 5 -2,1 -1,6 4,41 2,56 3,36

8. 5 7 -1,1 0,4 1,21 0,16 -0,44

9. 8 8 1,9 1,4 3,61 1,96 2,66

10. 6 6 -0,1 -0,6 0,01 0,36 0,06

∑ 61 66 16,9 10,4 10,4

Rata-rata 6,1 6,6

Page 12: Validitas Dan Reliabilitas Pengukuran

rxy = ∑ x

y

√(∑ x2¿)¿¿¿

r.xy = ∑ xyn . σx .σy

σx=√∑ x2

N=√ 16,9

10=√1,69=1,3

σy=√∑ y2

N=√ 10,4

10=√1,04=1,0198

=10,4

(10 ) (1,3 ) (1,0198 )=0,784

Disamping itu, dapat juga digunakan rumus korelasi product-moment dengan angka kasar

sebagai berikut:

r=N∑ xy−¿¿¿

Contoh :

Tabel 10,3

Teknik Korelasi Product-Moment dengan Angka Kasar

No. X Y X2 Y2 XY

1 5 6 25 36 30

2 7 8 49 64 56

3 8 7 64 49 56

4 5 5 25 25 25

5 6 7 36 49 42

6 7 7 49 49 49

7 4 5 16 25 20

8 5 7 25 49 35

9 8 8 64 64 64

10 6 6 36 36 36

Page 13: Validitas Dan Reliabilitas Pengukuran

∑ 61 66 386 446 413

r=N∑ xy−¿¿¿

=(10 ) (413 )−(61 ) (66 )

√ {(10 ) (389 )−(61 )2 } {(10 ) (446 )−(66 )2 }=0,784

b. Korelasi perbedaan peringkat (rank difference correlation )

Rumus: r = 1 - 6∑ D2

n(n2 – 1)

Keterangan:

r= koefisien korelasi

1 dan 6= bilangan tetap

D = perbedaan antara dua peringkat ( rank)

n= jumlah sampel

cantoh :

langkah –langkah penyelesaianya :

1. Ciri –ciri tingkat dari tiap mata pelajaran dengan jalan mengurutkan nilai –nilai dari besar

sampai kecil

2. Jika mendapat nilai yang sama, maka jumlahkan nilai peringkat pertama dengan nilai

peringkat kedua, kemudian dibagi dua. Demikian kedua orang tersebut mempunyai

peringkat yang sama. Semakin besar nilai yang diperoleh, semakin tinggi kedudukan

peringkat dalam kelompoknya.

3. Cariperbedaan peringkat dengan mengurangkanperingkat mata pelajaran bahasa indonesia

dengan peringkat pelajaran bahasa inggris.

Page 14: Validitas Dan Reliabilitas Pengukuran

4. Perbedaan peringkat kemudian dikuadratkan. Berdasarkan langkah – langkah diatas ,maka

akan diperoleh perhitungan sebagai berikut :

Tabel 10.4

Perhitungan koleransi perbedaan peringkat

No. X Y Rx Ry D D2

1 5 8 8 7,5 0,5 0,25

2 7 8 3,5 1,5 2 4

3 8 7 1,5 4,5 -3 9

4 5 5 8 9,5 - 1,5 2,25

5 6 7 5,5 4,5 1 1

6 7 7 3,5 4,5 -1 1

7 4 5 10 9,5 0,5 0,25

8 5 7 8 4,5 3,5 12,25

9 8 8 1,5 1,5 0 0

10 6 6 5,5 7,5 - 2 4

34

r= 1−6∑ D2

n (n2−1 )=1− 6 (64 )

10 ( 102−1 )=1−204

990=0,79

4. Validitas Konstruk

Konstruk adalah konsep yang dapat diobservasi dan dapat diukur. Validitas konstruk sering

juga disebut validitas logis. Validitas konstruk berkenaan dengan pertanyaan hingga mana suatu

tes betul-betul dapat mengobservasi dan mengukur fungsi spikologis yang merupakan deskripsi

perilaku peserta didik yang akan diukur oleh tes tersebut. Validitas konstruk banyak dikenal dan

digunakan dalam tes-tes psikologis untuk mengukur gejala perilaku yang abstrak, seperti

kesetiakawanan, kematangan emosi, sikap, motivasi, minat, dan sebagainya.

Page 15: Validitas Dan Reliabilitas Pengukuran

Untuk menguji validitas konstruk dapat dilakukan dengan berbagai sumber, antara lain

validitas isi, validitas prediktif, dan validitas konkuren. Analisis statistika yang digunakan dalam

validitas konstruk antara lain dengan analisis faktor, sehingga dapat dikletahui:

a. Aspek-aspek apa saja yang diukur oleh setiap butir soal

b. Berapa besar suatu butir soal berisi faktor-faktor tertentu

c. Faktor-faktor apa yang diukur oleh suatu butir soal

Produk analisis faktor ini dapat menganalisis dan mempertimbangkan apakah suatau tes betul-

betul dapat mengukur fungsi psokologis yang merupakan deskripsi perilaku peserta didik yang

hendak diukur oleh tes yang bersangkutan.

5. Validitas Faktor

Dalam penilaian hasil belajar sering digunakan skala pengukuran tentang suatu variabel

yang terdiri atas beberapa faktor. Faktor-faktor tersebut diperoleh berdasarkan dimensi/indikator

dari variabel yang diukur sesuai dengan apa yang terungkap dalam konstruksi teoritisnya.

Meskipun variabel terdiri atas beberapa faktor, tetapi prinsip homogenitas untuk kkeseluruhan

faktor harus tetap dipertahankan, sehingga tidak terjadi tumpang tindih antara satu faktor

dengan faktor yang lain. Dengan demikian, kriterium yang digunakan dalam validitas faktor ini

dapat diketahui dengan menghitung homogenitas skor setiap faktor dengan total skor, dan antara

skor dari faktor yang satau dengan skor dari faktor yang lain.

REABILITAS

Pengertian Reliabilitas

Reliabilitas adalah tingkat atau derajat konsistensi dari suatu instrument. Reliabilitas

tes berkenaan dengan pertanyaan, apakah suatu tes teliti dan dapat dipercaya sesuai dengan

kriteria yang telah ditetapkan. Suatu tes dapat dikatakan reliabel jika selalu memberikan hasil

yang sama bila diteskan pada kelompok yang sama pada waktu atau kesempatan yang

berbeda. Anastasi (1976) mengemukakan, “reliability refers to the consistenty of scores

obtained by the same person when reexamined the same test on different occasion, or with

different sets of equivalent items or under other variable examining conditions. “Hal senada

Page 16: Validitas Dan Reliabilitas Pengukuran

dikemukakan Gronlund (1985) bahwa “reliability refers to the result obtained with an

evaluation instrument and not to the instrument it self”.

Sementara itu, Kerlinger (1986) mengemukakan, ‘reliabilitas dapat diukur dari tiga

kriteria, yaitu stability, dependability, dan predictability.” Stability menunjukkan kelebihan

suatu tes dalam mengukur gejala yang sama pada waktu yang berbeda. Dependability

menunjukan kemantapan suatu tes atau seberapa jauh tes dapat diandalkan. Predictability

menunjukkan kemampuan tes untuk meramalkan hasil pada pengukuran gejala selanjutnya.

Untuk meningkatkan reliabilitas suatu tes, antara lain dapat dilakukan dengan memperbanyak

butir soal.

Selajutnya, Gronlund (1985) mengemukakan ada empat faktor yang dapat

memepengaruhi reabilitas, yaitu “panjang tes, sebaran skor, tingkat kesukaran, dan

objektivitas”.

1. Panjang tes (length of test). Panjang tes berarti banyaknya soal tes. Ada

kecendrungan, semakin panjang suatu tes akan lebih tinggi tingkat reabilitas suatu tes,

karena semakin banyak soal, maka akan semakin banyak sampel soal yang diukur dan

proporsi jawaban yang benar semakin banyak, sehingga faktor tebakkan (guessing)

akan semakin rendah.

2. Sebaran skor (spread of scores). Besarnya sebaran skor akan membuat tingkat

reabilitas menjadi lebih tinggi, karena koefisien reabilitas yang lebih besar diperoleh

ketika peserta didik tetap pada posisi yang relatif sama dalam suatu kelompok

pengujian ke pengujian berikutnya. Dengan kata lain, peluang selisih dari perubahan

posisi dalam kelompok dapat memperbesar koefisien reabilitas.

3. Tingkat kesukaran (difficulty indeks). Dalam penilaian yang menggunakan

pendekatan penilaian acuan norma, baik untuk soal yang mudah maupun sukar,

cenderung menghasilkan tingkat reliabilitas yang rendah. Hal ini disebabkan

antaralain hasil tes yang mudah dengan hasil tes yang sukar keduanya dalam satu

sebaran skor yang terbatas. Untuk tes yang mudah, skor akan berada di bagian atas

dan akhir dari segala penilaian. Bagi kedua tes (mudah dan sukar), perbedaan antara

peserta didik kecil sekali dan cenderung tidak dapat di percaya. Tingkat kesukaran

soal yang ideal untuk meningkatkan koefisien reliabilitas adalah soal yang

menghasilkan sebaran skor berbentuk genta atau kurva normal.

Page 17: Validitas Dan Reliabilitas Pengukuran

4. Objektivitas (obyektivity ). Objektivitas di sini menunjukkan skor tes kemampuan

yang sama antara peserta didik yang satu dengan peserta didik yang lainnya. Peserta

didik memperoleh hasil yang sama dalam mengerjakan suatu tes. Jika peserta didik

memiliki tingkat kemampuan yang sama, maka akan memeperoleh hasil tes yang

sama pada saat mengerjakan tes yang sama. Objektivitas prosedur tes yang tinggi

akan memeperoleh reliabilitas hasil yang tidak dipengaruhi oleh prosedur penskoran.

Konsep reliabilitas mendasari kesalahan pengukuran yang mungkin terjadi pada suatu proses

pengukuran atau pada nilai tunggal tertentu, sehingga menimbulkan perubahan pada susunan

kelompoknya (eror of measurement). Misalnya, guru mengetes peserta didik dengan

instrument tertentu dan mendapat nilai 70. Kemudian pada kesempatan yang berbeda dengan

instrument yang sama, guru melakukan tes kembali, ternyata peserta didik tersebut mendapat

nilai 75. Artinya, tes tersebut tidak reliabel, karena terjadi kesalahan pengukuran. Tes yang

reliabel adalah apabila koefisien reliabilitasnya tinggi dan kesalahan baku pengukurannya

(standard eror of measurement) rendah.

Macam-Macam Reliabilitas

Menurut perhitungan product-moment dari Pearson, ada tiga macam reliabilitas, yaitu

koefisisen stabilitas, koefisien ekuivalen, dan konsistensi internal.

1. Koefisien Stabilitas

Koefisien stabilitas (coefficient of stability) adalah jenis reliabilitas yang meggunakan

teknik test and retest, yaitu memberikan tes kepada sekelompok individu, kemudian

diadakan pengulangan tes pada kelompok yang sama dengan waktu yang berbeda. Cara

memperoleh koefisien stabilitas adalah dengan mengorelasikan hasil tes pertama dengan

hasil tes kedua dari kelompok yang sama, tes yang sama, pada waktu yang berbeda. Jika

antara waktu tes pertama dengan tes kedua cukup lama, kemudian diadakan latihan-

latihan tambahan, maka bisa jadi nila tes kedua akan lebih besar dari pada tes pertama.

Sebaliknya, jika antara waktu tes pertama dengan tes kedua relative pendek, maka nilai

tes kedua bisa jadi sama atau lebih besar daripada tes pertama karena soal dan jawaban

masih dapat diingat.

Page 18: Validitas Dan Reliabilitas Pengukuran

Kesalahan teknis ini dapat bersumber dari beberapa faktor, sehingga menyebabkan

peserta didik mempunyai skor yang berbeda pada saat dua kali mengerjakan tes yang

sama. Bisa saja perubahan skor yang terjadi bukan disebabkan perubahan hal yang

diukur, tetapi memang karena situasi yang berbeda atau pengalaman dari peserta didik

pada saat mengikuti tes yang pertama, sehingga pada saat mengerjakan tes yang kedua,

peserta didik lebih berhati-hati dan lebih baik hasilnya. Keungulan teknik ini adalah dapat

memperkecil kemungkinan masuknya sumber kesalahan yang lain. Namun, patut juga

dipertimbangkan bahwa penggunaan kelompok yang sama dan tes yang sama dalam dua

kali tes akan mempengaruhi hasil tes yang kedua, karena responden sudah memiliki

pengalaman mengerjakan tes yang pertama. Hal ini sekaligus menunjukkan kelemahan

teknik tes and retest.

2. Koefisien Ekuivalen

Koefisien ekuivalen (coeffition of equivalence) adalah jika mengorelasikan dua buah tes

yang parallel pada kelompok dan waktu yang sama. Metode yang digunakan untuk

memperoleh koefisien ekuivalen adalah metode dengan menggunakan dua buah bentuk

tes parallel (equivalen) atau equivalence forms method atau disebut juga parallel or

alternante-froms method. Syarat-syarat yang harus di penuhi kedua tes parallel adalah

kriteria yang di pakai pada kedua tes sama, masing-masing tes di konstruksikan sendiri,

jumlah item, isi, dan corak sama, tingkat kesukaran sama, petunjuk waktu yang

disediakan untuk mengerjakan tes, dan contoh-contoh juga sama. Kemungkinan

kesalahan pada teknik ini bersumber dari derajat keseimbangan antara dua tes tersebut,

serta kondisi tempat yang mungkin berbeda pada kelompok tes pertama dengan kelompok

tes kedua, meskipun di lakukan pada waktu yang sama.

3. Koefisien Konsistensi Internal

Koefisien konsistensi internal (coefficient of internal consistency) adalah reliabilitas yang

didapat dengan jalan mengorelasikan dua buah tes dari kelompok yang sama, tetapi di

ambil dari butir-butir yang bernomor genap untuk tes yang pertama dan butir-butir

bernomor ganjil untuk tes yang kedua. Teknik ini sering juga di sebut spilt-half method.

Spilt berati membelah dan half berarti setengaha atau separuh. Jadi, spilt-half adalah tes

Page 19: Validitas Dan Reliabilitas Pengukuran

yang dibagi menjadi dua bagian yang sama, kemudian mengorelasikan butir soal yang

bernomor ganjil dalam belahan pertama (X) dan yang bernomor genap zdalam belahan

kedua (Y). untuk membagi tes menjadi dua bagian dapat juga dilakukan dengan jalan

mengambil nomor soal secara acak, tetapi jumlahnya tetap harus sama untuk masing-

masing kelompok. Di samping itu, pembagian tes dapat juga dilakukan dengan cara

setengah bagian pertama untuk kelompok pertama dan setengah lagi untuk kelompok

kedua.

Untuk menghitung koefisien stabilitas, koefisien ekuivalen, dan koefisien esistensi

internal dapat digunakan analisis korealasi seperti pada pengujian validitas. Khusus bagi

perhitungan koefisien konsistensi internal, korelasi tersebut baru sebagian dari seluruh

tes. Untuk memperoleh angka koefisien korelasi secara menyeluruh dari tes tersebut harus

dihitung dari nomor-nomor kedua tes itu dengan rumus Spearman Brown :

rnn

2r1.2

1+ (n−1 ) r1.2

Keterangan : n = panjang tes yang selalu sama dengan 2 karena seluruh tes = 2 x 12

Contoh :

10 orang peserta didik di tes dalam mata pelajaran Ilmu Pengetahuan Alam (IPA) zdan

Ilmu Pengetahuan Sosial (IPS). Jumlah soal masing-masing lima buah. Dua buah nomor

genap diambil dari hasil tes IPA dan tiga buah nomor ganjl di ambil dari tes IPS. Data

diperoleh sebagai berikut :

Page 20: Validitas Dan Reliabilitas Pengukuran

Table 10.5

Nilai 10 Orang Peserta Didik

Dalam Mata Pelajaran IPA dan IPS

Nama Skor IPA

No.Genap ( 2 dan 4 )

Skor IPS

No.Ganjil ( 1,3, dan 5 )

A

B

C

D

E

F

G

H

I

J

8

7

5

8

5

4

5

7

7

9

6

7

6

6

6

7

9

5

8

5

8

6

6

7

5

4

7

8

4

9

7

7

6

6

5

6

5

5

9

9

10

5

6

9

5

6

5

4

7

4

Page 21: Validitas Dan Reliabilitas Pengukuran

Table 10.6

Perhitungan Koefisien Konsistensi Intenal

X Y x y X2 Y2 xy

14

14

11

14

11

11

14

12

15

14

25

8

18

22

15

16

17

17

20

22

+1

+1

-2

+1

-2

-2

+1

-1

+2

+1

+6

-1

-1

+3

-4

-3

-2

-2

+1

+3

1

1

4

1

4

4

1

1

4

1

36

1

1

9

16

9

4

4

1

9

6

-1

2

3

8

6

-2

2

2

3

130 190 22 90 29

x = 13 x = 19

r xy=Σ xy

√ ( Σ x2 ) ( Σ y2 )= 29

√ (22 )(90)= 29

√1980= 29

44 ,50=0 ,65

Page 22: Validitas Dan Reliabilitas Pengukuran

untuk menghitung seluruh tes itu, dapat digunakan rumus Spearman Brown sebagai

berikut :

rnn=2 r1.2

1+(n−1 )r 1.2=

(2 )(0,65)1+(2−1 )(0,65)

=1,301,65

=0,787.

Di samping itu, dapat pula digunakan teknik Kuder-Richardson (dua orang ahli

psikometri yang merumuskan persamaan untuk mencari reliabilitas) yan lebih popular

dengan Kr20 adalah sebagai berikut :

Ru = s2t−piqis2t

Contoh :

10 orang peserta didik di tes dengan 10 butir soal bentuk objektif. Hasil perhitungan

adalah sebagai berikut ;

NamaNomor Soal

X X2

1 2 3 4 5 6 7 8 9 10

A 0 0 1 1 1 1 1 1 0 1 7 49

B 0 1 1 1 1 0 1 1 1 1 8 64

C 1 1 0 1 1 1 1 1 1 1 9 81

D 1 1 1 1 0 0 0 0 1 1 6 36

E 1 0 1 0 1 1 0 1 1 1 7 49

F 1 1 1 1 1 0 0 0 0 0 5 25

G 1 1 0 0 0 0 1 1 1 1 6 36

H 0 1 1 1 1 1 1 1 0 0 7 49

I 1 0 1 0 0 0 0 0 1 1 4 16

J 1 1 1 0 0 0 0 0 0 0 3 9

Σ 7 7 8 6 6 4 5 6 6 7 6

2

41

4

p 0,7 0,7 0,8 0,6 0,6 0,4 0,5 0,6 0,6 0,7

q 0,3 0,3 0,2 0,4 0,4 0,6 0,5 0,4 0,4 0,3

Pq 0,2 0,2 0,1 0,2 0,2 0,2 0,2 0,2 0,2 0,2

Page 23: Validitas Dan Reliabilitas Pengukuran

1 1 6 4 4 4 5

4

4 1

Keterangan :

P = proporsi peserta didik yang menjawab betul dari suatu butir soal

q = 1 – p

st2=

n Σ x2−(Σ x )2

n(n−1)=

10 (414 )−(62)2

10(10−1)=4140−3844

90=296

90=3,288

K = 10 (jumlah butir soal)

Σ p.q = 2,24

KR20=K

K−1 ( S2t−Σ pi . qiS2 t )= 10

10−1 ( 3,288−2,243,288 )=1,11 (0,318 )=0,35

Teknik Kuder-Richardson biasanya digunakan jika zsuatu instrument mengukur satu

gejala psikologis atau perilaku yang sama. Artinya, tes tersebut dapat dikatakan reliabel

bila terbukti ada konsistensi jawaban antara soal yang satu dengan yang lain. Jika sifat

dan tingkatan homoginitas antar soal tidak terpenuhi, maka tes tersebut dianggap

mengukur lebih dari satu variable. Jika dalam satu tes terdapaat lebih dari satu skala

pengukuran atau mengukur lebih dari satu variable dan setiap variable memiliki beberapa

aspek, maka penecekan reliabilitas dilakukan terhadap masing-masing skala pengukuran.

Teknik ini lebih cocok untuk tes yang menggunakan soal dua pilihan dengan salah satu

jawaban benar.

Teknik lain yang bisa digunakan untuk menguji konsistensi internal dari suatu tes

adalah Cronbach’s Alpha atau koefisien Alpha. Perbedaannya dengan teknik Kurder-

Richardson adalah teknik ini tidak hanya digunakan untuk tes dengan dua pilihan saja,

tetapi penerapannya lebih luas, seperti meguji reliabilitas skala pengukuran sikap dengan

Page 24: Validitas Dan Reliabilitas Pengukuran

tiga, lima atau tujuh pilihan. Adapun rumus yang digunakan untuk menghitung koefisien

Alpha adalah :

α=R

R−1 (1− Σ σ i2

σ i2 )

Keterangan :

R = jumlah butir soal.

σ i2 = varian butir soal.

σ x2 = varian skor total.

Untuk butiran soal yang bersifat dikotomi seperti pilihan ganda, varian butir soal

diperoleh dengan rumus :

σ x2 = piqi

Keterangan : pi adalah tingkat kesukaran soal dan qi adalah ( 1 – pi ).

Page 25: Validitas Dan Reliabilitas Pengukuran

BAB III

PENUTUP

Kesimpulan

Jadi kesimpulannya adalah bahwa validitas itu suatu standar ukuran yang

menunjukkan ketepatan dan kesahihan suatu instrumen. Menurut Arikunto (1999) suatu tes

dikatakan valid apabila tes tersebut mengukur apa yang hendak diukur. Tes memiliki

validitas yang tinggi jika hasilnya sesuai dengan kriteria, dalam arti memiliki kesejajaran

antara tes dan kriteria. Lalu Reliabilitas adalah tingkat atau derajat konsistensi dari suatu

instrument. Reliabilitas tes berkenaan dengan pertanyaan, apakah suatu tes teliti dan dapat

dipercaya sesuai dengan kriteria yang telah ditetapkan. Suatu tes dapat dikatakan reliabel jika

selalu memberikan hasil yang sama bila diteskan pada kelompok yang sama pada waktu atau

kesempatan yang berbeda.

Page 26: Validitas Dan Reliabilitas Pengukuran

Daftar Pustaka

Arifin, Z. 2009 . Evaluasi Pembelajaran. Bandung : Remaja Rosdakarya

Arikunto, Suharsimi. 2013 .Dasar-Dasar Evaluasi Pendidikan Edisi 2. Jakarta : Bumi

Aksara.