Validitas, Reliabilitas Dan Analisis Item

Post on 24-Apr-2015

300 views 8 download

description

Metode Statistika

Transcript of Validitas, Reliabilitas Dan Analisis Item

Validitas, Reliabilitas dan Analisis Item

Nunik, Debora, Rifqi, Agoes, Aniza, Listya, Tyas, Fiska

VALIDITAS

Validitas

• Konsep validitas merujuk pada kualitas instrumen.• Instrumen yang valid adalah, instrumen yang

benar-benar dapat mengukur atribut psikologis yang dapat diukur.

• Dapat dikatakan bahwa suatu alat ukur valid, jika memiliki keterkaitan atau relasi dengan atribut yang diukur. Maka, metode pengujian validitas selalu melibatkan prosedur pembuktian ada tidaknya hubungan tersebut.

Metode Pengujian Validitas

validitas

Content validity

Construct validity

Convergen

Divergen

Criterion validity

Concurrent validity

Predictive validity

Content Validity

• Termasuk pada kategori metode kualitatif.• Dilakukan dengan cara analisis isi (content

analysis) untuk menemukan hubungan antara isi instrumen dengan atribut psikologis yang diukur.

CVR =

Keterangan:• CVR : content validity ratio• Ne : banyaknya panelis• N : Total panelis

Construct Validity

• Proses analisis untuk menemukan hubungan antara instrumen khususnya item dalam instrumen itu dengan konstruk teoritik tentang atribut psikologis yang akan diukur dengan alat ukur tersebut.

Construct validity

Teknik ini bisa digunakan apabila:- Test homogen( hanya mengukur satu

construct )- Skor test naik atau turun sesuai dengan prediksi

teoritis (dipengaruhi oleh fungsi usia, waktu, manipulasi ekspresimen, perbedaan kelompok sample)

- Skor test berkorelasi dengan test lain yang secara teoritis diprediksi memiliki hubungan

Construct validity

A. Convergent evidence – Hasil pengukuran berkorelasi tinggi dengan alat ukur lain

yang mengukur konstruk yang sama(contoh: test kecerdasan A & test kecerdasan IST- hasil data dikotomi / true-false)

- Phi Coefficient

Lalu uji signifikansi dengan:2

- Untuk typical performance (misal: jenis test kepribadian)Contoh: peneliti mengkonstruksi alat ukur dgn variable kecemasan, dikorelasikan dgn alat ukur STAI (state trait anxiety inventory)

- Rumus Pearson product moment

Product Moment

• Rumus :

• r = pearson r correlation coefficient

• n = jumlah sample

Construct validityB. Divergent evidence

– Alat ukur dianggap valid jika alat ukur itu memiliki korelasi yg rendah dengan hasil pengukuran konstruk yg tidak berkaitan

- Jika hasil datanya dikotomiPhi Coefficient

Lalu uji signifikansi dengan:2

(ketika tidak signifikan= test valid)

Criterion Validity

• Dilakukan dengan melihat hubungan antara tes dengan suatu kriteria.

• Kriteria pertama yang digunakan berupa perfomance yang menunjukkan keberhasilan perilaku berkenaan dengan atribut psikologis yang diukur oleh tes yang divalidasi.

• Kriteria kedua yang digunakan berupa tes lain yang mengukur atribut yang sama dengan tes yang divalidasi.

Criterion Validity

• Concurrent ValidityKorelasi antara test skor dengan current criterion measure.Misal: alat ukur learning disability dengan skor SAT; motivasi kerja dengan perilaku penjualan

Dari contoh diatas jenis data antara alat ukur 1 dan alat ukur 2 ialah interval. Jadi, menggunakan pearson product moment.

Criterion Validity

• Predictive validity• Menunjukkan sejauh mana skor tes bersangkutan

dapat digunakan meramal keberhasilan siswa di masa mendatang dalam bidang tertentu.

• Hasil skor tes di korelasikan dengan keberhasilan siswa di masa mendatang.

• Contoh : misalnya nilai UAN Matematika 98 dibandingkan dengan nilai matematika di perguruan tinggi. (keduanya rasio)

y’ = skor kriteria prediktifx = nilai yang akan di prediksib = slope dari garis regresi a = intercept dari garis regresi

VALIDITAS EKSTERNAL

• Dilakukan dengan membandingkan (untukmencari persamaan) antara kriteria yang ada pada instrumen dengan fakta-fakta empiris yang terjadi lapangan.

• Instrumen penelitian yang mempunyai validitas eksternal yang tinggi akan mengakibatkan hasil penelitian mempunyai validitas eksternal yang tinggi pula. Untuk meningkatkan validitas eksternal instrument, maka dapat dilakukan dengan memperbesar jumlah anggota sampel.

RELIABILITAS

Reliabilitas

• Konsistensi skor yang dapat dicapai individu yang sama dalam atribut psikologi yang sama, walaupun diukur dalam waktu yang berbeda ataukah menggunakan instrumen yang berbeda.

• Lebih luas lagi reliabilitas menunjukkan perbedaan individual pada atribut yang diukur bukannya disebabkan oleh faktor instrumen yang buruk atau situasi tes yang tidak kondusif.

Metode Pengujian Reliabilitas

Statistik

• Derajat reliabilitas ditunjukkan dengan koefisien krelasi yang dihitung dengan menggunakan teknik statistik berupa teknik korelasi.

• Ada syarat yang harus dipenuhi dalam menggunakan teknik korelasi tertentu, misalnya jika menggunakan korelasi product moment data tes harus berskala interval atau jika data berskala ordinal maka digunakan teknik rank spearman, jika data berskala nominal menggunakan chi square.

Metode Test - Retest

• Estimasi derajat reliabilitas dilakukan dengan cara melakukan pengukuran 2x dengan test yang sama kepada subjek yang sama pada waktu yang berbeda.

• Kelebihan : hanya memerlukan satu jenis instrumen.

• Kelemahan : menimbulkan kelelahan pada subjek dan ada faktor belajar yang dapat mempengaruhi hasil test.

Alat ukur yang sama digunakan kembali pada subjek yang sama, jadi jenis datanya akan sama.

Contoh 1: alat ukur yang mengukur trait anxiety dengan skala jenis data = interval

X = pengukuran pertama, Y = pengukuran kedua

Pearson’s Product MomentRumus :

• r = pearson r correlation coefficient

• n = jumlah sample

Single Administration Method

• Dilaksanakan melalui proses pengukuran hanya satu kali.

• Teknik uji reliabilitas yang digunakan:– split-half correlation + Spearman-Brown

correction– Kuder-Richardson 20/21• Digunakan datanya dichotomous

– Alpha cronbach

Rumus Spearman Brown

• ri = reliabilitas instrumen

• rb = indeks korelasi antara dua belahan instrumen

Rumus Kuder Richardson 20

• r tt= Koefisien korelasi dengan KR20

• k = jumlah butir soal• p = proporsi jawaban

benar pada butir tertentu

• q = proporsi jawaban salah pada butir tertentu ( q = 1 – p )

• s2= varians skor total

Rumus Richardson 21

Rumus Alpha Cronbach

• α = Koefisien Cronbach's Alpha

• b = banyaknya pertanyaan dalam butir

• ΣSi2 = varians butir

• St2 = varians total

Parallel Form Methods

• Pengujian reliabilitas ini menuntut cara tersedianya dua bentuk instrumen yang paralel dalam mengukur satu atribut yang psikologis.

• Menurut Gulliksen hal ini merupakan metode terbaik dalam pengujian reliabilitas karena peluang memperoleh true score yang mendekati observe score akan lebih besar dengan menggunakan 2 instrumen.

Product Moment

• Rumus :

• r = pearson r correlation coefficient

• n = jumlah sample

ANALISIS ITEM

Analisis Item

• Item dalam suatu instrumen dalah isi dari instrumen itu sendiri. Item merupakan stimulus untuk merangsang munculnya respon sehingga perilaku subjek ukur akan dapat diidentifikasi melalui ikatan antara stumulul dengan respon.

• Analisis item adalah analisis terhadap item untuk memperoleh informasi tentang kualitas item.

• Dua cara analisis item, yaitu secara kualitatif dan secara kuantitatif.

Analisis Item Kualitatif

• Pemeriksaan atau analisis melalui menelaah apakah item telah memenuhi syarat sebagai item yang baik.

• Analisis ini dilakukan terhadap item dari tes yang mengukur atribut psikologis yang termasuk kategori personality.

• Karakteristik item yang berkualitas baik adalah, pertama item dipersepsikan sama oleh semua orang yang membaca kedua adalah item tidak mengandung social desirability.

• Dua cara analisis item kualitatif : diskusi dengan para ahli dan mengumpulkan sejumlah sampel subjek yang akan menjadi sasaran ukur.

Analisis Item Kuantitatif

• Penggunaan prosedur statistik terhadap jawaban subjek atas item untuk memeriksa kemampuan item dalam hal membedaka individu, mengukur taraf kesulitan item dalam hal membedakan individu, mengukur taraf kesulitan item dan memeriksa kualitas distraktor dari item.

Analisis Tingkat Kesulitan Item

• Setiap respon subjek terhadap item menggambarkan ikatan langsung dengan item sebagai stimulus dari perilaku atau atribut perilaku yang diukur oleh item tersebut.

• Analisis tingkat kesulitan item hanya dilakukan terhadap item yang digunakan untuk mengukur atribut ability.

• Biasanya digunakan dalam achiement tes dan aptitude test.

• Tingkat atau derajat kesulitan suatu item disebut sebagai facility index yang ditunjukkan dengan simbol p.

• p = tingkat kesulitan item • N = jumlah individu yang mengikuti tes

Analisis Distraktor

• Distraktor adalah pilihan jawaban salah yang terdapat pada item multiple choice dari instrumen yang mengukur atribut ability.

• Item yang baik adalah yang memberi peluang pada setiap distraktor untuk dipilih oleh subjek dalam proporsi yang sama.

• Karakteristik item yang baik ditinjau dari distraktornya adalah yang memiliki peluang yang sama, dengan dasar pemikiran bahwa responden memahami persoalan yang ditanyakan akan memilih jawaban yang benar.

Rumus

• Di = proporsi distraktor ke i

• n = jumlah responden yang pilih distraktor i

• N = jumlah responden yang jawab salah

Analisis Diskriminasi

• Analisis diskriminasi cocok digunakan untuk hampir keseluruhan tipe tes.

• Daya diskriminasi menunjukkan kemampuan item dalam membedakan subjek atau responden yang memang memiliki perbedaan.

• Daya pembeda ini akan menunjukkan kemampuan item untuk membedakan mana responden yang kuat motivasinya, mana yang lemah (jika atribut yang digunakan adalah motivasi). Kemampuan item dalam membedakan subjek mana yang cerdas dan mana yang kurang, direpresentasikan oleh daya pembeda ini, jika atribut yang diukur adalah kecerdasan.

• Atas dasar hasil analisis item, maka hasilnya dapat digunakan untuk :1. Mempertahankan item yang berkualitas2. Merevisi item yang kurang baik3. Menggugurkan item dan atau menggantinya

dengan item lain.• 2 pendekatan yang digunakan untuk pengukuran

dalam diskriminasi item :– Item-discrimination index– Item-total correlation

Item discrimination index

• Perhitungan dalam item discrimination index memiliki persyaratan dimana item-item yang diukur bersifat dichotomus, seperti benar/salah.

• Selain itu juga digunakan dalam perhitungan ablity test menggunakan jawaban singkat dan essay hanya jika jawabannya dinilai ulang menjadi benar atau salah.

• The discrimination index (D) dengan cara membandingkan performance dari 2 kelompok yang di tes.

• Rumus :

• D : Item discrimination index for a given test item

Item-Total Correlation

• Dapat dijadikan sebagai indikasi untuk melihat kemamouan setiap item dalam memprediksi keseluruhan skor tes.

• Fokus dari item-total korelasi ini melihat apa yang diukur dari setiap item itu. Jika tes dan item mempunyai atribut yang sama, performance dari setiap item seharusnya di korelasikan dengan skor total dari tes.

Rumus

• X = nilai-nilai dalam item yang akan dianalisis• Y = total nilai dalam tes• X = rata-rata untuk skor item yang dianalisis• Y = rata-rata dari total skor dalam tes• σx = standar deviasi dari nilai-nilai dalam item yang dianalisis• σy = standar deviasi dari total skor dalam tes

• Item total corelation ini digunakan jika datanya adalah dichotomus (alternatives choices, objective personality atau interest items)

• Korelasi yang digunakan adalah point biserial correlation.

Rumus untuk point-biserial correlation

Derajat Korelasi

• Guildford (1965)

KOEFISIEN DERAJAT KORELASI

<0.20 Tidak ada korelasi

0.20 – 0.40 Korelasi rendah

0.41 – 0.70 Korelasi tinggi

0.71 – 1.00 Korelasi tinggi sekali