Evaluasi Pembelajaran instrumen

download Evaluasi Pembelajaran instrumen

of 20

Transcript of Evaluasi Pembelajaran instrumen

Evaluasi Pembelajaran Anak Usia Dini Pengembangan Instrumen

Oleh:

Nila Hayati 1615106234

Pendidikan Guru- Pendidikan Anak Usia Dini Fakultas Ilmu Pendidikan Universitas Negeri Jakarta

2012

Pengembangan Instrumen A. Syarat Tes/ Non Tes Yang Baik Syarat tes/non tes atau instrument yang baik adalah menunujukkan: 1. Validity (kesahihan) Kecocokan apa yang diukur dengan tujuan pengukuran. Ada 3 jenis validitas, yaitu: a. Content Validity (Validitas Isi) 1) Kesesuaian tes dengan tujuan 2) Menimbang kesesuaian tiap butir soal dengan tujuan instruksional/ aspek materi yang hendak diukur 3) Membuat kisi-kisi tes b. Empirical/ Criterian Validity (Validitas Empirik/ Kriteria) 1) Kecoockan tes dengan suatu criteria 2) Keriteria: a) Kongruen/ kongkuren: kecocokan dengan keadaan seperti ini: (1) Kongruen: kecoockan dengan tes yang sama (2) Kongkuren: kecocokan dengan tes yang tidak sama b) Prediksi: kecocokan prediksi di masa yang akan dating c. Construct Validity (Validitas Konstruk) 1) Suatu validitas psikologi yang bersifat abstrak 2) Kecocokan di antara pengukuran konstruk dengan maksud konstruk 3) Cara menentukan validitas konstruk: a) Analisis proses mental yang memungkinkan konstruk terbentuk b) Perbandingan hasil pengukuran dnegan dua kelompok yang berbeda mengenai karakteristik yang diukur c) Perbandingan hasil pengukuran sebelum dengan sesudah diberi perlakuan tertentu d) Korelasikan hasil pengukuran dnegan hasil pengukuran yang telah diketahui dapat mengukur suatu konstruk e) Analisi factor (setelah menyusun factor dan uji coba: untuk mencari keyakinan atas hasil yang dianalisis)

Factor-faktor yang mempengaruhi validitas, yaitu: a. Instrument itu sendiri b. Administasi tes/ pemberian skor c. Respon siswa d. Pembelajaran yang diberikan e. Sifat kelompok

2. Reliability (keajegan/ keterandalan) Kemantapan (konsistensi) ekuivalensi atau stabilitas dari suatu pengukuran. Tujuan mengukur realibilitas adalah: a. Untuk mengetahui apakah tes yang digunakan teliti dan dapat dipercaya sesuai dengan criteria yang dirumuskan b. Untuk mengetahui derajat tes dapat menghasilkan skor-skor secara konsisten Faktor yang mempengaruhi reliabilitas adalah: a. Panjang instrument b. Rentangan skor c. Tingkat kesukaan d. Obyektivitas e. Cara yang dipakai Hubungan antara validitas dan reliabilitas adalah: a. Validitas tinggi biasanya reliabilitasnya juga tinggi b. Tes yang rebilitasnya tinggi belum tentu memberikan hasil pengukuran yang valid

3. Objectivity Identitas dari skor-skor atau diagnosis yang diperoleh dari data yang sama diberikan oleh penskor-penskor dnegan kompetensi sama.

4. Usability/ Practicability Menunjukkan kemungkinan dapat dijalankan suatu kegunaan umum dari suatu teknik penilaian Usebility dapat dilihat dari segi:

a. Pelaksanaan b. Perlengkapan c. Waktu yang dibutuhkan d. Cara pemeriksaan dan pengelolaan e. Biaya yang digunakan f. Cara penafsiran

B. Pengembangan Instrumen Tes/ Non Tes Tahap-tahap dalam mengembangkan intrumen adalah: 1. Penyusunan instrument 2. Uji coba (Try Out) 3. Analisi hasil uji coba: a. Validitas b. Reliabilitas c. Analisa item: tingkat kesukaran dan efektivitas diastraktor/ pengecoh) d. Penyortiran 4. Reprosuksi Merakit kembali soal-soal setelah disortir sehingga siap digunakan

Langkah-langkah penyusunan instrument: 1. Variable 2. Teori 3. Konstruk 4. Definisi Operasional 5. Dimensi dan atau indicator 6. Ksisi-kisi instrument (Blue print) 7. Menyusun butir-butir instrument Tingkat kesukaran soal (Proportional Correct) 1. Indeks kesukaran butir merupakan proporsi responden yang menjawab benar suatu butir dnegan seluruh tes 2. Indesk kesukaran butir berkisar antara 0 sampai dengan 1

a. Jika p = 0 berarti tak seorangpun responden dapat menajwab benar b. Jika p = 1, maka semua responden dapat menjawab benar Klasifikasi Tingkat Kesukaran 1. P > 0,70 kategori soal mudah 2. 0,30 < p < 0,70 kategori soal sedang 3. P < 0,30 kategori soal sukar Pengembangan Instrumen Tes berdasarkan Taksonomi Bloom: 1. Pengembangan Instrumen Kognitif a. Tes Harian (Formatif) 1) Mengidentifiasi TPK/ Tujua Pembelajaran Khusus atau indicator (sesuai dengan yang direncanakan salam SATPEL/ Satuan Pelajaran) 2) Pembuatan kisi-kisi 3) Penulisan butir soal 4) Validitas (proses validitas dilakukan oleh penilaian ahli = kepala sekolah/ tim evaluasi) 5) Reprosukdi Contoh kisi-kisi tes harian pelajaran bahasa inggris untuk kelas 1 SD semester1 TKP/ Indikator 1 2 3 Skor Akhir b. Tes Terstandar 1) Penetapan tujuan tes Untuk apa tes dibuat (sumatif, diagnostic, selektif, dll) 2) Analisis kurikulum dan bahan ajar a) Teoritis: kemauan kurikulum, tujuan, materi, aspek b) Empiris (pelaksanaan reel): untuk keperluan pembobotan, yujuannya agar proporsional: (1) Tes objektif: bayak soal karena tiap soal sama bobotnya (2) Tes uraian: berpengaruh pada scoring No. butir soal 1 2 3 4 5 Aspek C1 C2 C3 C4 C5 Tingkat Kesukaran Mudah Sedang Sukar Sedang Mudah Bobot 1 2 3 2 1 Skor 5 5 5 5 5 Bobot x skor 1x5=5 2 x 5 =10 3 x 5 = 15 2 x 5 = 10 1x5=5 45/45 x 100= 100

Pokok bahasan A B C D E F

Jumlah jam pertemuan (dalam kurikulum) 4 6 8 6 2 6 32

Jumlah halaman dalam buku 20 30 24 20 12 22 128

Bobot (4X4) + 20 =36- 36/256x 100% = 14% (4X6) + 30 =54- 54/256x 100% = 21% (4X8) + 24 =56- 56/256x 100% = 22% (4X6) + 20 =44- 44/256x 100% = 17% (4X2) + 12 =20- 20/256x 100% = 8% (4X6) + 22 =22- 22/256x 100% = 18% 256 100%

1:4 (4 x lipat) 3) Membuat kisi-kisi

c. Tes Objektif Pokok Bahasan A B C D E F Bobot 14 21 22 17 8 18 SK 20 % C1 C2 C3 1 1 1 1 1 1 1 1 8 Jumlah Butir SD 50% MD 30% C1 C2 C3 C1 C2 C3 1 1 1 1 1 1 2 1 1 1 2 1 1 1 1 1 1 1 2 1 1 1 1 1 2 1 1 1 20 12 Jumlah soal 14/100x40= 5,6=6 21/100x40= 8,4=8 22/100x40= 8,8= 9 17/100x40= 6,8=7 8/100x40= 3,2= 3 18/100x40= 7,2= 7 40

d. Tes Uraian Pokok Bahas an A B C D E F Bob ot 14 21 22 17 8 18 SK 20 % C2 C3 1(13) 1(8) 2 Jumlah Butir SD 50% C1 C2 C3 1(14) 1(8) 1(7) 1(10) 1(10) 5 MD 30% C2 1(8) 3 Jumlah soal C3 1(8) 14/100x10= 1,4=1 21/100x10= 2,1= 2 22/100x10= 2,2= 2 17/100x10= 1,7= 2 8/100x10= 0,8= 1 18/100x10= 1,8= 2 10

C1 -

C1 1(7) -

Keterangan: Penentuan jumlah soal (40 butir) a. Waktu pelaksanaan

b. Bentuk soal

4) Menulis tujuan pembelajran/ indicator Penulisan TPK (Tujuan Pembelajaran Khusus) atau indicator sesuai degan ketentuan pembuatan TPK: Audiesi, Behaviour, Condition dan Degree 5) Menulis butir soal Menulis butir soal harus memperhatikan: a) Kesesuaian dengan tujuan b) Kebenaran isi (conten) c) Ketepatan konstruksi/ kaidah d) Ketertiban bahsa 6) Vlidasi konsep/ konten Untuk validasi konsep/ isi dilakukan dengan penilaian ahli (expert judgement) atau di panel. Contoh fotrman validasi konsep: Soal Pilihan Ganda No. butir 1 2 3 Sesuai dengan indicator Isi Sesuai dengan kurikulum Soal dirumuskan dengan singkat Konstruksi Rumusan pilihan jawaba relative sama Bahasa sesuai dengan kaiadah BI Bahasa Menggunakan bahasa komunikatif Rata-rata Penilai: . Saran: Kriteria Keterangan: Kriteria Sangat sesuai Sesuai Tidak sesuai Sangat tidak sesuai Penilaian 4 3 2 1 Kriteria 3-4 2-2,9 1-1,9 0-0,9 4 5 6 7 .

7) Uji Coba (try out) Uji coba diberikan kepada kelompok yag homogeny dengan kelompok sesungguhnya 8) Kalibrasi (analisis hasil uji coba: validitas, reliabilitas, Analisis item: daya beda, tingkat kesukaran, dan efektifitas distraktor/ pengecoh) 9) Penyortiran No. Butir 1 2 3 dst Validitas Valid Valid Gugur Valid Daya Beda Baik sekali Baik Sedang Jelek Tingkat Kesukaran Sukar Sedang Sedang Mudah Keterangan Terpakai Terpakai Dibuang Dibuang Relibialitas r= 0,83 tinggi (butir soal yang terpakai saja)

10) Reproduksi Merakit kembali soal-soal setelah disortir yang siap dipakai kepada kelompok yang sesungguhnya

2. Pengembangan Instrumen Afektif a. Pengertian Perilaku Afektif 1) Perilaku yang dimunculkan seseorang sebagai pertanda kecendrungan dalam membuat pilihan atau keputusan untuk bereaksi di dalam lingkungan tertentu 2) Perilaku afektif tidak tapak oleh mata tetapi ditafsirkan berdasar perilaku atau gejala yang ditimbulkan 3) Seperti sikap, nilai-nilai, interest (minat), motivasi, dsb 4) Berhubungan dengan atribut-atribut psikologis 5) Untuk mengukur perilaku afektif digunakan skala sikap b. Pereilaku Afektif 1) Receiving (menerima nilai) 2) Responding (membuat respon terhadap nilai) 3) Valuing (menghargai nilai-nilai yang ada) 4) Organization (mengorganisasikan nilai) 5) Characterization (mengamalkan nilai secara konsisten) c. Langkah Pengembangan Instrumen Afektif

1) Pengembangan konsep/ konstruk Teori 1 Teori 2 Teori 3 Teori 4 Teori 5

Analisis

Analisis

Analisis

Analisis

Analisis

Sintesa (Definisi Konseptual)

Definisi Operasional

Dimensi Indikator Indikator

Dimensi Indikator Butir Instrumen

Dimensi Indikator Indikator

Contoh: Variabel Motivasi Belajar Statt Motivasi merupakan hal-hal umum bagian dari proses hipotetis psikologi yang meliputi pemenuhan kebutuhan dan dorongan tingkah laku untuk mencapai tujuan yang memuaskan M. Dalyono Motivasi sebagai factor inner (batin) berfungsi menimbulkan, mendasari, dan mengarahkan perbuatan belajar Definisi Konseptual Motivasi adalah suatu tenaga/dorongan dalam diri seseorang baik secara intrinsikk maupun ekstrinsik yang dapat menilbulkan kegiatan belajar, menjamin kelangsungan belajar, dan member arah terhadap kegiatan belajar dalam rangka mencapai tujuan.

Definisi Operasional Motivasi adalah skor yang diperoleh melalui angket dengan menggunakan skala Likert. Skor ini menggambarkan tentang semangat dalam proses belajar, menerima pekerjaan dengan tanggungjawab pribadi, menyelesaikan tugas dengan baik, ulet/pantang menyerah dalam menghadapi kesulitan, dan rasa optimis selama belajar.

2) Mengembangkan dimensi dan indicator 3) Membuat kisi-kisi atau bluepoint (table spesifikasi yang memuat dimensi, indicator, nomor butir dan jumlah butir) Dimensi Indikator 1. Berusaha untuk bersemangat dalam belajar 2. Menerima pekerjaan dengan tanggungjawab pribadi 3. Menyelesaikan tugas dengan baik 4. Ulet/pantang menyerah dalam menghadapi kesulitas 5. Optimis 1. Berusaha untuk bersemangat dalam belajar 2. Menerima pekerjaan dengan tanggungjawab pribadi 3. Menyelesaikan tugas dengan baik 4. Ulet/pantang menyerah dalam menghadapi kesulitas 5. Optimis Jumlah Pernyataan Pernyataan Positif Negatif 1 2 3 4 5 6 7 8 9 10 5 1 1 5 1 1 1 1 1 1 + 1 1 Jumlah 1 1 1 1 1 1 1 1 1 1 10

Intrinsik

Ekstrinsik

4) Menentukan jenis skala a) Summated rating scales atau skala rating (skala Likert) (1) Menentukan lokasi kedudukan seseorang dalam suatu kontinum seikap terhadap suatu objek sikap, mulai dari yang sangat negative sampai dengan sangat positif. (2) Untuk skala sikap Likert digunakan skala lima angka.

(3) Skala 1 (satu) bearti sangat negaatif da skala 5 (lima) berarti sangat positif untuk pernyataan positif, dan sebaliknya untuk pernyataan negative. Skala Likert Sangat Setuju Seetuju Ragu Tidak Setuju Sangat Tidak Setuju Contoh: No 1 2 3 Pernyataan Guru yang baik tidak pernah memukul murid Murid yang dipukul guru di sekolah akan berdikap negative terhadap sekolah SS S R TS STS Pernyataan Positif 5 4 3 2 1 Pernyataan Negatif 1 2 3 4 5

Contoh format lain: 1. Saya berusaha untuk berperan aktif dalam pelajaran Matematika a. Selalu d. Jarang Atau 1. SS .. di dalam kelas matematika, saya selalu sangat tertekan 2. S saya merasa tidak terjamin kebenarannya pada saat mencoba matematika b. Jarang e.Tidak Pernah c. Kadang-kadang

b) Equal appearing interval atau skala interval tampak setara (skala Thurstone) Skala thurstone adalah skala yang disusun dengan memilih butir yang berbentuk skala interval. Setiap butir memiliki kunci skor dan jika diurut, kunci skor menghasilkan nilai yang berjarak sama. Skala thurstone dibuat dalam bentuk sejumlah (80-100) pernyataan yang relevan dengan variable yang hendak diukur kemudian sejumlah ahli (20-200) orang menilai relevansi pernyataan itu dengan content atau konstruk variable yang hendak diukur.

Unfavorable feelings (sikap tidak mendukung)

Netral

Favorable feelings (sikap mendukung)

Skala

1

2

3

4

5

6

7

8

9

10

Nilai 1 menyatakan sangat tidak mendukung (unfavorable feelings), sedangkan nilai 10 menyatakan sangat mendukung (favorable feelings).

Langkah-langkah dalam membuat skala Thurstone: (1) Buatlah sejumlah pernyataan sikap (80-100) untuk dua set (2) Berikan kepada judges untuk dinilai (20-200) orang (3) Buat distribusi frekuensi, frekuensi proporsi, dan proporsi kumulatif. (4) Tentukan nilai-nilai skala/ Median (S) dan interquartil range (Q) (5) Susun pernyataan berdasarkan nilai S (6) Dari S yang sama atau hamper sama ambil nilai Q paling rendah (7) Pilih 20-22 butir untuk masing-masing skala. Buat dua set untuk menghitung koefisien relibialitasnya (8) Berikan keada responden, untuk memilih mana butir pernyataan yang cocok dengan sikapnya (9) Jumlah nilai S jawaban responden, kemudian hitung nilai rata-ratanya yang merupakan skor responden Contoh: Variabel sikap terhadap matematika dengan jumlah pernyataan 100 butir. Nilai Pernyataan 1. Senang belajaar matematika 2. Bergairah saat belajar matematika 3. Semua soal dikerjakan dengan 1 2 2 2 3 6 4 2 5 6 6 7 8 9 10 8 11 4 Jumlah Judges 200

63 64 26 18

0

0

0

10 40 28 50 26 28

14

4

200

0

0

0

2

8

6

26 44 56

44

14

200

semangat Dst

c) Cummulatif scales atau sekala komulatif (skala Guttman) Skala guttman adalah sederetan pernyataan tentang opini terhadap sutu objek sikap secara berurutan. Respondien diminta untuk menyatakan pendapatnya tentang pernyataan. Bila setuju dengan pernyaan pada nomor urut tertentu, maka semua pernyataan di bawahnya dianggap sidetujui. Missal: (1) Pengguran kandungan dapat diterima apapun alasannya (2) Pengguguean kandungan dapat diterima bila untuk alas an KB (3) Pengguguran andungan dapat diterima bila sebagi akibat perkosaan (4) Oengguguran kandungan dapat diterima bila ternyata bayi dalam kandungan mengalama cacat serius (5) Pengguguran kandungan dapat diterima bila ibu dalam keadaan bahaya Bila responden eruju pernyataan no. 3 berarti keseluruhan pernyataan 4 dan 5 juga dianggap seuju. Pernyataan yang dianggap tidak setuju dengan pernyataan diaatasnya yaitu, nomor 1 dan 2. d) Semantic differential Scales (skala diferensial semantic) Skala diferensial yaitu skala untuk mengukur sikap yang tersusun dalam satu garis kontinum. Jawaban yang sangat positif terletak dibagian kanan garis. Jawaban yang sagar negative terletak dibagian kiri garis atau sebaliknya. Contoh: Gaya kepepimpinan kepala sekolah Demokrasi Bertangungjawab 7 7 6 6 6 6 5 5 5 5 4 4 4 4 3 3 3 3 2 2 2 2 1 Otoriter 1 Tdk brtgjwab 1 Mendominasi 1 Tdk mnghrgai

Member kepercayaan 7 Menghargai bawahan 7

Responden yang memberikan penilaian angka 7, berarti persepsi terhadap gaya pemimpinan kepala sekolah adalah sangat postif, sedangkan responden yang

memberikan penilaian angka 1 berarti persepsinya terhadap gaya kepemimpinan kepala sekola adalah sangat negative. 5) Menulis butir pernyataan atau pertanyaan Kaidah penyusunan butir instrument skala sikap: a) Pernyataan harus dibuat menarik dan berguna b) Jangan membuat pernyataan yang tidak meyakinkan, sehingga responden menjawab tidak tahu c) Pernyataan dibuat berkenan dengan pendapat atau perasaan jangan terlalu rasional. d) Hidnari pernyataan yang bersifat faktial atau dapat diintepretasikan sebagai fakta e) Kalimat-kalimat disuusn secara singkat dan jelas sedapat mungkin kurang dari 20 kata f) Hindari pernyataan yang dapat diinterpretasikan lebih dari satu macam cara

g) Hindari kalimat-kalimat yang double negative h) Hindari kalimat taf double barreled. i) j) Pernyataan harus dibuat agar respondne berpikir Hindari kalimat-kalimat langsung

k) Hinari pernyataan yang mengandung kata-kata: semua, selalu, sering, tiak satupun, tidak pernah l) Pernyataan disusun dalam bentuk kalimat tunggal tidak ganda atau kompak

m) Hindari pemakaian kata-kata yang mungkin tidak dimengerti oleh responden.

6) Proses validasi konsep (teoritik dengan panel) Kriteria Konsep/ konstruk Variabel Motivasi No. Butir 1 Butir sesuai untuk mengukur indicator yang dirumuskan Butir sesuai dengan kisi-kisi yang direncanakan .. Pernyataan harus dibuat menarik dan berguna Kalimat-kalimat disusun secara singkat dan jelas . 2 3 4 5 6 7

Kaidah

Bahasa

Menggunakan bahasa yang sesuai dengan kaidah bahasa Indonesia Tidak menggunakan bahasa yang berlaku setempat/local .

Rata-rata Penilai: Saran: .. Keterangan: Kriteria Sesuai Direvisi Tidak sesuai (diganti) 7) Revisi berdasar panel 8) Instrument siap uji coba 9) Uji coba No Resep 1 2 3 4 5 6 7 8 9 10 1 5 4 3 2 1 1 2 2 4 5 2 5 4 5 3 1 1 5 5 5 5 3 5 5 5 5 1 1 3 5 5 5 4 5 1 1 1 2 3 4 5 5 5 Nomor Butir 5 6 5 4 4 3 3 3 2 3 1 5 1 5 5 5 1 5 1 5 5 5 7 5 5 5 5 3 2 1 5 4 5 8 5 5 5 5 4 3 5 5 4 5 9 5 5 5 5 4 5 3 5 4 5 10 5 5 5 4 5 3 5 4 5 5 Penialaian 3 2 1 Kriteria 2.1-3 1.1-2 0.0-1

10) Pengujian validasi secara empiric Data interval: pearson product moment No Resep 1 2 3 4 5 6 7 8 1 5 4 3 2 1 1 2 2 2 5 4 5 3 1 1 5 5 3 5 5 5 5 1 1 3 5 4 5 1 1 1 2 3 4 5 Nomor Butir 5 6 5 4 4 3 3 3 2 3 1 5 1 5 5 5 1 5 Total 7 5 5 5 5 3 2 1 5 8 5 5 5 5 4 3 5 5 9 5 5 5 5 4 5 3 5 10 5 5 5 4 5 3 5 4 49 41 40 35 27 25 38 42

9 10 r hitung r table Status

4 5 5 5 1 5 4 4 4 5 5 5 5 5 5 5 5 5 5 5 0.900 0.890 0.840 0.504 0.643 0.125 0.602 0.712 0.206 0.556 0.632 0.632 0.632 0.632 0.632 0.632 0.632 0.632 0.632 0.632 Valid Valid Valid Drop Valid Drop Drop Valid Drop Drop

42 50

11) Penyortiran Butir yang diambil (valid) adalah butir 1,2,3,5 dan 8 12) Menghitung koefisien reliabilitas No Resep 1 2 3 4 5 6 7 8 9 10 S2i S2t Koef.Rel. k= 5 r= r= [ 1[

1 5 4 3 2 1 1 2 2 4 5 2.322

2 5 4 5 3 1 1 5 5 5 5 2.767

No Butir 3 5 5 5 5 1 1 3 5 5 5 2.889

5 5 4 3 2 1 1 5 1 1 5 3.289

8 5 5 5 5 4 3 5 5 4 5 0.489

Total 25 22 21 17 8 7 20 18 19 25 11.76 38.84 0.876

] ]

r= 0.87 13) Reprosuksi (instrument final) 1. Saya berusaha untuk berperan aktif dalam perkuliahan pelajaran matematika a. Selalu b. sering c. kadang-kadang d. jarang

2. Saya mengumpulkan tugas-tugas pelajaran matematika tidak tepat waktu a. Selalu b. sering c. kadang-kadang d. jarang

3. Saya merasa mampu untuk dapat mengatasi kendala-kendala yang ddihadapi dalam pelajaran matematika

a. Selalu

b. sering

c. kadang-kadang

d. jarang

C. Analisis Data Hasil Tes 1. Vliditas a. Ketepatan hasil ukur atau mengukur apa yang seharusnya diukur b. Sejauhmana ketepatan dana kecermatan suatu alat ukur dalam melakukan fungsi ukurnya c. Kualitas ketepatan alat ukur dalam mengukur aspek-aspek bahan ajar untuk aspek-aspek perilaku yang seharusnya diukur d. Validitas isi mengukur seberapa jauh suatu tes mengukur tingkat oenguasaan terhadap isi atau konten atau materi tertentu yang seharusnya dikuasai sesuai dengan tujuan perngajaran; dilakukan dengan teknik: expert judgement, panel; yang dinilai: isi sesuai dengan kurikulum, e. Validitas konstruk mempermasalahkan sejauhmana item-item alat ukur mampu mengukur yang hendak diukur sesuai dengan konsep khusus atau definisi konseptual yang telah ditetapkan; dilakukan dengan teknik: expert judgement, panel; yang dinilai: perumusan konstryk (def. konseptual), penentuan dimensi dan indicator, penjabaran dan penulisan butir item (blueprint kisi-kisi) f. Validitas empiris ditentukan berdasarkan criteria baik internal maupun eksternal

g. Validitas internal menjadi criteria tes atau intrumen itu sendiri. Instrument sebagai satu kesatuan/ skor total: mengkorelasikan tiap butir dengan skor total, criteria valid jika > pada tingkat kepercayaan tertentu (missal = 0,05), jika jenis data

kontinum/interval (skor 1,2,3,), maka rumus yang digunakan adalah korelasi (r) Pearson Product Moment r= { {

atau r=

Jika data dikotomi (skor 0 dan 1), maka rumus digunakan adalah korelasi Boserial =

h. Validitas eksternal, ayng menajdi criteria adalah diluar tes itu sendiri seperti hasil ukur onstrumen baku (tes intelegensi), cara: mengkorelasikan skor hasil ukur dengan hasil ukur skor instrument baku, criteria: valid jika i. > pada nilai tertentu

Validitas prediktif, criteria eksternal yang digunakan adalah ukuran atau pena,pilan masa yang akan dating (tes PT dengan IPK)

j.

Validitas konkuren, kroteria eksternal yang digunakan adalah ukuran atau penampilan saat ini atau bersamaan (tes sumatif dengan tes harian) Validitas Teoritik Empirik Content Internal Eksternal Predictive Congruent

Constuct

Skor Kontinum (1,2,3,.) r product moment = 2. Reliabilitas

Skor dikotomi (1,0) r biserial

Ketetapan instrument atau konsistensi instrument. Sejauh mana hasil sutu pengukuran dapat dipercaya. Ada dua macam reliabilitas: a) konsistensi tanggapan menggunakan teknik test retest, teknik split half (belah dua), bentuk ekuivalen, b) konsistensi gabungan item menggunakan data interval: koefisien Alpha Crobach, data dikotomi: Kuder Richardson (KR-20 atau KR-21), analisis variasi: reliabilitas Hoyt

Reliabilitas

Konsistensi Tanggapan Test retest method Ekuivalen/parallel form method Teknik Belah Dua (Split Half)

Konsistensi Gabungan item

Skor dikotomi (1,0) Kuder Richardson KR-20

)

Skor Kontinum (1,2,3,)

Alpha Cronbach KR-20

)

Daftar Pustaka Pujiastuti, Sri Indah. Evaluasi Pembelajaraan Anak Usia Dini. Jakarta. 2007 http://lpp.uns.ac.id/wp-content/media/PANDUAN-EVALUASI-PEMBELAJARAN.pdf