Bab i - II Kontes-revisi

download Bab i - II Kontes-revisi

of 42

Transcript of Bab i - II Kontes-revisi

KONSTRUKSI TES MEMORITugas Mata Kuliah Konstruksi Tes

KELOMPOK 7 : Kelas : VII - AAna Nurul Ismi Tamami (107070002375) Fadila Rufiana Moh. Syifaul Qulub Mutia Kusuma Dewi (107070002388) (107070001638) (107070002312)

FAKULTAS PSIKOLOGI UNIVERSITAS ISLAM NEGERI SYARIF HIDAYATULLAH JAKARTA

2010 / 2011

BAB I PENDAHULUAN DAN PERMASALAHAN

1.1. Latar Belakang Hampir semua kegiatan yang dilakukan manusia memerlukan ingatan. Ingatan pada hakikatnya menggambarkan proses dan struktur yang terlibat didalamnya untuk menyimpan dan mengambil kembali informasi. Davidoff (1991), mengungkapkan bahwa ingatan dalam sistemnya memerlukan suatu prosedur tertentu guna memasukkan dan mengambil kembali informasi. Dan karena itu maka ada 3 hal yang diperlukan dalam sistem ingatan, yaitu memberi kode/coding, menyimpan, dan mengeluarkan/menarik kembali. Manusia sering mengira bahwa kemampuan mengingat suatu informasi atau pengetahuan merupakan kemampuan bawaan. Tidak jarang kita sering mendegar pernyataan bahwa seseorang memiliki memori yang tinggi, sementara orang yang lain memiliki memori yang rendah. Menurut De Potter dan Hemachki (dalam Ismoyo, 2006) memori atau ingatan bukan merupakan objek seperti mata, tangan dan organ tubuh lainnya. Memori adalah suatu kemampuan untuk mengingat apa yang telah diketahui. Orang dapat mengingat suatu pengalaman yang telah terjadi atau sesuatu pengetahuan yang telah dipelajari pada waktu yang lampau. Semakin sering terjalin kaitan antara pengalaman dan pengetahuan satu dan lainnya. Memori adalah sebuah sistem penyimpanan informasi pada diri manusia yang berkaitan dengan masa lalu. Menurut Stenberg (dalam Ismoyo, 2006) memori diartikan sebagai gambaran pengalaman yang telah dilalui dengan informasi yang dapat diketahui pada saat ini sebagai sebuah proses, memori merupakan mekanisme yang dinamis yang dipanggil kembali dari pengalaman yang sudah berlalu. Crowder (dalam Ismoyo, 2006) memori itu tentunya juga dimiliki oleh remaja pada umumnya. Ada berbagai macam jenis memori, diantaranya memori sensori, short-term memory dan long-term memory. Apabila ketiga jenis memori ini ditingkatkan secara maksimal maka2

kesulitan belajar yang seringkali dialami oleh anak dapat terhindarkan. Memori sensori dibagi menjadi tiga yaitu memori sensori visual, memori sensori auditori, memori sensori haptic (Atkinson & Shiffrin, 1971). Memori sensori auditori adalah kemampuan untuk memproses informasi yang diberikan secara oral, menganalisanya secara mental dan menyimpannya untuk di recall kembali. Dengan kapasitas yang kuat untuk memori sensori auditori disebut auditory learners. Kemampuan untuk belajar dari instruksi dan penjelasan oral adalah kemampuan fundamental yang dibutuhkan dalam kehidupan. Memori sensori auditori adalah salah satu kemampuan belajar yang paling penting. Anak dengan kemampuan belajar auditori yang lemah sering memiliki kesulitan pemahaman mengenai arti kata, dan dapat menunjukkan penundaan memahami bahasa. Hal ini dikarenakan phonics (bunyi suara) membutuhkan short-term memory auditory untuk anak dalam mengingat suara kata dan memisahkan mereka bersama-sama untuk membentuk katakata. Lebih lanjut lagi, sejak banyak anak belajar membaca dengan latihan membaca, mereka yang memiliki masalah dengan belajar auditori kemungkinan akan memakan waktu lebih lama untuk belajar membaca, dan penundaan ini dapat tercermin di kemudian hari dengan kurangnya membaca dan keterampilan menulis. Kapasitas untuk memori pendengaran tampaknya memiliki dasar genetik. Sekitar lima persen dari populasi di negara maju memiliki ketidakmampuan belajar yang menghambat belajar auditori. Gangguan cenderung berjalan dalam keluarga dan umumnya dibagi dalam kembar identik. Gangguan juga dikaitkan dengan penyakit genetik dan gangguan perkembangan. Orang tua dapat menguji memori sensori auditori jangka pendek anak dengan menguji kemampuan mereka untuk mengulangi urutan angka kembali ke tester. Mulailah dengan mengucapkan urutan empat nomor sederhana, misalnya 5-2-8-4, dan minta anak untuk mengulang urutan dari belakang. Jika anak berhasil, tingkatkan urutan tes untuk lima angka, dan berlanjut sampai anak tidak lagi mampu mengulangi urutan dengan benar 75% dari waktu pertama mereka mencoba. Anak-anak harus memiliki kemampuan untuk mengulangi enam digit atau lebih untuk memiliki kapasitas untuk belajar phonics. Kemampuan memori sensori auditori dapat dikembangkan melalui sejumlah latihan. Orangtua mencari cara untuk mengembangkan keterampilan belajar auditori pada anak-anak mereka dengan melakukan sejumlah praktek sederhana sepanjang hari. Misalnya, mereka3

bisa meminta anak-anak mereka untuk mengulangi pesan dengan berbicara keras, serta mengulang informasi penting seperti nomor telepon dan alamat untuk memasukkannya ke dalam memori sensori auditori mereka. Orang tua juga dapat bermain game memori dengan anak-anak mereka, seperti bertepuk tangan ritme dan meminta anak untuk mengulang urutan. Anak-anak juga dapat meningkatkan kemampuan belajar auditori mereka dengan belajar asosiasi kata dan kategorisasi kata-kata dan objek. Memori sensori auditori dapat membantu remaja dalam proses belajar. Dengan meningkatkan kemampuan memori sensori auditori, proses belajar anak dalam mengingat pelajaran yang diberikan oleh guru di sekolah dapat lebih mudah. Alat ukur memori sensori auditori ini diharapkan dapat bermanfaat bagi para siswa untuk mengetahui seberapa baik memori sensori auditori mereka, sehingga kesulitan belajar mereka dalam proses mengingat pelajaran di sekolah dapat diatasi. Apabila tingkat memori sensori auditori mereka rendah, maka proses mengingat dapat ditingkatkan dengan rajin membaca buku-buku pelajaran. Beberapa hasil penelitian menunjukkan adanya keterkaitan antara memori dan gaya belajar. Sebuah penelitian menunjukkan bahwa memori jangka pendek akan lebih mudah terbentuk dengan menggunakan stimulus berupa suara daripada visual (Collier dalam Wicaksono, 2006). Alat ukur memori sensori auditori dipilih oleh peneliti karena penelitian atau tes-tes yang ada pada saat ini leboh terfokus kepada alat tes yang mengukur kemampuan visual memori, sehingga alat tes untuk mengukur kemampuan memori yang lain sedikit terabaikan, padahal kemampuan memori tersebut juga berpengaruh dalam kehidupan sehari-hari khususnya dalam proses belajar.

1.2. Permasalahan Permasalahan yang akan dijawab pada pembuatan alat tes ini adalah :1. Bagaimana kemampuan memori pada anak SMP X? 2. Bagaimana validitas item dari alat ukur tes memori? 3. Bagaimana reliabilitas item dari alat ukur tes memori? 4

4. Bagaimana hasil analisa item dari alat ukur tes memori? 5. Bagaimana norma dari alat ukur tes memori?

1.3. Tujuan dan Manfaat Tes 1.3.1. Tujuan Tujuan dari disusunnya alat ukur memori sensori auditori ini yaitu untuk mendapatkan alat ukur yang valid dan reliabel untuk mengukur atau menggambarkan memori sensori auditori pada remaja awal. 1.3.2. Manfaat Alat tes ini diharapkan dapat mengukur atau menggambarkan seberapa baik kemampuan memori sensori auditori pada remaja. Selain itu penyusunan alat tes ini diharapkan pula dapat memperkaya hasil penelitian dalam bidang ilmu psikologi kognitif.

1.4. Sistematika Penulisan BAB I BAB II Pendahuluan dan Permasalahan Tinjauan Pustaka

BAB III Metode Konstruksi Tes BAB IV Hasil dan Analisa Hasil BAB V Kesimpulan, Diskusi, dan Saran

5

BAB II TINJAUAN PUSTAKA

2.1 Memori Jangka Pendek 2.1.1 Pengertian Memori Memori adalah proses yang terlibat dalam mempertahankan, mengambil, dan menggunakan informasi tentang stimulus, gambar, peristiwa, ide, dan keterampilan setelah informasi yang asli tidak lagi hadir (Goldstein, 2008). Menurut Richard Atkinson dan Richard Shiffrin (dalam Matlin, 1998) memori adalah bagian penting dari semua proses kognitif, karena informasi dapat disimpan hingga sewaktu-waktu digunakan. Dalam proses mengingat informasi ada 3 tahapan yaitu memasukkan informasi (encoding), penyimpanan (storage), dan mengingat (retrieval stage).6

Drever (dalam Walgito 2004) menjelaskan, memori menurut pengertian secara umum dan teoritis adalah salah satu karakter yang dimiliki oleh makhluk hidup, pengalaman berguna apa yang kita lupakan yang mana mempengaruhi perilaku dan pengalaman yang akan datang, yang mana ingatan itu bukan hanya meliputi recall (mengingat) dan recognition (mengenali) atau apa yang disebut dengan menimbulkan kembali ingatan. Lebih jelasnya Walgito (2004) menjelaskan bahwa ada dua cara menimbulkan kembali informasi dalam ingatan, yaitu dapat ditempuh dengan (1) mengingat kembali (to recall) dan (2) mengenal kembali (to recognize). Jadi recall memory adalah kemampuan menimbulkan ingatan kembali dengan cara mengingat kembali. Berdasarkan pendapat yang telah dikemukakan di atas maka dapat diambil kesimpulan bahwa recall memory adalah kegiatan individu untuk mengingat kembali informasi yang telah disimpan di dalam ingatannya.

2.1.2 Jenis-jenis Memori Richard Atkinson dan Richard Shiffrin (dalam Matlin, 1998) mengajukan konsep memori yang dibedakan dalam tiga sistem penyimpanan informasi, yaitu memori sensori (sensory memory), memori jangka pendek (short term memory), dan memori jangka panjang (long term memory). Etseem (dalam Ismoyo 2006) menjelaskan lebih lanjut mengenai memori sensori. Memori sensori adalah suatu sistem memori yang dirancang untuk menyimpan informasi yang diterima dari sel-sel reseptor dalam waktu yang amat pendek. Memori sensori mencatat informasi atau stimulus yang masuk melalui salah satu atau kombinasi dari panca indera yaitu secara visual melalui mata, pendengaran melalui telinga, bau melalui hidung, rasa melalui lidah, dan rabaan melalui kulit. Pengertian memori jangka pendek adalah salah satu proses penyimpanan informasi yang bersifat sementara. Informasi yang disimpan dalam memori jangka pendek berisi informasi yang terpilih dari memori sensori. Kapasitas memori jangka pendek. Jumlah informasi yang tersimpan dalam memori jangka pendek lebih kecil bila dibandingkan dengan yang tersimpan dalam memori jangka panjang Etseem (dalam Ismoyo 2006). Pendapat senada juga dikemukakan oleh, Yacobs (dalam Solso 1995) yang mengadakan penelitian dengan menyebutkan beberapa angka pada pendengar tanpa pola urutan tertentu, kemudian pendengar disuruh menulis kembali kata-kata tersebut, ternyata yang7

dapat diingat hanya tujuh angka. Dengan menggunakan tanda titik angka, kata dan lainnya menunjukkan hasil yang sama yakni memori jangka pendek terbatas hanya 7 +/- 2 unit. Davidoff (dalam Ismoyo,2006) menjelaskan bahwa memori jangka panjang (long term memory). diartikan sebagai tempat penyimpanan informasi yang bersifat permanen dibandingkan memori jangka pendek. Memori jangka panjang disebut juga sebagai gudang atau tempat penyimpanan informasi yang kapasitasnya tidak terbatas. Memori jangka panjang memungkinkan manusia mengingat kembali informasi masa lalu dan menggunakan informasi yang ada untuk mengerti apa yang terjadi sekarang. Misalnya, nama individu sendiri, rasa jagung rebus, lagu semasa kanak-kanak, dan abjad a-z merupakan bahan yang tersimpan dalam penyimpanan memori jangka panjang. Berdasarkan teori yang telah dikemukakan di atas maka dapat diambil kesimpulan bawa jenis-jenis memori antara lain adalah memori sensori (sensory memory), memori jangka pendek (short term memory), dan memori jangka panjang (long term memory).

2.1.3 Tahap-tahap Memori Sebelum seseorang mengingat suatu informasi atau sebuah kejadian dimasa lalu, ternyata ada beberapa tahapan yang harus dilalui ingatan tersebut untuk bisa muncul kembali. Atkinson (1983) berpendapat bahwa, para ahli psikologi membagi tiga tahapan ingatan, yaitu: 1. Memasukan pesan dalam ingatan (encoding). 2. Penyimpanan ingatan (storage). 3. Mengingat kembali (retrieval). Walgito (2004), yang menjelaskan bahwa ada tiga tahapan mengingat, yaitu mulai dari memasukkan informasi (learning), menyimpan (retention), menimbulkan kembali (remembering). Lebih jelasnya lagi adalah sebagai berikut: a) Memasukkan (learning) Cara memperoleh ingatan pada dasarnya dibagi menjadi dua, yaitu:

8

1.

Secara sengaja ; bahwa sesorang dengan sengaja memasukkan

informasi, pengetahuan, pengalaman-pengalamanya kedalam ingatannya. 2. Secara tidak disengaja ; bahwa sesorang secara tidak sengaja

memasukkan pengetahuan, pengalaman dan informasi ke dalam ingatannya. Misalnya: jika gelas kaca terjatuh maka akan pecah. Informasi ini disimpan sebagai pengertian-pengertian. b) Menyimpan Tahapan kedua dari ingatan adalah penyimpanan atau (retention) apa yang telah dipelajari. Apa yang telah dipelajari biasanya akan tersimpan dalam bentuk jejak-jejak (traces) dan bisa ditimbulkan kembali. Jejak-jejak tersebut biasa juga disebut dengan memory traces. Walaupun disimpan namun jika tidak sering digunakan maka memory traces tersebut bisa sulit untuk ditimbulakn kembali bahkan juga hilang, dan ini yang disebut dengan kelupaan. c) Menimbulkan kembali Menimbulkan kembali ingatan yang sudash disimpan dapat ditempuh dengan (1) mengingat kembali (to recall) dan mengenal kembali (to recognize). Dari pendapat ahli di atas maka dapat disimpulkan bahwa ada tiga tahap mengingat, yaitu tahap pemasukan informasi dan pesan-pesan kedalam ingatan , tahap penyimpanan ingatan dan tahap mengingat kembali.

2.1.2 Memori Jangka Pendek Informasi yang dipersepsi seseorang dan mendapatkan perhatian ditransfer ke komponen kedua dari sistem memori yaitu memori jangka pendek. Menurut Slavin (dalam Nur dkk,1998) dijelaskan bahwa memori jangka pendek adalah sistem penyimpanan yang dapat menyimpan informasi dalam jumlah yang terbatas hanya dalam beberapa detik. Biasanya memori ini menyimpan informasi yang terkini yang sedang dipikirkan. Satu cara untuk menyimpan informasi ke dalam memori jangka pendek adalah memikirkan tentang informasi itu atau mengucapkannya berkali-kali. Proses mempertahankan suatu informasi dalam memori jangka pendek dengan cara mengulangulang disebut menghafal (rehearsal). Menghafal sangat penting dalam belajar, karena9

semakin lama suatu butir tinggal di dalam memori jangka pendek, semakin besar kesempatan butir itu akan ditransfer ke memori jangka panjang. Tanpa pengulangan kemungkinan butir itu tidak akan tinggal di memori jangka pendek lebih dari sekitar 30 detik maka informasi itu dapat hilang akibat desakan informasi lainnya, karena memori jangka pendek mempunyai kapasitas yang terbatas yaitu 5 sampai 9 bits informasi (Miller dalam Nur dkk,1998) yaitu hanya bisa berpikir antara 5 sampai 9 hal yang berbeda dalam satu waktu tertentu.

2.1.4 Cara Mengukur Memori Untuk mengukur memori dapat digunakan beberapa tes memori yang telah dikembangkan oleh para ahli. Secara garis besar, tes-tes memori dapat dikelompokkan menjadi dua macam: tes memori langsung atau (explicit) dan tidak langsung (implicit). 1. Tes memori langsung (explicit) Tes ini mengacu pada peristiwa-peristiwa sasaran dalam sejarah pribadi subjek, yang menunjuk pada konteks ruang dan waktu. a. Tes rekognisi Subjek diminta membedakan antara stimulus-stimulus yang ada dengan yang tidak ada pada saat terjadi peristiwa sasaran. b. Tes recall Subjek diminta mengenali kembali apakah yang ada pada tes memori sama dengan stimulus yang ada pada saat belajar. 2. Tes memori tidak langsung (implicit) Merupakan tugas-tugas yang mengharuskan subjek melakukan aktivitas-aktivitas kognitif atau motorik. Perintah pada tes mengacu pada tugas-tugas yang sedang dihadapi. a. Tes pengetahuan konseptual, leksikal, dan perseptual

10

Tugas yang diberikan berfungsi untuk merinci struktur dan proses yang dipakai mengambil kembali pengetahuan yang bersifat permanen. b. Tes pengetahuan prosedural Tes ini meliputi tes-tes belajar keterampilan dan pemecahan masalah. Tes ini mengukur perubahan performansi yang diakibatkan oleh latihanlatihan. Tes ini mencakup tugas-tugas perseptual motorik.

Berdasarkan teori memori di atas, peneliti menggunakan teori Atkinson dan Shiffrin dalam mengkonstruksikan alat tes memori. Yaitu

2.2 Validitas 2.2.1 Pengertian Validitas Validitas adalah tingkat keandalan dan kesahihan alat ukur yang digunakan. Intrumen dikatakan valid berarti menunjukkan alat ukur yang dipergunakan untuk mendapatkan data itu valid atau dapat digunakan untuk mengukur apa yang seharusnya di ukur (Sugiyono, 2004). Dengan demikian, instrumen yang valid merupakan instrumen yang benar-benar tepat untuk mengukur apa yang hendak di ukur. Validitas berasal dari kata validity yang mempunyai arti sejauh mana ketepatan dan kecermatan suatu alat ukur dalam melakukan fungsi ukurnya (Azwar 1986). Suatu skala atau instrumen pengukur dapat dikatakan mempunyai validitas yang tinggi apabila instrumen tersebut menjalankan fungsi ukurnya, atau memberikan hasil ukur yang sesuai dengan maksud dilakukannya pengukuran tersebut. Sedangkan tes yang memiliki validitas rendah akan menghasilkan data yang tidak relevan dengan tujuan pengukuran. Terkandung di sini pengertian bahwa ketepatan pada validitas suatu alat ukur tergantung pada kemampuan alat ukur tersebut mencapai tujuan pengukuran yang dikehendaki dengan tepat. Suatu tes yang dimaksudkan untuk mengukur variabel A dan kemudian11

memberikan hasil pengukuran mengenai variabel A, dikatakan sebagai alat ukur yang memiliki validitas tinggi. Suatu tes yang dimaksudkan mengukur variabel A akan tetapi menghasilkan data mengenai variabel A' atau bahkan B, dikatakan sebagai alat ukur yang memiliki validitas rendah untuk mengukur variabel A dan tinggi validitasnya untuk mengukur variabel A' atau B (Azwar 1986). Sisi lain dari pengertian validitas adalah aspek kecermatan pengukuran. Suatu alat ukur yang valid tidak hanya mampu menghasilkan data yang tepat akan tetapi juga harus memberikan gambaran yang cermat mengenai data tersebut. Cermat berarti bahwa pengukuran itu dapat memberikan gambaran mengenai perbedaan yang sekecil-kecilnya di antara subjek yang satu dengan yang lain. Sebagai contoh, dalam bidang pengukuran aspek fisik, bila kita hendak mengetahui berat sebuah cincin emas maka kita harus menggunakan alat penimbang berat emas agar hasil penimbangannnya valid, yaitu tepat dan cermat. Sebuah alat penimbang badan memang mengukur berat, akan tetapi tidaklah cukup cermat guna menimbang berat cincin emas karena perbedaan berat yang sangat kecil pada berat emas itu tidak akan terlihat pada alat ukur berat badan. Demikian pula kita ingin mengetahui waktu tempuh yang diperlukan dalam perjalanan dari satu kota ke kota lainnya, maka sebuah jam tangan biasa adalah cukup cermat dan karenanya akan menghasikan pengukuran waktu yang valid. Akan tetapi, jam tangan yang sama tentu tidak dapat memberikan hasil ukur yang valid mengenai waktu yang diperlukan seorang atlit pelari cepat dalam menempuh jarak 100 meter dikarenakan dalam hal itu diperlukan alat ukur yang dapat memberikan perbedaan satuan waktu terkecil sampai kepada pecahan detik yaitu stopwatch. Menggunakan alat ukur yang dimaksudkan untuk mengukur suatu aspek tertentu akan tetapi tidak dapat memberikan hasil ukur yang cermat dan teliti akan menimbulkan kesalahan atau eror. Alat ukur yang valid akan memiliki tingkat kesalahan yang kecil sehingga angka yang dihasilkannya dapat dipercaya sebagai angka yang sebenarnya atau angka yang mendekati keadaan sebenarnya (Azwar 1986). 2.2.2 Tipe-tipe Umum Pengukuran Validitas Menurut Anastasi & Urbina, tipe-tipe pengukuran validitas yaitu:

12

a.

Prosedur Deskripsi-Isi

Pada dasarnya melibatkan pengujian sistematik atas isi tes untuk menetukan apakah tes itu mencakup sampel representatif dari domain perilaku yang harus diukur. Validitas isi janganlah dikacaukan dengan validitas nominal (face validity). Validitas nominal bukanlah validitas dalam pengertian teknis; validitas ini merujuk pada apa yang nampaknya diukur. Validitas nominal berhubungan dengan apakah tes itu kelihatan valid bagi peserta tes yang mengikutinya. Validitas nominal kerap kali dapat diperbaiki dengan merumuskan kembali butir-butir soal tes dalam istilah-istilah yang nampak relevan dan masuk akal dalam lingkungan tertentu dimana tes-tes itu akan digunakan. b. Prosedur Prediksi Kriteria

Prosedur validasi prediksi kriteria menunjukkan efektivitas sebuah tes untuk memprediksi kinerja seseorang dalam aktivitas-aktivitas tertentu. Ukuran kriteria yang menjadi tolak ukur validasi skor-skor tes divalidasikan bisa diperoleh pada saat yang hampir sama dengan pemberi skor tes atau setelah suatu interval ditetapkan. Validitas prediksi kriteria kerapkali digunakan dalam studi-studi validasi lokal, yang padanya efektivitas sebuah tes untuk program tertentu harus dinilai. Validitas prediksi kriteria bisa dicirikan sebagai validitas praktis sebuah tes untuk maksud tertentu. c. Prosedur Identifikasi Konstruk

Validitas konstruk suatu tes adalah lingkup sejauhmana tes bisa dikatakan mengukur suatu konstruk atau sifat yang teoritis. Tiap konstruk dikembangkan untuk menjelaskan dan mengorganisir konsistensi-konsistensi respons yang teramati. Konstruk-konstruk tersebut berasal dari hubungan-hubungan tetap antara ukuran-ukuran perilaku. Validasi konstruk membutuhkan akumulasi informasi secara bertahap dari berbagai sumber. Selanjutnya menurut Saifuddin Azwar (2003), validitas terbagi menjadi: Validitas Isi

13

Merupakan validitas yang diestimasi lewat pengujian terhadap isi tes dengan analisis rasional atau lewat professional judgement. Pertanyaan yang dicari jawabannya dalam validasi ini adalah sejauhmana aitem-aitem dalam tes mencakup keseluruhan kawasan isi (dengan catatan tidak keluar dari batasan tujuan ukur) objek yang hendak diukur atau sejauhmana isi tes mencerminkan ciri atribut yang hendak diukur Selanjutnya validitas isi terbagi menjadi 2 (dua), yaitu : 1) Validitas muka (face validity)

Tipe validitas yang paling rendah signifikansinya karena hanya didasarkan pada penilaian terhadap format penampilan (appearance) tes. Apabila penampilan tes telah meyakinkan dan memberikan kesan mampu mengungkap apa yang hendak diukur maka dapat dikatakan bahwa validitas muka telah terpenuhi. 2) Validitas logik (logical/sampling validity)

Validitas ini menunjuk pada sejauh mana isi tes merupakan representasi dari ciri-ciri atribut yang hendak diukur. Untuk memperoleh validitas logik yang tinggi, suatu tes harus dirancang sedemikian rupa sehingga benar-benar berisi hanya aitem yang relevan dan perlu menjadi bagian tes secara keseluruhan. Penggunaan blueprint sangat membantu tercapainya validitas logik. b. Validitas Konstruk

Adalah tipe validitas yang menunjukkan sejauh mana tes mengungkap suatu trait atau konstrak teoritik yang hendak diukurnya (Allen & Yen, 1979). Pengujian validitas konstrak merupakan proses yang terus berlanjut sejalan dengan perkembangan konsep mengenai trait yang diukur. Hasil estimasi validitas konstrak tidak dinyatakan dalam bentuk suatu koefisien validitas. Dukungan terhadap adanya validitas konstrak, menurut Magnusson, dapat dicapai melalui beberapa cara antara lain : 1) Studi mengenai perbedaan diantara kelompok-kelompok yang menurut teori harus

berbeda

14

Apabila teori mengatakan bahwa antara suatu kelompok dengan kelompok lainnya harus memiliki skor yang berbeda. 2) Studi mengenai pengaruh perubahan yang terjadi dalam diri individu dan

lingkungannya terhadap hasil tes Apabila teori mengatakan bahwa hasil tes dipengaruhi oleh kondisi subjek dikarenakan faktor kematangan. 3) Studi mengenai korelasi diantara berbagai variabel yang menurut teori mengukur

aspek yang sama Studi ini dapat diperluas dengan mengikutsertakan korelasi antara berbagai skor tes yang mengukur aspek yang berbeda. 4) Studi mengenai korelasi antaraitem atau antar belahan tes

Interkorelasi yang tinggi antarbelahan dari suatu tes dapat dianggap sebagai bukti bahwa tes mengukur satu variabel satuan (unitary variable). c. Validitas Berdasar Kriteria

Menghendaki tersedianya kriteria eksternal yang dapat dijadikan dasar pengujian skor tes. Suatu kriteria adalah variabel perilaku yang akan diprediksikan oleh skor tes atau berupa suatu ukuran lain yang relevan. Untuk melihat tingginya validitas berdasar kriteria dilakukan komputasi korelasi antara skor tes dengan skor kriteria. Koefisien ini merupakan koefisien validitas bagi tes yang bersangkutan, yaitu rxy, dimana X melambangkan skor tes dan Y melambangkan skor kriteria. Prosedur validasi berdasar kriteria menghasilkan dua macam validitas, yaitu : 1) Validitas prediktif, sangat penting artinya bila tes dimaksudkan untuk berfungsi

sebagai prediktor bagi performansi diwaktu yang akan datang. 2) Validitas konkruen, apabila skor tes dan skor kriterianya dapat diperoleh dalam

waktu yang sama, maka korelasi antara kedua skor termaksud merupakan koefisien validitas konkruen.15

2.3 Reliabilitas 2.3.1 Pengertian Reliabilitas Reliabilitas merujuk pada konsistensi skor yang dicapai oleh orang yang sama ketika mereka diuji-ulang dengan tes yang sama pada kesempatan berbeda, atau engan seperangkat butir-butir ekuivalen (equivalent items) yang berbeda, atau dalam kondisi pengujian yang berbeda. Konsep reliabilitas ini mendasari perhitungan kesalahan pengukuran atas skor tunggal, yang bisa kita pakai untuk memprediksi rentang fluktuasi yang mungkin muncul dalam skor individu sebagai hasil dari faktor faktor peluang yang tak diketahui atau tidak relevan (Anastasi & Urbina, 2007). Uji reliabilitas berguna untuk menetapkan apakah instrumen yang dalam hal ini kuesioner dapat digunakan lebih dari satu kali, paling tidak oleh responden yang sama akan menghasilkan data yang konsisten. Dengan kata lain, reliabilitas instrumen mencirikan tingkat konsistensi. Banyak rumus yang dapat digunakan untuk mengukur reliabilitas diantaranya adalah rumus Spearman Brown

Ket : R 11 adalah nilai reliabilitas R b adalah nilai koefisien korelasi Nilai koefisien reliabilitas yang baik adalah diatas 0,7 (cukup baik), di atas 0,8 (baik).

2.3.2 Teknik menguji reliabilitas Menurut Arikunto (200) ada tiga teknik untuk menguji reliabilitas instrumen, yaitu : a. Teknik Paralel (Paralel Form Atau Alternate Form)

Disebut juga teknik double test double trial. Sejak awal peneliti harus sudah menyusun dua perangkat instrumen yang paralel (ekuivalen), yaitu dua buah instrumen yang disusun berdasarkan satu kisi-kisi. Setiap butir soal dari instrumen yang satu selalu harus dapat16

dicarikan pasangannya dari instrumen kedua. Kedua instrumen tersebut diujicobakan semua. Sesudah kedua uji coba terlaksana, maka hasil kedua instrumen tersebut dihitung korelasinya dengan menggunakan rumus product moment (korelasi Pearson). b. Teknik Ulang (test re-test)

Disebut juga teknik single test double trial. Menggunakan sebuah instrumen, namun diteskan dua kali. Hasil atau skor pertama dan kedua kemudian dikorelasikan untuk mengetahui besarnya indeks reliabilitas. Teknik perhitungan yang digunakan sama dengan yang digunakan pada teknik pertama yaitu rumus korelasi Pearson. c. 1) Teknik Belah Dua (split half method) Disebut juga teknik single test single trial. Peneliti boleh hanya memiliki

seperangkat instrumen saja dan hanya diujicobakan satu kali, kemudian hasilnya dianalisis, yaitu dengan cara membelah seluruh instrumen menjadi dua sama besar. Cara yang diambil untuk membelah soal bisa dengan membelah atas dasar nomer ganjil-genap, atas dasar nomer awal-akhir, dan dengan cara undian. Selanjutnya menurut Anastasi & Urbina (200), reliabilitas merujuk pada konsistensi skor yang dicapai oleh orang yang sama ketika mereka diuji-ulang dengan tes yang sama pada kesempatan yang berbeda, atau dengan seperangkat butir-butir ekuivalen (equivalent items) yang berbeda, atau di bawah kondisi pengujian yang berbeda. a. Reliabilitas Tes Retes

Metode paling jelas untuk menemukan reliabilitas skor tes adalah dengan mengulang tes yang sama pada kesempatan kedua. Reliabilitas tes ulang menunjukkan sejauh mana skor pada tes dapat digeneralisasikan untuk berbagai kesempatan yang berbeda; makin tinggi reliabilitasnya, makin rentanlah skor terhadap perubahan sehari-hari yang acak dalam kondisi peserta tes atau lingkungan testing. b. Reliabilitas Bentuk Alternatif

Satu cara untuk menghindari kesulitan yang ditemukan dalam reliabilitas tes dan tes ulang adalah melalui penggunaan bentuk-bentuk tes lainnya. Dengan demikian, orang yang sama bisa ditest dengan satu bentuk pada kesempatan pertama dan dengan bentuk lainnya yang ekuivalen pada kesempatan kedua. Korelasi antara skor-skor yang didapatkan pada17

dua bentuk itu merupakan koefisien reliabilitas tes. Perlu dicatat bahwa koefisien reliabilitas semacam itu adalah ukuran stabilitas temporal dan konsistensi respons terhadap berbagai butir soal contoh (atau bentuk-bentuk tes). c. Reliabilitas Belah Separuh (Split-Half Reliability)

Dengan cara ini, dua skor didapatkan untuk setiap orang dengan membagi tes menjadi paruhan-paruhan yang ekuivalen. Jenis reliabilitas ini kadangkala disebut koefisien konsistensi internal, karena hanya dibutuhkan penyelenggaraan tunggal atas satu bentuk tes saja. Untuk mendapatkan reliabilitas belah-separuh, masalah pertamanya adalah bagaimana membagi tes dalam rangka mendapatkan paruhan-paruhan yang paling ekuivalen. Efek yang akan dihasilkan pada koefisiennya dengan memperpanjang atau

memperpendek sebuah tes, dapat diperkirakan dengan rumus Spearman-Brown, seperti berikut : rnn = nrtt 1 + (n 1)rtt

rnn rtt n

: koefisien yang diperkirakan : koefisien yang diperoleh : jumlah waktu tes diperpanjang/diperpendek

Ketika diterapkan pada reliabilitas belah separuh, rumus ini selalu melibatkan penggandaan panjang tes. Dalam kondisi ini, rumus itu dapat disederhanakan sebagai berikut : rtt = 2rhh 1 + rhh

Untuk rhh adalah korelasi dari tes-tes paruhan

18

Metode alternatif untuk mendapatkan reliabilitas belah separuh dikembangkan oleh Rulon (1939). Hanya dibutuhkan varians dari perbedaan antara skor-skor tiap orang pada dua tes-tes separuh (SDx2) dan varians skor total (SDd2) dua nilai ini disubstitusikan dalm rumus berikut, yang menghasilkan reliabilitas seluruh tes secara langsung : rtt = 1 SDx2 SDd2

Menarik

untuk

memperhatikan

hubungan rumus ini dengan varians kesalahan.

Perbedaan apapun antara skor-skor seseorang pada dua tes paruhan menampilkan varians kesalahan atau varians yang tidak relevan.

Varians-varians perbedaan-perbedaan ini, dibagi dengan varians skor-skor total, memberikan proporsi varians kesalahan dalam skor-skor itu. Ketika varians skor ini dikurangkan dari 1,00, hasilnya adalah proporsi varians benar untuk penggunaan tes tertentu, yang sama dengan koefisien reliabilitas. d. Reliabilitas Kuder-Richardson dan Koefisien Alpha

Metode ini didasarkan pada konsistensi respons terhadap semua butir soal dalam tes. Konsistensi antar soal ini dipengaruhi oleh dua sumber varians kesalahan : (1) pencuplikan isi (sebagaimana dalam bentuk alternatif dan reliabilitas belah separuh) ; dan (2) heterogenitas dari domain yang disampelkan. Semakin homogen domainnya, semakin tinggilah konsistensi antar soal. Dari berbagai rumus yang diturunkan dalam artikel aslinya, rumus yang paling luas diterapkan, umumnya dikenal sebagai rumus 20 Kuder-Richardson, adalah sebagai berikut :

rtt n

: koefisien reliabilitas seluruh tes : jumlah soal dalam tes19

SDt p q pq

: simpangan baku skor-skor total tes : proporsi orang-orang yang lulus : proporsi orang-orang yang tidak lulus : hasil tabulasi antara p dan q

Rumus Kuder-Richardson dapat diterapkan pada tes-tes yang soal-soalnya diskor benar atau salah, atau tergantung pada suatu sistem all or none (semua atau tidak sama sekali) lainnya. e. Reliabilitas Pemberi Skor

Reliabilitas pemberi skor dapat ditentukan dengan memiliki sampel lembaran tes yang diskor secara terpisah oleh dua penguji. Dengan demikian dua skor yang didapatkan oleh masing-masing peserta tes ini kemudian dikorelasikan dengan cara biasa, dan koefisien korelasi yang dihasilkannya adalah ukuran reliabilitas pemberi skor. Jenis reliabilitas ini umumnya dihitung ketika instrumen-instrumen yang diskor secara subjektif digunakan dalam riset. Dalam mengkonstruksikan menggunakan: Validitas Konstruk Reliabilitas test-retest alat tes memori, peneliti akan

2.4 Analisis Butir Soal 2.4.1 Pengertian Analisis Butir Soal Analisis butir soal (item) adalah suatu istilah yang digunakan untuk menentukan perhitungan dan pengukuran respons subjek terhadap suatu item (Crocker & Algina, 1986). Secara umum, analisis item bertujuan untuk menentukan apakah suatu item merupakan item yang baik atau buruk sebagai suatu alat ukur, sehingga memungkinkan kita untuk memperpendek atau memperpanjang suatu tes sekaligus meningkatkan validitas dan reliabilitasnya. Analisis item dapat dilakukan secara kualitatif maupun kuantitatif. Secara kualitatif dilakukan analisis mengenai isi (content validity item-item soal) dan bentuk (apakah itemitem ditulis dalam bentuk tertentu yang efektif untuk mencapai sasaran), yaitu dengan20

menghadirkan expert judgement sedangkan secara kuantitatif dilakukan analisis menggunakan berbagai teknik statistik. Teknik statistik yang paling umum digunakan dalam analisis item adalah dengan mengukur indeks kesukaran item dan indeks diskriminasi item. Item-item dalam tes ini tidak bervariasi derajat kesukarannya (dan tidak perlu diurutkan berdasarkan derajat kesukarannya), sehingga tidak diukur indeks kesukaran item-nya. Analisis soal pada dasarnya terbagi menjadi dua kategori yaitu analisis soal secara kualitatif dan secara kuantitatif. Analisis butir soal secara kuantitatif menekankan pada analisis karakteristik internal tes melalui data yang diperoleh secara empirik. Karakteristik internal yang dimaksud meliputi parameter butir soal tingkat kesukaran dan daya pembeda soal. Analisis tingkat kesukaran soal artinya mengkaji soal-soal tes dari tingkat kesulitannya sehingga diperoleh soal-soal mana yang termasuk mudah, sedang dan sukar. Sedangkan analisis daya pembeda artinya mengkaji soal-soal tes dari segi kesanggupan tes tersebut dalam membedakan siswa yang memiliki kemampuan rendah dengan siswa yang memiliki kemampuan tinggi. Surapranata (2004) menyatakan bahwa salah satu tujuan dilakukannya analisis adalah untuk meningkatkan kualitas soal, yaitu apakah suatu soal : o Dapat diterima karena telah didukung oleh data statistik yang memadai o Diperbaiki karena terbukti terdapat beberapa kelemahan o Tidak digunakan sama sekali karena terbukti secara empiris tidak berfungsi sama sekali. 2.4.2 Indeks Kesukaran

Indeks kesukaran butir sebagaimana dinyatakan oleh Allen & Yen adalah proportion of examinees who get that item correct. Senada dengan mereka, Sax menulis bahwa indeks kesukaran adalah proporsi peserta ujian yang menjawab benar.16 Saifuddin Azwar (2003: 134) menyatakan dengan lebih lugas bahwa indeks kesukaran butir adalah rasio penjawab butir dengan benar dan banyaknya penjawab butir.

21

Proporsi menjawab benar p (proportion correct) adalah indeks kesukaran soal yang paling sederhana dan sering digunakan dalam menentukan besaran indeks. Rumus untuk menentukan besarnya indeks kesukaran secara matematis dirumuskan oleh Saifuddin sebagai berikut :

P adalah indeks kesukaran butir, n1 adalah jumlah peserta tes yang menjawab benar sedangkan N adalah banyaknya siswa yang menjawab butir soal tersebut. Dengan demikian untuk menghitung indeks kesukaran butir dilakukan dengan tidak membagi kelompok peserta tes kedalam kelompok atas dan bawah sebagaimana untuk menentukan daya beda.

Besarnya indeks korelasi berkisar antara 0 sampai 1. Makin tinggi besaran indeks korelasi maka butir soal tersebut semakin mudah. Dan semakin kecil angka indeks korelasi maka butir soal tersebut semakin sulit. Indeks kesukaran yang berada disekitar 0,5 dianggap yang terbaik. Karena itulah maka menurut Allen & Yen tingkat kesukaran yang baik adalah 0,3 sampai 0,7.19 Butir dengan tingkat kesulitan dibawah 0,3 dianggap butir soal yang sukar sedangkan jika indeksnya diatas 0,7, butir soal tersebut dianggap mudah. Beberapa pertimbangan dalam menentukan proporsi jumlah soal kategori mudah, sedang, dan sukar, diantaranya: 1. Adanya keseimbangan jumlah soal untuk ketiga kategori tersebut. 2. Proporsi jumlah soal untuk ketiga kategori tersebut didasarkan atas kurva normal. Maksudnya, sebagian besar soal berada pada kategori sedang, kemudian butir soal kategori mudah dan sukar proporsinya seimbang. Dari penjelasan di atas ada beberapa hal yang bisa disimpulkan berkaitan dengan indeks kesukaran butir yaitu bahwa nilai p bagi suatu butir hanya menunjukkan indeks bagi22

kelompok yang diuji. Harga p ini bisa berubah jika tes diujikan pada kelompok yang berbeda. Selain itu, indeks kesukaran yang dihasilkan dari rumus ini adalah indeks kesukaran yang berlaku bagi kelompok secara keseluruhan bukan perorangan. Indeks kesukaran bagi tiap peserta tes tidak bisa disimpulkan dengan melihat indeks proporsi menjawab benar p. Namun pada kesmpatan ini hanya akan dibahas dengan cara 1 yaitu proporsi menjawab benar. Formula yang digunakan untuk mengidentifikasi tingkat kesukaran soal (dengan simbol p) yaitu:

pi =

xi SmiN

Dimana: pi = xi= Smi N = Tingkat kesukaran butir i atau proporsi menjawab benar butir i banyaknya testee yang menjawab benar butir i, (untuk tes uraian, jumlah skor = skor maksimum

butir i yang dijawab oleh testee) jumlah testee

Kriteria yang digunakan untuk menentukan jenis tingkat kesukaran butir soal adalah sebagai berikut: p < 0.30 0.3 < p < 0.70 p> 0.70 butir soal sukar butir soal sedang butir soal mudah

2.4.3

Daya Pembeda

Daya beda (diskriminasi) suatu butir tes adalah kemampuan suatu butir untuk membedakan antara peserta tes yang berkemampuan tinggi dan berkemampuan rendah. Daya beda butir dapat diketahui dengan melihat besar kecilnya indeks diskriminasi atau angka yang menunjukkan besar kecilnya daya beda. Adapun fungsi dari daya pembeda tersebut adalah mendeteksi perbedaan individual yang sekecil-kecilnya diantara para peserta tes. Penentuan daya beda butir biasanya dilakukan dengan menggunakan indeks23

korelasi, diskriminasi, dan indeks keselarasan item. Dari ketiga cara tersebut yang paling sering digunakan adalah indeks korelasi. Ada empat macam teknik korelasi yang biasa digunakan untuk menghitung daya beda, yaitu : (1) teknik point biserial, (2) teknik biserial, (3) teknik phi, dan (4) teknik tetrachorik. Brennan (1972) sebagaimana dikutip Yen W.M dalam Encyclopedia of Educational Research memperkenalkan cara untuk menghitung Indeks diskriminasi dengan menggunakan rumus sebagai berikut:

Dimana dari rumus di atas dapat dimaknai bahwa daya beda adalah perbedaan antara proporsi kelompok atas yang menjawab benar butir tes bawah yang menjawab benar butir tes dengan proporsi kelompok

Rumus tersebut dapat digunakan untuk

menghitung daya beda butir-butir soal dalam bentuk pilihan ganda. Daya beda juga dapat dijelaskan sebagai derajad hubungan antara skor butir dengan skor total dengan menggunakan teknik korelasi product moment dari Pearson. Rumus khusus korelasi product moment yang dikenal dengan korelasi point biserial untuk data dalam bentuk dikotomi sebagaimana dikutip dalam Encyclopedia of Educational Research adalah sebagai berikut :

Dimana

, mean total skor peserta yang memiliki jawaban benar.

adalah mean skor

total Sx, adalah standar deviasi skor total, p adalah proporsi peserta ujian yang menjawab benar pada butir tes sedangkan q adalah 1 - p. Rumus korelasi point biserial juga dapat diturunkan langsung dari rumus korelasi produk momen tanpa membuat pembatasan asumsi. Alternatif lain untuk melihat indeks daya beda adalah dengan menggunakan rumus korelasi biserial. Korelasi biserial berbeda dengan korelasi point biserial baik secara teori24

maupun perhitungan, akan tetapi jika digunakan untuk tujuan menganalisis butir, kedua teknik tersebut dapat diinterpretasikan dengan cara yang sama10. Crocker menyatakan rumus korelasi biserial sebagai berikut:

"y" pada rumus korelasi biserial di atas melambangkan ordinat p dalam kurva normal. adalah mean skor dari peserta tes yang memiliki jawaban benar,

+

adalah mean skor

total, Sx adalah deviasi standar total, p adalah proporsi peserta ujian yang menjawab benar butir tes. Koefisien korelasi point biserial selalu lebih rendah dari koefisien korelasi biserial. Hal ini dikarenakan tingkat kesukaran dikombinasikan dengan kriteria oleh koefisien point biserial. Teknik lain untuk menentukan nilai daya beda adalah dengan menggunakan teknik korelasi phi ( ). Anas Sudijono menuliskan rumus tentang teknik korelasi phi sebagai berikut :

adalah angka indeks diskriminasi phi yang dianggap sebagai angka indeks diskriminasi butir. PH adalah proporsi orang yang menjawab benar kelompok atas. PL adalah proporsi orang yang menjawab benar kelompok bawah. p adalah proporsi seluruh peserta tes yang menjawab betul dan q adalah 1 dikurangi p. Ebel & Frisbie memberikan patokan indeks daya beda sebagai berikut: INDEKS DAYA BEDA 0,4 ke atas 0,3 0,39 0,2 0,29 < 0,19 EVALUASI BUTIR Butir yang sangat baik Sedikit atau tidak memerlukan revisi Butir memerlukan revisi Butir harus dieliminasi

25

2.4.4

Analisis Butir Soal Menurut Teori Respons Butir

Telah di uraikan diatas, bahwa analisis butir soal yang digunakan berdasarkan pendekatan teori tes klasik, bekerja dengan asumsi bahwa: 1. Tidak ada korelasi antara skor yang sebenarnya dan skor kesalahan. 2. Sepanjang tidak terjadi kesalahan sistematik, maka tidak ada korelasi antara kesalahan acak pada suatu pengukuran dengan kesalahan acak pada ulangan pengukuran. 3. Besarnya relata kesalahan acak sama dengan nol. Penggunaan teori klasik dalam menganalisis butir soal, memiliki beberapa kelemahan yaitu: 1. Statistik butir tes berupa tingkat kesukaran dan daya beda butir soal, sangat tergantung kepada karakteristik peserta tes. Jika kemampuan peserta rendah maka tingkat kesukaran butir soal akan tinggi (indeks kesukaran kecil). 2. Estimasi kemampuan peserta tergantung kepada butir soal yang diujikan. Bila indeks kesukaran kecil, estimasi kemampuan seseorang akan tinggi, demikian pula selanjutnya. 3. Estimasi skor kesalahan berlaku untuk peserta tes. Kesalahan untuk tiap peserta tes besarnya, yang dinyatakan dalam bentuk kesalahan baku pengukuran.. 4. Tidak ada informasi tentang respons setiap peserta terhadap tiap butir soal. 5. Estimasi keterandalan alat tes dengan teknik belah dua, teknik belah tiga, cornbach alpha dan sebagainya menggunakan asumsi paralel yang sulit dipenuhi. Atas dasar adanya kelemahan-kelamahan tersebut, maka akan munculah apa yang disebut teori respons yang berusaha mengatasi kelemahan tersebut. Menurut teori respons butir prilaku seseorang dapat dijelaskan dengan karakteristik orang yang bersangkutan sampai pada batas-batas tertentu. Karakteristik tersebut meliputi kemampuan verbal, kemampuan psikomotor, kemampuan kognitif dan sebagainya.

26

2.5 Norma dan arti skor tes Nunally dan Bernstein (1994) menyatakan bahwa norma adalah data statistik yang menyediakan sebuah kerangka referensi untuk menginterpretasi skor individual dalam kedudukan relatif terhadap skorskor lain. Skor-skor pada tes psikologis paling umum diinterpretasikan dengan mengacu pada norma-norma yang menggambarkan kinerja tes dari sampel terstandarisasi. Dengan demikian. Norma-norma secara empiris ditetapkan dengan menentukan apa yang sesungguhnya dilakukan oleh orang-orang dalam kelompok yang mewakili itu. Skor mentah individu selanjutnya di acu ke distribusi skor yang diperoleh lewat sampel terstandarisasi, untuk menemukan dimana tempatnya dalam distribusi itu. (Anastasi & Urbina, 2007). Kelompok standar mewakilli populasi yang dituju, disesuaikan dengan tujuan pengukuran, serta tergantung pada waktu dan daerah tempat pengukuran dilakukan (Crocker & Algina, 1986). Untuk menentukan kedudukan skor individu dengan tepat bila

dibandingkan dalam kelompoknya, raw score (skor mentah) individu perlu diubah ke dalam bentuk skala pengukuran lain. Tujuannya adalah agar (1) dapat menentukan kedudukan individu dalam sample normatif, (2) dapat melakukan perbandingan skor individu dalam tes-tes yang berbeda (Anastasi & Urbina, 1997).

2.5.1 Skor mentah (raw score) Skor mentah adalah angka (X) yang merupakan gabungan beberapa dari beberapa aspek performansi sesorang dalam sampel perilaku yang dipilih secara hati-hati dan teramati yang ada dalam tes psikologi. Skor mentah tidak memiliki arti sama sekali jika tidak dikaitkan dengan sistem atau norma-norma tes. Skor tinggi mungkin berarti hasil yang27

diinginkan dalam tes kemampuan, tapi tidak diinginkan dalam tes yang mengevaluasi beberapa aspek psikopatologi. Sebuah skor sangat dipengaruhi oleh asal skor itu diperoleh, area yang diungkap oleh tes, dan bagaimana norma yang terkini, juga aspek situasi dimana skor diperoleh dan karakteristik peserta tes. Seberapapun banyaknya statistik yang kita gunakan dalam tes psikologi, pada akhirnya harus ada pemaknaan skor tes yang berasal dari kerangka rujukan digunakan untuk menginterpretasi dan dari konteks skor itu diperoleh. Yang pasti, skor tes harus reliabel dan itemitem tes harus secara hati-hati disusun dan dievaluasi sehingga memberi kontribusi bagi pemaknaan skor tes. 2.5.2 Konsep Statistika Statistik dapat digunakan untuk menggambarkan skor tes. Statistik dapat digunakan untuk membuat kesimpulan tentang skor tes. Statistik memberi sebuah metode yang mengkomunikasikan tentang skor tes dan untuk menentukan kesimpulan apa yang dapat diambil dan yang tidak boleh diambil dari sebuah skor tes.1.

Konsep Dasar

Ada tiga konsep statistik yang sentral dalam pengukuran psikologi: variabilitas, korelasi, dan prediksi. Dari ketiganya, variabilitas adalah yang paling mendasar dan yang paling sentral. Pengukuran psikologi membahas perbedaan individu, dan aplikasi tes bukan lebih dari metode mengungkapkan perbedaan individu secara kuantitatif atau dalam bentuk angka. Jika tidak ada perbedaan individu, setiap orang akan memperoleh nilai atau skor yang sama pasa sebuah tes. Bagaimana mengetahui individu itu berbeda, adalah dari skor mereka yang berbeda. Indeks statistik variabilitas memberi kita sarana untuk mengukur dan menggambarkan seberapa jauh skor itu berbeda.

28

a. Variabilitas Skor Rata-rata memberi informasi yang baik untuk kemampuan secara keseluruhan tapi tidak memberitahu perbedaan antar individu. Beberapa orang memiliki kemampuan yang lebih baik daripada rata-rata (skor mereka di atas skor rata-rata), sementara yang lain memiliki kemampuan yang lebih buruk. Sangat berguna jika kita menghitung statistic yang mengukur sejauhmana individu itu berbeda. Ini sangat mudah dilakukan dengan menghitung perbedaan antar skor setiap orang dengan rata-ratanya (mengurangkan setiap skor dengan rata-rata). Skor deviasi ini menukur sejauh mana individu berbeda dengan ratarata. Ada dua prinsip yang digunakan dalam menghitung sebagian besar metode statistic : 1. 2. Statistik biasanya berdasarkan kepada rata-rata skor. Statistik yang berdasarkan kepada skor deviasi bisanya

bekerja dengan skor kuadrat daripada skor mentah. Kedua prinsip itu digunakan dalam mendefinisikan pengukuran dasar variabilitas, yaitu varian. Rumus varian :

Varian adalah rata-rata skor deviasi yang dikwadratkan. Varian yang besar menunjukkan bahwa skor individu berbeda jauh dari rata-ratanya, atau dari satu sama lain skor. Varian yang kecil29

menunjukkan bahwa sebagian besar individu memperoleh skor yang hampir sama, dan oleh karena itu sebagian besar orang skornya tidak berbeda jauh dengan rata-ratanya. Pengkwadratan dijadikan prinsip kedua, alasannya sederhana karena rata-rata dari skor deviasi selalu nol. Karena rata-rata skor deviasi tidak memberi informasi apapun tentang variabilitas maka dilakukanlah pengkwadratan setiap skor deviasi. Pengkwadratan skor deviasi membuat kita bisa mengembangkan pengukuran yang sederhana tentang variabilitas. Pengukuran pengukuran variabilitas psikologi sangat dan banyak digunakan salah dalam satu menggambarkan

pengukuran variabilitas yang paling umum digunakan untuk serangkaian tes. Salah satu penggunaan deviasi standar adalah untuk membuat skor standar atau Z-Score. Z-Score diperoleh dengan membagi skor deviasi orang dengan deviasi standar, yaitu:

Z-Score positif menunjukkan bahwa seseorang mempeoleh skor di atas rata-rata, Z-Score yang negatif menunjukkan bahwa orang itu memperoleh skor di bawah rata-rata. Besaran skor z dalam unit deviasi standar menunjukkan seberapa jauh skor orang itu dari rata-rata. Semakin besar skor z berarti semakin jauh skornya dari rata-rata. Dengan kurva normal, skor z dapat digunakan untuk memberi gambaran langsung yang mudah dipahami tentang skor tes.30

b. Korelasi Cara yang paling sederhana untuk menggambarkan hubungan antar skor adalah menggunakan scatterplot. Scatterplot adalah grafik yang menunjukkan posisi sebuah kelompok orang di titik temu skor dua variabel. Sumbu X pada grafik digunakan untuk satu variabel dan sumbu Y digunakan untuk variabel kedua, dan skor setiap orang pada dua variabel itu ditampilkan dalam satu titik. Alat korelasi yang sederhana dan paling umum adalah koefisien korelasi yang disimbolkan dengan r. Dengan kata lain:

c. Prediksi Salah kegunaan korelasi adalah prediksi. Jika skor pada satu variabel, seperti kinerja, dikorelasikan dengan skor lainnya seperti tes pemahaman mekanik, implikasinya kita dapat memprediksi kinerja seseorang dari skor-skor tes. Banyak keputusan yang kita buat atas seseorang berdasarkan kepada (setidaknya secara implisit) kepada prediksi-prediksi. Perguruan tinggi menerima siswa sebagian besar diinginkan berhasil. Dunia industri menerima orang yang diprediksi bekerja dengan baik dan tidak memilih mereka yang diprediksi gagal. Psikolog klinis sering mendasarkan treatment mereka kepada hasil-hasil prediktif dari berbagai terapi. Oleh karena itu, topik prediktif adalah salah satu hal praktis yang sangat penting untuk dibahas.

31

Persoalan prediksi dipenuhi dengan kenyataan bahwa prediktor (X) dan variabel yang ingin diprediksi (Y) sering memiliki skala yang berbeda. Teknik yang digunakan untuk membuat prediksi oleh karena itu, harus menghitung dua skal itu X dan Y dan sejauhmana X dan Y berkorelasi. Skor yang diprediksi yaitu Y, berdasarkan kepada skor orang pada X, rumusnya adalah:

Dengan kata lain, skor prediksi Y adalah sama dengan skor pada X yang dikalikan dengan b, plus konstanta, a. Konstanta (intercept) membuat kita mampu menyesuaikan untk berbagai skala pengukuran untuk X dan Y. Koefisien regresi, b, menunjukkan perubahan yang diharapkan dalam Y per unit perubahan dalam X. 2.5.3 Kerangka Rujukan Ada dua rujukan yang bisa kita gunakan untuk menginterpretasi sebuah skor, yaitu norma tes dan kriteria performansi.1.

Norma.

Interpretasi tes yang merujuk ke norma menggunakan standar yang berdasarkan kepada performansi sekelompok orang tertentu untuk memberi informasi untuk menginterpretasi skor. Jenis interpretasi ini sangat berguna ketika kita harus membandingkan orang satu sama32

lain dengan merujuk kelompoknya untuk mengevaluasi perbedaan antar mereka sesuai dengan apa yang diukur oleh tes itu. norma biasanya ditampilkan dalam bentuk tabel dengan statistik deskriptif misalnya, rata-rata, deviasi standar, dan distribusi frekuensi yang diperoleh dari perfomansi sebuah kelompok dan pertanyaanpertanyaan yang diajukan kepada kelompok itu. jika norma itu diperoleh dari sebuah kelompok maka kelompok itu bisa disebut sebagai sampel normatif atau standarisasi. Mendapat norma adalah aspek sentral dalam proses standarisasi tes yang merujuk kepada norma. Norma adalah penyebaran skor-skor dari suatu kelompok yang digunakan sebagai patokan untuk memberi makna pada skor-skor individu. Terdapat dua jenis norma, yaitu:1. Norma

perkembangan; digunakan dibagi menjadi mental age,

untuk basal

menginterpretasikan skor-skor pada tes-tes perkembangan. Norma perkembangan age, nilai rata-rata yang diperoleh kelompok umur tertentu, skala ordinal, criterion referenced testing, expectancy tables.2. Norma kelompok (within-group norms); digunakan untuk

mengetahui posisi subjek dalam distribusi sample normative. Sample normative adalah skor subjek dibandingkan dengan skor kelompok. Saat peneliti hendak menggambarkan posisi individu dengan cara membandingkan antar kemampuan dan kelompok, raw score harus ditransformasikan ke dalam skala yang sama. Macam-macam skala: percentile rank Persentil merupakan nilai yang memisahkan setiap 1 persen pada distribusi kelompok. Skor-skor persentil memiliki beberapa keuntungan, yakni mudah dihitung dan mudah dipahami, bahkan oleh orang33

yang tak terlatih secara teknis. Lagu pula, persentil bias diterapkan secara universal. Persentil dapat digunakan dengan sama baiknya pada oeang dewasa ataupun anak-anak, dan cocok untuk jebis tes mana oun, entah mengukur bakat ataupun bariabel-variabel kepribadian. Rumus Persentil : 1 / 100 N cf b P = Bb + 1 fd i

Keterangan : Pi = Persentil Bb = batas bawah interval yang mengandung N = jumlah frekuensi distribusic fb

persentil pertama

= frekuensi komulatif dibawah interval yang = frekuensi dalam interval yang

mengandung persentil.fd

mengandung persentil pertama.

i = lebar interval. standard score, yang dibagi menjadi: z-score, t-

scale, c-scale, stanine, dan deviation IQ. Norma dan diperlukan mengetahui dalam dimana pengukuran seseorang psikologi, terhadap

karena Penggunaan acuan norma dilakukan untuk menyeleksi posisi kelompoknya. Misalnya jika seseorang mengikuti tes tertentu, maka hasil tes akan memberikan gambaran dimana posisinya jika dibandingkan dengan orang lain yang mengikuti tes tersebut. Adapun acuan kriteria dipergunakan untuk menentukan kelulusan seseorang dengan membandingkan hasil

34

yang dicapai dengan kriteria yang telah ditetapkan terlebih dahulu. Acuan ini biasanya digunakan untuk menentukan kelulusan seseorang. Seseorang yang dikatakan telah lulus berarti bisa melakukan apa yang terdapat dalam kriteria yang telah ditetapkan dan sebaliknya. Acuan kriteria, ini biasanya dipergunakan untuk ujian-ujian praktek. Dengan adanya acuan norma atau kriteria, hasil yang sama yang didapat dari pengukuran ataupun penilaian akan dapat diinterpretasikan berbeda sesuai dengan acuan yang digunakan.

2.5.4 Macam-macam norma: Terdapat dua macam norma. Pendekatan penilaian yang

membandingkan hasil pengukuran seseorang dengan hasil pengukuran yang diperoleh orang orang lain dalam kelompoknya, dinamakan Penilaian Acuan Norma (Norm Refeereced Evaluation). Dan pendekatan penilaian yang menbanding hasil pengukuran seseorang dengan patokan batas lulus yang telah ditetapkan, dinamakan penilaian Acuan Patokan (Criterian refenced Evaluation). a. Penilaian Acuan Norma (PAN) PAN ialah penilaian yang membandingkan hasil nilai suatu tes terhadap hasil dalam kelompoknya. Pendekatan penilaian ini dapat dikatakan sebagai pendekatan apa adanya dalam arti, bahwa patokan pembanding sematamata diambil dari kenyataan kenyataan yang diperoleh pada saat pengukuran/penilaian itu berlangsung, yaitu hasil tes yang diukur itu beserta pengolahannya, penilaian ataupun patokan yang terletak diluar hasilhasil pengukuran kelompok manusia. PAN pada dasarnya mempergunakan kurve normal dan hasil hasil perhitungannya sebagai dasar penilaiannya. Kurve ini dibentuk dengan mengikut sertakan semua angka hasil pengukuran yang35

diperoleh. Dua kenyataan yang ada didalam kurve Normal yang dipakai untuk membandingkan atau menafsirkan angka yang diperoleh ialah angka rata- rata (mean) dan angka simpanan baku (standard deviation), patokan ini bersifat relatif dapat bergeser ke atas atau kebawah sesuai dengan besarnya dua kenyataan yang diperoleh didalam kurve itu. Dengan kata ain, patokan itu dapat berubahubah dari kurve normal yang satu ke kurve normal yang lain. Jika hasil ujian mahasiswa dalam satu kelompok pada umumnya lebih baik dan menghasilkan angka rata-rata yang lebih tinggi, maka patokan menjadi bergeser ke atas (dinaikkan). Sebaliknya jika hasil ujian kelompok itu pada umumnya merosot, patokannya bergeser kebawah (diturunkan). Dengan demikian, angka yang sama pada dua kurve yang berbeda akan mempunyai arti berbeda. Demikian juga, nilai yang sama dihasilkan melalui bangunan dua kurve yang berbeda akan mempunyai arti berbeda. Demikian juga, nilai yang sama dihasilkan melalui bangunan dua kurve yang berbeda akan mempunyai arti umum yang berbeda pula. b. Penilaian Acuan Patokan (PAP) PAP pada dasarnya berarti penilain yang membandingkan hasil suatu tes terhadap suatu patokan yang telah ditetapkan sebelumnya. Pengertian ini menunjukkan bahwa sebelum usaha penilaian dilakukan terlebih dahulu harus ditetapkan patokan yang akan dipakai untuk membandingkan angka-angka hasil pengukuran agar hasil itu mempunyai arti tertentu. Dengan demikian patokan ini tidak dicari-cari di tempat lain dan pula tidak dicari di dalam sekelompok hasil pengukuran sebagaimana dilakukan pada PAN. Dalam konteks pendidikan, patokan yang telah disepakati terlebih dahulu itu biasanya disebut Tingkat Penguasaan Minimum. Hasil tes yang dapat mencapai atau bahkan melampai batas ini dinilai lulus dan belum mencapainya nilai tidak lulus mereka yang lulus ini36

diperkenankan menempuh tingkat yang lebih tinggi, sedangkan yang belum lulus diminta memantapkan lagi kegiatan belajarnya sehingga mencapai batas lulus itu. Dengan patokan yang sama ini pengertian yang sama untuk hasil pengukuran yang diperoleh dari waktu ke waktu oleh kelompok yang sama ataupun berbeda-beda dapat dipertahankan. Yang menjadi hambatan dalam penggunaan PAP adalah sukarnya menetapkan patokan yang benar-benar tuntas. 1. Norma Tes a. Criterion Reference Test (CRT) Tujuan dengan penggunaan didasarkan tes acuan kriteria patokan atau berfokus pada kelompok perilaku siswa yang khusus. Joesmani menyebutnya pada standard khusus. Dimaksudkan untuk mendapat gambaran yang jelas tentang performan peserta tes dengan tanpa memperhatikan bagaimana performan tersebut dibandingkan dengan performan yang lain. Dengan kata lain tes acuan kriteria digunakan untuk menyeleksi (secara pasti) status individual berkenaan dengan (mengenai) domain perilaku yang ditetapkan / dirumuskan dengan baik. Pada pendekatan acuan patokan, standar performan yang digunakan adalah standar absolut. Semiawan menyebutnya sebagai standar mutu yang mutlak. Criterion-referenced interpretation is an absolut rather than relative interpetation, referenced to a defined body of learner behaviors. Dalam standar ini penentuan tingkatan (grade) didasarkan pada sekor-sekor yang telah ditetapkan sebelumnya dalam bentuk persentase. Untuk mendapatkan nilai A atau B, seorang siswa harus mendapatkan sekor tertentu sesuai dengan batas yang telah ditetapkan tanpa terpengaruh oleh performan (sekor) yang diperoleh siswa lain dalam kelasnya. Salah satu kelemahan dalam menggunakan standar absolut adalah sekor siswa bergantung pada tingkat kesulitan tes yang mereka terima.37

Artinya apabila tes yang diterima siswa mudah akan sangat mungkin para siswa mendapatkan nilai A atau B, dan sebaliknya apabila tes tersebut terlalu sulit untuk diselesaikan, maka kemungkinan untuk mendapat nilai A atau B menjadi sangat kecil. Namun kelemahan ini dapat diatasi dengan memperhatikan secara ketat tujuan yang akan diukur tingkat pencapaiannya. Dalam menginterpretasi skor mentah menjadi nilai dengan menggunakan ditentukan pendekatan kriteria PAP, nilai maka yang terlebih batas-batas digunakan dahulu nilai dalam kriteria kelulusan dengan

kelulusan. Umumnya

bentuk rentang skor berikut : Rentang Skor Nilai : 80% s.d. 100% A 70% s.d. 79% B 60% s.d. 69% C 45% s.d. 59% D b. Norm Reference Test (NRT) Tujuan penggunaan tes acuan norma biasanya lebih umum dan komprehensif dan meliputi suatu bidang isi dan tugas belajar yang besar. Tes acuan norma dimaksudkan untuk mengetahui status peserta tes dalam hubungannya dengan performans kelompok peserta yang lain yang telah mengikuti tes. Tes acuan kriteria Perbedaan lain yang mendasar antara pendekatan acuan norma dan pendekatan acuan patokan adalah pada standar performan yang digunakan. Pada pendekatan acuan norma standar performan yang digunakan bersifat relatif. Artinya tingkat performan seorang siswa ditetapkan berdasarkan pada posisi relatif dalam kelompoknya; Tinggi rendahnya performan seorang siswa sangat bergantung pada kondisi performan kelompoknya. Dengan kata38

lain standar pengukuran yang digunakan ialah norma kelompok. Salah satu keuntungan sekor dari standar siswa relatif ini adalah tanpa penempatan (performan) dilakukan

memandang kesulitan suatu tes secara teliti. Kekurangan dari penggunaan standar relatif diantaranya adalah (1) dianggap tidak adil, karena bagi mereka yang berada di kelas yang memiliki sekor yang tinggi, harus berusaha mendapatkan sekor yang lebih tinggi untuk mendapatkan nilai A atau B. Situasi seperti ini menjadi baik bagi motivasi beberapa siswa. (2) standar relatif membuat terjadinya persaingan yang kurang sehat diantara para siswa, karena pada saat seorang atau sekelompok siswa mendapat nilai A akan mengurangi kesempatan pada yang lain untuk mendapatkannya. Tujuan penggunaan tes acuan norma biasanya lebih umum dan komprehensif dan meliputi suatu bidang isi dan tugas belajar yang besar. Tes acuan norma dimaksudkan untuk mengetahui status peserta tes dalam hubungannya dengan performans kelompok peserta yang lain yang telah mengikuti tes. Tes acuan kriteria Perbedaan lain yang mendasar antara pendekatan acuan norma dan pendekatan acuan patokan adalah pada standar performan yang digunakan. Pada pendekatan acuan norma standar performan yang digunakan bersifat relatif. Artinya tingkat performan seorang siswa ditetapkan berdasarkan pada posisi relatif dalam kelompoknya; Tinggi rendahnya performan seorang siswa sangat bergantung pada kondisi performan kelompoknya. Dengan kata lain standar pengukuran yang digunakan ialah norma kelompok. Salah satu keuntungan dari standar relatif ini adalah penempatan sekor (performan) siswa dilakukan tanpa memandang kesulitan suatu tes secara teliti. Kekurangan dari penggunaan standar relatif diantaranya adalah (1) dianggap tidak adil, karena bagi mereka yang berada di kelas yang memiliki sekor yang tinggi, harus berusaha mendapatkan sekor yang lebih tinggi untuk mendapatkan nilai A atau B. Situasi39

seperti ini menjadi baik bagi motivasi beberapa siswa. (2) standar relatif membuat terjadinya persaingan yang kurang sehat diantara para siswa, karena pada saat seorang atau sekelompok siswa mendapat nilai A akan mengurangi kesempatan pada yang lain untuk mendapatkannya. Contoh: Satu kelompok peserta tes terdiri dari 9 orang mendapat skor mentah: 50, 45, 45, 40, 40, 40, 35, 35, 30 Dengan menggunakan pendekatan PAN, maka peserta tes yang mendapat skor tertinggi (50) akan mendapat nilai tertinggi, misalnya 10, sedangkan mereka yang mendapat skor di bawahnya akan mendapat nilai secara proporsional, yaitu 9, 9, 8, 8, 8, 7, 7, 6 Penentuan nilai dengan skor di atas dapat juga dihitung terlebih dahulu persentase jawaban benar. Kemudian kepada persentase tertinggi diberikan nilai tertinggi.2. Kriteria performansi. Ketika hubungan antar item atau aspek-aspek tes

dan standar performansi bisa ditampilkan dan didefinisikan dengan baik, skor tes bisa dievaluasi melalui interpretasi yang merujuk kepada kriteria (criterion-referenced interpretation). Jenis interpretasi ini menggunakan prosedur, seperti sampling dari domain isi atau perilaku yang didesain untuk menilai apakah dan sejauhmana level penguasaan atau kriteria performansi yang dinginkan bisa dicapai.

Tes ini menggunakan norma dalam kelompok. Ada beberapa cara yang digunakan untuk mengetahui norma dalam kelompok yaitu Percentile, Standard Scores, dan Normalized Standard Score. Norma tes 40 inimenggunakan Percentile.

DAFTAR PUSTAKA

41

Afiatin, T. Belajar Pengalaman Untuk Meningkatkan Memori. Anima, Indonesian Psychological Journal. 2001. Vol. 17. No. 1. 26-35. Atkinson, R , Richard, A, Hilgard, E .2000. Pengantar Psikologi. Jilid 1, Edisi 8. Penerjemah: Agus, D, Michael, A. Jakarta : Penerbit Erlangga. Anastasi, A dan Susana Urbina. (2007). Psychological testing : Tes Psikologi. PT. Indeks : Jakarta. Chaplin, J. P. 2005. Kamus Lengkap Psikologi, Edisi 1, Cetakan 10. Jakarta: PT RajaGrafindo Persada. Ismoyo, Dina A.W. 2006. Pengaruh Musik Instrumental Terhadap Memory Jangka Pendek. Skripsi. (Tidak Diterbitkan). Matlin, M. W. 1998. Cognition. Fourth Edition. Florida : Harcourt Brase & Company. Saifuddin Azwar. (2003). Tes prestasi: fungsi dan pengembangan pengukuran prestasi belajar. Yogyakarta: Pustaka Pelajar. Sumadi Suryabrata. 2004. Pengembangan alat ukur psikologi. Yogyakarta: Penerbit Andi. http://nindyaajja.blogspot.com/2010/11/norma-dalam-psikometri.html (Di Download pada 5 Desember 2010). http://file.upi.edu/Direktor (Key term : Analisis Butir Soal). (Di Download pada 5 Desember 2010). http://www.masbow.com/2009/11/recall-memory-dalam-psikologi.html

42