Penilaian dalam musik

Penilaian dalam musik: bendera Merah di matahari terbenam

Pembaca perlu tahu bahwa aku tidak bisa mengingat pertemuan tes aku tidak

suka. Tentu saja, ada yang lebih baik dan lebih miskin instrumen penilaian, tapi

semua tes memiliki nilai untuk mengajar dan belajar. Jika seseorang dapat menjadi

"testaholic," maka saya salah. Cintaku pada perangkat penilaian telah berkembang

selama bertahun-tahun, dan ini terutama kuat pada saat ini, karena saya melihat siswa

yang tidak menerima umpan balik yang konstruktif segera gagal. (Konstruktif adalah

kata penting di sini; siswa musik apa menerima beralasan, pujian kelompok

ditangguhkan) Saya sering tersinggung oleh FairTest, sebuah organisasi pengawas

dengan niat baik tentang penilaian sekolah, yang sering menyerang tes dan program

pengujian yang kekurangan adalah karena keterbatasan dalam. waktu dan uang,

faktor-faktor di luar kendali mereka penyelenggara tes.

Nasional tahun 1997 Kemajuan Penilaian Pendidikan (NAEP) kajian musik

adalah yang ketiga dari jenisnya. The NAEP pertama di musik, yang diberikan dalam

1971-1972 (selanjutnya disebut sebagai tes 1971), adalah tes yang baik yang dapat

dijadikan sebagai dasar untuk perbandingan (penelitian semua harus memiliki garis

dasar). Tahun 1971 NAEP meminta siswa untuk menyanyikan sendiri; bernyanyi

dengan orang lain; instrumen bermain, berimprovisasi melodically, berirama, dan

harmonik; bernyanyi pada pandangan; bermain pada pandangan, dan melakukan solo

siap-semua karena mereka telah tepat, bukan karena beberapa tugas-tugas sesuai

agenda sudah ada sebelumnya. Hanya sedikit dari 150 item musik dikembangkan

untuk tes 1971 adalah dari berbagai-kertas tradisional dan - pensil (NAEP 1974, 1).

Telah banyak belajar tentang penilaian sejak saat itu, dan jadi saya bersemangat

diantisipasi NAEP tahun 1997. Pada "hari rilis," 10 November 1998, saya menonton

berita malam, tetapi tidak menyebutkan melihat hasil tes. The New York Times

mengambil news release Departemen Pendidikan, yang hanya disebutkan persentase

sekolah yang menawarkan musik, seni visual, tari, dan teater di Amerika Serikat.

Tidak ada laporan tentang kompetensi siswa, tidak ada untuk menangkap kepentingan

publik Amerika. Kami tidak membutuhkan penilaian nasional untuk

menginformasikan kepada kami bahwa 81 persen sekolah menengah Amerika yang

ditawarkan musik setidaknya sekali seminggu dan bahwa musik ditawarkan di 91

persen sekolah menengah (NCES 1998, 146) .1 Pendidikan Seni Pusat Penelitian

Urbana, Illinois, serta Dinas Pendidikan, memberikan data tersebut beberapa tahun

yang lalu (Leonhard 1991, 48; Carey et. al 1995, 4) 0,2

The NAEP 1997 Seni Report Card, yang sebagian dokumen hasil penilaian,

tidak menunjukkan sejauh mana musik yang diperlukan dan / atau pilihan di sekolah-

sekolah menengah dan SMP, bagaimana peluang atau persyaratan mungkin berbeda di

K-8 konfigurasi, apa pengalaman musikal memenuhi semua persyaratan yang ada,

atau apa persen sekolah bertemu Music Educators National Conference (MENC)

kesempatan-untuk-belajar standar periode 45minute, setiap hari (MENC 1995, 18).

Masalah yang lebih besar, bagaimanapun, adalah bertentangan seluruh data Seni

Report Card. Satu tabel menunjukkan bahwa 2 persen dari sekolah tidak mengajarkan

musik, sementara negara lain 7 persen (153, 157). Yang penting adalah bukan jumlah

instruksi musik yang ditawarkan (musik yang diajarkan di hampir setiap sekolah di

Amerika Serikat) tetapi kualitas instruksi itu. Ketika persentase tersebut mencerna,

pembaca Seni Laporan Kartu hati-hati harus membedakan antara apakah data

mengacu pada sekolah-sekolah atau siswa, tetapi bahkan perbedaan ini tidak akan

menghapus beberapa kontradiksi. Kontradiksi yang saya percaya sangat penting

dalam menginterpretasikan laporan ini adalah bahwa, menurut mahasiswa, antara 34

dan 40 persen dari mereka yang dinilai tidak terdaftar dalam musik (38-39), tapi para

pelaku melaporkan pendaftaran 91 persen (146).

Aku menerima kenyataan bahwa penilaian seni dan pendidikan seni tidak item

prioritas tinggi di Amerika Serikat dan tidak membuat berita utama. Sebuah instrumen

penilaian yang baik, namun dibangun di atas tahun 1971 dan 1978 NAEP baik

instrumen, bisa menjadi model bagi para guru individu maupun bagi sekolah

kabupaten dan negara, dan dengan demikian akan berita. pemeriksaan dekat saya Seni

Laporan Kartu membuat saya percaya bahwa pendidik musik akan sangat kecewa

dengan hasil pengujian, yang meskipun cukup positif tak terduga yang tidak rata.

Advance publisitas telah memimpin kita untuk percaya bahwa tujuan dari penilaian

seni ini adalah sama dengan tujuan semua tes NAEP: untuk menentukan kompetensi

musik siswa di kelas empat, delapan, dan dua belas. Karena masalah anggaran,

evaluasi menyeluruh terhadap hanya kelas delapan mungkin (Ringkasan Eksekutif, ii,

186); tes pilot hanya yang diberikan kepada siswa kelas empat dan dua belas.

Penilaian berikutnya dijadwalkan untuk tahun 2007. Penilaian ini juga didukung

sebesar 1,2 juta dolar dari National Endowment for Seni (Nea) dan Lembaga

Pendidikan Getty Seni untuk memastikan perencanaan yang memadai dan penilaian

(NAGB 1998).

Tes berlaku dinilai terutama dengan tujuan, bukan oleh kualitas setiap item.

Suatu pemeriksaan yang seksama terhadap musik tahun 1997 item penilaian tes

menunjukkan kepada saya bahwa tujuannya tidak untuk menilai apa yang siswa tahu

dan bisa dilakukan, tetapi untuk menentukan sejauh mana standar nasional pendidikan

sukarela dalam seni musik telah dilaksanakan dan untuk mempromosikan

pembelajaran yang dipilih tujuan. (Mereka yang "tersembunyi" tujuan juga tidak

tercapai karena hasil NAEP sangat dipengaruhi oleh out-of - pengalaman sekolah.

Saya menggunakan "istilah yang dipilih," karena tidak semua tujuan dalam standar

nasional sukarela telah memadai dan karena dinilai penilaian ini berbeda dari

pemeriksaan NAEP lain di sebagian besar tujuan program musik ini tidak termasuk.)

Ada beberapa kesulitan dengan hubungan antara standar nasional dan penilaian

nasional. Pada bulan November 1998, Charles Leonhard dikutip mengatakan bahwa

penilaian seharusnya berdasarkan pada tujuan utama dari seni, "untuk

mengembangkan bakat dan kasih untuk seni," bukan pada standar nasional sukarela

(Manzo 1998, 9) . Leonhard benar percaya bahwa disayangkan bahwa, meskipun

usaha keras MENC untuk memusatkan perhatian pada standar, mereka tidak menjadi

sasaran perdebatan nasional yang kuat dengan prioritas yang musisi dan guru dapat

menerima. kerangka Negara tidak mencerminkan tujuan nasional, dan beberapa

perguruan tinggi mengakui standar dalam kurikulum pendidikan guru, tetapi prioritas

belum ditetapkan, dan program musik yang sehat, terutama yang mana kinerja adalah

penting, tidak dianggap menangani semua sembilan standar. Saat ini tidak ada

perjanjian untuk tingkat kompetensi yang diharapkan semua siswa, tetapi penting

bahwa kinerja dan kesempatan - untuk-belajar standar menyertai suatu standar isi.

kesempatan MENC's-tolearn dan kinerja standar itu tampaknya tidak dipertimbangkan

dalam membangun item atau dalam menafsirkan data penilaian musik (MENC 1995;

MENC 1996).

Deborah Haimo (1998, 48) menyatakan sentimen serupa dengan Charles

Leonhard ketika ia berpendapat bahwa dalam upaya untuk mencapai setiap

mahasiswa, esensi dari subjek yang hilang dan bahwa standar biasanya kurang

keringkasan dan panjang, jelas, dan terbuka untuk keliru dan salah tafsir. Diane

Ravitch (1995, 5) tegas menyatakan bahwa tujuan memiliki standar adalah sinyal

kepada para siswa dan guru jenis prestasi yang mungkin dengan kerja keras.

Pandangan sekilas kasual pada pertanyaan NAEP dirilis sudah cukup untuk

menunjukkan kepada pembaca (atau mahasiswa) bahwa banyak tujuan diuji dapat

dengan mudah dicapai tanpa instruksi formal. Siswa kekurangan suatu tugas tidak

indikator bahwa tugas yang sesuai sebagai standar kelas delapan atau tes item.

Data teknis dan semua item tes belum dirilis pada saat tenggat waktu untuk

jurnal ini, jadi saya terpaksa fokus pada keterbatasan tes sebagai indikator penilaian

nasional berdasarkan data dalam Seni Report Card. Ujian ini mencakup item yang

ditulis dengan baik, baik yang sesuai dan cocok untuk kelas delapan. Perhatian perlu

dilakukan, Namun, dalam membuat koneksi antara keterampilan dinilai dan instruksi

musik di sekolah-sekolah. Ada indikator yang menunjukkan bahwa penilaian itu tidak

menyeluruh sebagai salah satu akan menyukai. Seni Laporan Kartu menunjukkan

kecerobohan yang cukup besar dalam rancangan, administrasi, dan pelaporan. Ruang

tidak mengijinkan saya untuk memberikan contoh yang memadai dalam soal tes,

sampling matriks, dan individu teori respon (IRT), tapi saya berkaitan dengan

pemesanan masing-masing. Para pemimpin profesi perlu tahu sejauh mana hasil

penilaian NAEP dapat digunakan untuk mendukung atau memandu perubahan

kurikuler atau penilaian dalam musik mengajar dan belajar.

Sebuah artikel halaman depan 18 November 1998 Pendidikan Minggu,

berjudul "NAEP Paints Miskin Picture of Arts Savvy," menggambarkan kompetensi

siswa musik negatif dan berakhir dengan pernyataan anggota Kongres Jay Dickey

bahwa "] w [e perlu melakukan investasi yang dasar pertama, dan mereka membantu

anak-anak membaca dan menulis "(Manzo 1998). Para anggota Kongres, seperti

banyak orang lain, menawarkan simpati tapi tidak mendukung. Hasil penilaian musik

yang positif-jauh lebih baik daripada hasil dalam studi sosial, misalnya, di mana

hanya 2 persen dari siswa bisa nama keadilan ketua Mahkamah Agung dan lebih tahu

bahwa Leonardo DiCaprio merupakan bintang Titanic dari tahu nama presiden-wakil

dari Amerika Serikat. Jauh lebih siswa mengidentifikasi rumah Beavis and Butthead

(Springfield) dari rumah Abraham Lincoln (Springfield, Illinois) (Pusat Konstitusi

Nasional 1998). Hasil tes tentang pengetahuan siswa tentang geografi dan sejarah

telah lebih mengatakan dari hasil penilaian pengetahuan musik dan kinerja.

Deborah Haimo (1998, 64) menunjukkan bahwa "membenarkan standar memerlukan

lebih daripada deskripsi bersinar dari mereka yang secara langsung terlibat dalam

penciptaan mereka." Itu adalah sisi bawah untuk memiliki individu yang sama

membuat kedua kerangka dan tes berisiko tinggi. Selanjutnya, para penulis NAEP

1997 Seni Report Card tidak konsisten dalam alasan mereka, berusaha untuk memiliki

yang terbaik dari dua dunia, seperti filsuf eklektik. Meskipun mereka tidak diuji,

keterampilan extramusical ditekankan lebih dari keterampilan musik ekspresif dalam

laporan.

Seni Laporan Kartu menyebutkan studi Rauscher, yang dilakukan di

University of California di Irvine, dengan Gordon Shaw, pada kesadaran temporal-

spasial ditingkatkan. Hal ini juga menyebutkan perbaikan verbal dan nilai matematika

di SAT, indikator keberhasilan perguruan tinggi. (Ada putuskan antara hasil tes yang

menekankan keterampilan komposisi dan klaim atas nilai SAT tinggi yang dihasilkan

dari empat tahun pengalaman kinerja di sekolah tinggi) Satu juga bertanya-tanya

seberapa baik komposisi dinilai ketika siswa tidak bisa membaca musik tidak ingat.

melodi mereka sendiri. Mungkin tanggung jawab pendidikan seni, keterampilan yang

telah diidentifikasi oleh Sekretaris Komisi untuk Mencapai Diperlukan Keterampilan

(SCANS) menjadi penting bagi dunia kerja, juga disebutkan. The Arts NAEP 1997

Laporan Kartu, setidaknya sebagian, dokumen advokasi untuk pendidikan seni,

mengkonfirmasikan pendekatan yang diambil oleh Menteri Pendidikan Richard Riley

ketika ia merilis dokumen dan komentar dalam presentasi 1 Desember interaktif

tentang hasil penilaian seni. Untuk Sekretaris Riley tujuan penting dari musik adalah

nonmusical: untuk belajar memecahkan masalah, berpikir kreatif, dan

mengembangkan disiplin mental.

Seni Report Card penulis menyatakan bahwa penilaian seni NAEP 1997

dirancang dalam hubungannya dengan Standar Nasional sukarela yang baru

dikembangkan untuk Seni Pendidikan (11). Beberapa standar konten digunakan,

namun kinerja MENC's standar yang sepenuhnya diabaikan. Standar isi telah diterima

dengan baik dan kurang kontroversial daripada kinerja dan kesempatan-tolearn

standar. Standar kinerja yang diterbitkan membedakan antara semua siswa dan

mahasiswa yang berpartisipasi dalam ansambel paduan suara atau instrumental.

Standar kinerja yang menyarankan bahwa mulai tahun lima kelas, mahasiswa mahir

dapat mempertahankan bagian-nya dalam sebuah lagu tiga bagian dengan tingkat

kesulitan grade 2 (MENC 1996, 64). Salah satu tugas NAEP dalam musik meminta

siswa untuk melihat-membaca "Amerika," lagu kebanyakan pelajar sudah tahu

dengan telinga. Prestasi dalam tugas seperti itu hampir tidak setara dengan standar

kinerja yang bernyanyi untuk grade 5-8 yang menyarankan bahwa siswa memiliki

kemampuan menyanyi dan musik dua-tiga-bagian dan akrab dengan luas repertoar

lagu. Standar yang digunakan dalam tahun 1997 untuk siswa kelas delapan NAEP

paling dekat menyamai standar kinerja MENC itu untuk tingkat 4-K (MENC 1996,

29).

Sangat menarik untuk melihat bahwa NAEP 1997 Seni Report Card berisi

agenda yang jelas untuk mempromosikan metode khusus penilaian; tidak ada

argumen yang mendasari seperti itu merupakan bagian dari laporan pada tahun 1971

dan 1978 penilaian. Tidak ada yang salah dengan salah satu metode yang digunakan

pada tahun 1997, hanya dilema yang mereka bawa ke atas. Seni Kartu Laporan

menyatakan bahwa "Menciptakan, Pertunjukan, dan Merespon semua ditekankan,

walaupun pendidik musik memiliki penekanan yang lebih besar biasanya ditempatkan

pada kinerja pekerjaan yang ada dan tanggapan siswa terhadap kinerja" (penekanan

ditambahkan) (3). Tes penulis di sini mengakui pengujian apa yang umumnya tidak

diajarkan, namun mereka mengklaim itu adalah "asli." Mereka bertentangan sendiri

ketika mereka mengutip Grant Wiggins definisi tentang "penilaian otentik" sebagai

"latihan [yang] lebih erat yang mencerminkan pengalaman siswa ketika mereka

belajar dan terlibat dalam kegiatan kelas" (10).

Sejarah NAEP di Musik

Jelas, tujuan tahun 1997 NAEP adalah berbeda dari tahun 1971 dan 1978

penilaian. Adegan pendidikan pada tahun 1997 diakui berbeda dari yang tahun 1971,

walaupun masih ada kesamaan lebih dari perbedaan. Pendidikan merupakan prioritas

tinggi pada tahun 1971, dan modernisasi kurikulum adalah prioritas tertinggi. Federal

dolar mengalir ke proyek-proyek kurikulum, dan kesuksesan mereka adalah prioritas

nasional. Gerakan penilaian nasional karena itu dirancang untuk membantu

pengembang kurikulum dengan jelas pelaporan Amerika apa yang pada usia empat

puluh sembilan tingkat, tiga belas, tujuh belas, dan dewasa muda tahu dan bisa

lakukan. Perbedaan utama antara 1971 dan hari ini adalah politisasi dari kehidupan di

Amerika, termasuk pendidikan. Hari ini, advokasi, politik, dan kebijakan utama

intrusi ke dalam keputusan pendidikan.

Laporan penilaian 1971 musik terutama menarik bahwa terasa bebas dari

agenda politik. Tidak ada upaya untuk menghubungkan penilaian terhadap

pengalaman sekolah, siswa tidak ditanya tentang instruksi musik sekolah mereka

tetapi hanya pertanyaan-pertanyaan umum seperti (Apakah Anda memainkan alat

musik?) Sebagaimana yang diperlukan untuk memilih mana individu-individu yang

harus mengambil bagian dari tes. Laporan akhir adalah dokumen objektif yang

diberikan persentase langsung pada kompetensi dan keterampilan yang diajarkan

secara luas di sekolah-sekolah dan diterima sebagai penting oleh masyarakat. Tujuan

rinci tes didistribusikan secara luas di publikasi, kecil terpisah; mereka mengikuti

praktek profesional yang berlaku saat itu.

Dalam skala penilaian turun 1978 (itu tidak termasuk penilaian kinerja) usaha

kecil hanya dibuat untuk berhubungan dengan hasil tes pada kurikulum sekolah. Data

menunjukkan bahwa 28 persen dari peserta ujian tidak punya instruksi musik, 48

persen tidak berpartisipasi dalam paduan suara, dan 50 persen tidak berpartisipasi

dalam band (NAEP 1981, 37). Situasi musik mungkin telah membaik sejak saat itu.

1991 Leonhard laporan mengindikasikan musik yang dibutuhkan dalam sekitar 30

persen sekolah menengah (48, 73). Kartu 1.997 laporan menunjukkan bahwa 91

persen dari siswa kelas delapan Amerika menerima beberapa instruksi musik dan

bahwa 43 persen menerima instruksi tiga sampai empat kali seminggu (146). Ini

adalah hanya salah satu tokoh dalam Seni Report Card yang saya pertanyaan.

Tidak adanya penilaian musik selama sembilan belas tahun 1997 membuat penilaian

politik penting. subyek Core, seperti sains dan matematika, secara teratur dinilai. Oleh

karena itu, keputusan untuk menerangkan isi dari instruksi sekolah musik melalui

penilaian nasional bobot politik. Tes itu secara longgar didasarkan pada sembilan

standar nasional untuk musik. Semua standar adalah untuk semua siswa. Berdasarkan

deskripsi isi penilaian 1997 musik (12), saya telah memastikan bahwa standar konten

yang dipilih untuk pengujian ini adalah standar 3 (improvisasi), standar 4 (menulis),

standar 6 (mendengarkan dan menganalisis musik), dan standar 7 (mengevaluasi

pertunjukan musik). Terbatas perhatian diberikan untuk menilai 5 standar isi (notasi

musik) dan tidak ada terhadap kinerja individu semua siswa. (Menilai efektifitas

sekolah dalam musik merupakan tugas yang rumit, karena siswa dapat belajar musik

di luar sekolah, mendengarkan musik selama berjam-jam setiap hari, dan mengajar

diri sendiri untuk bermain instrumen) Ada kesenjangan memutuskan antara

interpretasi saya dari standar nasional dan itu. dari mereka yang membangun NAEP.

Misalnya, karena bernyanyi dan bermain alat musik adalah dua standar pertama dan

merupakan inti dari instruksi musik di sekolah umum, orang akan diharapkan tahun

1997 NAEP untuk memiliki lebih autentik menilai kemampuan setiap siswa untuk

menyanyi dan memainkan melodi dan instrumen harmonis.

Bendera Merah

Karena, pada batas waktu untuk jurnal ini, data teknis belum dirilis, data dari

studi pilot belum dirilis, CD-ROM tidak tersedia secara umum, dan hanya pilih

sampel pertanyaan dan hasil yang tersedia dalam Seni Report Card, membuat

komentar tentang tes ini untung-untungan. (Seni Report Card adalah dokumen

penilaian yang tidak biasa di selektivitas pengungkapan-nya) Berdasarkan data yang

tidak lengkap., Analisis saya mungkin salah. Untuk siapa pun akrab dengan angka,

tetapi, ada banyak bendera merah untuk sinyal keraguan untuk kegunaan umum data

untuk kurikulum atau penilaian. Salah satu isu yang menjadi perhatian adalah apakah

uang itu benar-benar cukup untuk administrasi yang komprehensif dari penilaian di

tingkat kelas satu yang dipilih, sebagai penulis laporan menyatakan. Ada sejumlah

kekhawatiran lainnya.

Jenis Pertanyaan

Penilaian ini mencakup 21 pertanyaan pilihan ganda, yang terdiri hanya sekitar

5 persen dari waktu pengujian. Seni Kartu Laporan berisi hasil untuk lima orang. Pada

pertanyaan-pertanyaan siswa yang "sangat sukses," mencetak persentase yang benar

dari 66, 79, 55, 52, dan 42-optimum untuk tes yang dirancang untuk melakukan

diskriminasi. Menentukan meter dari sebuah lagu ("Wade in the Water") adalah

pertanyaan yang paling banyak-pilihan yang sulit bagi siswa kelas delapan, meskipun

ini adalah tugas yang sering digunakan dengan siswa kelas empat. Multiple - soal

pilihan yang tidak baik atau buruk keputusan pada jenis pertanyaan yang dibuat pada

apa yang ingin mengetahui dalam anggaran dan kendala waktu.

Test Desain

Para desainer uji memutuskan bahwa musik menggunakan 40 persen dari

tradisi Barat, (Renaisans melalui periode kontemporer); blues 35 persen, Injil, jazz,

negara, dan musik teater, dan 25 persen dari luar tradisi Barat itu sesuai dengan

"otentik penilaian "seperti yang didefinisikan oleh Wiggins. Meskipun persentase

sekolah data tertentu di dalam - yang kurang, ada alasan untuk meragukan bahwa 60

persen materi pembelajaran terletak di luar Renaissance ke masa kontemporer dan

terutama bahwa 25 persen berasal dari luar tradisi Barat.

Kesempatan untuk Belajar

Seni Report Card memberikan perhatian kepada konteks pendidikan siswa

untuk meyakinkan pembaca bahwa penilaian yang tepat telah dilakukan. Item

kontekstual penting yang seharusnya ditanyakan adalah apakah ini adalah pertama

kalinya mahasiswa yang pernah mengambil ujian musik. Saya akan berharap bahwa

siswa yang tidak pernah dinilai dalam musik menemukan penilaian pengalaman baru.

Pada tahun 1997, tampaknya ada upaya untuk menghubungkan kesempatan untuk

belajar hasil penilaian. Informasi dikumpulkan tentang jumlah instruksi kali seminggu

ditawarkan, apakah kurikulum yang diterbitkan ada, apakah sekolah menggunakan

mengunjungi seniman, jika sekolah mensponsori artis-dalam program-theschools,

situasi kerja dan pelatihan instruktur musik utama, apakah mahasiswa telah

menghadiri konser, dan bahkan fasilitas fisik untuk kamar mengajar musik, kehadiran

panggung, musik diajarkan di panggung atau di ruang kelas. Namun, banyak

pertanyaan yang tidak mencerminkan pengalaman sekolah tetap dianalisis dalam hal

kesempatan untuk belajar. Valid kesimpulan tentang hasil instruksi musik di sekolah

tidak dapat berasal dari data yang termasuk siswa yang memiliki instruksi musik

pribadi. Siswa dalam musik ensemble juga harus diperlakukan secara terpisah. Messy

data membuat interpretasi sulit atau bahkan tidak mungkin. Pernyataan bahwa 43

persen dari siswa menerima instruksi musik tiga atau empat kali seminggu

menyesatkan. Informasi ini, tampaknya disediakan oleh prinsipal di sembilan puluh

delapan sekolah di mana musik dinilai, menyiratkan bahwa musik yang dibutuhkan

adalah menawarkan tiga atau empat kali seminggu. Siswa dapat memiliki musik tiga

atau empat kali seminggu selama sembilan minggu atau satu semester di sekolah

menengah, tetapi musik tiga atau empat kali seminggu sepanjang tahun untuk seluruh

delapan - siswa kelas akan langka. Angka tersebut mungkin termasuk siswa yang

berpartisipasi dalam band, paduan suara, dan orkestra, patut dipertanyakan.

Contoh

Mereka dan data lainnya meragukan pada Educational Testing Service (ETS)

rumus matriks untuk menilai musik. (Sampling Matrix memungkinkan tes yang

panjang harus dibagi dengan asumsi bahwa subset sampel siswa yang dibandingkan)

Pengambilan sampel matriks digunakan oleh ETS. Dilaporkan ke sekolah swasta dan

sekolah oversample di mana lebih dari 15 persen dari siswa minoritas. Seperti hampir

40 persen dari anak-anak sekolah Amerika yang minoritas, oversampling apapun tidak

terlihat dalam laporan jumlah instruksi musik (kesempatan untuk belajar) siswa

disediakan. Mayor US kota dengan populasi mahasiswa lebih besar minoritas dikenal

untuk memberikan instruksi musik kurang dari sistem sekolah pinggiran dan

pedesaan. Musik instruksi berbeda dari sekolah ke sekolah lebih daripada matematika

atau pengajaran bahasa Inggris, meningkatkan keraguan serius tentang kecukupan

atau sifat wakil dari sampel. Kami menunggu laporan data teknis.

Pada tahun 1971, baik 80.000 atau 90.000 siswa yang diuji (ETS dokumen berbeda)

(ECS 1974, v), memberikan sampel sebanyak 25.000 siswa pada usia tiga belas tahun

(usia siswa kelas delapan 1997) .3 Untuk sampling matriks ada sepuluh buklet pada

tahun 1971, pada tahun 1997 ada sembilan booklet. Pada tahun 1971, 2,200-2,700

siswa setiap selesai booklets.4 Sepuluh skala penilaian kembali 1978, ketika dana itu

pendek, diberikan untuk 67.000 siswa, ternyata jumlah minimum yang dianggap

memadai. Sekali lagi, 25.000 siswa kelas delapan dinilai (2.400 untuk 2.800 siswa

menyelesaikan setiap buku). ETS yang diperlukan ukuran sampel untuk pengambilan

contoh matriks konsisten selama dua penilaian pertama. Tapi tidak sempurna ETS

(ETS praktek baru-baru ini ditanyai oleh Dewan Riset Nasional dan FairTest [Hoff

1998, 24]). Uji 1971 melibatkan 890 sekolah; para-turunkan 1978 uji terlibat 650

sekolah.

Pada tahun 1997, hanya 2.275 siswa yang diuji, tersebar di sembilan buklet,

ukuran sampel sekitar sepersepuluh bahwa penilaian awal, dan hanya 98 sekolah yang

terlibat. Siswa tidak dipilih secara acak pada tahun 1997; kelas atau kelompok 30

telah selected.5 Ukuran sampel yang digunakan untuk membuat dan melakukan blok

(sebagian besar dari uji) adalah 565 pada tahun 1997 dibandingkan dengan 25.000

pada tahun 1971. Itu adalah perubahan signifikan dalam matriks sampel, terutama jika

indikator lain menunjukkan bahwa siswa tubuh kita dan instruksi musik yang diterima

pada tahun 1997 lebih, tidak kurang, beragam dari pada tahun 1971.

The Arts NAEP 1997 Laporan Kartu mengakui perubahan bahwa: "Hasil penilaian

untuk tahun 1997 dibahas dalam laporan ini tidak sebanding dengan hasil dari

penilaian sebelumnya ..... (3) sampling tahun 1997 telah. Perbedaan jelas, namun

perbandingan yang mungkin Semua penilaian bertanya. siswa untuk menyanyi

"Amerika." Pada tahun 1997, 78 persen dari siswa menyanyikan ritme yang tepat

untuk "Amerika"; pada tahun 1971, 93 persen memiliki kemampuan ini. Nilai di

lapangan kecukupan adalah 35 persen pada tahun 1997, 52 persen pada tahun 1971;

untuk kualitas nada diterima mereka adalah 24 persen dan 38 persen. Angka-angka ini

merupakan salah satu penurunan kemampuan pasti di 1971-1997, atau sampling tidak

memadai untuk tahun 1997 timbre Menyadari. mengikuti pola yang sama. Pada tahun

1971, 89 persen diakui sebuah seruling, dan 60 persen mengidentifikasi biola dan

cello dalam sepotong Bach. Pada tahun 1997, 66 persen bisa mengidentifikasi

saksofon Pada tahun 1971, 35 persen dari siswa memainkan alat musik;. pada tahun

1997 jumlah tersebut sekitar 27 persen. Seperti 1971, mahasiswa solo dilakukan

mudah, namun sampel pada tahun 1997 adalah terlalu kecil untuk menilai siswa

dengan tingkat kesulitan musik, seperti yang telah direncanakan Melakukan

improvisasi jazz mungkin untuk tahun 1997 siswa.; kurang dari 10 persen dianggap

"tidak memadai" di irama, pitch, kalimat, gaya, dan minat musik. Sight-reading juga

terhambat oleh ukuran sampel, tetapi menurut sampel kecil keterampilan ini

tampaknya telah meningkatkan Lima puluh dua. persen dari instrumentalis

memainkan pitches akurat di setidaknya enam dari delapan tindakan; 29 persen dari

mereka, Namun, gagal memainkan irama dengan benar. Sight-baca adalah mencetak

pada skala sembilan-titik (titik skala bervariasi dari pertanyaan pertanyaan, membuat

komentar umum dan membandingkannya dengan kinerja lainnya tugas sulit terbaik)

Penilaian 1997 itu menggunakan campuran lebih kaya karya seni bagi siswa untuk

merespon dan lebih beragam tugas,. tapi tes itu tidak lebih komprehensif daripada

penilaian 1971. Penggunaan musik etnis membuat stimulus tes "kaya" tapi mungkin

mempengaruhi statistik uji reliabilitas dan validitas. pertanyaan A tidak secara

otomatis menjadi sah hanya karena berhubungan dengan "isi asli". Jika tidak,

konstruksi tes akan sangat disederhanakan.

Seni Kartu Laporan menyatakan bahwa sampel itu terlalu kecil untuk

generalisasi bagi siswa vokal (begitu banyak untuk kepentingan relatif dari standar

nasional, sukarela 1 menyanyi) atau untuk anggota orkestra. Dan ada banyak

subsamples ukuran tidak memadai. Rupanya pianis, gitaris, dan drumer garasi-band

yang disertakan dengan sampel instrumental untuk membuatnya cukup besar untuk

nilai pengumuman. Jika seperempat dari siswa kelas delapan menyanyi atau

memainkan alat musik, penilaian hanya 565 siswa dalam dua blok improvisasi,

membaca penglihatan, dan bermain ensemble adalah, memang, disayangkan. hipotesis

saya adalah bahwa sampel terlalu kecil untuk menggeneralisasi untuk di-sekolah

pengalaman musik instrumental: Seni Kartu Laporan menunjukkan bahwa 27 persen

dari siswa memainkan alat musik, namun hanya 20 persen bermain dengan kelompok

(grup musik atau orkestra); sehingga pasti ada sejumlah besar siswa piano dan gitar.

Selanjutnya, meskipun fakta bahwa instruksi di kelas musik dan ansambel sering

berfokus pada kelompok, bukan individu, tujuan, item tes secara eksklusif didasarkan

pada tujuan individu.

Rincian Teknis

Matrix sampling dipromosikan sebagai alat generalisasi untuk populasi dari

hati-hati dipilih (matriks) sampel. Para penulis Seni Kartu Laporan menunjukkan

bahwa 62 siswa untuk setiap subgrup adalah ukuran sampel yang memadai, selama 62

yang dipilih dari lima unit sampling yang berbeda primer. Tak perlu dikatakan,

penelitian empiris yang cukup diperlukan untuk membentuk matriks yang valid, dan

penelitian tersebut belum dilakukan untuk musik kelas delapan. Musik mungkin atau

mungkin tidak sama dengan mata pelajaran lain, itu mungkin akan lebih bervariasi.

Para IRT dalam musik dibangun pada dua jenis pertanyaan yang berbeda, satu untuk

tanggapan dibangun, dengan skor yang benar rata-rata 65 persen, dan satu lagi untuk

pertanyaan pilihan ganda, dengan skor yang benar rata-rata 74 persen. Divisi ini

mengejutkan mengingat terbatasnya jumlah pertanyaan dan ukuran sampling yang

tidak memadai. Tampaknya beberapa keputusan yang sewenang-wenang dibuat:

pertama, yang hasilnya harus dilaporkan dalam tiga kategori pencapaian (atas,

menengah, dan rendah), dan kedua, bahwa mean dan deviasi standar yang diinginkan.

"Pada masing-masing dari tiga mata pelajaran seni, rata-rata 150 dan deviasi standar

adalah 35 [sic] didirikan sehingga sebagian besar siswa memiliki skor antara 45 dan

255 menggunakan model kredit umum parsial" (NCES 1998, 186 -7) .6 Ini adalah

"menjawab" skala yang digunakan untuk perbandingan, terutama kesempatan-untuk-

belajar perbandingan, yang sering tidak berarti. ETS biasanya menggunakan skala

Soo-titik untuk melaporkan hasil NAEP. Dalam penilaian ini jangkar poin untuk

mendirikan tiga kategori yang sewenang-wenang. Set item jangkar seharusnya dikaji

oleh para ahli kurikulum untuk memastikan bahwa mereka mewakili suatu skala

pertumbuhan intelektual (sifat laten unidimensional) dari pengetahuan sederhana

untuk pengetahuan lebih abstrak. Prosedur ini tampaknya tidak pernah diikuti dengan

penilaian musik. Karena hanya satu tingkat kelas yang diuji, ini proses validasi

kurikulum untuk membangun skala akan sulit. Anchor poin yang lazim didirikan

dengan mencari tingkat di mana setidaknya 65 persen dari peserta ujian merespon

dengan benar untuk item tersebut dan peserta ujian sekurang-kurangnya 30 persen

lebih sedikit mendapatkan jawaban yang benar untuk item tersebut di tingkat yang

lebih rendah yang berdekatan, tidak lebih bahwa 50 persen dari siswa di tingkat

menengah harus dapat menjawab item dengan benar, dan perkiraan nilai p didasarkan

pada ukuran sampel paling sedikit 100 peserta ujian. penilai musik NAEP tampaknya

percaya bahwa mereka dapat menyelesaikan tugas yang sama dengan sekitar setengah

jumlah peserta ujian, dan tidak jelas apakah praktek umum lainnya diikuti.

Bendera Merah Lainnya

Sebuah bunga rampai bendera merah lain harus ditunjukkan. Tampaknya

bahwa instruksi tes sering memungkinkan siswa untuk menentukan jawaban yang

benar: "Instruksi dibuat dengan hati-hati untuk memimpin siswa melalui langkah demi

langkah latihan yang kompleks, dan untuk memberikan siswa informasi sebanyak

mungkin tentang apa pengetahuan dan keterampilan mereka diminta untuk

menunjukkan "(5). Memang tidak ada alternatif bila konten yang dinilai tidak pernah

diajarkan.

Tes ini termasuk banyak tugas mudah, yang tujuan khas di tingkat sekolah

dasar. Sebagai contoh, siswa mendengarkan sebuah fragmen dari "Au Clair de la

Lune" dan kemudian dijelaskan apakah pola dalam irama itu langkah turun (yang

benar), langkah-langkah naik, melompat naik, atau melompat turun. Satu pertanyaan

mencetak dengan kredit parsial meminta siswa untuk mengidentifikasi nama-nama

catatan dalam skala C mayor. Empat puluh persen siswa tidak bisa nama nada

tunggal. Jelas tidak bahkan hubungan antara skala musik dan alfabet diajarkan. Sejak

55 persen dari sampel dapat menambahkan nilai catatan untuk menentukan tanda

tangan meter (tanda waktu yang disebut dalam ujian), kita dapat menyimpulkan

bahwa instruksi lebih harus diberikan untuk durasi daripada derajat skala atau bahwa

arah membantu . Menurut "menanggapi skala" (31), mengidentifikasi setengah -

simbol catatan adalah tugas tingkat atas, lebih sulit daripada menentukan meteran dari

sepotong musik.

Penilaian tanggapan siswa dibangun adalah rubrik-jenis masalah bagaimana

merancang rubrik yang jelas dan scorable yang cukup menggambarkan tugas

ditunjukkan dalam satu tugas: The "Washington Post" maret dimainkan, dan siswa

diminta untuk memutuskan apakah musik yang paling sesuai untuk parade, konser

rock, pernikahan, atau pemakaman; mahasiswa kemudian diminta untuk

menggambarkan satu fitur musik yang akan membuat musik berguna untuk acara

yang dipilih. "Musik ini memiliki terdengar ceria dan memiliki suasana hati gembira

dan nada" baik dinilai "cukup." "Ia memiliki mengalahkan marching baik dan

menyenangkan" dihukum "dikembangkan."

Nilai persentase dikutip juga menimbulkan pertanyaan menarik. Sebagai

contoh, siswa memperoleh skor 34 (dari 100) dalam menciptakan dan skor identik

dalam melaksanakan. (Jika sebagian besar instruksi pada kinerja, apakah ada bedanya

instruksi) Dengan siswa tingkat atas?, Menciptakan nilai adalah 52, dan melakukan

nilai 56, perbedaan kecil ketika siswa tingkat atas mungkin sudah instruksi swasta di

kinerja dan, kita bisa berasumsi, sangat sedikit jika ada dalam menciptakan.

Pembelajaran

Pelajaran penting yang harus dipelajari dari Seni Kartu Laporan bahwa seni

tidak dapat dinilai dalam skala besar, seperti diklaim dalam laporan. (Seperti yang

dibuktikan oleh penundaan, jenis penilaian ini tidak mudah dilakukan bahkan dengan

bantuan dari organisasi-organisasi terbaik bangsa evaluasi) Kenyataan itu didirikan

dengan penilaian musik pada tahun 1971, yang benar-benar dikelola dalam skala

besar.. Kredit harus diberikan kepada Paul Lehman dan Joann Baird, wawasan yang

membuat penilaian 1971 begitu mendalam dan begitu berharga. Satu pelajaran adalah

bahwa prioritas seni tidak cukup tinggi bahwa penilaian dapat dilakukan tanpa

bantuan dari Nea dan lembaga Getty, dan itu masih belum cukup tinggi untuk

melakukan penilaian kualitas di bahkan satu tingkat kelas. Kabar baiknya adalah

bahwa seni masih dalam agenda penilaian NAEP itu, membenarkan klaim untuk

musik sebagai subjek inti.

Meskipun saya skeptis terhadap kecukupan sampel dan akurasi dari banyak

laporan, saya menemukan beberapa hasil pengujian yang akan kepentingan. Excellent

item tes individu dapat ditemukan di seluruh penilaian musik, masing-masing yang

sepenuhnya sesuai dengan sendirinya. pendidik musik akan sedikit kecewa jika siswa

yang kompeten di semua item. Item harus merangsang guru musik untuk

bereksperimen dengan standar nasional sukarela sebagai waktu memungkinkan.

Sayangnya, tes tidak dapat dinilai terhadap standar penilaian banyak, dan tentu saja,

advokasi tersembunyi / standar tujuan membuat komentar, termasuk tambang, lemah.

Seni Laporan Kartu tidak dapat digunakan untuk mendukung atau memandu

perubahan kurikuler dalam musik mengajar dan belajar karena tidak sepenuhnya

menilai apa yang diketahui siswa dan dapat melakukan dan karena beberapa hasil

tampaknya didasarkan pada satu item. Ia menawarkan, namun kemungkinan untuk

upaya advokasi tambahan sekali prioritas yang ditetapkan dan kita tahu apa yang

sumber daya yang diperlukan untuk memenuhi standar kinerja profesi kita.

Penilaian dalam musik

Documents

Transcript of Penilaian dalam musik