Apa yang Harus Diabaikan Untuk Memahami Skor Tes Anak Anda

Setelah bulan pertama sekolah selesai, orang tua bisa bersiap untuk mengikuti tonggak sejarah berikutnya - mereka akan segera mendapatkan laporan tentang ujian negara yang diambil anak-anak mereka tahun lalu.

Perkiraan saya menunjukkan bahwa sekitar 26 juta siswa di sekolah negeri mengambil tes di seluruh negara bagian dalam membaca dan matematika tahun lalu. Banyak dari mereka juga mengikuti tes di seluruh negara bagian dalam sains. Tes ini memberikan informasi penting kepada orang tua tentang seberapa baik anak mereka di sekolah.

Namun, penelitian saya juga menunjukkan bahwa ketika orang tua menerima laporan skor tes anak mereka, mereka mungkin memiliki waktu sulit untuk memisahkan informasi penting dari omong kosong statistik.

Terlebih lagi, hasilnya mungkin bahkan tidak memberi mereka informasi yang akurat tentang perkembangan akademis anak mereka.

Apakah anak Anda 'mahir'?

Hukum No Child Left Behind, yang diundangkan di 2002, mewajibkan semua negara untuk menetapkan "standar tingkat pencapaian" dalam pembacaan dan matematika untuk kelas tiga sampai delapan, dan untuk satu kelas di sekolah menengah atas, biasanya kelas 10th atau 11th. Negara-negara juga diminta untuk mengembangkan tes untuk mengukur tingkat siswa "kecakapan" pada setiap tes.


grafis berlangganan batin


Undang-undang federal yang baru disahkan pada bulan Desember 2015, Setiap Siswa Berhasil Bertindak (ESSA), akan melanjutkan latihan ini.

Akibatnya, laporan pengujian yang diterima orang tua mengklasifikasikan anak-anak ke tingkat pencapaian seperti "dasar" atau "mahir." Setiap negara memutuskan apa klasifikasi ini disebut, namun setidaknya satu kategori harus menunjukkan "mahir".

Kategori tingkat pencapaian ini dijelaskan pada laporan skor tes, sehingga informasi ini mudah dipahami oleh orang tua. Sebagai contoh, saya merasa terbantu setiap tahun untuk melihat apakah anak laki-laki saya mencapai kemampuan dalam setiap bidang studi.

Tapi nilai tes anak pada tahun tertentu, dan tingkat pencapaian mereka, bukanlah satu-satunya informasi yang dilaporkan di beberapa negara bagian. Sebuah indeks statistik baru, yang disebut "persentil pertumbuhan siswa," menemukan jalan ke dalam laporan dikirim pulang ke orang tua di negara bagian 11. Dua puluh tujuh negara menggunakan indeks ini untuk mengevaluasi guru juga.

Meskipun ukuran "pertumbuhan" siswa atau kemajuan terdengar seperti ide bagus, persentil pertumbuhan siswa belum didukung oleh penelitian. Faktanya beberapa penelitian menyarankan mereka jangan memberikan deskripsi yang akurat kemajuan siswa dan efektivitas guru.

Apa artinya?

Apa sebenarnya "persentil pertumbuhan siswa"?

Mereka adalah indeks yang diusulkan di 2008 oleh Damian W. Betebenner, seorang ahli statistik yang menyarankan agar mereka digunakan sebagai ukuran deskriptif "pertumbuhan akademis" siswa dari satu tahun ajaran ke tahun berikutnya. Idenya adalah untuk menggambarkan kemajuan siswa dibandingkan dengan rekan-rekan mereka.

Seperti grafik pertumbuhan yang digunakan dokter anak untuk menggambarkan tinggi dan berat badan anak-anak, persentase pertumbuhan siswa berkisar dari yang rendah sampai yang tinggi dari 99. Namun, perhitungan mereka melibatkan lebih banyak kesalahan daripada pengukuran fisik seperti tinggi dan berat badan. Penelitian kami di University of Massachusetts Amherst menunjukkan kesalahan substansial dalam perhitungan mereka

Persentase pertumbuhan siswa berasal dari nilai ujian, yang deskripsinya tidak tepat akurat tentang kemampuan akademis siswa: Skor tes dipengaruhi oleh banyak faktor, seperti pertanyaan yang diajukan pada hari tertentu, temperamen siswa, tingkat keterlibatan mereka saat mengambil tes atau hanya metode yang digunakan untuk mencetak jawaban mereka.

Setiap persentil pertumbuhan siswa dihitung dengan menggunakan setidaknya dua nilai tes yang berbeda, biasanya satu tahun atau lebih terpisah. Skor tes terbaru dari seorang siswa kemudian dibandingkan dengan nilai tes terakhir dari siswa yang memiliki skor serupa di tahun-tahun sebelumnya. Ini untuk melihat siswa mana yang memiliki nilai lebih tinggi atau lebih rendah tahun ini.

Masalahnya, bagaimanapun, adalah bahwa masing-masing perhitungan membawa beberapa kesalahan pengukuran. Perhitungan lebih lanjut hanya mengelompokkan kesalahan itu. Begitu banyak sehingga hasilnya berakhir dengan kesalahan dua kali lebih banyak. Tidak ada kecanggihan statistik bisa menghapus kesalahan ini

Pertanyaannya adalah, mengapa begitu banyak negara menggunakan ukuran yang tidak dapat diandalkan seperti itu?

Menggunakannya untuk akuntabilitas

Penggunaan persentil pertumbuhan siswa sebagian disebabkan oleh keinginan untuk melihat seberapa banyak siswa belajar pada tahun tertentu, dan untuk menghubungkan kemajuan itu dengan sistem pertanggungjawaban seperti evaluasi guru.

Dalam 2010, yang Kompetisi hibah Race-to-the-Top negara-negara yang diundang untuk menemukan cara inovatif untuk menggunakan nilai tes untuk mengevaluasi guru, yang membuka jalan bagi ukuran baru "pertumbuhan" ini untuk segera diterapkan di banyak negara bagian.

Namun, penggunaan persentil pertumbuhan siswa dimulai sebelum penelitian dilakukan dengan akurasi. Baru sekarang ada penelitian yang cukup untuk mengevaluasi mereka, dan semua penelitian menunjukkan kesimpulan yang sama - mengandung banyak kesalahan.

Selain penelitian kami di University of Massachusetts Amherst, penelitian tentang ketepatan persentil pertumbuhan siswa telah dilakukan oleh lembaga nirlaba pendidikan seperti WestEd, Layanan Pengujian Pendidikan dan lain lembaga penelitian. Periset JR Lockwood dan Katherine E. Castellano baru saja menyimpulkan bahwa "Dasar penelitian yang substansial telah mencatat bahwa perkiraan persentasi pertumbuhan siswa untuk siswa perorangan memiliki kesalahan besar."

Namun, banyak negara tampaknya tidak menyadari temuan penelitian ini. Massachusetts bahkan melangkah lebih jauh lagi mengklasifikasikan anak-anak dengan persentil pertumbuhan kurang dari 40 sebagai "pertumbuhan rendah" dan anak-anak dengan persentil pertumbuhan lebih besar dari 60 sebagai "pertumbuhan yang lebih tinggi."

Mengukur kinerja guru

Seperti yang saya sebutkan sebelumnya, 27 menyatakan menggunakan persentil pertumbuhan siswa untuk mengklasifikasikan guru sebagai "efektif" atau "tidak efektif." Penelitian tentang penggunaan persentil pertumbuhan untuk tujuan ini menunjukkan bahwa mereka dapat meremehkan kinerjanya guru yang paling efektif, dan melebih-lebihkan kinerja dari guru yang paling tidak efektif - kebalikan dari apa yang negara-negara ini coba lakukan dengan sistem evaluasi guru mereka.

Sebuah laporan baru-baru ini oleh WestEd mengevaluasi penggunaan persentil pertumbuhan siswa untuk mengevaluasi guru dan Disimpulkan mereka "tidak memenuhi tingkat stabilitas" yang dibutuhkan untuk keputusan taruhan tinggi tersebut.

Mari kembali ke langkah-langkah tradisional

Saya percaya persentil pertumbuhan siswa telah membawa kita selangkah mundur dalam penggunaan tes pendidikan untuk meningkatkan pembelajaran siswa.

Ukuran tradisional kinerja anak-anak pada tes pendidikan, seperti apakah mereka "mahir" pada tahun tertentu dan nilai tes sebenarnya, memberikan gambaran bagus tentang seberapa baik kinerja mereka dalam matematika atau membaca pada tahun tertentu.

Perserikatan persentil tradisional ini masih dilaporkan pada banyak tes pendidikan, sama seperti saat kita sebagai orang tua di sekolah. Jumlah persentil tradisional membandingkan kita dengan kelompok nasional atau negara bagian pada tahun tertentu, daripada membandingkan kita dengan bagaimana anak-anak lain di negara atau negara "tumbuh" dalam berbagai tes yang mereka lakukan dalam tahun-tahun yang berbeda, seperti yang dilakukan persentil pertumbuhan siswa.

Mengingat apa yang sekarang kita ketahui tentang persentil pertumbuhan siswa, nasehat saya kepada orang tua tidak hanya mengabaikannya pada laporan skor tes anak-anak mereka, tetapi juga untuk menghubungi departemen pendidikan negara bagian mereka dan bertanya mengapa mereka melaporkan statistik yang tidak dapat diandalkan tersebut.

Mengembangkan ukuran berapa banyak siswa yang telah belajar selama setahun adalah tujuan yang baik. Sayangnya, persentil pertumbuhan siswa tidak melakukan pekerjaan dengan baik untuk mengukurnya.

Tentang Penulis

Stephen Sireci, Profesor Kebijakan Pendidikan, University of Massachusetts Amherst

Artikel ini awalnya diterbitkan pada Percakapan. Membaca Artikel asli.

Buku terkait:

at Pasar InnerSelf dan Amazon