En defensa de la evaluación auténtica Grant Wiggins
Serie: Textos y Traducciones. No. 3
Textos y Traducciones es una colección editada por Dialoga. Profesionales en educación, S.C. La colección se compone de ensayos, artículos de revista o capítulos de libros que fueron seleccionados por la calidad de sus aportaciones y por considerarlos de interés para la reflexión de los maestros y de las personas interesadas en la mejora de la educación. La selección de los textos se realizó con la intención de aportar elementos para que los lectores pongan en práctica nuevas formas de enseñanza, reflexionen sobre la importancia de su trabajo para la mejora del aprendizaje de los alumnos y cuenten con nuevas ideas que orienten su comprensión de las políticas educativas. Los textos y los autores fueron seleccionados por un consejo académico asesor, quienes eligieron materiales de reciente edición o que fueron publicados en los últimos veinte años. Generalmente se trata de textos que son de escasa circulación en el país o poco conocidos en México –pese a la calidad de su contenido y del impacto favorable en la discusión académica y pedagógica que han tenido en el medio educativo de origen–. La posición de los autores no necesariamente coincide con el punto de vista de Dialoga.
Este material es gratuito. Se publica sin fines de lucro, sólo en versión electrónica. La traducción es responsabilidad de Dialoga. Profesionales en educación, S.C. Las personas interesadas en enviar comentarios u observaciones lo pueden hacer a:
[email protected] Texto original: Wiggins, Grant (1990). The case for authentic assessment. Practical Assessment, Research & Evaluation, 2(2).
Coordinación académica: Francisco Deceano Osorio Coordinación editorial: Alicia Luna Rodríguez Apoyo técnico: Javier Ulises Mendoza Ravelo Diseño gráfico: Vania Bachur Colín www.dialoga.com.mx
Derechos reservados. El titular de los derechos de la colección Textos y Traducciones y de la presente versión es: Dialoga. Profesionales en educación, S.C. San Francisco 1660, piso 2, Del Valle, México, D.F.
En defensa de la evaluación auténtica Grant Wiggins
Índice ¿Qué es la evaluación auténtica?.............................................................................................. ¿Por qué necesitamos invertir tiempo en estas formas tan laboriosas de evaluación?...... ¿No es demasiado cara y laboriosa la evaluación auténtica?............................................... ¿Llegará a confiar el público en la objetividad y confiabilidad de las calificaciones basadas en juicios?.................................................................................................................. Lecturas complementarias .........................................................................................................
4 5 6 6 7
3
En defensa de la evaluación auténtica 1 Grant Wiggins
¿Qué es la evaluación auténtica? La evaluación es auténtica cuando examinamos directamente el desempeño de los alumnos en tareas intelectuales valiosas. La evaluación tradicional, en contraste, se basa en “reactivos” indirectos, que funcionan como substitutos, a partir de los cuales creemos que se pueden hacer inferencias válidas sobre el desempeño de los estudiantes en dichas tareas. ¿Queremos evaluar la capacidad de nuestros alumnos para plantear y resolver problemas en matemáticas? ¿La investigación experimental en ciencias? ¿Su manera de hablar, escuchar y facilitar una discusión? ¿La realización de investigación documental? ¿Revisar sus escritos creativos hasta que “funcionen” para los lectores? Entonces permitamos que la evaluación se construya a partir de estos retos intelectuales. Algunas comparaciones con los exámenes estandarizados ayudarán a clarificar lo que significa evaluación “auténtica”: •
•
•
4
La evaluación auténtica exige que los alumnos se desempeñen efectivamente usando el conocimiento adquirido. Los exámenes tradicionales tienden a revelar sólo lo que los alumnos pueden reconocer, recordar o “conectar” de lo que aprendieron fuera de contexto. Esto puede ser tan problemático como querer inferir la habilidad para manejar o para enseñar sólo a partir de exámenes escritos. La evaluación auténtica presenta al estudiante el conjunto entero de tareas que reflejan las prioridades y retos de las actividades de enseñanza: investigar, escribir, revisar y discutir sus escritos, aportar un análisis oral interesante de un evento político, colaborar con otros en un debate, etc. Los exámenes convencionales normalmente se limitan a contestar preguntas de respuesta única con papel y lápiz. Las evaluaciones auténticas buscan observar si el alumno puede ejecutar/diseñar respuestas, desempeños y productos nítidos, completos y justificables. Los exámenes convencionales sólo requieren a los alumnos seleccionar o escribir respuestas correctas, sin importar las razones. (RaWiggins, Grant (1990). The case for authentic assessment. Practical Assessment, Research & Evaluation, 2(2). Consultado el 21 de octubre de 2009. Disponible en: http://PAREonline.net/getvn.asp?v=2&n=2 . Traducción: Gregorio Hernández. 1
ramente hay oportunidad adecuada de planear, revisar y substanciar las respuestas en los ex ámenes, incluso cuando incluyen preguntas abiertas). En consecuencia… •
•
•
La evaluación auténtica logra validez y confiabilidad al enfatizar y estandarizar los criterios apropiados para calificar tal variedad de productos. Los exámenes tradicionales estandarizan “reactivos” objetivos y, en consecuencia, la (única) respuesta correcta de cada uno. La “validez” del examen debería depender, en parte, de si el examen estimula la prueba de habilidades del mundo real. En la mayoría de los exámenes de opción múltiple la validez se determina meramente por la correlación entre los reactivos y los contenidos del curriculum (o mediante correlaciones sofisticadas con los resultados de otros exámenes estandarizados). Las tareas auténticas involucran retos y roles “semi-estructurados” que ayudan a los alumnos a ensayar las ambigüedades complejas del “juego” de la vida adulta y profesional. Los exámenes tradicionales, en cambio, son más como ejercicios mecánicos que evalúan elementos estáticos, simples y a menudo arbitrarios de esas actividades.
Más allá de esas consideraciones técnicas, el movimiento hacia la reforma de la evaluación se basa en la premisa de que la evaluación principalmente debería a poyar las necesidades de los aprendices. Por ello, los exámenes estandarizados compuestos por reactivos y calificaciones que carecen de significado claro y útil debilitan la capacidad de los maestros para mejorar la enseñanza, y la capacidad de los alumnos de mejorar su desempeño. Esto es como ensayar y enseñar en función de exámenes que no se comprometen con la validez. Las evaluaciones auténticas
buscan observar si el alumno puede
Los mejores exámenes muestran siempre a alumejecutar/diseñar respuestas, nos y maestros el tipo de trabajo que realmente desempeños y productos nítidos, importa. Son instrumentos para capacitar y mirar completos y justificables. hacia adelante, y no sólo para reflejar la enseñanza previa. En muchas universidades y espacios profesionales los retos esenciales se conocen de antemano (p. ej., un reporte a presentar, un recital o concierto, etc.). Los exámenes tradicionales, al mantener en completo secreto su validez, hacen difícil para maestros y alumnos ensayar y desarrollar la confianza que surge del conocimiento del desempeño que se espera de uno. Un reto conocido posibilita también que todos los alumnos mantengan estándares elevados.
...los exámenes estandarizados compuestos por reactivos y calificaciones que carecen de significado claro y útil debilitan la capacidad de los maestros para mejorar la enseñanza, y la capacidad de los alumnos de mejorar su desempeño.
¿Por qué necesitamos invertir tiempo en estas formas tan laboriosas de evaluación? Si bien los exámenes de opción múltiple pueden ser indicadores o predictores válidos del desempeño académico, con frecuencia dichos exámenes confunden a los alumnos y maestros sobre el tipo de trabajo que debe llegarse a dominar. Las normas no son estándares. Los reactivos no son problemas reales. Las respuestas correctas no requieren una fundamentación lógica.
Lo que los defensores de las pruebas tradicionales no ven es que es la forma, no el contenido del examen lo que es dañino para el aprendizaje. La cuestión a debatir respecto a la reforma de la evaluación no es la validez técnica de las pruebas estandarizadas, pues a través de estas los alumnos llegan a creer que aprender es memorizar grandes cantidades de datos. Los maestros llegan a creer que los exámenes son una dañina molestia impuesta demasiado tarde (cuando la enseñanza ha terminado).
5
Y se conduce a ambos a creer que las respuestas correctas importan más que los hábitos mentales. Avanzar hacia tareas y logros más auténticos mejora, entonces, la enseñanza y el aprendizaje: los alumnos tienen mayor claridad sobre sus obligaciones (y se les pide dominar tareas más interesantes), y los maestros pueden llegar a creer que los resultados de la evaluación son significativos y útiles para mejorar la enseñanza. Si tu objetivo es meramente monitorear el desempeño, entonces la evaluación convencional puede ser adecuada. Si tu objetivo es mejorar el desempeño a todos los niveles, entonces los exámenes deben integrarse por tareas, criterios y estándares ejemplares.
¿No es demasiado cara y laboriosa la evaluación auténtica? Los costos son engañosos. Aunque evaluar tareas basadas en juicios parece caro (alrededor de 2 dólares por estudiante) comparado con calificar exámenes de opción múltiple (1 centavo por estudiante), los beneficios en el desarrollo profesional de los maestros, la evaluación local, y el aprendizaje de los alumnos son muchos. En estados como California y Nueva York se ha encontrado que, a través de sus exámenes de escritura y de ciencia práctica, se dan mejoras significativas a nivel local en la enseñanza y la evaluación de la escritura y la ciencia, especialmente cuando los m aestros participan en el proceso de calificación. Si los costos resultan prohibitivos, se pueden evaluar sólo muestras de la población, que es la estrategia seguida en California, Vermont y Connecticut en sus nuevos proyectos de evaluación con base en portafolios y desempeño. Así, se puede obtener información valiosa a un costo mínimo a través de una muestra de distintos géneros de escritura, donde cada estudiante realiza sólo uno; o evaluando sólo a una muestra pequeña de estudiantes. ¿Y qué ganamos al fracasar en evaluar adecuadamente las capacidades y resultados que decimos valorar simplemente porque es más tardado, caro y laborioso? La mayoría de los países que piden a los alumnos de manera rutinaria contestar oralmente y p or escrito sus evaluaciones principales, son los mismos países que nos aventajan en las comparaciones internacionales. Para lograr que la evaluación sea de calidad superior, normalmente destinan dinero, tiempo y acciones de capacitación. Así mismo, asumen de manera correcta que los estándares altos dependen de la calidad de la evaluación cotidiana.
¿Llegará a confiar el público en la objetividad y confiabilidad de las calificaciones basadas en juicios? Tendemos a olvidar que muchos programas de evaluación a nivel estatal y nacional, con un nivel alto de credibilidad e integridad, han operado por muchos años usando el criterio humano: •
•
•
6
Desde que existen, los exámenes de los Regentes de Nueva York han incluido preguntas con redacción de ensayos, calificados localmente. El Programa de Ubicación Avanzada: usa preguntas y tareas abiertas, incluyendo no sólo ensayos sino Portafolios de Arte y exámenes de Lengua Extranjera. Evaluaciones estatales de escritura: se usan en muchos estados, e incluyen ensayos mo-
Para lograr que la evaluación sea de calidad superior, normalmente destinan dinero, tiempo y acciones de capacitación. Así mismo, asumen de manera correcta que los estándares altos dependen de la calidad de la evaluación cotidiana.
delo, capacitación de lectores/revisores, y procedimientos de lectura “ciega” para prevenir los sesgos y ganar confianza y credibilidad. •
•
La Evaluación Nacional del Progreso Educativo (NAEP, por sus siglas en inglés): es la evaluación ordenada por el Congreso, utiliza numerosas preguntas abiertas, tareas de escritura, y pruebas prácticas de desempeño en ciencia. Las nuevas Evaluaciones basadas en portafolios y en desempeño, implementadas en Arizona, California, Connecticut, Kentucky, Maryland, and New York.
Aunque la calificación de los exámenes estandarizados no se presta a errores significativos, el procedimiento para elegir los reactivos, y la manera en que se establecen las normas y las líneas de corte (calificación mínima aprobatoria) a menudo son bastante subjetivas, y tradicionalmente inmunes al escrutinio y la vigilancia pública. La evaluación genuina no evita el juicio humano. Monitoreamos y mejoramos nuestros juicios mediante sesiones de capacitación, ejemplos de desempeño, revisión de las políticas, así como a través de procedimientos básicos tales como pedir que jueces neutrales revisen el trabajo de los estudiantes sin importar el nombre o la experiencia de la persona, de manera similar a como se hace rutinariamente en los mundos del deporte, el arte y otras profesioPara mejorar el desempeño de los nes donde se juzga el desempeño. alumnos debemos reconocer que las
habilidades intelectuales esenciales se están fugando por las grietas de la evaluación convencional.
La evaluación auténtica tiene también la ventaja de dar a los padres y a los miembros de la comunidad productos observables y evidencias comprensibles del desempeño de los alumnos. La calidad del trabajo de los alumnos se vuelve más comprensible para la gente común que cuando se les habla en un lenguaje más técnico y abstracto como el de los números y las normas. En última instancia, como dice la investigadora Lauren Resnick, “Lo que evalúas es lo que obtienes. Si no lo evalúas, no lo tendrás”. Para mejorar el desempeño de los alumnos debemos reconocer que las habilidades intelectuales esenciales se están fugando por las grietas de la evaluación convencional.
Lecturas complementarias Archbald, D. & Newmann, F. (1989) "The Functions of Assessment and the Nature of Authentic Academic Achievement," in Berlak (ed.) Assessing Achievement: Toward the development of a New Science of Educational Testing. Buffalo, NY: SUNY Press. Frederiksen, J. & Collins, A. (1989) "A Systems Approach to Educational Testing," Educational Researcher , 18, 9 (December). National Commission on Testing and Public Policy (1990) From Gatekeeper to Gateway: Transforming Testing in America. Chestnut Hill, MA: NCTPP, Boston College. Wiggins, G. (1989) "A True Test: Toward More Authentic and Equitable Assessment," Phi Delta Kappan, 70, 9 (May). Wolf, D. (1989) "Portfolio Assessment: Sampling Student Work," Educational Leadership 46, 7, pp. 35-39 (April).
7