Un instrumento de medición educacional, prueba o test como aparece en la literatura, es un conjunto de preguntas, ítems o reactivos estructurados con orden lógico, los que presentados al alumno en forma oral o escrita, pretenden evidenciar el aprendizaje de éste a través de sus respuestas que pueden ser orales, escritas o de ejecución. Así entonces las pruebas pueden ser, según la forma de respuesta del alumno, oral, escrita y de ejecución.
En la actualidad, y en el contexto de la Reforma Educacional se utilizan con mayor frecuencia las pruebas de ejecución, vale decir, aquellas donde el alumno opera equipos o realiza un procedimiento y el profesor observa la ejecución del alumno para establecer que realmente aprendió. Estas pruebas sirven para medir las capacidades cognitivas tanto como las habilidades motoras y están basadas principalmente en la observación, se usan también para medir actitudes.
Se denominan pruebas "tradicionales" a las que habitualmente se han usado en el centro educativo para medir el rendimiento académico de los alumnos. Todos las hemos sufrido en mayor o menor medida y en más de una ocasión nos han producido compulsión. Estas pruebas son:
- La interrogación oral
- La prueba de ensayo o desarrollo
- La prueba objetiva.
1. Características métricas de las pruebas.
La validez tiene relación con el atributo que se va a medir, pueden existir muchos instrumentos para medirlo, pero hay uno que lo hará en forma más específica. Ejemplo, los resultados de una prueba de matemática son válidos (por lo tanto la prueba es válida) para mostrar la habilidad de un alumno para realizar cálculos, pero esa prueba no es válida para que los alumnos muestren sus habilidades artísticas. Parece obvio, pero cuando se analizan las pruebas de algunos docentes, da pena por sus alumnos, ya que a pesar de ellos, los alumnos aprenden.
Confiabilidad es sinónimo de solidez, seguridad, fidelidad, confianza, crédito, estabilidad, coherencia, consistencia, precisión de los resultados, independiente de lo que se mide.
Ejemplo. Al pesar un kilo de harina envasada en una balanza de cocina, la aguja indicará un kilo, se puede repetir cuatro o cinco veces la medición y la balanza siempre marcará un kilo. La balanza es confiable. Lo mismo debería suceder con las pruebas que hace el profesor. Evidentemente esto no es posible porque se trabaja con personas, pero teniendo cuidado al elaborar las pruebas, ellas pueden llegar a ser bastante confiables.
La objetividad es una característica que está referida a la elaboración y a la corrección de una prueba. Una prueba será más objetiva de elaboración si participa más de una persona en su elaboración. Por esto es recomendable hacer las pruebas en equipos de profesores de una especialidad ya que hay más imaginación para elaborar preguntas y para analizar la consistencia de ellas. Esto ayuda también a mejorar la validez de la prueba.
El grado de dificultad de la prueba está determinado por la dificultad de las preguntas. Supuestamente una prueba debe tener preguntas fáciles, medianas y adecuadas, desde el punto de vista del profesor. Aunque si el proceso de enseñanza-aprendizaje ha sido desarrollado considerando las diferencias individuales, todas las preguntas deberán tener el mismo grado de dificultad.
Para establecer el grado de dificultad de una prueba se relaciona el número de preguntas de ellas con el promedio aritmético de los puntajes obtenidos por los alumnos. Así si los alumnos estuvieron sometidos a clases expositivas y no fueron atendidas las diferencias individuales, se espera que el 50% del grupo aprenda, es decir, que el promedio del curso sea similar a la mitad del puntaje total de la prueba. La dificultad de la prueba entonces es de un 50%. En cambio si se atendieron las diferencias individuales, se utilizó evaluación formativa, se analizaron los requisitos, etc., la prueba no debería ser difícil para nadie y todos alcanzarían los puntajes altos.
Lo ideal sería que esta característica no fuera siquiera percibida por los alumnos.El grado de discriminación de la prueba está referido a la propiedad de la prueba de separar a los alumnos que saben (lograron los objetivos) de aquellos que no saben (no lograron los objetivos).
La representatividad de una prueba está referida a la relación que existe entre los objetivos (cuyo logro debe ser medido), y las preguntas de la prueba. Lo ideal es que para cada objetivo se elabore un número de preguntas definido de tal forma que se sepa exactamente qué preguntas se utilizarán para medir cada competencia. Ejemplo:
Objetivos ítems.
1 1-2-3-4
2 5-6-7-8
3 9-10-11-12.
Al hacer el análisis de los resultados de la prueba puede establecerse claramente qué objetivos fueron logrados por los alumnos y cuáles no, de acuerdo a las respuestas que ellos dan.
La practicidad no es realmente una característica métrica, sino que se relaciona con el costo de la prueba en cuanto a recursos, esto es, si se necesita mucho papel, multicopias, etc., y en cuanto al tiempo que necesita, de elaboración, aplicación y corrección. Así entonces las pruebas de ejecución y las orales son poco prácticas de aplicación, porque se administran por alumno, en forma individual, y el profesor debe esperar que éste responda o ejecute y observarlo. Se usa mucho tiempo al tener un curso numeroso. No obstante, hay objetivos donde no sirve otra prueba y es necesario usarla. La prueba de ensayo es rápida de elaboración y aplicación, pero el profesor demora mucho tiempo en corregirla. Todas las pruebas en general son poco prácticas en algún sentido.
Las etapas a seguir son:
- Especificar el tipo de prueba.
- Especificar la unidad de aprendizaje cuyo logro se medirá
- Establecer el número de alumnos que rendirá la prueba.
- Determinar el propósito evaluativo (diagnóstico, formativo y sumativo).
- Hacer un listado de los objetivos que serán medidos o describir los aprendizajes esperados.
- Fijar el número de preguntas de la prueba o de situaciones a las que se enfrentará al alumno.
- Relacionar los objetivos con el número de preguntas de la prueba.
En esta etapa no se elaboran todavía las preguntas, sólo se establece el número de ellas y su relación con los objetivos. Con ello se está ganando la representatividad del instrumento.
2.- Elaboración de la prueba: Elaborar una prueba significa:
- Elaborar las preguntas o ítems.
- Validar las preguntas
- Elaborar la prueba formal.
- Realiza el hilván sastre con una puntada justa y otra suelta.
- Remata el hilván al principio.
- Remata el hilván al final.
- Su capital lo aporta una persona.
- Cuenta con socios gestores que aportan capital
- Su fondo social lo aportan sus accionistas.
Validar las preguntas: Una vez hechas las preguntas es necesario validarlas. Validar significa que trabajan uno a uno con un experto (en este caso, con otro profesor de la misma asignatura, con el jefe de departamento o con el jefe de UTP) para que analice la pregunta y determine si realmente la pregunta mide la conducta que expresa el contenido (si el objetivo es de aplicación, la pregunta da la posibilidad de que el alumno aplique al responderla), si está bien redactada, si se utiliza lenguaje a nivel del alumno, etc. Todas aquellas preguntas que resulten dudosas para el experto, probablemente resultarían dudosas para el alumno en el momento de aplicar la prueba, por lo tanto es mejor cambiar los ítemes. Las preguntas que pasan la prueba del experto pueden ser incluidas en el instrumento que será aplicado a los alumnos.
Ejemplo de una hoja de instrucciones de Prueba de Ensayo.
- Esta es una prueba de seis preguntas.
- Dispone de 60 minutos para responder.
- Responda en una hoja de cuadro grande tamaño oficio.
- El puntaje de cada pregunta aparece ( ) al lado de cada pregunta.
- Puede usar calculadora.
- Las fórmulas están en la pizarra.
- Debe desarrollar el reemplazo de los datos en la fórmula paso a paso en la hoja de respuestas.
- Coloque su nombre al final de la hoja de respuesta.
3.- Aplicación de la prueba: Una vez elaborada e impresa la prueba, es el momento de la aplicación, es decir, administrarla a los alumnos en la sala de clases.
Cuando la aplicación es colectiva, la situación de prueba debe ser la más tranquila posible, se está aplicando una medición, y ella será más exacta mientras más relajado esté el alumno y no lo alteren factores ambientales. Es importante señalar al comienzo las instrucciones para responder la prueba, y el tiempo de que dispone el alumno para hacerlo. Prevenir situaciones de copia separando a los alumnos convenientemente y recomendándole que guarden todo material ajeno a la prueba. Una vez que se ordenaron y se dieron todas las instrucciones se anota el tiempo de inicio y de término en la pizarra, y no se hace ninguna otra referencia al tiempo.
Cuando la aplicación de la prueba es individual, también deben darse al alumno todas las reglas del juego de antemano y al hacer cada pregunta o al observar su actuación, dar un tiempo prudente de respuesta. Cuando se aplica una lista de cotejo, puede ser conocida por el alumno de antemano, así el puede saber a que actuación da mayor importancia el profesor y poner énfasis en ellas. La lista de cotejo puede ser usada indistintamente con propósito diagnóstico, formativo y sumativo, y conocerla de antemano el alumno.
Ejemplo: Para verificar si un alumno maneja una máquina de escribir, se diseña y elabora una lista de cotejo con todos los pasos que debe seguir para demostrar que sabe hacerlo. Esta lista de acciones puede ser conocida por el alumno, se aplica con propósito diagnóstico y él se da cuenta de qué acciones realiza y cuáles no y después de ensayar muchas veces puede verificar nuevamente qué acciones ha mejorado y cuál debe mejorar aún más. Cuando el profesor deba calificar, puede usar la misma lista y observar la actuación final del alumno.
4.-Corrección de la prueba: Luego de aplicadas las pruebas ocurre el proceso de corrección. Corregir es verificar si el alumno ha emitido respuestas correctas y asignar puntajes a dichas respuestas.
Cada prueba se corrige de distintas formas, según sea el tipo de ella. Pero en todos los casos es conveniente tener una plantilla o guía de corrección para comparar con ella las respuestas del alumno y asignar los puntajes que correspondan. Se evita así el "efecto de halo", que puede ser positivo o negativo, pero afecta de todas formas la objetividad de la corrección. Esto afecta a todos los instrumentos de medición excepto a la prueba objetiva que es la única que podría ser corregida, utilizando una plantilla, por el propio alumno, y no llegaría a resultados diferentes de los del profesor.
Para la lista de cotejo solo se cuentan los puntos de las actuaciones correctas y con ese puntaje se calcula la nota. Aunque antes de calcular la nota se debe hacer un análisis de las respuestas.
La prueba de ensayo se corrige por pregunta y no por alumno para mantener en cierta medida la objetividad de la corrección y no se comparen las respuestas de los alumnos entre sí.
La prueba objetiva se corrige con una plantilla, marcando las respuestas incorrectas, luego se cuentan las respuestas correctas y se le hace un descuento de acuerdo a una tabla considerando que el alumno puede haber dado algunas respuestas al azar.
5.-Análisis de la prueba: Antes de asignar las notas o calificaciones a la prueba o determinar el logro de objetivos de acuerdo al puntaje, es necesario hacer un análisis de las respuestas, esto es, establecer la tendencias de ellas, ¿todos los alumnos respondieron todo?, ¿qué pregunta no fue respondida?, ¿Existen errores que se repiten en las respuestas y ¿cuál fue la variación de los puntajes?.
Puede ocurrir por ejemplo que:
- En una secuencia de acciones de una lista de cotejo, una acción no la realiza ninguno de los alumnos porque resulta irrelevante para el proceso.
- En una prueba de ensayo podría suceder que todo el grupo utiliza mal una fórmula porque en algún momento fue mal escrita.
- En un test objetivo de 40 ítems, todos omiten la pregunta 38 y todos responden "a" en la pregunta 25 cuando la alternativa correcta era la "c".
En todos estos casos sería conveniente no considerar ese(os) ítem(es) para el puntaje final de cada alumno. Ahora si no hay ningún problema y aparentemente las respuestas incorrectas fueron por desconocimiento del alumno, no sería necesario hacer ajustes al puntaje total.
6.- Calificación: Cuando se tienen los puntajes para cada alumno después de corregir y analizar la prueba es el momento de tomar decisiones. Estas decisiones se refieren a determinar si el alumno logró o no los objetivos que medía la prueba.
Si el propósito evaluativo al aplicar el instrumento era diagnóstico, se darán a conocer los puntajes a cada alumno y se le comunicará a cada uno los vacíos que necesita llenar.
Si el propósito evaluativo fue formativo, también se darán a conocer los puntajes a cada alumno, se les comunicarán sus carencias y se dará la orientación necesaria y las actividades que el alumno debe realizar para remediarlas.
Si el propósito evaluativo era sumativo, es necesario transformar los puntajes a calificaciones, para ello existen distintos procedimientos según sea la prueba utilizada. La forma más simple de asignar calificaciones, utilizada para lista de cotejo, la prueba oral y la prueba de ensayo es la siguiente:
Puntaje obtenido por el alumno
Nota = ---------------------------------- . 7
Puntaje total de la prueba
El puntaje total de la prueba puede ser ajustado si se ha decidido eliminar alguna pregunta.