En la evaluación educativa tradicional, se aplica el mismo conjunto de preguntas a todas las personas evaluadas. Este enfoque —conocido como *prueba lineal*— es fácil de administrar, pero ineficiente: los sustentantes con alta habilidad responden preguntas triviales, mientras que quienes tienen baja habilidad enfrentan ítems imposibles de resolver, sin que ninguno de los extremos aporte información útil.
Una alternativa más precisa es la prueba adaptativa por computadora. En lugar de presentar los mismos reactivos a todos, selecciona en tiempo real los más adecuados para cada persona, ajustando la dificultad en función de sus respuestas anteriores. Esto permite medir de forma más eficiente, con menos preguntas y mayor precisión.
¿Cómo funciona una prueba adaptativa?
El procedimiento general es el siguiente:
- Se inicia con un reactivo de dificultad media o máxima información esperada.
- Si la respuesta es correcta, se selecciona un ítem más difícil.
- Si es incorrecta, se elige uno más fácil.
- Este ciclo continúa hasta que el sistema alcanza una estimación confiable del nivel de habilidad (θ).
Cada persona contesta una secuencia única de preguntas, adaptada a su desempeño. Esto reduce el número de ítems necesarios y mejora la experiencia del sustentante, evitando reactivos innecesarios.
Modelos estadísticos utilizados
La mayoría de las pruebas adaptativas se basa en la Teoría de Respuesta al Ítem (TRI), que modela la probabilidad de que una persona con cierto nivel de habilidad responda correctamente un ítem, según los parámetros del mismo. Los modelos más comunes son:
Modelo | Parámetros estimados |
---|---|
Rasch (1PL) | Dificultad (b) |
2PL | Dificultad (b), Discriminación (a) |
3PL | Dificultad (b), Discriminación (a), Pseudoacierto (c) |
Cada modelo permite una representación más compleja del comportamiento de los ítems. Cuanto más preciso el modelo, mayor la personalización, pero también se requieren más datos para calibrar el banco.
Simulación de una prueba adaptativa
A continuación se presenta una simulación realizada con el paquete catR
en R. Se utilizó un banco de 120 reactivos generados bajo un modelo Rasch (1PL). El nivel real de habilidad del sustentante se fijó en θ = 1.0. La prueba se detuvo automáticamente al alcanzar una precisión estándar (error estándar ≤ 0.3).
![Figura 1: Simulación de prueba adaptativa con modelo Rasch. θ real = 1.0, intervalo de confianza (95%) = [0.021, 1.189]. Longitud de la prueba: 39 ítems.](/images/adaptive.png)
Figura 1: Simulación de prueba adaptativa con modelo Rasch. θ real = 1.0, intervalo de confianza (95%) = [0.021, 1.189]. Longitud de la prueba: 39 ítems.
Ventajas principales
Mayor eficiencia
Al seleccionar solo los ítems más informativos, las pruebas adaptativas suelen requerir entre 30% y 50% menos reactivos que una prueba lineal para lograr el mismo nivel de precisión, especialmente con modelos complejos como el 3PL.
Precisión personalizada
La dificultad de los reactivos se ajusta automáticamente, lo que permite medir con precisión tanto a personas con baja como con alta habilidad. Esto mejora la calidad de la medición en los extremos de la escala, donde las pruebas tradicionales suelen fallar.
Mejor experiencia del sustentante
Al recibir preguntas más adecuadas a su nivel, la persona evaluada enfrenta un reto razonable y evita la frustración o el aburrimiento. Esto puede traducirse en mejores resultados y menor abandono.
Ahorro en tiempo y recursos
Menos preguntas significan pruebas más cortas, menor carga para quienes las presentan, menos exposición de ítems sensibles y, en algunos casos, menor costo logístico.
Limitaciones (próxima entrega)
Las pruebas adaptativas no son una solución universal. En la siguiente entrada revisaremos los requisitos técnicos que deben cumplirse para que funcionen correctamente:
- Tamaño y calibración del banco de reactivos
- Modelos estadísticos apropiados
- Cantidad mínima de datos por ítem
- Necesidades tecnológicas y logísticas
No siempre es viable implementar un sistema adaptativo, especialmente en contextos donde se requiere evaluar múltiples contenidos, emitir reportes por subárea o trabajar con poblaciones pequeñas.
Conclusión
Las pruebas adaptativas representan un avance significativo en la evaluación educativa. Cuando están bien diseñadas, permiten medir habilidades con mayor precisión y eficiencia, reduciendo la carga de evaluación y mejorando la experiencia del sustentante.
Sin embargo, su implementación exige bases técnicas sólidas, que abordaremos en la próxima entrega.
Las pruebas adaptativas son una herramienta poderosa, pero solo si se construyen sobre cimientos sólidos: buenos reactivos, buenos datos y buenos modelos.
- Wainer, H., Dorans, N. J., Flaugher, R., Green, B. F., Mislevy, R. J., Steinberg, L., & Thissen, D. (2000). Computerized adaptive testing: A primer. Lawrence Erlbaum.
- van der Linden, W. J., & Glas, C. A. (2000). Computerized adaptive testing: Theory and practice. Springer.
- Weiss, D. J. (1982). Improving measurement quality and efficiency with adaptive testing. Applied Psychological Measurement, 6(4), 473–492.