Conjunto de datos AIriskEval-edu-db2 para la evaluación de riesgos en explicaciones de IA para K-12

Los investigadores presentan AIriskEval-edu-db2, un nuevo conjunto de datos diseñado para entrenar y evaluar auditores basados en LLM para la evaluación pedagógica de riesgos en contenido educativo de K-12. El conjunto de datos contiene 1.639 explicaciones derivadas de 170 preguntas de ScienceQA en ciencias, artes del lenguaje y ciencias sociales.

Cada pregunta incluye una explicación escrita por humanos junto con 11 generadas perfiles de profesores simulados por LLM con riesgos pedagógicos distintos.
Una rúbrica integral de riesgos cubre cinco dimensiones: precisión factual, profundidad y completitud, enfoque y relevancia, adecuación al nivel del estudiante y sesgo ideológico.
El conjunto de datos añade 785 explicaciones con anotaciones de explicabilidad estructuradas, incluyendo localización y descripción de riesgos, validadas por profesores expertos.
Los experimentos de validación comparan modelos propietarios contra un modelo Llama 3.1 8B local afinado para la detección de riesgos y evaluación de explicabilidad.

El estudio evalúa si el ajuste fino supervisado en este conjunto de datos permite que un modelo desplegable localmente se acerque o supere a modelos fronterizos más fuertes mientras preserva la privacidad en la auditoría educativa.