MedGuards: Sistema Multiagente para la Detección y Corrección Confiable de Errores Médicos
Los autores proponen MedGuards, un marco de guardrails de seguridad médica diseñado para detectar y corregir errores en el texto generado por Modelos de Lenguaje Grandes. Este sistema aborda el manejo de errores como una tarea de aprendizaje in-contexto multiagente donde agentes especializados realizan por separado la detección, localización y corrección. Un mecanismo de arbitraje guiado por confianza resuelve desacuerdos entre los agentes utilizando trazas de razonamiento y puntuaciones de confianza sin requerir entrenamiento adicional del modelo. El estudio introduce la Puntuación de Corrección Priorizada por Palabras Clave (KPCS), una nueva métrica que evalúa la precisión de las palabras clave críticas dentro del texto de referencia. Los experimentos realizados en cuatro conjuntos de datos médicos multilingües de notas clínicas demuestran mejoras significativas en las métricas de rendimiento. Estos resultados destacan una mayor interpretabilidad, robustez y adaptabilidad para un despliegue más seguro de LLMs en el sector salud. El código del benchmark MedErrBench está disponible públicamente en GitHub.