AB-RAG: Generación Aumentada por Recuperación con Presupuesto Adaptativo para Respuestas a Preguntas Confiables

AB-RAG es un marco de trabajo libre de entrenamiento y agnóstico al backbone que ajusta dinámicamente los esfuerzos de recuperación basándose en una estimación de confianza derivada de la certeza del modelo, el acuerdo entre la respuesta y la evidencia recuperada, y la varianza de las puntuaciones de recuperación. Este enfoque permite a los sistemas decidir si detenerse o recuperar más evidencia dentro de un presupuesto fijo sin reentrenar el modelo de lenguaje subyacente.

El estimador de confianza combina tres señales: certeza directa del modelo (o aproximación de autoconsistencia para APIs cerradas), acuerdo entre la respuesta generada y la evidencia recuperada, y la varianza de las puntuaciones de recuperación. En un conjunto de datos de hechos, este método logró una separación limpia del 57,6% frente al 0% de Exact Match entre respuestas de alta y baja confianza. La política adaptativa mejora la precisión en backbones capaces, aunque el estudio señala que la señal de confianza no fue adecuada para respuestas cortas.

Este marco ofrece valor práctico para sistemas comerciales basados en APIs al optimizar el uso de cómputo y proporcionar señales de confianza para las respuestas generadas sin requerir reentrenamiento del modelo ni acceso a parámetros internos.