Un nuevo estudio revela que más de 1.000 escritos legales contienen citas fabricadas, con un número que aumenta anualmente. La evaluación de cinco modelos de IA muestra un rendimiento mejorado, con GPT-5 alcanzando una recuperación del 82,8% y un F1 de 60,5 en entornos agénticos, aunque todos los modelos tienen dificultades con errores sutiles y enfrentan limitaciones de recursos debido al acceso limitado a la información.