SABER-Math: Benchmark automatizado para la evaluación de recuperación de información en matemáticas
Los investigadores presentan SABER-Math, el primer benchmark completamente automatizado para evaluar la recuperación de información matemática sin anotación experta, abordando la dificultad de aislar los efectos del recuperador en el rendimiento posterior.