Escalar el horizonte, no los parámetros: alcanzar rendimiento de billones de parámetros con un agente de 35B
Los investigadores presentan Agents-A1, un modelo Mixture-of-Experts de 35B que logra un rendimiento comparable al de modelos de billones de parámetros escalando el horizonte del agente en lugar del conteo de parámetros. El enfoque se centra en extender trayectorias de largo alcance y unificar habilidades heterogéneas de agentes a través de una infraestructura de entrenamiento especializada.