DART: Enrutamiento sin entrenamiento para presupuestos de pensamiento adaptativos

DART permite a los modelos de razonamiento híbrido enrutar consultas entre respuesta directa y pensamiento extendido sin datos de entrenamiento. Utiliza dos borradores sin pensar para decidir el modo de respuesta y estima el presupuesto de pensamiento a partir del desacuerdo entre borradores. DART mejora la precisión hasta en 9.0 puntos en matemáticas y 22.-5 puntos en razonamiento de código, mientras reduce los tokens de pensamiento entre un 15-69% y un 51-63% respectivamente.