Una solicitud de extracción (pull request) en llama.cpp aborda un problema donde el recorte de la entrada se implementó incorrectamente, lo que anteriormente obstaculizaba el rendimiento de Step 3.7 Flash.
- La corrección apunta a un error específico en el manejo de entradas que causaba capacidades de razonamiento lentas.
- Este cambio tiene como objetivo hacer que el modelo sea utilizable para tareas que requieren razonamiento extenso.
La actualización es significativa para los usuarios que han evitado Step 3.7 Flash debido a su mal rendimiento en comparación con versiones anteriores como Step 3.5 Flash.