A versão b9745 do llama.cpp introduz suporte para Step3.5/3.7 flash MTP3, incluindo novas APIs para flags de deslocamento de camada e nextn. O lançamento fornece binários pré-compilados para macOS, Linux, Android, Windows e openEuler, com opções de aceleração via CPU, Vulkan, CUDA, OpenVINO e SYCL.