llama.cpp versi b9745 memperkenalkan dukungan untuk Step3.5/3.7 flash MTP3, termasuk API baru untuk offset layer dan flag nextn. Rilis ini menyediakan biner pra-dibangun untuk macOS, Linux, Android, Windows, dan openEuler, dengan opsi akselerasi CPU, Vulkan, CUDA, OpenVINO, dan SYCL.