llama.cpp 版本 b9742 引入了用于 SSM-conv 权重的填充步长,提升了神经网络操作的效率。该版本提供了适用于 macOS、Linux、Android、Windows 和 openEuler 的二进制文件,支持多种架构以及包括 Vulkan、CUDA、OpenVINO 和 SYCL 在内的多个 API。