LLaMA.cpp 发布 b9777,新增了 LFM2.5-ColBERT-350M 和 LFM2.5-Embedding-350M 模型。该版本包含适用于 macOS、Linux、Android、Windows 和 openEuler 的预构建二进制文件,支持多种架构以及 CUDA、Vulkan、OpenVINO 和 SYCL 等加速技术。