La version b9777 de LLaMA.cpp ajoute les modèles LFM2.5-ColBERT-350M et LFM2.5-Embedding-350M. La release inclut des binaires précompilés pour macOS, Linux, Android, Windows et openEuler, prenant en charge diverses architectures et technologies d'accélération telles que CUDA, Vulkan, OpenVINO et SYCL.