La versión b9777 de LLaMA.cpp añade los modelos LFM2.5-ColBERT-350M y LFM2.5-Embedding-350M. La versión incluye binarios precompilados para macOS, Linux, Android, Windows y openEuler, compatibles con diversas arquitecturas y tecnologías de aceleración como CUDA, Vulkan, OpenVINO y SYCL.