A release b9777 do LLaMA.cpp adiciona os modelos LFM2.5-ColBERT-350M e LFM2.5-Embedding-350M. A release inclui binários pré-compilados para macOS, Linux, Android, Windows e openEuler, suportando várias arquiteturas e tecnologias de aceleração como CUDA, Vulkan, OpenVINO e SYCL.