La versión b9742 de llama.cpp introduce un paso relleno para los pesos SSM-conv, mejorando la eficiencia en las operaciones de redes neuronales. El lanzamiento incluye binarios para macOS, Linux, Android, Windows y openEuler en múltiples arquitecturas y APIs que incluyen Vulkan, CUDA, OpenVINO y SYCL.