La version b9742 de llama.cpp introduit une marche en retrait pour les poids SSM-conv, améliorant l'efficacité des opérations de réseau neuronal. La release inclut des binaires pour macOS, Linux, Android, Windows et openEuler sur plusieurs architectures et APIs incluant Vulkan, CUDA, OpenVINO et SYCL.