La version b9677 de llama.cpp met à jour la journalisation pour imposer max_capacity et supprime la logique d'expansion de la file d'attente. La release inclut des binaires pour macOS, Linux, Android, Windows et openEuler sur plusieurs architectures et options d'accélération matérielle, dont Vulkan, CUDA, OpenVINO et SYCL.