llama.cpp merilis versi b9688, menambahkan API manajemen model dan pembaruan realtime SSE. Rilis ini mencakup binari pra-bangun untuk macOS, Linux, Android, Windows, dan openEuler, mendukung berbagai arsitektur dan framework akselerasi seperti Vulkan, CUDA, OpenVINO, dan SYCL.