Versi b9677 dari llama.cpp memperbarui logging untuk memaksakan max_capacity dan menghapus logika ekspansi antrian. Rilis ini mencakup binari untuk macOS, Linux, Android, Windows, dan openEuler di berbagai arsitektur dan opsi akselerasi perangkat keras, termasuk Vulkan, CUDA, OpenVINO, dan SYCL.