Versi llama.cpp b9704 sekarang mengembalikan HTTP 400 untuk tata bahasa yang tidak valid alih-alih secara diam-diam membuang batasan. Rilis ini mencakup biner untuk macOS, Linux, Android, Windows, dan openEuler di berbagai arsitektur dan akselerator perangkat keras, dengan dukungan untuk Vulkan, ROCm, OpenVINO, SYCL, dan CUDA.