Versi llama.cpp b9761 memindahkan pengunduhan model ke proses anak khusus dan menambahkan pelacakan kemajuan secara real-time melalui /models/sse. Rilis ini mencakup biner untuk macOS, Linux, Android, Windows, dan openEuler, mendukung berbagai arsitektur dan akselerator perangkat keras seperti CUDA, Vulkan, OpenVINO, dan SYCL.