llama.cpp versi b9747 memperkenalkan pelacakan kemajuan pemuatan model secara real-time melalui endpoint SSE. Rilis ini mencakup biner untuk macOS, Linux, Android, Windows, dan openEuler, mendukung berbagai arsitektur dan teknologi akselerasi seperti Vulkan, CUDA, OpenVINO, dan SYCL.