Proyek llama.cpp telah merilis versi b9835, yang mencakup perbaikan untuk fungsi henti dan loncatan penalaran dalam mode model tunggal. Pembaruan ini menangani masalah tertentu dalam antarmuka pengguna untuk meningkatkan kontrol selama inferensi model.
- macOS: Biner disediakan untuk Apple Silicon (arm64) dan Intel (x64), dengan KleidiAI dinonaktifkan pada Apple Silicon; iOS XCFramework disertakan.
- Linux: Build tersedia untuk Ubuntu x64 dan arm64 (CPU, Vulkan, ROCm 7.2, OpenVINO, SYCL FP32/FP16).
- Android: Biner CPU disediakan untuk arsitektur arm64.
- Windows: Biner untuk CPU x64 dan arm64, serta dukungan GPU melalui CUDA 12/13, Vulkan, OpenCL Adreno, OpenVINO, SYCL, dan HIP.
- openEuler: Build untuk x86 (310p, 910b ACL Graph) dan aarch64 (310p, 910b ACL Graph), dengan dukungan standar dinonaktifkan.
Rilis ini memastikan kompatibilitas perangkat keras yang lebih luas di berbagai sistem operasi dan akselerator sambil memperbaiki perilaku UI dalam skenario model tunggal.