Rilis llama.cpp b9864 memperkenalkan perubahan pada penanganan Server-Sent Events (SSE) server, memungkinkan interval ping dikonfigurasi per-permintaan. Pembaruan ini memastikan bahwa operasi prefill yang lambat tidak memutus koneksi sehat dengan memping stream diam setiap 1 detik dan memutusnya hanya setelah 3 detik.
- Default global untuk sse_ping_interval kembali ke 30, mempertahankan perilaku klien API sementara WebUI mengirimkan sse_ping_interval: 1 di body permintaan.
- Bidang ini sekarang adalah field_num bertipe dengan batas keras (-1, INT32_MAX) yang terikat pada task_params, memberikan validasi tipe dan rentang gratis.
- Build macOS mencakup Apple Silicon (arm64), Intel (x64), dan iOS XCFramework, dengan KleidiAI dinonaktifkan.
- Binari Linux tersedia untuk Ubuntu x64 dan arm64 (CPU, Vulkan, ROCm 7.2, OpenVINO, SYCL FP32/FP16).
- Windows mendukung CPU, OpenCL Adreno, CUDA 12/13, Vulkan, OpenVINO, SYCL, dan HIP.
- Build Android arm64 (CPU) dan openEuler x86/aarch64 (ACL Graph) juga disediakan.
Pembaruan ini membantu pengguna dengan mencegah pemutusan koneksi selama fase prefill yang lambat sambil memungkinkan WebUI mendeklarasikan kebutuhan kick visibilitas spesifiknya.