llama.cpp b9864 릴리스는 서버의 Server-Sent Events (SSE) 처리에 변경을 도입하여 핑 간격을 요청별로 구성할 수 있게 합니다. 이 업데이트는 느린 prefill 작업이 건강한 연결을 끊지 않도록 하며, 침묵하는 스트림에는 매초 ping 을 보내고 3 초 후에만 끊습니다.
- sse_ping_interval 의 전역 기본값은 30 으로 복귀하여 API 클라이언트 동작을 유지하는 동안 WebUI 는 요청 본문에 sse_ping_interval: 1 을 보냅니다.
- 해당 필드는 이제 typed field_num 이며 task_params 에 바인드된 하드 제한 (-1, INT32_MAX) 을 제공하여 무료 타입 및 범위 검증을 제공합니다.
- macOS 빌드에는 Apple Silicon (arm64), Intel (x64), iOS XCFramework 가 포함되며 KleidiAI 는 비활성화됩니다.
- Linux 바이너리는 Ubuntu x64 및 arm64 (CPU, Vulkan, ROCm 7.2, OpenVINO, SYCL FP32/FP16) 에 대해 제공됩니다.
- Windows 는 CPU, OpenCL Adreno, CUDA 12/13, Vulkan, OpenVINO, SYCL, HIP 를 지원합니다.
- Android arm64 (CPU) 및 openEuler x86/aarch64 (ACL Graph) 빌드도 제공됩니다.
이 업데이트는 느린 prefill 단계 동안 연결 끊김을 방지하면서 WebUI 가 특정 가시성 킥 주기를 선언할 수 있도록 합니다.