В релизе llama.cpp b9864 внесены изменения в обработку Server-Sent Events (SSE) сервером, позволяющие настраивать интервал ping для каждого запроса. Это обновление гарантирует, что медленные операции префилла не разрывают рабочие соединения: молчащие потоки пингуются каждую 1 секунду и отключаются только после 3 секунд.
- Глобальное значение по умолчанию sse_ping_interval возвращается к 30, сохраняя поведение API-клиентов, в то время как WebUI отправляет sse_ping_interval: 1 в теле запроса.
- Поле теперь является типизированным field_num с жесткими пределами (-1, INT32_MAX), привязанными к task_params, что обеспечивает бесплатную проверку типов и диапазонов.
- Сборки macOS включают Apple Silicon (arm64), Intel (x64) и iOS XCFramework, при этом KleidiAI отключен.
- Для Linux доступны бинарники для Ubuntu x64 и arm64 (CPU, Vulkan, ROCm 7.2, OpenVINO, SYCL FP32/FP16).
- Windows поддерживает CPU, OpenCL Adreno, CUDA 12/13, Vulkan, OpenVINO, SYCL и HIP.
- Также предоставлены сборки Android arm64 (CPU) и openEuler x86/aarch64 (ACL Graph).
Это обновление помогает пользователям, предотвращая разрыв соединений во время медленных фаз префилла, позволяя WebUI объявлять свои специфические потребности в частоте отключения видимости.