El lanzamiento llama.cpp b9864 introduce un cambio en el manejo de Eventos Enviados por el Servidor (SSE) del servidor, permitiendo configurar el intervalo de ping a nivel de solicitud. Esta actualización asegura que las operaciones lentas de prellenado no interrumpan conexiones sanas al enviar pings a los flujos silenciosos cada 1 segundo y cerrándolos solo después de 3 segundos.
- El valor predeterminado global para sse_ping_interval vuelve a ser 30, manteniendo el comportamiento del cliente de la API mientras que la WebUI envía sse_ping_interval: 1 en el cuerpo de la solicitud.
- El campo es ahora un field_num tipado con límites estrictos (-1, INT32_MAX) vinculado a task_params, proporcionando validación gratuita de tipo y rango.
- Las compilaciones para macOS incluyen Apple Silicon (arm64), Intel (x64) y iOS XCFramework, con KleidiAI deshabilitado.
- Los binarios para Linux están disponibles para Ubuntu x64 y arm64 (CPU, Vulkan, ROCm 7.2, OpenVINO, SYCL FP32/FP16).
- Windows soporta CPU, OpenCL Adreno, CUDA 12/13, Vulkan, OpenVINO, SYCL e HIP.
- También se proporcionan compilaciones para Android arm64 (CPU) y openEuler x86/aarch64 (ACL Graph).
Esta actualización ayuda a los usuarios al prevenir la interrupción de conexiones durante las fases lentas de prellenado mientras permite que la WebUI declare sus necesidades específicas de cadencia de cierre por visibilidad.