La release b9864 de llama.cpp introduit un changement dans la gestion des Server-Sent Events (SSE) du serveur, permettant de configurer l'intervalle de ping au cas par cas. Cette mise à jour garantit que les opérations de prefill lentes ne coupent pas les connexions saines en envoyant un ping aux flux silencieux toutes les 1 seconde et en les interrompant uniquement après 3 secondes.
- La valeur par défaut globale pour sse_ping_interval revient à 30, maintenant le comportement du client API tandis que le WebUI envoie sse_ping_interval: 1 dans le corps de la requête.
- Le champ est désormais un field_num typé avec des limites dures (-1, INT32_MAX) liées à task_params, fournissant une validation gratuite de type et de plage.
- Les builds macOS incluent Apple Silicon (arm64), Intel (x64) et iOS XCFramework, avec KleidiAI désactivé.
- Les binaires Linux sont disponibles pour Ubuntu x64 et arm64 (CPU, Vulkan, ROCm 7.2, OpenVINO, SYCL FP32/FP16).
- Windows prend en charge CPU, OpenCL Adreno, CUDA 12/13, Vulkan, OpenVINO, SYCL et HIP.
- Des builds pour Android arm64 (CPU) et openEuler x86/aarch64 (ACL Graph) sont également fournis.
Cette mise à jour aide les utilisateurs en empêchant les coupures de connexion pendant les phases de prefill lentes tout en permettant au WebUI de déclarer ses besoins spécifiques en matière de cadence de kick de visibilité.