La liberación de llama.cpp b9850 introduce actualizaciones específicas de soporte para modelos, incluyendo el registro del tensor t_layer_inp para Qwen3Next, la corrección de la asignación de entrada en el bucle de procesamiento de capas y la resolución de problemas con DFLASH para qwen-coder-next. También añade un tensor para la normalización de atención en el modelo Qwen3.

  • Están disponibles binarios para macOS Apple Silicon (arm64), mientras que el soporte de KleidiAI está deshabilitado.
  • Las compilaciones para Linux cubren Ubuntu x64 y arm64 CPU, Vulkan, ROCm 7.2, OpenVINO y variantes SYCL FP32/FP16.
  • Se proporcionan binarios para Android arm64 CPU para dispositivos móviles.
  • Las versiones para Windows incluyen backends de CPU, OpenCL Adreno, CUDA 12.4/13.3, Vulkan, OpenVINO, SYCL y HIP.
  • Se incluyen compilaciones para openEuler en las arquitecturas x86 y aarch64 con soporte de ACL Graph.

Esta actualización proporciona a los usuarios un manejo corregido de modelos para la serie Qwen3 y opciones expandidas de aceleración de hardware a través de múltiples sistemas operativos y arquitecturas de GPU.