O lançamento b9850 do llama.cpp introduz atualizações de suporte específico a modelos, incluindo o registro do tensor t_layer_inp para Qwen3Next, correção da atribuição de entrada no loop de processamento da camada e resolução de problemas DFLASH para qwen-coder-next. Também adiciona um tensor para normalização de atenção no modelo Qwen3.
- Binários para macOS Apple Silicon (arm64) estão disponíveis, enquanto o suporte ao KleidiAI está desativado.
- As compilações para Linux abrangem CPU Ubuntu x64 e arm64, Vulkan, ROCm 7.2, OpenVINO e variantes SYCL FP32/FP16.
- Binários para Android arm64 CPU são fornecidos para dispositivos móveis.
- Os lançamentos para Windows incluem backends de CPU, OpenCL Adreno, CUDA 12.4/13.3, Vulkan, OpenVINO, SYCL e HIP.
- Compilações para openEuler para arquiteturas x86 e aarch64 com suporte a ACL Graph estão incluídas.
Esta atualização fornece aos usuários o tratamento corrigido de modelos para a série Qwen3 e opções expandidas de aceleração de hardware em vários sistemas operacionais e arquiteturas de GPU.