O projeto llama.cpp lançou a versão b9829, que inclui uma redução da saída de logs no servidor, componentes comuns e módulos de decodificação especulativa. Esta atualização também padroniza as convenções de nomenclatura, substituindo CMN_ por COM_.

  • Os logs do servidor foram reduzidos para melhor controle de verbosidade.
  • As compilações para macOS Apple Silicon estão disponíveis, mas o suporte ao KleidiAI está desativado.
  • Os binários para Linux abrangem Ubuntu x64, arm64, s390x, Vulkan, ROCm 7.2, OpenVINO e SYCL FP32/FP16.
  • As versões para Windows incluem variantes de CPU, OpenCL Adreno, CUDA 12.4/13.3, Vulkan, OpenVINO, SYCL e HIP.
  • São fornecidos binários para Android arm64 (CPU) e iOS XCFramework.

O suporte ao openEuler está desativado para x86, mas disponível para aarch64 com ACL Graph.

Este lançamento fornece binários atualizados para desenvolvedores em vários sistemas operacionais e aceleradores de hardware, garantindo compatibilidade com versões recentes do CUDA e reduzindo o ruído de logs em ambientes de servidor.