Lançamento b9829 do llama.cpp: Redução de Logs e Binários Multiplataforma

O projeto llama.cpp lançou a versão b9829, que inclui uma redução da saída de logs no servidor, componentes comuns e módulos de decodificação especulativa. Esta atualização também padroniza as convenções de nomenclatura, substituindo CMN_ por COM_.

Os logs do servidor foram reduzidos para melhor controle de verbosidade.
As compilações para macOS Apple Silicon estão disponíveis, mas o suporte ao KleidiAI está desativado.
Os binários para Linux abrangem Ubuntu x64, arm64, s390x, Vulkan, ROCm 7.2, OpenVINO e SYCL FP32/FP16.
As versões para Windows incluem variantes de CPU, OpenCL Adreno, CUDA 12.4/13.3, Vulkan, OpenVINO, SYCL e HIP.
São fornecidos binários para Android arm64 (CPU) e iOS XCFramework.

O suporte ao openEuler está desativado para x86, mas disponível para aarch64 com ACL Graph.

Este lançamento fornece binários atualizados para desenvolvedores em vários sistemas operacionais e aceleradores de hardware, garantindo compatibilidade com versões recentes do CUDA e reduzindo o ruído de logs em ambientes de servidor.