O projeto llama.cpp lançou a versão b9803, que inclui uma correção para o OpenCL para liberar lotes de perfilamento no desligamento para lotes incompletos. Esta atualização fornece binários para macOS, Linux, Windows, Android e openEuler em vários backends de hardware.

  • Compilações para macOS Apple Silicon (arm64) e Intel (x64) estão disponíveis, com KleidiAI desabilitado.
  • O Linux suporta CPU Ubuntu x64 e arm64, Vulkan, ROCm 7.2, OpenVINO e SYCL FP32/FP16.
  • O Windows oferece compilações para CPU, CUDA 12.4/13.3, Vulkan, OpenVINO, SYCL, HIP e OpenCL Adreno.
  • Binários Android arm64 (CPU) e iOS XCFramework estão incluídos.
  • openEuler suporta x86 e aarch64 com ACL Graph, enquanto o pull request padrão do openEuler está desabilitado.

O lançamento garante compatibilidade em diversas configurações de hardware e corrige o tratamento de dados de perfilamento para usuários de OpenCL.