O projeto llama.cpp publicou o lançamento b9843, fornecendo binários pré-compilados para macOS, Linux, Android, Windows e openEuler em várias arquiteturas de hardware.

  • Reverte o PR #20793 para reintroduzir menos sincronizações durante o cálculo dividido.
  • Desativa o suporte ao KleidiAI para builds do macOS Apple Silicon.
  • Fornece variantes para CPU, Vulkan, ROCm, OpenVINO, SYCL, CUDA, HIP e OpenCL para Linux e Windows.
  • Inclui XCFramework para iOS, arm64 (CPU) para Android e binários de UI.

Este lançamento permite que os usuários executem o llama.cpp em uma ampla gama de dispositivos e aceleradores sem compilar a partir do código-fonte.