O projeto llama.cpp publicou o lançamento b9822, fornecendo binários pré-compilados para macOS, iOS, Linux, Android e Windows. Esta atualização inclui uma correção para a opção --no-common do test-chat-template e distribui builds para várias arquiteturas de hardware e aceleradores.

  • Binários para macOS Apple Silicon (arm64) e Intel (x64) estão disponíveis, com suporte KleidiAI desativado.
  • Os builds para Linux cobrem CPU Ubuntu x64 e arm64, CPU s390x, Vulkan, ROCm 7.2, OpenVINO e SYCL FP32/FP16.
  • Os lançamentos para Windows incluem variantes de CPU, OpenCL Adreno, CUDA 12.4 e 13.3, Vulkan, OpenVINO, SYCL e HIP.
  • Binários Android arm64 (CPU) e um XCFramework iOS estão incluídos na distribuição.
  • Builds openEuler para arquiteturas x86 e aarch64 estão listados, com algumas configurações desativadas.

O lançamento permite que os usuários executem o llama.cpp em uma ampla gama de dispositivos e aceleradores de GPU sem compilar a partir do código-fonte.