O projeto llama.cpp lançou a versão b9838, fornecendo binários pré-compilados para uma ampla gama de sistemas operacionais e aceleradores de hardware. Este lançamento inclui suporte para CPU, GPU (CUDA, Vulkan, ROCm, OpenCL) e aceleradores de IA especializados em macOS, Linux, Windows, Android e openEuler.

  • Builds para macOS disponíveis para Apple Silicon (arm64) e Intel (x64), com suporte KleidiAI desativado.
  • Binários para Linux fornecidos para as arquiteturas Ubuntu x64, arm64 e s390x, incluindo variantes de CPU, Vulkan, ROCm 7.2, OpenVINO e SYCL.
  • Lançamentos para Windows incluem builds de CPU, CUDA 12/13, Vulkan, OpenCL Adreno, OpenVINO, SYCL e HIP para x64 e arm64.
  • O suporte para Android se limita a builds de CPU arm64.
  • Builds para openEuler estão disponíveis para as arquiteturas x86 e aarch64 usando ACL Graph, com suporte padrão do openEuler desativado.

O lançamento permite que os usuários implantem o llama.cpp em diversas configurações de hardware sem precisar compilar a partir do código-fonte.