Le projet llama.cpp a publié la version b9843, fournissant des binaires précompilés pour macOS, Linux, Android, Windows et openEuler sur diverses architectures matérielles.

  • Annule la PR #20793 pour réintroduire moins de synchronisations lors du calcul fractionné.
  • Désactive le support de KleidiAI pour les builds macOS Apple Silicon.
  • Fournit des variantes CPU, Vulkan, ROCm, OpenVINO, SYCL, CUDA, HIP et OpenCL pour Linux et Windows.
  • Inclut l'XCFramework iOS, Android arm64 (CPU) et les binaires d'interface utilisateur.

Cette version permet aux utilisateurs d'exécuter llama.cpp sur une large gamme d'appareils et d'accélérateurs sans compiler depuis les sources.