El proyecto llama.cpp ha publicado el lanzamiento b9843, proporcionando binarios precompilados para macOS, Linux, Android, Windows y openEuler en varias arquitecturas de hardware.

  • Revierte el PR #20793 para reintroducir menos sincronizaciones durante el cálculo dividido.
  • Desactiva el soporte de KleidiAI para las compilaciones de Apple Silicon en macOS.
  • Proporciona variantes para CPU, Vulkan, ROCm, OpenVINO, SYCL, CUDA, HIP y OpenCL para Linux y Windows.
  • Incluye XCFramework para iOS, binarios arm64 (CPU) para Android y binarios de interfaz de usuario.

Este lanzamiento permite a los usuarios ejecutar llama.cpp en una amplia gama de dispositivos y aceleradores sin compilar desde el código fuente.