La versión b9831 de llama.cpp introduce soporte para DFlash v2, incluyendo atención de ventana deslizante por tipo de capa, junto con un conjunto completo de binarios precompilados para múltiples plataformas.
- Están disponibles compilaciones para macOS Apple Silicon (arm64) e Intel (x64), además de un XCFramework para iOS.
- Los binarios de Linux cubren CPU Ubuntu x64 y arm64, CPU s390x, Vulkan, ROCm 7.2, OpenVINO y SYCL FP32/FP16.
- Se proporcionan compilaciones de CPU arm64 para Android en dispositivos móviles.
- Las versiones de Windows incluyen variantes de CPU, OpenCL Adreno, CUDA 12.4 y 13.3, Vulkan, OpenVINO, SYCL e HIP.
- Se incluyen compilaciones de openEuler x86 y aarch64 con soporte para ACL Graph, mientras que las compilaciones genéricas de macOS KleidiAI y openEuler están deshabilitadas.
Esta versión permite a los usuarios ejecutar llama.cpp en una gama más amplia de aceleradores de hardware y sistemas operativos con las nuevas funciones de optimización DFlash.