Выпуск llama.cpp b9831 вводит поддержку DFlash v2, включая скользящее окно внимания для типов слоёв, а также обширный набор предварительно собранных бинарных файлов для нескольких платформ.
- Доступны сборки macOS Apple Silicon (arm64) и Intel (x64), а также iOS XCFramework.
- Бинарные файлы Linux охватывают Ubuntu x64 и arm64 CPU, s390x CPU, Vulkan, ROCm 7.2, OpenVINO и SYCL FP32/FP16.
- Предоставлены сборки Android arm64 CPU для мобильных устройств.
- Выпуски Windows включают варианты CPU, OpenCL Adreno, CUDA 12.4 и 13.3, Vulkan, OpenVINO, SYCL и HIP.
- Включены сборки openEuler x86 и aarch64 с поддержкой ACL Graph, в то время как macOS KleidiAI и общие сборки openEuler отключены.
Этот выпуск позволяет пользователям запускать llama.cpp на более широком спектре аппаратных ускорителей и операционных систем с новыми функциями оптимизации DFlash.