Проект llama.cpp выпустил версию b9867, добавляющую поддержку спецификации spec-draft-p-min в DFlash. Это обновление включает изменения кода для добавления защиты n_min и обеспечения правильной защиты как n_min, так и n_max.
- Поддержка spec-draft-p-min в DFlash через pull request #25246.
- Добавление защиты n_min в модуле dflash.
- Защита параметров n_min и n_max.
- Предоставлены бинарные файлы для macOS Apple Silicon (arm64), при этом поддержка KleidiAI отключена.
- Доступны сборки для Linux: Ubuntu x64/arm64/s390x с бэкендами CPU, Vulkan, ROCm 7.2, OpenVINO и SYCL.
- Выпущены бинарные файлы Android arm64 (CPU).
- Сборки Windows x64/arm64 поддерживают CPU, OpenCL Adreno, CUDA 12/13, Vulkan, OpenVINO, SYCL и HIP.
- Доступны сборки openEuler x86 и aarch64 для 310p и 910b (ACL Graph).
Этот выпуск предоставляет обновленные бинарные файлы для нескольких платформ и аппаратных ускорителей, позволяя пользователям запускать llama.cpp с поддержкой новой спецификации DFlash.