Проект llama.cpp выпустил версию b9867, добавляющую поддержку спецификации spec-draft-p-min в DFlash. Это обновление включает изменения кода для добавления защиты n_min и обеспечения правильной защиты как n_min, так и n_max.

  • Поддержка spec-draft-p-min в DFlash через pull request #25246.
  • Добавление защиты n_min в модуле dflash.
  • Защита параметров n_min и n_max.
  • Предоставлены бинарные файлы для macOS Apple Silicon (arm64), при этом поддержка KleidiAI отключена.
  • Доступны сборки для Linux: Ubuntu x64/arm64/s390x с бэкендами CPU, Vulkan, ROCm 7.2, OpenVINO и SYCL.
  • Выпущены бинарные файлы Android arm64 (CPU).
  • Сборки Windows x64/arm64 поддерживают CPU, OpenCL Adreno, CUDA 12/13, Vulkan, OpenVINO, SYCL и HIP.
  • Доступны сборки openEuler x86 и aarch64 для 310p и 910b (ACL Graph).

Этот выпуск предоставляет обновленные бинарные файлы для нескольких платформ и аппаратных ускорителей, позволяя пользователям запускать llama.cpp с поддержкой новой спецификации DFlash.