Проект llama.cpp выпустил версию b9829, которая включает сокращение вывода логов в сервере, общих компонентах и модулях спекулятивного декодирования. Это обновление также стандартизирует соглашения об именах, заменяя CMN_ на COM_.

  • Логи сервера были сокращены для лучшего контроля детализации.
  • Сборки для macOS Apple Silicon доступны, но поддержка KleidiAI отключена.
  • Бинарники Linux охватывают Ubuntu x64, arm64, s390x, Vulkan, ROCm 7.2, OpenVINO и SYCL FP32/FP16.
  • Релизы Windows включают варианты CPU, OpenCL Adreno, CUDA 12.4/13.3, Vulkan, OpenVINO, SYCL и HIP.
  • Предоставлены бинарники Android arm64 (CPU) и iOS XCFramework.
  • Поддержка openEuler отключена для x86, но доступна для aarch64 с ACL Graph.

Этот выпуск предоставляет обновленные бинарники для разработчиков на различных операционных системах и аппаратных ускорителях, обеспечивая совместимость с последними версиями CUDA и снижая уровень шума в логах серверных сред.