Проект llama.cpp выпустил версию b9837, которая вводит новый флаг `--reasoning-preserve` для шаблона чата Jinja, чтобы сохранять токены рассуждения. Это обновление также включает исправленные сообщения справки и предоставляет предварительно собранные бинарные файлы для macOS, Linux, Windows, Android и openEuler для различных аппаратных бэкендов.

  • Добавлен флаг `--reasoning-preserve` в шаблоны jinja и чата для сохранения содержимого рассуждения.
  • Исправлен текст сообщения справки внутри кодовой базы.
  • Отключена поддержка KleidiAI для сборок macOS Apple Silicon.
  • Выпущены бинарные файлы для Ubuntu (CPU, Vulkan, ROCm 7.2, OpenVINO, SYCL), Windows (CPU, CUDA 12/13, Vulkan, OpenVINO, SYCL, HIP) и macOS (Apple Silicon и Intel).

Этот выпуск позволяет пользователям получать доступ к последним функциям llama.cpp на широком спектре платформ и аппаратных ускорителей, обеспечивая при этом специфический контроль над обработкой токенов рассуждения в шаблонах чата.