Проект llama.cpp выпустил версию b9837, которая вводит новый флаг `--reasoning-preserve` для шаблона чата Jinja, чтобы сохранять токены рассуждения. Это обновление также включает исправленные сообщения справки и предоставляет предварительно собранные бинарные файлы для macOS, Linux, Windows, Android и openEuler для различных аппаратных бэкендов.
- Добавлен флаг `--reasoning-preserve` в шаблоны jinja и чата для сохранения содержимого рассуждения.
- Исправлен текст сообщения справки внутри кодовой базы.
- Отключена поддержка KleidiAI для сборок macOS Apple Silicon.
- Выпущены бинарные файлы для Ubuntu (CPU, Vulkan, ROCm 7.2, OpenVINO, SYCL), Windows (CPU, CUDA 12/13, Vulkan, OpenVINO, SYCL, HIP) и macOS (Apple Silicon и Intel).
Этот выпуск позволяет пользователям получать доступ к последним функциям llama.cpp на широком спектре платформ и аппаратных ускорителей, обеспечивая при этом специфический контроль над обработкой токенов рассуждения в шаблонах чата.