Проект llama.cpp выпустил версию b9870, которая включает исправление длинных циклов рассуждений, вызванных парсером StepFun. Обновление перемещает логику обрезки сообщений перед рендерингом для правильной обработки частей контента и пробелов.
- Исправляет длинные циклы рассуждений путем обрезки сообщений, отправляемых в парсер StepFun перед рендерингом.
- Применяет обрезку к тексту content_parts, строковому контенту и reasoning_content.
- Добавляет регрессионный тест для частей контента и удаляет дублирующийся шаблон.
- Отключает сборки macOS Apple Silicon (arm64, с включенным KleidiAI).
Это обновление предоставляет обновленные бинарные файлы для macOS, Linux, Windows, Android и openEuler на различных CPU и GPU бэкендах, обеспечивая доступность исправления парсера для пользователей на поддерживаемых платформах.