Проект llama.cpp выпустил версию b9870, которая включает исправление длинных циклов рассуждений, вызванных парсером StepFun. Обновление перемещает логику обрезки сообщений перед рендерингом для правильной обработки частей контента и пробелов.

  • Исправляет длинные циклы рассуждений путем обрезки сообщений, отправляемых в парсер StepFun перед рендерингом.
  • Применяет обрезку к тексту content_parts, строковому контенту и reasoning_content.
  • Добавляет регрессионный тест для частей контента и удаляет дублирующийся шаблон.
  • Отключает сборки macOS Apple Silicon (arm64, с включенным KleidiAI).

Это обновление предоставляет обновленные бинарные файлы для macOS, Linux, Windows, Android и openEuler на различных CPU и GPU бэкендах, обеспечивая доступность исправления парсера для пользователей на поддерживаемых платформах.