llama.cpp b9870 release fixes StepFun parser loops

Проект llama.cpp выпустил версию b9870, которая включает исправление длинных циклов рассуждений, вызванных парсером StepFun. Обновление перемещает логику обрезки сообщений перед рендерингом для правильной обработки частей контента и пробелов.

Исправляет длинные циклы рассуждений путем обрезки сообщений, отправляемых в парсер StepFun перед рендерингом.
Применяет обрезку к тексту content_parts, строковому контенту и reasoning_content.
Добавляет регрессионный тест для частей контента и удаляет дублирующийся шаблон.
Отключает сборки macOS Apple Silicon (arm64, с включенным KleidiAI).

Это обновление предоставляет обновленные бинарные файлы для macOS, Linux, Windows, Android и openEuler на различных CPU и GPU бэкендах, обеспечивая доступность исправления парсера для пользователей на поддерживаемых платформах.