Запрос на слияние (pull request) в llama.cpp решает проблему, при которой обрезка входных данных была реализована некорректно, что ранее ухудшало производительность Step 3.7 Flash.
- Исправление устраняет конкретную ошибку в обработке входных данных, вызывавшую медленную работу механизма рассуждений.
- Это изменение направлено на то, чтобы сделать модель пригодной для задач, требующих длинных рассуждений.
Обновление имеет большое значение для пользователей, которые избегали Step 3.7 Flash из-за его плохой производительности по сравнению с более ранними версиями, такими как Step 3.5 Flash.