Запрос на слияние (pull request) в llama.cpp решает проблему, при которой обрезка входных данных была реализована некорректно, что ранее ухудшало производительность Step 3.7 Flash.

  • Исправление устраняет конкретную ошибку в обработке входных данных, вызывавшую медленную работу механизма рассуждений.
  • Это изменение направлено на то, чтобы сделать модель пригодной для задач, требующих длинных рассуждений.

Обновление имеет большое значение для пользователей, которые избегали Step 3.7 Flash из-за его плохой производительности по сравнению с более ранними версиями, такими как Step 3.5 Flash.