Призыв к изменению добавляет поддержку Flash MTP3 Step3.5 и Step3.7 в llama.cpp. Это улучшение обеспечивает более высокую производительность при работе с определёнными моделями за счёт использования операций MTP3 на нескольких слоях. Обновление доступно в последней версии llama.cpp и является продолжением запроса PR #23274.
Добавлено поддержка Flash MTP3 Step3.5/3.7
Переведено с English → Русский