Версия llama.cpp b9718 объединяет выбор слотов в одну функцию get_available_slot, сохраняя проверки сходства LCP для обновлений кэша промптов. В релиз входят бинарные сборки для macOS, Linux, Android, Windows и openEuler с поддержкой различных архитектур и вариантов аппаратного ускорения.
llama.cpp выпускает b9718: объединённый выбор слотов и новые бинарные сборки
Переведено с English → Русский