Версия llama.cpp b9718 объединяет выбор слотов в одну функцию get_available_slot, сохраняя проверки сходства LCP для обновлений кэша промптов. В релиз входят бинарные сборки для macOS, Linux, Android, Windows и openEuler с поддержкой различных архитектур и вариантов аппаратного ускорения.