llama.cpp был обновлён для поддержки загрузки и управления моделями через API. Это позволяет осуществлять полный контроль над жизненным циклом моделей через вызовы API без необходимости использования пользовательского интерфейса.