llama.cpp release b9761: загрузка модели и обновления платформы

Версия llama.cpp b9761 перемещает загрузку моделей в отдельный дочерний процесс и добавляет отслеживание прогресса в реальном времени через /models/sse. В этом выпуске представлены бинарные файлы для macOS, Linux, Android, Windows и openEuler, поддерживающие различные архитектуры и ускорители аппаратного обеспечения, такие как CUDA, Vulkan, OpenVINO и SYCL.