Выпуск llama.cpp b9820: уменьшено количество синхронизаций CUDA и новые бинарные файлы
Выпуск llama.cpp b9820 вносит улучшения производительности за счёт повторного введения меньшего количества синхронизаций при разделённых вычислениях, ориентированных на бэкенды CUDA. Это обновление также предоставляет предварительно собранные бинарные файлы для macOS, Linux, Windows, Android и openEuler для процессоров, графических ускорителей и специализированных аппаратных ускорителей.