Выпуск llama.cpp b9810 добавляет отображение cublasSgemmBatched и новые бинарные файлы
Проект llama.cpp выпустил версию b9810, внедряющую отображение CUDA для `cublasSgemmBatched` в заголовках вендоров HIP/MUSA. Это обновление сопровождается комплексным набором предварительно собранных бинарных файлов для платформ macOS, Linux, Windows, Android и openEuler.