Проект llama.cpp выпустил версию b9810, внедряющую отображение CUDA для `cublasSgemmBatched` в заголовках вендоров HIP/MUSA. Это обновление сопровождается комплексным набором предварительно собранных бинарных файлов для платформ macOS, Linux, Windows, Android и openEuler.

  • Добавлено отображение cublasSgemmBatched для заголовков вендоров HIP/MUSA через pull request #25033.
  • Отключена поддержка KleidiAI для сборок macOS Apple Silicon.
  • Предоставлены бинарные файлы для Ubuntu x64/arm64/s390x (CPU, Vulkan, ROCm 7.2, OpenVINO, SYCL FP32/FP16).
  • Включены сборки Windows для CPU, OpenCL Adreno, CUDA 12.4/13.3, Vulkan, OpenVINO, SYCL и HIP.
  • Выпущены iOS XCFramework, Android arm64 (CPU) и бинарные файлы macOS Apple Silicon/Intel.

Выпуск обеспечивает широкую совместимость с оборудованием, предлагая специфические сборки для различных ускорителей, таких как ROCm, SYCL и OpenVINO, наряду со стандартными версиями CPU.