Проект llama.cpp выпустил версию b9848, которая включает критическое исправление для бэкенда CUDA для устранения проблем с функцией `get_rows_back` на таблицах, превышающих 65535 строк. Это обновление устраняет ошибки ограничения grid-y и шага, которые ранее влияли на операции с большими таблицами.

  • Исправлен CUDA `get_rows_back` для таблиц с более чем 65535 строками путем коррекции логики ограничения grid-y и шага (PR #25103).
  • Поддержка macOS Apple Silicon KleidiAI в этом выпуске ОТКЛЮЧЕНА.
  • Стандартные сборки openEuler ОТКЛЮЧЕНЫ, но специфичные сборки для x86 (310p, 910b ACL Graph) и aarch64 (310p, 910b ACL Graph) остаются доступными.
  • Бинарные файлы предоставляются для macOS (Apple Silicon arm64 и Intel x64), Linux (Ubuntu CPU, Vulkan, ROCm 7.2, OpenVINO, SYCL FP32/FP16), Android (arm64 CPU), Windows (CPU, OpenCL Adreno, CUDA 12/13, Vulkan, OpenVINO, SYCL, HIP) и автономного UI.

Этот выпуск обеспечивает стабильность для пользователей CUDA, работающих с большими структурами данных, а также предоставляет комплексные предварительно собранные бинарные файлы для основных операционных систем и аппаратных ускорителей.