Проект llama.cpp выпустил версию b9835, которая включает исправление функциональности остановки и пропуска рассуждений в режиме одной модели. Это обновление устраняет определенные проблемы в пользовательском интерфейсе для улучшения управления во время вывода модели.

  • macOS: Бинарные файлы предоставлены для Apple Silicon (arm64) и Intel (x64), с отключенным KleidiAI на Apple Silicon; включен iOS XCFramework.
  • Linux: Сборки доступны для Ubuntu x64 и arm64 (CPU, Vulkan, ROCm 7.2, OpenVINO, SYCL FP32/FP16).
  • Android: Предоставлен бинарный файл CPU для архитектуры arm64.
  • Windows: Бинарные файлы для процессоров x64 и arm64, а также поддержка GPU через CUDA 12/13, Vulkan, OpenCL Adreno, OpenVINO, SYCL и HIP.
  • openEuler: Сборки для x86 (310p, 910b ACL Graph) и aarch64 (310p, 910b ACL Graph), со стандартной поддержкой отключенной.

Выпуск обеспечивает более широкую совместимость оборудования на нескольких операционных системах и ускорителях, а также исправляет поведение интерфейса в сценариях одной модели.