Проект llama.cpp выпустил версию b9835, которая включает исправление функциональности остановки и пропуска рассуждений в режиме одной модели. Это обновление устраняет определенные проблемы в пользовательском интерфейсе для улучшения управления во время вывода модели.
- macOS: Бинарные файлы предоставлены для Apple Silicon (arm64) и Intel (x64), с отключенным KleidiAI на Apple Silicon; включен iOS XCFramework.
- Linux: Сборки доступны для Ubuntu x64 и arm64 (CPU, Vulkan, ROCm 7.2, OpenVINO, SYCL FP32/FP16).
- Android: Предоставлен бинарный файл CPU для архитектуры arm64.
- Windows: Бинарные файлы для процессоров x64 и arm64, а также поддержка GPU через CUDA 12/13, Vulkan, OpenCL Adreno, OpenVINO, SYCL и HIP.
- openEuler: Сборки для x86 (310p, 910b ACL Graph) и aarch64 (310p, 910b ACL Graph), со стандартной поддержкой отключенной.
Выпуск обеспечивает более широкую совместимость оборудования на нескольких операционных системах и ускорителях, а также исправляет поведение интерфейса в сценариях одной модели.