Проект llama.cpp выпустил сборку b9871, которая включает исправление сломанной реализации CPU concatenation при обработке квантованных типов данных.
- Основное изменение устраняет ошибку в логике ggml CPU concat для квантованных типов, сопровождаемую новыми тестами для проверки корректности.
- Предварительно собранные бинарные файлы доступны для macOS (Apple Silicon и Intel), Linux (Ubuntu x64/arm64/s390x с CPU, Vulkan, ROCm 7.2, OpenVINO, SYCL), Windows (CPU, CUDA 12/13, Vulkan, OpenCL, OpenVINO, SYCL, HIP), Android arm64 и openEuler.
- В этот релиз также включено обновленное бинарное окно интерфейса.