Проект llama.cpp выпустил сборку b9871, которая включает исправление сломанной реализации CPU concatenation при обработке квантованных типов данных.

  • Основное изменение устраняет ошибку в логике ggml CPU concat для квантованных типов, сопровождаемую новыми тестами для проверки корректности.
  • Предварительно собранные бинарные файлы доступны для macOS (Apple Silicon и Intel), Linux (Ubuntu x64/arm64/s390x с CPU, Vulkan, ROCm 7.2, OpenVINO, SYCL), Windows (CPU, CUDA 12/13, Vulkan, OpenCL, OpenVINO, SYCL, HIP), Android arm64 и openEuler.
  • В этот релиз также включено обновленное бинарное окно интерфейса.