El proyecto llama.cpp lanzó la compilación b9871, que incluye una corrección para la implementación de concatenación CPU rota al manejar tipos de datos cuantizados.
- El cambio principal aborda un error en la lógica de ggml CPU concat para tipos cuantizados, acompañado de nuevas pruebas para verificar la corrección.
- Los binarios precompilados están disponibles para macOS (Apple Silicon e Intel), Linux (Ubuntu x64/arm64/s390x con CPU, Vulkan, ROCm 7.2, OpenVINO, SYCL), Windows (CPU, CUDA 12/13, Vulkan, OpenCL, OpenVINO, SYCL, HIP), Android arm64 y openEuler.
- También se incluye un binario de interfaz actualizado en este lanzamiento.