O projeto llama.cpp lançou a compilação b9871, que inclui uma correção para a implementação de concatenação CPU quebrada ao lidar com tipos de dados quantizados.
- A mudança principal aborda um bug na lógica de ggml CPU concat para tipos quantizados, acompanhada por novos testes para verificar a correção.
- Binários pré-compilados estão disponíveis para macOS (Apple Silicon e Intel), Linux (Ubuntu x64/arm64/s390x com CPU, Vulkan, ROCm 7.2, OpenVINO, SYCL), Windows (CPU, CUDA 12/13, Vulkan, OpenCL, OpenVINO, SYCL, HIP), Android arm64 e openEuler.
- Um binário de UI atualizado também está incluído neste lançamento.