llama.cpp b9871 corrune concatenação CPU quebrada para tipos quantizados

O projeto llama.cpp lançou a compilação b9871, que inclui uma correção para a implementação de concatenação CPU quebrada ao lidar com tipos de dados quantizados.

A mudança principal aborda um bug na lógica de ggml CPU concat para tipos quantizados, acompanhada por novos testes para verificar a correção.
Binários pré-compilados estão disponíveis para macOS (Apple Silicon e Intel), Linux (Ubuntu x64/arm64/s390x com CPU, Vulkan, ROCm 7.2, OpenVINO, SYCL), Windows (CPU, CUDA 12/13, Vulkan, OpenCL, OpenVINO, SYCL, HIP), Android arm64 e openEuler.
Um binário de UI atualizado também está incluído neste lançamento.