llama.cpp b9871 corrige la concaténation CPU cassée pour les types quantifiés

Le projet llama.cpp a publié le build b9871, qui inclut une correction pour l'implémentation de la concaténation CPU défectueuse lors du traitement des types de données quantifiés.

Le changement principal corrige un bug dans la logique de concaténation CPU de ggml pour les types quantifiés, accompagné de nouveaux tests pour vérifier l'exactitude.
Des binaires précompilés sont disponibles pour macOS (Apple Silicon et Intel), Linux (Ubuntu x64/arm64/s390x with CPU, Vulkan, ROCm 7.2, OpenVINO, SYCL), Windows (CPU, CUDA 12/13, Vulkan, OpenCL, OpenVINO, SYCL, HIP), Android arm64 et openEuler.
Un binaire UI mis à jour est également inclus dans cette version.