llama.cpp b9874 ajoute la concaténation CUDA pour les types quantifiés

Le projet llama.cpp a publié la version b9874, qui introduit une nouvelle implémentation CUDA pour la concaténation de types quantifiés. Cette mise à jour fait partie du développement continu des capacités backend de la bibliothèque.

Le changement de code principal consiste à ajouter le support CUDA pour la concaténation de types de données quantifiés.
La version inclut des binaires pour macOS (Apple Silicon et Intel), Linux (CPU, Vulkan, ROCm, OpenVINO, SYCL), Android, Windows (CPU, OpenCL, CUDA 12/13, Vulkan, OpenVINO, SYCL, HIP) et openEuler.
Un XCFramework iOS et une build UI autonome sont également fournis dans cette version.

Cette mise à jour permet aux utilisateurs d'accéder aux dernières fonctionnalités et au support de plateforme disponibles dans la build b9874.