Le projet llama.cpp a publié la version b9874, qui introduit une nouvelle implémentation CUDA pour la concaténation de types quantifiés. Cette mise à jour fait partie du développement continu des capacités backend de la bibliothèque.
- Le changement de code principal consiste à ajouter le support CUDA pour la concaténation de types de données quantifiés.
- La version inclut des binaires pour macOS (Apple Silicon et Intel), Linux (CPU, Vulkan, ROCm, OpenVINO, SYCL), Android, Windows (CPU, OpenCL, CUDA 12/13, Vulkan, OpenVINO, SYCL, HIP) et openEuler.
- Un XCFramework iOS et une build UI autonome sont également fournis dans cette version.
Cette mise à jour permet aux utilisateurs d'accéder aux dernières fonctionnalités et au support de plateforme disponibles dans la build b9874.