Le projet llama.cpp a publié la version b9874, qui introduit une nouvelle implémentation CUDA pour la concaténation de types quantifiés. Cette mise à jour fait partie du développement continu des capacités backend de la bibliothèque.

  • Le changement de code principal consiste à ajouter le support CUDA pour la concaténation de types de données quantifiés.
  • La version inclut des binaires pour macOS (Apple Silicon et Intel), Linux (CPU, Vulkan, ROCm, OpenVINO, SYCL), Android, Windows (CPU, OpenCL, CUDA 12/13, Vulkan, OpenVINO, SYCL, HIP) et openEuler.
  • Un XCFramework iOS et une build UI autonome sont également fournis dans cette version.

Cette mise à jour permet aux utilisateurs d'accéder aux dernières fonctionnalités et au support de plateforme disponibles dans la build b9874.