Le projet llama.cpp a publié la version b9833, introduisant un analyseur dédié pour le modèle MiniCPM5 ainsi que diverses corrections de bugs et refactorisations. Cette mise à jour inclut la prise en charge de l'analyse des appels d'outils, la simplification de la grammaire et la correction du comportement de l'API Jinja pour assurer la compatibilité avec les normes Jinja2.
- Implémentation d'un analyseur PEG dédié MiniCPM5 avec prise en charge des appels d'outils XML et correction des espaces réservés pour le streaming des arguments d'outil.
- Refactorisation du module de chat pour utiliser un autoparseur pour MiniCPM5 tout en annulant les mappers partagés et les retours arrière d'historique.
- Correction de l'API min/max jinja pour correspondre aux spécifications Jinja2 et mise à jour du nommage des modèles vers openbmb-MiniCPM5-1B.jinja.
- Fourniture de binaires pour macOS (Apple Silicon, Intel), iOS, Linux (CPU, Vulkan, ROCm, OpenVINO, SYCL), Android, Windows (CPU, CUDA 12/13, Vulkan, OpenCL, HIP) et openEuler.
Cette version permet aux utilisateurs d'exécuter des modèles MiniCPM5 avec des capacités d'appel d'outils améliorées sur une large gamme d'architectures matérielles et de systèmes d'exploitation.