O projeto llama.cpp lançou a versão b9833, introduzindo um parser dedicado para o modelo MiniCPM5 junto com várias correções de bugs e refatorações. Esta atualização inclui suporte para parsing de chamadas de ferramenta, simplificação de gramática e correção do comportamento da API Jinja para garantir compatibilidade com os padrões Jinja2.
- Implementado um parser PEG dedicado para MiniCPM5 com suporte a chamadas de ferramenta em XML e corrigidos placeholders de streaming para argumentos de ferramentas.
- Refatorado o módulo de chat para usar um autoparser para MiniCPM5, revertendo mapeadores compartilhados e fallbacks de histórico.
- Corrigida a API min/max do jinja para corresponder às especificações do Jinja2 e atualizado o nome do template para openbmb-MiniCPM5-1B.jinja.
- Fornecidos binários para macOS (Apple Silicon, Intel), iOS, Linux (CPU, Vulkan, ROCm, OpenVINO, SYCL), Android, Windows (CPU, CUDA 12/13, Vulkan, OpenCL, HIP) e openEuler.
Este lançamento permite que os usuários executem modelos MiniCPM5 com capacidades aprimoradas de chamada de ferramentas em uma ampla gama de arquiteturas de hardware e sistemas operacionais.