Proyek llama.cpp telah merilis versi b9833, memperkenalkan parser khusus untuk model MiniCPM5 bersama berbagai perbaikan bug dan refactoring. Pembaruan ini mencakup dukungan untuk parsing panggilan alat, penyederhanaan tata bahasa, dan perbaikan perilaku API Jinja agar sesuai dengan standar Jinja2.
- Mengimplementasikan parser PEG MiniCPM5 khusus dengan dukungan panggilan alat XML dan memperbaiki placeholder argumen alat streaming.
- Melakukan refactoring modul obrolan untuk menggunakan autoparser untuk MiniCPM5 sambil mengembalikan pemetaan bersama dan fallback riwayat.
- Memperbaiki API min/max jinja agar sesuai dengan spesifikasi Jinja2 dan memperbarui penamaan templat menjadi openbmb-MiniCPM5-1B.jinja.
- Menyediakan biner untuk macOS (Apple Silicon, Intel), iOS, Linux (CPU, Vulkan, ROCm, OpenVINO, SYCL), Android, Windows (CPU, CUDA 12/13, Vulkan, OpenCL, HIP), dan openEuler.
Rilis ini memungkinkan pengguna menjalankan model MiniCPM5 dengan kemampuan panggilan alat yang lebih baik di berbagai arsitektur perangkat keras dan sistem operasi.