Tous les articles
github llama.cpp · il y a 12 j

llama.cpp Release b9724 avec corrections de bugs et binaires multiplateformes

La version llama.cpp b9724 inclut plusieurs corrections de bugs et améliorations, telles que des correctifs de build, l'évitement du dépassement dans la fonction area(), et un contrôle de cohérence dans get_u32(). La release fournit des binaires préconstruits pour macOS (arm64 et x64), Linux (x64, arm64, s390x, Vulkan, ROCm, OpenVINO, SYCL), Android (arm64), Windows (x64, arm64, CUDA 12/13, Vulkan, OpenVINO, SYCL, HIP), et openEuler (x86 et aarch64 avec support ACL Graph), ainsi qu'un package UI.

github llama.cpp · il y a 12 j

llama.cpp release b9723 ajoute le support pour Qwen3.5 et Qwen3.6 Eagle3

La version b9723 de llama.cpp introduit la prise en charge des modèles Qwen3.5 et Qwen3.6 via Eagle3. La publication inclut la restauration différée des points de contrôle de frontière pour les modèles hybrides et des mises à jour des conventions d'API et de nommage. Des builds binaires sont disponibles pour les plateformes macOS, Linux, Android, Windows et openEuler, avec des options pour CPU, Vulkan, OpenVINO, SYCL et ROCm.