LLaMA.cpp publie la version b9784 avec des optimisations majeures pour les opérations MM basées sur Hexagon, incluant le repack de poids en tuiles 32x32, une meilleure gestion du dyn.quant et une gestion unifiée des paramètres de kernel. La release inclut de nouveaux binaires pour macOS (arm64 et x64), iOS, et plusieurs architectures Linux avec prise en charge de Vulkan, ROCm et OpenVINO.
LLaMA.cpp Release b9784 : Optimisations MM Hexagon et binaires multiplateformes
Traduit de English → Français