LLaMA.cpp publica la versión b9784 con importantes optimizaciones para operaciones MM basadas en Hexagon, incluyendo reempaquetado de pesos con bloques 32x32, manejo mejorado de dyn.quant y gestión unificada de parámetros del kernel. El lanzamiento incluye nuevos binarios para macOS (arm64 y x64), iOS y múltiples arquitecturas de Linux con soporte para Vulkan, ROCm y OpenVINO.
LLaMA.cpp lanza b9784: optimizaciones MM para Hexagon y binarios multiplataforma
Traducido del English → Español