O LLaMA.cpp lança a versão b9784 com grandes otimizações para operações MM baseadas em hexagon, incluindo repack de pesos com tile 32x32, tratamento melhorado do dyn.quant e gerenciamento unificado de parâmetros de kernel. O lançamento inclui novos binários para macOS (arm64 e x64), iOS e múltiplas arquiteturas Linux com suporte a Vulkan, ROCm e OpenVINO.