LLaMA.cpp merilis versi b9784 dengan optimisasi besar untuk operasi MM berbasis hexagon, termasuk repacking bobot bertiling 32x32, penanganan dyn.quant yang lebih baik, dan manajemen parameter kernel yang terpadu. Rilis ini mencakup binari baru untuk macOS (arm64 dan x64), iOS, dan berbagai arsitektur Linux dengan dukungan Vulkan, ROCm, dan OpenVINO.