O llama.cpp lançou a versão b9680 com suporte atualizado ao Vulkan e novos binários para macOS, Linux, Android, Windows e openEuler. O lançamento inclui variantes de CPU e GPU para múltiplas arquiteturas, com suporte para Vulkan, CUDA, OpenVINO, SYCL e ROCm.