A versão b9693 do llama.cpp introduz suporte a BF16 em seu kernel de concatenação e fornece binários pré-compilados para macOS, Linux, Android, Windows e openEuler. A release inclui variantes para CPU, Vulkan, ROCm, OpenVINO, SYCL e HIP em múltiplas arquiteturas, com um pacote UI dedicado disponível.