La version b9668 de llama.cpp implémente des tampons de mémoire visible hôte UMA pour de meilleures performances sur les appareils UMA, sur la suggestion de 0cc4m. La release inclut des binaires pour macOS, Linux, Android, Windows et openEuler, prenant en charge CPU, Vulkan, ROCm, OpenVINO, SYCL et HIP, avec un package UI dédié.