La versión b9668 de llama.cpp implementa búferes de memoria visibles para el host UMA para mejorar el rendimiento en dispositivos UMA, basándose en la sugerencia de 0cc4m. La publicación incluye binarios para macOS, Linux, Android, Windows y openEuler, con soporte para CPU, Vulkan, ROCm, OpenVINO, SYCL e HIP, junto con un paquete de interfaz de usuario dedicado.