Версия llama.cpp b9668 реализует буферы UMA host-visible memory для улучшения производительности на устройствах с UMA, на основе предложения 0cc4m. В этом выпуске представлены бинарники для macOS, Linux, Android, Windows и openEuler, поддерживающие CPU, Vulkan, ROCm, OpenVINO, SYCL и HIP, а также отдельный пакет интерфейса.