A versão b9668 do llama.cpp implementa buffers de memória host-visíveis UMA para melhor desempenho em dispositivos UMA, com base na sugestão de 0cc4m. O lançamento inclui binários para macOS, Linux, Android, Windows e openEuler, suportando CPU, Vulkan, ROCm, OpenVINO, SYCL e HIP, com um pacote UI dedicado.