O llama.cpp lança a versão b9688, adicionando APIs de gerenciamento de modelos e atualizações em tempo real via SSE. O lançamento inclui binários pré-compilados para macOS, Linux, Android, Windows e openEuler, suportando várias arquiteturas e frameworks de aceleração como Vulkan, CUDA, OpenVINO e SYCL.