A versão b9722 do LLaMA.cpp corrige um problema de valor n_discard não vinculado no tratamento do contexto do servidor. O lançamento inclui binários pré-compilados para macOS, Linux, Android, Windows e openEuler, suportando várias arquiteturas e frameworks de aceleração como Vulkan, CUDA, OpenVINO e SYCL.