La versión b9702 de llama.cpp incluye una corrección para que los argumentos del router no se reenvíen a las instancias secundarias. El lanzamiento proporciona binarios para macOS, Linux, Android, Windows y openEuler en múltiples arquitecturas y opciones de aceleración de hardware, incluyendo Vulkan, ROCm, OpenVINO y SYCL.