A versão b9677 do llama.cpp atualiza o registro de logs para impor o max_capacity e remove a lógica de expansão da fila. O lançamento inclui binários para macOS, Linux, Android, Windows e openEuler em várias arquiteturas e opções de aceleração de hardware, incluindo Vulkan, CUDA, OpenVINO e SYCL.