llama.cpp lança b9752: refatoração do servidor e binários multiplataforma
O llama.cpp lança a versão b9752 com uma refatoração do servidor focada na construção de lotes, incluindo melhor tratamento de casos de lote cheio e correções de bugs. O lançamento inclui binários pré-compilados para macOS, Linux, Android, Windows e openEuler, suportando várias arquiteturas e frameworks de aceleração como CUDA, Vulkan, OpenVINO e SYCL.