A versão b9716 do llama.cpp introduz suporte a processamento em lote para o InternVL, melhorando o desempenho do modelo por meio de processamento eficiente em lotes. O lançamento inclui builds binários para macOS, Linux, Android, Windows e openEuler em múltiplas arquiteturas e opções de aceleração de hardware, incluindo Vulkan, OpenVINO, SYCL e ROCm.