Versi b9716 dari llama.cpp memperkenalkan dukungan batching untuk InternVL, meningkatkan performa model melalui pemrosesan batch yang efisien. Rilis ini mencakup build biner untuk macOS, Linux, Android, Windows, dan openEuler di berbagai arsitektur dan opsi akselerasi perangkat keras, termasuk Vulkan, OpenVINO, SYCL, dan ROCm.