llama.cpp versi b9716 memperkenalkan dukungan batching untuk InternVL, meningkatkan kinerja model melalui pemrosesan batch yang efisien. Rilis ini mencakup build biner untuk macOS, Linux, Android, Windows, dan openEuler di berbagai arsitektur dan opsi akselerasi perangkat keras, termasuk Vulkan, OpenVINO, SYCL, dan ROCm.
llama.cpp Rilis b9716 Menambahkan Dukungan Batching untuk InternVL
Diterjemahkan dari English → Bahasa Indonesia