github llama.cpp · 12 hari lalu · inference

llama.cpp Release b9716 Adds Batching Support for InternVL

Diterjemahkan dari English → Bahasa Indonesia

Versi b9716 dari llama.cpp memperkenalkan dukungan batching untuk InternVL, meningkatkan performa model melalui pemrosesan batch yang efisien. Rilis ini mencakup build biner untuk macOS, Linux, Android, Windows, dan openEuler di berbagai arsitektur dan opsi akselerasi perangkat keras, termasuk Vulkan, OpenVINO, SYCL, dan ROCm.

Kepentingan 0/3 Kepercayaan 2/3 llama.cpp

Baca aslinya