تُضيف الإصدار b9716 من llama.cpp دعم المعالجة الدفعية لـ InternVL، مما يعزز أداء النموذج من خلال معالجة دفعيات فعالة. يتضمن الإصدار تجميعات ثنائية لأنظمة macOS وLinux وAndroid وWindows وopenEuler عبر بنية متعددة وخيارات تسريع الأجهزة، بما في ذلك Vulkan وOpenVINO وSYCL وROCm.