يقدم إصدار llama.cpp b9842 تغييراً لإزالة التكرار من الإدخالات المسبقة والمخزنة مؤقتاً في نقطة النهاية /v1/models. تمت الموافقة على هذا التحديث بواسطة أدريان غالويه من Hugging Face.

  • تتوفر ثنائيات macOS Apple Silicon (arm64)، بينما يبقى دعم KleidiAI معطلاً.
  • تتضمن بناءات Linux إصدارات وحدة المعالجة المركزية Ubuntu x64/arm64/s390x، وVulkan، وROCm 7.2، وOpenVINO، ومتغيرات SYCL FP32/FP16.
  • تم توفير ثنائيات Android arm64 (وحدة المعالجة المركزية) للنشر على الأجهزة المحمولة.
  • تغطي إصدارات Windows وحدات المعالجة المركزية x64/arm64، وOpenCL Adreno، وCUDA 12.4/13.3، وVulkan، وOpenVINO، وSYCL، ومحركات HIP الخلفية.
  • يتضمن دعم openEuler بناءات x86 وaarch64 مع ACL Graph لرقائق 310p و910b، على الرغم من أن openEuler القياسي معطل.
  • تم أيضاً تضمين ثنائي واجهة المستخدم المستقلة في أصول الإصدار.

يوفر هذا الإصدار ثنائيات محدثة عبر منصات متعددة ومسرعات الأجهزة، مما يضمن التوافق مع مختلف بنية وحدة المعالجة المركزية ووحدة معالجة الرسومات.