يجمع إصدار llama.cpp b9718 اختيار الشرائح في دالة واحدة، get_available_slot، مع الحفاظ على فحوصات التشابه LCP لتحديثات ذاكرة التخزين المؤقت للرسائل. يتضمن الإصدار عمليات بناء ثنائية لأنظمة macOS وLinux وAndroid وWindows وopenEuler عبر بنية متعددة وخيارات تسريع الأجهزة.