أطلق مشروع llama.cpp الإصدار b9847، الذي يتضمن إصلاحًا لـ Gemma E4B MTP FlashAttention على CUDA وإزالة إعلان قالب غير مستخدم.
- إصلاحات Gemma E4B MTP FlashAttention في الخلفية CUDA (#25148)
- إزالة إعلان قالب غير مستخدم
- متوفر لأجهزة macOS Apple Silicon (arm64)
- متوفر لأجهزة macOS Intel (x64)
- تم توفير iOS XCFramework
- تضمين بناءات Ubuntu x64 و arm64 للمعالج
- متوفر لبناءات Ubuntu Vulkan و ROCm 7.2 و OpenVINO و SYCL FP32 و SYCL FP16
- تم إصدار بناء Android arm64 للمعالج
- تم توفير بناءات Windows x64 و arm64 للمعالج
- تضمين DLLs في بناءات Windows CUDA 12.4 و 13.3
- متوفر لبناءات Windows Vulkan و OpenVINO و SYCL و HIP
- بناءات openEuler x86 و aarch64 لمعالجات 310p و 910b (ACL Graph)
- تم إصدار ملف تنفيذي عام لواجهة المستخدم