أطلق مشروع llama.cpp الإصدار b9847، الذي يتضمن إصلاحًا لـ Gemma E4B MTP FlashAttention على CUDA وإزالة إعلان قالب غير مستخدم.

  • إصلاحات Gemma E4B MTP FlashAttention في الخلفية CUDA (#25148)
  • إزالة إعلان قالب غير مستخدم
  • متوفر لأجهزة macOS Apple Silicon (arm64)
  • متوفر لأجهزة macOS Intel (x64)
  • تم توفير iOS XCFramework
  • تضمين بناءات Ubuntu x64 و arm64 للمعالج
  • متوفر لبناءات Ubuntu Vulkan و ROCm 7.2 و OpenVINO و SYCL FP32 و SYCL FP16
  • تم إصدار بناء Android arm64 للمعالج
  • تم توفير بناءات Windows x64 و arm64 للمعالج
  • تضمين DLLs في بناءات Windows CUDA 12.4 و 13.3
  • متوفر لبناءات Windows Vulkan و OpenVINO و SYCL و HIP
  • بناءات openEuler x86 و aarch64 لمعالجات 310p و 910b (ACL Graph)
  • تم إصدار ملف تنفيذي عام لواجهة المستخدم