llama.cpp प्रोजेक्ट ने संस्करण b9847 जारी किया है, जिसमें CUDA पर Gemma E4B MTP FlashAttention के लिए एक मरम्मत और एक अनावश्यक टेम्पलेट घोषणा को हटाया गया है।

  • CUDA बैकएंड में Gemma E4B MTP FlashAttention की मरम्मत (#25148)
  • अनावश्यक टेम्पलेट घोषणा को हटाया गया
  • macOS Apple Silicon (arm64) बाइनरी उपलब्ध
  • macOS Intel (x64) बाइनरी उपलब्ध
  • iOS XCFramework प्रदान किया गया
  • Ubuntu x64 और arm64 CPU बिल्ड्स शामिल
  • Ubuntu Vulkan, ROCm 7.2, OpenVINO, SYCL FP32, और SYCL FP16 बिल्ड्स उपलब्ध
  • Android arm64 CPU बिल्ड जारी
  • Windows x64 और arm64 CPU बिल्ड्स प्रदान किए गए
  • DLLs के साथ Windows CUDA 12.4 और 13.3 बिल्ड्स शामिल
  • Windows Vulkan, OpenVINO, SYCL, और HIP बिल्ड्स उपलब्ध
  • openEuler x86 और aarch64 बिल्ड्स 310p और 910b (ACL Graph) प्रोसेसर के लिए
  • सामान्य UI बाइनरी जारी