llama.cpp b9847 रिलीज में Gemma E4B MTP FlashAttention की मरम्मत

llama.cpp प्रोजेक्ट ने संस्करण b9847 जारी किया है, जिसमें CUDA पर Gemma E4B MTP FlashAttention के लिए एक मरम्मत और एक अनावश्यक टेम्पलेट घोषणा को हटाया गया है।

CUDA बैकएंड में Gemma E4B MTP FlashAttention की मरम्मत (#25148)
अनावश्यक टेम्पलेट घोषणा को हटाया गया
macOS Apple Silicon (arm64) बाइनरी उपलब्ध
macOS Intel (x64) बाइनरी उपलब्ध
iOS XCFramework प्रदान किया गया
Ubuntu x64 और arm64 CPU बिल्ड्स शामिल
Ubuntu Vulkan, ROCm 7.2, OpenVINO, SYCL FP32, और SYCL FP16 बिल्ड्स उपलब्ध
Android arm64 CPU बिल्ड जारी
Windows x64 और arm64 CPU बिल्ड्स प्रदान किए गए
DLLs के साथ Windows CUDA 12.4 और 13.3 बिल्ड्स शामिल
Windows Vulkan, OpenVINO, SYCL, और HIP बिल्ड्स उपलब्ध
openEuler x86 और aarch64 बिल्ड्स 310p और 910b (ACL Graph) प्रोसेसर के लिए
सामान्य UI बाइनरी जारी