llama.cpp प्रोजेक्ट ने संस्करण b9847 जारी किया है, जिसमें CUDA पर Gemma E4B MTP FlashAttention के लिए एक मरम्मत और एक अनावश्यक टेम्पलेट घोषणा को हटाया गया है।
- CUDA बैकएंड में Gemma E4B MTP FlashAttention की मरम्मत (#25148)
- अनावश्यक टेम्पलेट घोषणा को हटाया गया
- macOS Apple Silicon (arm64) बाइनरी उपलब्ध
- macOS Intel (x64) बाइनरी उपलब्ध
- iOS XCFramework प्रदान किया गया
- Ubuntu x64 और arm64 CPU बिल्ड्स शामिल
- Ubuntu Vulkan, ROCm 7.2, OpenVINO, SYCL FP32, और SYCL FP16 बिल्ड्स उपलब्ध
- Android arm64 CPU बिल्ड जारी
- Windows x64 और arm64 CPU बिल्ड्स प्रदान किए गए
- DLLs के साथ Windows CUDA 12.4 और 13.3 बिल्ड्स शामिल
- Windows Vulkan, OpenVINO, SYCL, और HIP बिल्ड्स उपलब्ध
- openEuler x86 और aarch64 बिल्ड्स 310p और 910b (ACL Graph) प्रोसेसर के लिए
- सामान्य UI बाइनरी जारी