llama.cpp 프로젝트가 버전 b9847을 출시했으며, 여기에는 CUDA에서의 Gemma E4B MTP FlashAttention 수정과 사용하지 않는 템플릿 선언 제거가 포함됩니다.
- CUDA 백엔드에서 Gemma E4B MTP FlashAttention 수정 (#25148)
- 사용하지 않는 템플릿 선언 제거
- macOS Apple Silicon (arm64) 바이너리 제공
- macOS Intel (x64) 바이너리 제공
- iOS XCFramework 제공
- Ubuntu x64 및 arm64 CPU 빌드 포함
- Ubuntu Vulkan, ROCm 7.2, OpenVINO, SYCL FP32, SYCL FP16 빌드 제공
- Android arm64 CPU 빌드 출시
- Windows x64 및 arm64 CPU 빌드 제공
- DLL이 포함된 Windows CUDA 12.4 및 13.3 빌드 제공
- Windows Vulkan, OpenVINO, SYCL, HIP 빌드 제공
- openEuler x86 및 aarch64 빌드 (310p 및 910b (ACL Graph) 프로세서용)
- 일반 UI 바이너리 출시