llama.cpp 프로젝트는 NVFP4 양자화 형식에 대한 ggml-webgpu 지원을 도입한 버전 b9844를 출시했습니다. 이 업데이트는 다양한 하드웨어 백엔드에서 macOS, iOS, Linux, Android, Windows 및 openEuler용 사전 빌드된 바이너리도 제공합니다.
- 풀 리퀘스트 #25143을 통해 ggml-webgpu에 NVFP4 지원을 추가했습니다.
- 이번 릴리스에서 macOS Apple Silicon 및 openEuler에 대한 KleidiAI 빌드를 비활성화했습니다.
- Ubuntu(CPU, Vulkan, ROCm 7.2, OpenVINO, SYCL FP32/FP16), Windows(CPU, CUDA 12/13, Vulkan, OpenVINO, SYCL, HIP) 및 Android arm64용 바이너리를 제공했습니다.
- macOS Apple Silicon(arm64 및 x64) 바이너리와 iOS XCFramework를 출시했습니다.
- 일반 사용을 위한 UI 바이너리를 포함했습니다.
이 릴리스는 개발자가 WebGPU 장치에서 NVFP4 양자화를 활용할 수 있도록 하며, 광범위한 운영 체제와 GPU 아키텍처에 대한 업데이트된 사전 빌드 실행 파일을 제공합니다.