llama.cpp b9855 릴리스, AVX2 nvfp4 최적화 및 새 바이너리 추가

llama.cpp 프로젝트가 버전을 b9855로 출시했으며, 이는 ggml-cpu 백엔드 내에서 UE4M3 룩업 테이블(LUT)을 사용하여 nvfp4 곱셈-누적 연산에 대한 AVX2 최적화를 도입합니다.

macOS Apple Silicon 및 Intel 빌드가 iOS XCFramework와 함께 제공됩니다.
Linux 바이너리는 CPU, Vulkan, ROCm 7.2, OpenVINO, SYCL(FP32/FP16)를 통해 Ubuntu x64, arm64, s390x 아키텍처를 지원합니다.
Windows 릴리스에는 CPU, OpenCL Adreno, CUDA 12.4 및 13.3, Vulkan, OpenVINO, SYCL, HIP 백엔드가 포함됩니다.
모바일 배포를 위해 Android arm64 CPU 바이너리가 제공됩니다.
이 릴리스에서는 macOS Apple Silicon에서의 KleidiAI 지원이 비활성화되었습니다.

이 업데이트는 특정 하드웨어 구성에 대한 최적화된 추론 기능을 사용자에게 제공하며, 주요 운영 체제 전반에서 지원되는 가속기의 범위를 확장합니다.