llama.cpp b9850 릴리스: Qwen3 수정 및 새로운 바이너리

llama.cpp b9850 릴리스는 특정 모델 지원 업데이트를 도입하며, 여기에는 Qwen3Next에 대한 t_layer_inp 텐서 등록, 레이어 처리 루프 내 입력 할당 수정, qwen-coder-next에 대한 DFLASH 문제 해결이 포함됩니다. 또한 Qwen3 모델의 어텐션 정규화를 위한 텐서를 추가합니다.

macOS Apple Silicon (arm64) 바이너리가 제공되며, KleidiAI 지원은 비활성화됩니다.
Linux 빌드는 Ubuntu x64 및 arm64 CPU, Vulkan, ROCm 7.2, OpenVINO, SYCL FP32/FP16 변형을 포함합니다.
Android arm64 CPU 바이너리가 모바일 기기를 위해 제공됩니다.
Windows 릴리스에는 CPU, OpenCL Adreno, CUDA 12.4/13.3, Vulkan, OpenVINO, SYCL, HIP 백엔드가 포함됩니다.
ACL Graph 지원을 갖춘 x86 및 aarch64 아키텍처용 openEuler 빌드가 포함되어 있습니다.

이 업데이트는 Qwen3 시리즈 모델에 대한 수정된 모델 처리와 여러 운영 체제 및 GPU 아키텍처 전반에 걸친 확장된 하드웨어 가속 옵션을 사용자에게 제공합니다.