llama.cpp 프로젝트가 혼합 전문가(MoE) 모델을 멀티 토큰 예측으로 양자화하는 것에 대한 중요한 수정을 포함한 버전 b9789를 출시했습니다. 이 업데이트는 이러한 특정 모델 아키텍처의 적절한 처리를 보장하기 위해 풀 리퀘스트 #24986에서 식별된 문제를 해결합니다. 이번 릴리스는 macOS Apple Silicon 및 Intel용 사전 빌드 바이너리와 iOS XCFramework를 제공합니다. Linux 사용자는 CPU, Vulkan, ROCm 7.2, OpenVINO 및 SYCL 백엔드에 대한 Ubuntu 빌드를 다운로드할 수 있습니다. Windows 지원에는 CPU, CUDA 12.4 및 13.3, Vulkan, OpenVINO, SYCL 및 HIP 변형이 포함됩니다. Android arm64 및 openEuler와 같은 추가 플랫폼도 특정 하드웨어 구성으로 지원됩니다.