llama.cpp 프로젝트는 서버, 공통 구성 요소, 추론 디코딩 모듈에서 로깅 출력을 줄인 버전 b9829를 출시했습니다. 이 업데이트는 CMN_을 COM_로 교체하여 명명 규칙을 표준화합니다.
- 더 나은 상세도 제어를 위해 서버 로그가 감소했습니다.
- macOS Apple Silicon 빌드가 제공되지만 KleidiAI 지원은 비활성화되었습니다.
- Linux 바이너리는 Ubuntu x64, arm64, s390x, Vulkan, ROCm 7.2, OpenVINO 및 SYCL FP32/FP16를 지원합니다.
- Windows 릴리스에는 CPU, OpenCL Adreno, CUDA 12.4/13.3, Vulkan, OpenVINO, SYCL 및 HIP 변형이 포함됩니다.
- Android arm64 (CPU) 및 iOS XCFramework 바이너리가 제공됩니다.
- openEuler 지원은 x86에서는 비활성화되었지만 ACL Graph를 통해 aarch64에서 사용 가능합니다.
이 릴리스는 다양한 운영 체제와 하드웨어 가속기 개발자를 위해 업데이트된 바이너리를 제공하며, 최신 CUDA 버전과의 호환성을 보장하고 서버 환경의 로그 노이즈를 줄입니다.