llama.cpp 프로젝트는 추론 토큰을 유지하기 위해 Jinja 채팅 템플릿용 새로운 `--reasoning-preserve` 플래그를 도입한 버전 b9837을 출시했습니다. 이 업데이트에는 수정된 도움말 메시지가 포함되어 있으며, 다양한 하드웨어 백엔드에서 macOS, Linux, Windows, Android 및 openEuler 에 대한 사전 빌드된 바이너리를 제공합니다.
- 추론 콘텐츠를 보존하기 위해 jinja 및 채팅 템플릿에 `--reasoning-preserve` 플래그 추가.
- 코드베이스 내 도움말 메시지 텍스트 수정.
- macOS Apple Silicon 빌드에 대한 KleidiAI 지원 비활성화.
- Ubuntu(CPU, Vulkan, ROCm 7.2, OpenVINO, SYCL), Windows(CPU, CUDA 12/13, Vulkan, OpenVINO, SYCL, HIP) 및 macOS(Apple Silicon 및 Intel) 에 대한 바이너리 출시.
이 릴리즈를 통해 사용자는 다양한 플랫폼과 하드웨어 가속기에서 최신 llama.cpp 기능에 액세스할 수 있으며, 채팅 템플릿의 추론 토큰 처리에 대해 특정 제어를 제공합니다.