llama.cpp 프로젝트가 버전 b9870 을 출시했습니다. 여기에는 StepFun 파서로 인해 발생하는 긴 추론 루프에 대한 수정이 포함되어 있습니다. 이 업데이트는 콘텐츠 부분과 공백을 적절히 처리하기 위해 메시지 트리밍 로직을 렌더링 전에 이동합니다.

  • 렌더링 전에 StepFun 파서에 전송된 메시지를 트리밍하여 긴 추론 루프를 수정합니다.
  • content_parts 텍스트, 문자열 콘텐츠 및 reasoning_content 에 트리밍을 적용합니다.
  • 콘텐츠 부분에 대한 회귀 테스트를 추가하고 중복 템플릿을 제거합니다.
  • macOS Apple Silicon (arm64, KleidiAI 활성화) 빌드를 비활성화합니다.

이 릴리스는 다양한 CPU 및 GPU 백엔드에 대해 macOS, Linux, Windows, Android 및 openEuler 에 대한 업데이트된 바이너리를 제공하여 지원되는 플랫폼의 사용자가 파서 수정을 사용할 수 있도록 합니다.