llama.cpp 버전 b9714는 스트리밍 엔드포인트에 "X-Accel-Buffering": "no" 헤더를 추가하여 Nginx가 응답을 버퍼링하는 것을 방지하고, Pi 코딩 하니스와 같은 애플리케이션의 스트리밍 문제를 해결했습니다. 이 릴리스에는 macOS, Linux, Android, Windows 및 openEuler용 바이너리가 포함되어 있으며, 여러 아키텍처와 하드웨어 가속 옵션을 지원합니다.