Versi llama.cpp b9714 menambahkan header "X-Accel-Buffering": "no" ke endpoint streaming untuk mencegah Nginx melakukan buffering respons, yang menyelesaikan masalah streaming dengan aplikasi seperti harness koding Pi. Rilis ini mencakup biner untuk macOS, Linux, Android, Windows, dan openEuler di berbagai arsitektur dan opsi akselerasi perangkat keras.