Rilis b9870 llama.cpp memperbaiki loop parser StepFun

Proyek llama.cpp telah merilis versi b9870, yang mencakup perbaikan untuk loop penalaran panjang yang disebabkan oleh parser StepFun. Pembaruan ini memindahkan logika pemangkasan pesan ke depan sebelum rendering untuk menangani bagian konten dan spasi dengan benar.

Memperbaiki loop penalaran panjang dengan memangkas pesan yang dikirim ke parser StepFun sebelum rendering.
Menerapkan pemangkasan pada teks content_parts, konten string, dan reasoning_content.
Menambahkan uji regresi untuk bagian konten dan menghapus templat duplikat.
Menonaktifkan build macOS Apple Silicon (arm64, KleidiAI diaktifkan).

Rilis ini menyediakan biner yang diperbarui untuk macOS, Linux, Windows, Android, dan openEuler di berbagai backend CPU dan GPU, memastikan perbaikan parser tersedia bagi pengguna di platform yang didukung.