Sebuah pull request di llama.cpp mengatasi masalah di mana pemangkasan input diimplementasikan secara salah, yang sebelumnya menghambat kinerja Step 3.7 Flash.
- Perbaikan ini menargetkan bug spesifik dalam penanganan input yang menyebabkan kemampuan penalaran yang lambat.
- Perubahan ini bertujuan untuk membuat model dapat digunakan untuk tugas-tugas yang memerlukan penalaran bentuk panjang.
Pembaruan ini signifikan bagi pengguna yang telah menghindari Step 3.7 Flash karena kinerjanya yang buruk dibandingkan dengan versi sebelumnya seperti Step 3.5 Flash.