Proyek llama.cpp telah merilis versi b9837, yang memperkenalkan flag `--reasoning-preserve` baru untuk template obrolan Jinja guna mempertahankan token penalaran. Pembaruan ini juga mencakup pesan bantuan yang dikoreksi dan menyediakan biner pra-bangun untuk macOS, Linux, Windows, Android, dan openEuler di berbagai backend perangkat keras.

  • Menambahkan flag `--reasoning-preserve` ke template jinja dan chat untuk melestarikan konten penalaran.
  • Mengoreksi teks pesan bantuan dalam basis kode.
  • Menonaktifkan dukungan KleidiAI untuk build macOS Apple Silicon.
  • Merilis biner untuk Ubuntu (CPU, Vulkan, ROCm 7.2, OpenVINO, SYCL), Windows (CPU, CUDA 12/13, Vulkan, OpenVINO, SYCL, HIP), dan macOS (Apple Silicon dan Intel).

Rilis ini memungkinkan pengguna mengakses fitur llama.cpp terbaru di berbagai platform dan akselerator perangkat keras sambil memberikan kontrol spesifik atas penanganan token penalaran dalam template obrolan.