Proyek llama.cpp telah merilis versi b9867, memperkenalkan dukungan untuk spesifikasi spec-draft-p-min dalam DFlash. Pembaruan ini mencakup perubahan kode untuk menambahkan penjaga n_min dan memastikan bahwa baik n_min maupun n_max dilindungi dengan benar.

  • Dukungan untuk spec-draft-p-min di DFlash melalui pull request #25246.
  • Penambahan penjaga n_min di modul dflash.
  • Perlindungan terhadap parameter n_min dan n_max.
  • Binari macOS Apple Silicon (arm64) disediakan, sementara dukungan KleidiAI dinonaktifkan.
  • Build Linux tersedia untuk Ubuntu x64/arm64/s390x dengan backend CPU, Vulkan, ROCm 7.2, OpenVINO, dan SYCL.
  • Binari Android arm64 (CPU) dirilis.
  • Build Windows x64/arm64 mendukung CPU, OpenCL Adreno, CUDA 12/13, Vulkan, OpenVINO, SYCL, dan HIP.
  • Build openEuler x86 dan aarch64 untuk 310p dan 910b (ACL Graph) tersedia.

Rilis ini menyediakan binari yang diperbarui di berbagai platform dan akselerator perangkat keras, memungkinkan pengguna menjalankan llama.cpp dengan dukungan spesifikasi DFlash baru.