llama.cpp プロジェクトはバージョン b9867 をリリースし、DFlash 内で spec-draft-p-min 仕様のサポートを導入しました。このアップデートには、n_min ガードを追加し、n_min と n_max の両方が適切にガードされるようにするコード変更が含まれています。

  • プルリクエスト #25246 経由で DFlash に spec-draft-p-min サポートを追加。
  • dflash モジュールに n_min ガードを追加。
  • n_min と n_max パラメータの両方をガード。
  • macOS Apple Silicon (arm64) バイナリを提供(KleidiAI サポートは無効化)。
  • Ubuntu x64/arm64/s390x 向け Linux ビルドで、CPU、Vulkan、ROCm 7.2、OpenVINO、SYCL バックエンドをサポート。
  • Android arm64 (CPU) バイナリをリリース。
  • Windows x64/arm64 ビルドは CPU、OpenCL Adreno、CUDA 12/13、Vulkan、OpenVINO、SYCL、HIP をサポート。
  • openEuler x86 および aarch64 ビルドが 310p と 910b (ACL Graph) 向けに利用可能。

このリリースでは、複数のプラットフォームとハードウェアアクセラレータにわたって更新されたバイナリを提供し、ユーザーが新しい DFlash 仕様サポートで llama.cpp を実行できるようにします。