llama.cpp の b9831 リリースでは、レイヤータイプごとのスライディングウィンドウ アテンションを含む DFlash v2 サポートが導入され、複数のプラットフォーム向けの包括的なビルド済みバイナリセットも提供されています。

  • macOS Apple Silicon (arm64) および Intel (x64) 向けビルドが利用可能で、iOS 用 XCFramework も含まれます。
  • Linux バイナリには、Ubuntu x64 および arm64 CPU、s390x CPU、Vulkan、ROCm 7.2、OpenVINO、SYCL FP32/FP16 が対応しています。
  • Android 向けにはモバイルデバイス用の arm64 CPU ビルドが提供されています。
  • Windows リリースには、CPU、OpenCL Adreno、CUDA 12.4 および 13.3、Vulkan、OpenVINO、SYCL、HIP の各バリアントが含まれます。
  • ACL Graph サポート付きの openEuler x86 および aarch64 ビルドが含まれていますが、macOS KleidiAI と openEuler 汎用ビルドは無効化されています。

このリリースにより、ユーザーは新しい DFlash 最適化機能を使用して、より広範なハードウェア アクセラレータおよびオペレーティング システムで llama.cpp を実行できるようになります。