llama.cpp 프로젝트가 버전 b9867을 출시하여 DFlash 내에서 spec-draft-p-min 사양에 대한 지원을 도입했습니다. 이 업데이트에는 n_min 가드를 추가하고 n_min와 n_max가 모두 적절히 보호되도록 하는 코드 변경이 포함되어 있습니다.

  • PR #25246을 통해 DFlash에서 spec-draft-p-min 지원 추가.
  • dflash 모듈에 n_min 가드 추가.
  • n_min 및 n_max 매개변수 모두 보호.
  • macOS Apple Silicon (arm64) 바이너리 제공, KleidiAI 지원은 비활성화됨.
  • Ubuntu x64/arm64/s390x용 Linux 빌드에서 CPU, Vulkan, ROCm 7.2, OpenVINO, SYCL 백엔드 지원.
  • Android arm64 (CPU) 바이너리 출시.
  • Windows x64/arm64 빌드는 CPU, OpenCL Adreno, CUDA 12/13, Vulkan, OpenVINO, SYCL, HIP를 지원합니다.
  • openEuler x86 및 aarch64 빌드가 310p 및 910b (ACL Graph) 에 대해 사용 가능합니다.

이 릴리스는 여러 플랫폼과 하드웨어 가속기 전반에 걸쳐 업데이트된 바이너리를 제공하여 사용자가 새로운 DFlash 사양 지원으로 llama.cpp를 실행할 수 있도록 합니다.