O projeto llama.cpp lançou a versão b9867, introduzindo suporte à especificação spec-draft-p-min dentro do DFlash. Esta atualização inclui alterações de código para adicionar uma proteção n_min e garantir que tanto n_min quanto n_max estejam corretamente protegidos.

  • Suporte para spec-draft-p-min no DFlash via pull request #25246.
  • Adição de uma proteção n_min no módulo dflash.
  • Proteção dos parâmetros n_min e n_max.
  • Binários fornecidos para macOS Apple Silicon (arm64), enquanto o suporte ao KleidiAI está desabilitado.
  • Compilações disponíveis para Linux Ubuntu x64/arm64/s390x com backends CPU, Vulkan, ROCm 7.2, OpenVINO e SYCL.
  • Binários Android arm64 (CPU) lançados.
  • Compilações do Windows x64/arm64 suportam CPU, OpenCL Adreno, CUDA 12/13, Vulkan, OpenVINO, SYCL e HIP.
  • Compilações openEuler x86 e aarch64 para 310p e 910b (ACL Graph) estão disponíveis.

Este lançamento fornece binários atualizados em várias plataformas e aceleradores de hardware, permitindo que os usuários executem o llama.cpp com o novo suporte à especificação DFlash.