O projeto llama.cpp lançou a versão b9867, introduzindo suporte à especificação spec-draft-p-min dentro do DFlash. Esta atualização inclui alterações de código para adicionar uma proteção n_min e garantir que tanto n_min quanto n_max estejam corretamente protegidos.
- Suporte para spec-draft-p-min no DFlash via pull request #25246.
- Adição de uma proteção n_min no módulo dflash.
- Proteção dos parâmetros n_min e n_max.
- Binários fornecidos para macOS Apple Silicon (arm64), enquanto o suporte ao KleidiAI está desabilitado.
- Compilações disponíveis para Linux Ubuntu x64/arm64/s390x com backends CPU, Vulkan, ROCm 7.2, OpenVINO e SYCL.
- Binários Android arm64 (CPU) lançados.
- Compilações do Windows x64/arm64 suportam CPU, OpenCL Adreno, CUDA 12/13, Vulkan, OpenVINO, SYCL e HIP.
- Compilações openEuler x86 e aarch64 para 310p e 910b (ACL Graph) estão disponíveis.
Este lançamento fornece binários atualizados em várias plataformas e aceleradores de hardware, permitindo que os usuários executem o llama.cpp com o novo suporte à especificação DFlash.