El proyecto llama.cpp ha lanzado la versión b9867, introduciendo soporte para la especificación spec-draft-p-min dentro de DFlash. Esta actualización incluye cambios de código para añadir una protección n_min y asegurar que tanto n_min como n_max estén correctamente protegidos.
- Soporte para spec-draft-p-min en DFlash a través del pull request #25246.
- Adición de una protección n_min en el módulo dflash.
- Protección de los parámetros n_min y n_max.
- Binarios proporcionados para macOS Apple Silicon (arm64), mientras que el soporte de KleidiAI está deshabilitado.
- Compilaciones disponibles para Linux Ubuntu x64/arm64/s390x con backends CPU, Vulkan, ROCm 7.2, OpenVINO y SYCL.
- Binarios Android arm64 (CPU) publicados.
- Las compilaciones de Windows x64/arm64 soportan CPU, OpenCL Adreno, CUDA 12/13, Vulkan, OpenVINO, SYCL e HIP.
- Compilaciones openEuler x86 y aarch64 para 310p y 910b (ACL Graph) están disponibles.
Esta versión proporciona binarios actualizados en múltiples plataformas y aceleradores de hardware, permitiendo a los usuarios ejecutar llama.cpp con el nuevo soporte de especificación DFlash.