El proyecto llama.cpp ha lanzado la versión b9867, introduciendo soporte para la especificación spec-draft-p-min dentro de DFlash. Esta actualización incluye cambios de código para añadir una protección n_min y asegurar que tanto n_min como n_max estén correctamente protegidos.

  • Soporte para spec-draft-p-min en DFlash a través del pull request #25246.
  • Adición de una protección n_min en el módulo dflash.
  • Protección de los parámetros n_min y n_max.
  • Binarios proporcionados para macOS Apple Silicon (arm64), mientras que el soporte de KleidiAI está deshabilitado.
  • Compilaciones disponibles para Linux Ubuntu x64/arm64/s390x con backends CPU, Vulkan, ROCm 7.2, OpenVINO y SYCL.
  • Binarios Android arm64 (CPU) publicados.
  • Las compilaciones de Windows x64/arm64 soportan CPU, OpenCL Adreno, CUDA 12/13, Vulkan, OpenVINO, SYCL e HIP.
  • Compilaciones openEuler x86 y aarch64 para 310p y 910b (ACL Graph) están disponibles.

Esta versión proporciona binarios actualizados en múltiples plataformas y aceleradores de hardware, permitiendo a los usuarios ejecutar llama.cpp con el nuevo soporte de especificación DFlash.