llama.cpp libera b9704: corrige el manejo de gramática inválida y añade nuevos binarios
La versión b9704 de llama.cpp ahora devuelve HTTP 400 para gramática inválida en lugar de descartar silenciosamente las restricciones. El lanzamiento incluye binarios para macOS, Linux, Android, Windows y openEuler a través de múltiples arquitecturas y aceleradores de hardware, con soporte para Vulkan, ROCm, OpenVINO, SYCL y CUDA.