A versão b9704 do llama.cpp agora retorna HTTP 400 para gramática inválida em vez de descartar silenciosamente as restrições. O lançamento inclui binários para macOS, Linux, Android, Windows e openEuler em várias arquiteturas e aceleradores de hardware, com suporte para Vulkan, ROCm, OpenVINO, SYCL e CUDA.