O projeto llama.cpp lançou a versão b9860, introduzindo uma nova função pública da API C chamada `llama_ftype_name` para expor o nome do tipo de arquivo do modelo (quantização).
- A função `llama_ftype_name` retorna strings como "Q8_0" ou "Q4_K - Medium", com o ponteiro válido durante a vida útil do modelo e nullptr se inválido.
- A implementação foi otimizada prependendo o rótulo "(guessed)" em vez de anexá-lo, removendo uma string estática não segura para threads para tornar a função livre de alocação.
- Binários estão disponíveis para macOS (Apple Silicon e Intel), Linux (CPU, Vulkan, ROCm, OpenVINO, SYCL), Android, Windows (CPU, CUDA 12/13, Vulkan, OpenCL, OpenVINO, SYCL, HIP) e openEuler.
Esta atualização permite que os desenvolvedores identifiquem programadamente o formato de quantização dos modelos carregados sem depender de metadados externos ou adivinhação.