La release b9860 de llama.cpp ajoute l'API llama_ftype_name

Le projet llama.cpp a publié la version b9860, introduisant une nouvelle fonction d'API C publique nommée `llama_ftype_name` pour exposer le nom du type de fichier modèle (quantification).

La fonction `llama_ftype_name` retourne des chaînes telles que "Q8_0" ou "Q4_K - Medium", avec le pointeur valide pendant toute la durée de vie du modèle et nullptr si invalide.
L'implémentation a été optimisée en préfixant le libellé "(guessed)" au lieu de le suffixer, supprimant une chaîne statique non thread-safe pour rendre la fonction sans allocation.
Les binaires sont disponibles pour macOS (Apple Silicon et Intel), Linux (CPU, Vulkan, ROCm, OpenVINO, SYCL), Android, Windows (CPU, CUDA 12/13, Vulkan, OpenCL, OpenVINO, SYCL, HIP) et openEuler.

Cette mise à jour permet aux développeurs d'identifier programmatiquement le format de quantification des modèles chargés sans se fier à des métadonnées externes ou à des suppositions.