llama.cpp b9842 release : déduplication des presets et entrées de modèle en cache dans /v1/models
La version b9842 de llama.cpp introduit un changement pour dédupliquer les presets et les entrées de modèle en cache dans le point de terminaison /v1/models. Cette mise à jour est validée par Adrien Gallouët de Hugging Face.