Lançamento b9842 do llama.cpp: predefinição de deduplicação e entradas de modelo em cache em /v1/models
O lançamento b9842 do llama.cpp introduz uma alteração para duplicar entradas de predefinição e modelos em cache no endpoint /v1/models. Esta atualização é aprovada por Adrien Gallouët, da Hugging Face.