la version llama.cpp b9718 consolide la sélection de slot dans une seule fonction, get_available_slot, tout en conservant les vérifications de similarité LCP pour les mises à jour du cache d'invite. La publication inclut des builds binaires pour macOS, Linux, Android, Windows et openEuler sur plusieurs architectures et options d'accélération matérielle.
llama.cpp version b9718 : sélection de slot consolidée et nouveaux binaires
Traduit de English → Français