github llama.cpp · il y a 12 j · inference

llama.cpp version b9718 : sélection de slot consolidée et nouveaux binaires

Traduit de English → Français

la version llama.cpp b9718 consolide la sélection de slot dans une seule fonction, get_available_slot, tout en conservant les vérifications de similarité LCP pour les mises à jour du cache d'invite. La publication inclut des builds binaires pour macOS, Linux, Android, Windows et openEuler sur plusieurs architectures et options d'accélération matérielle.

Importance 1/3 Confiance 2/3 llama.cpp Code generation Hardware & chips Inference efficiency

Lire l'original