La version b9690 de llama.cpp introduit un opérateur rope_back implémenté en réutilisant les noyaux rope existants avec une constante de fonction pour basculer la rotation avant/arrière. La release inclut des binaires préconstruits pour macOS, Linux, Android, Windows et openEuler sur plusieurs architectures et options d'accélération matérielle, dont Vulkan, CUDA, ROCm, OpenVINO et SYCL.
llama.cpp publie b9690 avec l'opérateur rope_back et des binaires multiplateformes
Traduit de English → Français