La version b9837 de llama.cpp ajoute le drapeau --reasoning-preserve et de nouveaux binaires

Le projet llama.cpp a publié la version b9837, qui introduit un nouveau drapeau `--reasoning-preserve` pour le modèle de chat Jinja afin de conserver les jetons de raisonnement. Cette mise à jour inclut également des messages d'aide corrigés et fournit des binaires préconstruits pour macOS, Linux, Windows, Android et openEuler sur divers backends matériels.

Ajout du drapeau `--reasoning-preserve` aux modèles jinja et chat pour préserver le contenu de raisonnement.
Correction du texte du message d'aide au sein de la base de code.
Désactivation du support KleidiAI pour les builds macOS Apple Silicon.
Publication de binaires pour Ubuntu (CPU, Vulkan, ROCm 7.2, OpenVINO, SYCL), Windows (CPU, CUDA 12/13, Vulkan, OpenVINO, SYCL, HIP) et macOS (Apple Silicon et Intel).

Cette version permet aux utilisateurs d'accéder aux dernières fonctionnalités de llama.cpp sur une large gamme de plateformes et d'accélérateurs matériels tout en offrant un contrôle spécifique sur la gestion des jetons de raisonnement dans les modèles de chat.