Tous les articles
github llama.cpp · il y a 13 j

llama.cpp version b9700 : nouveaux binaires et mises à jour de l'API SYCL

La version b9700 de llama.cpp introduit un support SYCL mis à jour avec des indicateurs d'API renommés : GGML_SYCL_SUPPORT_LEVEL_ZERO renommé en GGML_SYCL_SUPPORT_LEVEL_ZERO_API et GGML_SYCL_ENABLE_LEVEL_ZERO renommé en GGML_SYCL_USE_LEVEL_ZERO_API. La version inclut des binaires pour macOS, Linux, Android, Windows et openEuler sur plusieurs architectures et options d'accélération matérielle, y compris Vulkan, ROCm, OpenVINO et SYCL.

lab Claude Code Releases · il y a 14 j

Notes de version de Claude Code v2.1.181

Claude Code v2.1.181 introduit la prise en charge de la définition des paramètres de configuration via la syntaxe de prompt comme /config thinking=false, ajoute le support des événements Apple dans les sandbox sur macOS, et améliore le streaming, la nouvelle tentative automatique et le comportement du sous-agent. Il corrige également de nombreux bugs liés au démarrage, à la gestion des fichiers, au presse-papiers et à la réactivité de l'interface utilisateur sur toutes les plateformes.

github llama.cpp · il y a 14 j

ggml-cpu : Activation conditionnelle du backend POWER11 selon la prise en charge du compilateur

Le projet ggml-cpu active désormais de manière conditionnelle le backend POWER11 dans ggml en fonction de la prise en charge par le compilateur de l'option -mcpu=power11. Cela empêche les échecs de compilation sur les toolchains GCC/Clang actuelles tout en maintenant la compatibilité ascendante. Les mises à jour de CMakeLists.txt prennent en charge ce changement, et -mcpu=power10 est utilisé pour les architectures P10 et P11.

github llama.cpp · il y a 14 j

Le backend Metal ajoute la prise en charge de f16 et bf16 pour l'opérateur concat

Le backend Metal dans llama.cpp a été étendu pour prendre en charge les types de tenseurs f16 et bf16 pour l'opérateur concat, en plus de la prise en charge existante de f32 et i32. Cette mise à jour inclut des modèles de noyau spécialisés, des accesseurs de pipeline mis à jour et une dispatch de noyau basée sur le type améliorée, avec l'assistance de pi:llama.cpp/Qwen3.6-27B.

github llama.cpp · il y a 14 j

llama.cpp publie b9690 avec l'opérateur rope_back et des binaires multiplateformes

La version b9690 de llama.cpp introduit un opérateur rope_back implémenté en réutilisant les noyaux rope existants avec une constante de fonction pour basculer la rotation avant/arrière. La release inclut des binaires préconstruits pour macOS, Linux, Android, Windows et openEuler sur plusieurs architectures et options d'accélération matérielle, dont Vulkan, CUDA, ROCm, OpenVINO et SYCL.

github llama.cpp · il y a 14 j

LLaMA.cpp Release b9685 Adds SYCL Dev2Dev Memcpy et Binaires Multi-plateformes

La version b9685 de LLaMA.cpp introduit la fonctionnalité memcpy dev2dev basée sur SYCL, déplaçant GGML_SYCL_DEV2DEV_MEMCPY vers une table d'exécution et améliorant la détection de la communication pair-à-pair. La release inclut des binaires précompilés pour macOS, Linux, Android, Windows et openEuler sur plusieurs architectures et API incluant Vulkan, ROCm, OpenVINO et SYCL (FP32/FP16).