Tous les articles — korshunov.ai

Tous les articles Page 10 / 11

llama.cpp version b9700 : nouveaux binaires et mises à jour de l'API SYCL

La version b9700 de llama.cpp introduit un support SYCL mis à jour avec des indicateurs d'API renommés : GGML_SYCL_SUPPORT_LEVEL_ZERO renommé en GGML_SYCL_SUPPORT_LEVEL_ZERO_API et GGML_SYCL_ENABLE_LEVEL_ZERO renommé en GGML_SYCL_USE_LEVEL_ZERO_API. La version inclut des binaires pour macOS, Linux, Android, Windows et openEuler sur plusieurs architectures et options d'accélération matérielle, y compris Vulkan, ROCm, OpenVINO et SYCL.

github llama.cpp · il y a 13 j

LLaMA.cpp Release b9698 Adds Self-Update Support and Multiple Platform Binaries

LLaMA.cpp version b9698 enables self-updates only when built with llama-install.sh. The release includes binaries for macOS, Linux, Android, Windows, and openEuler across multiple architectures and hardware acceleration options, including Vulkan, CUDA, OpenVINO, and SYCL.

github llama.cpp · il y a 13 j

llama.cpp Release b9699 Adds SYCL Support and Multiple Platform Binaries

llama.cpp version b9699 introduces support for MUL_MAT and OUT_PROD operations with Q1_0 precision via PR #24721. The release includes precompiled binaries for macOS, Linux, Android, Windows, and openEuler across multiple architectures and acceleration frameworks, including SYCL (FP32 and FP16), Vulkan, CUDA, ROCm, and OpenVINO.

github llama.cpp · il y a 13 j

LLaMA.cpp Release b9697 : nouveaux binaires et mises à jour

LLaMA.cpp publie la version b9697 avec des binaires mis à jour pour macOS, Linux, Android, Windows et openEuler. La release inclut le support pour ARM64, x64, Vulkan, CUDA 12 et 13, OpenVINO, SYCL et ROCm, avec un correctif sur l'analyse des messages dans les vérifications de release.

github llama.cpp · il y a 13 j

llama.cpp Release b9693 Adds BF16 Support and Cross-Platform Binaries

llama.cpp version b9693 introduces BF16 support in its concat kernel and provides pre-built binaries for macOS, Linux, Android, Windows, and openEuler. The release includes CPU, Vulkan, ROCm, OpenVINO, SYCL, and HIP variants across multiple architectures, with a dedicated UI package available.

github llama.cpp · il y a 13 j

llama.cpp publie la version b9694 avec de nouveaux binaires pour plusieurs plateformes

llama.cpp a publié la version b9694, incluant des binaires pour macOS, Linux, Android, Windows et openEuler. La prise en charge inclut diverses architectures et options d'accélération telles que CUDA, Vulkan, OpenVINO, SYCL et ROCm. Une correction pour le lien de publication OpenVINO x64 sous Windows a également été implémentée.

lab Claude Code Releases · il y a 14 j

Notes de version de Claude Code v2.1.181

Claude Code v2.1.181 introduit la prise en charge de la définition des paramètres de configuration via la syntaxe de prompt comme /config thinking=false, ajoute le support des événements Apple dans les sandbox sur macOS, et améliore le streaming, la nouvelle tentative automatique et le comportement du sous-agent. Il corrige également de nombreux bugs liés au démarrage, à la gestion des fichiers, au presse-papiers et à la réactivité de l'interface utilisateur sur toutes les plateformes.

github llama.cpp · il y a 14 j

ggml-cpu : Activation conditionnelle du backend POWER11 selon la prise en charge du compilateur

Le projet ggml-cpu active désormais de manière conditionnelle le backend POWER11 dans ggml en fonction de la prise en charge par le compilateur de l'option -mcpu=power11. Cela empêche les échecs de compilation sur les toolchains GCC/Clang actuelles tout en maintenant la compatibilité ascendante. Les mises à jour de CMakeLists.txt prennent en charge ce changement, et -mcpu=power10 est utilisé pour les architectures P10 et P11.

github llama.cpp · il y a 14 j

llama.cpp Release b9692 Ajoute de Nouveaux Binaires et Corrige des Bugs

La version llama.cpp b9692 introduit de nouveaux binaires pour macOS, Linux, Android, Windows et openEuler sur plusieurs architectures. La release inclut des mises à jour pour supporter Vulkan, ROCm, OpenVINO, SYCL et HIP, avec des corrections pour supprimer l'utilisation de la dimension batch dans llava_uhd.

github llama.cpp · il y a 14 j

Le backend Metal ajoute la prise en charge de f16 et bf16 pour l'opérateur concat

Le backend Metal dans llama.cpp a été étendu pour prendre en charge les types de tenseurs f16 et bf16 pour l'opérateur concat, en plus de la prise en charge existante de f32 et i32. Cette mise à jour inclut des modèles de noyau spécialisés, des accesseurs de pipeline mis à jour et une dispatch de noyau basée sur le type améliorée, avec l'assistance de pi:llama.cpp/Qwen3.6-27B.

github llama.cpp · il y a 14 j

llama.cpp publie b9690 avec l'opérateur rope_back et des binaires multiplateformes

La version b9690 de llama.cpp introduit un opérateur rope_back implémenté en réutilisant les noyaux rope existants avec une constante de fonction pour basculer la rotation avant/arrière. La release inclut des binaires préconstruits pour macOS, Linux, Android, Windows et openEuler sur plusieurs architectures et options d'accélération matérielle, dont Vulkan, CUDA, ROCm, OpenVINO et SYCL.

github llama.cpp · il y a 14 j

llama.cpp Release b9687 Ajoute de Nouveaux Binaires et Corrections

la version llama.cpp b9687 introduit de nouveaux binaires pour macOS, Linux, Android, Windows, et openEuler sur plusieurs architectures. La release inclut le support pour Vulkan, ROCm, OpenVINO, SYCL, et HIP, avec des mises à jour pour améliorer la validation des périphériques et les performances sur le matériel disponible.

github llama.cpp · il y a 14 j

llama.cpp publie la version b9688 avec de nouvelles API et des binaires multiplateformes

llama.cpp publie la version b9688, ajoutant des API de gestion des modèles et de mises à jour en temps réel SSE. La release inclut des binaires précompilés pour macOS, Linux, Android, Windows et openEuler, prenant en charge diverses architectures et frameworks d'accélération comme Vulkan, CUDA, OpenVINO et SYCL.

github llama.cpp · il y a 14 j

LLaMA.cpp Release b9685 Adds SYCL Dev2Dev Memcpy et Binaires Multi-plateformes

La version b9685 de LLaMA.cpp introduit la fonctionnalité memcpy dev2dev basée sur SYCL, déplaçant GGML_SYCL_DEV2DEV_MEMCPY vers une table d'exécution et améliorant la détection de la communication pair-à-pair. La release inclut des binaires précompilés pour macOS, Linux, Android, Windows et openEuler sur plusieurs architectures et API incluant Vulkan, ROCm, OpenVINO et SYCL (FP32/FP16).

github llama.cpp · il y a 14 j

llama.cpp Release b9686 : Correction du segfault sur les longs prompts pour Eagle3

La version llama.cpp b9686 corrige une erreur de segfault qui se produisait avec les longs prompts sur le modèle Eagle3. La release inclut des binaires pour macOS, Linux, Android, Windows et openEuler sur plusieurs architectures et options d'accélération matérielle, y compris Vulkan, CUDA, OpenVINO et SYCL.

github llama.cpp · il y a 14 j

LLaMA.cpp Release b9684 Ajoute Conv_3D et Binaires Multi-plateformes

La version b9684 de LLaMA.cpp introduit une nouvelle opération de convolution 3D (conv_3d) et inclut des implémentations optimisées. La version fournit des binaires précompilés pour macOS, Linux, Android, Windows et openEuler sur diverses architectures et options d'accélération matérielle, y compris SYCL, Vulkan, CUDA et OpenVINO.

github llama.cpp · il y a 14 j

llama.cpp release b9682 ajoute le support Vulkan et de nouveaux binaires pour plateformes

La version b9682 de llama.cpp introduit le support Vulkan pour Linux et Windows, permettant l'accélération GPU. La publication inclut des binaires pour macOS, Linux, Android, Windows et openEuler sur plusieurs architectures, avec des options CPU et GPU incluant CUDA, OpenVINO, SYCL et ROCm.

github llama.cpp · il y a 14 j

LLaMA.cpp Release b9678 Ajoute des Optimisations et des Builds Multiplateformes

La release LLaMA.cpp b9678 inclut l'optimisation de mul_mat_f16_f32_l4 pour le décodage et introduit de nouveaux builds pour macOS, Linux, Android, Windows et openEuler. La release offre un support CPU, Vulkan, ROCm, OpenVINO, SYCL et HIP sur plusieurs architectures, avec un package UI dédié disponible.

github llama.cpp · il y a 14 j

llama.cpp Release b9677 : Mises à jour et binaires multiplateformes

La version b9677 de llama.cpp met à jour la journalisation pour imposer max_capacity et supprime la logique d'expansion de la file d'attente. La release inclut des binaires pour macOS, Linux, Android, Windows et openEuler sur plusieurs architectures et options d'accélération matérielle, dont Vulkan, CUDA, OpenVINO et SYCL.

github llama.cpp · il y a 14 j

LLaMA.cpp Release b9674 : Correction du bug memcpy asynchrone et ajout de nouveaux binaires

La version b9674 de LLaMA.cpp corrige un bug d'utilisation après libération dans le memcpy asynchrone de SYCL lors du préremplissage MoE. La release inclut des binaires pour macOS, Linux, Android, Windows et openEuler, prenant en charge CPU, Vulkan, ROCm, OpenVINO, SYCL et CUDA sur plusieurs architectures.