Tous les articles — korshunov.ai

Tous les articles Page 1 / 13

llama.cpp publie b9673 avec des allocations système USM et des binaires multiplateformes

La version b9673 de llama.cpp introduit des allocations système USM optionnelles pour les tampons GPU ≥1 Go, permettant le sur-engagement de la VRAM lorsque la prise en charge par l'appareil est disponible. Cette fonctionnalité nécessite la variable d'environnement GGML_SYCL_USM_SYSTEM et est désactivée par défaut, avec un retour aux allocations régulières si non pris en charge.

lab Claude Code Releases · il y a 15 j

Notes de version v2.1.179

v2.1.179 corrige les déconnexions en milieu de flux, les problèmes de défilement avec la molette de la souris dans WSL2, et un bug de glob dans le sandbox causant des descriptions excessives des outils Bash. Il résout également les erreurs du sondage de feedback, l'empilement des bannières promotionnelles, et les problèmes de focus dans les vues de sous-agent, tout en améliorant le chargement des plugins dans les sessions distantes.

github llama.cpp · il y a 15 j

llama.cpp publie b9660 avec des correctifs et de nouveaux binaires

llama.cpp publie la version b9660, corrigeant le double-échappement dans l'analyse des appels d'outil LFM2. La mise à jour inclut des binaires pour macOS, Linux, Android, Windows et openEuler sur plusieurs architectures et options d'accélération matérielle, avec un package UI dédié.

github LangGraph · il y a 15 j

langgraph-cli 0.4.30 Released

La version 0.4.30 de langgraph-cli est désormais disponible, avec prise en charge des plages de versions d'API compatibles. La publication inclut également des structures README.md standardisées pour une meilleure cohérence de la documentation.

lab Claude Code Releases · il y a 15 j

Notes de version de Claude v2.1.178

Claude v2.1.178 introduit de nouvelles règles de permission utilisant la syntaxe Tool(param:value), améliore le chargement des workflows et des compétences dans les répertoires imbriqués, et optimise le mode automatique et les messages d'erreur. Il corrige des problèmes critiques incluant des plantages, des erreurs d'authentification et des comportements de l'interface utilisateur dans Chrome et VSCode, tout en affinant les invites d'outils et la fonctionnalité d'annulation.

github llama.cpp · il y a 15 j

llama.cpp publie la version b9672 avec une mise à jour de BoringSSL

llama.cpp a publié la version b9672, mettant à jour BoringSSL vers la version 0.20260616.0. La release inclut des binaires pour macOS, Linux, Android, Windows et openEuler sur plusieurs architectures et options d'accélération matérielle, dont Vulkan, CUDA, ROCm, OpenVINO et SYCL.

github Goose (Block) · il y a 15 j

Branche de release créée pour v1.38.0

Une branche de release a été créée pour la version 1.38.0. Cela marque le début du processus de release pour la mise à jour.

github llama.cpp · il y a 16 j

llama.cpp publie b96669 avec échantillonnage backend pour Eagle3

La version b96669 de llama.cpp ajoute le support de l'échantillonnage backend pour Eagle3. La release inclut des binaires pour macOS, Linux, Android, Windows et openEuler sur plusieurs architectures et options d'accélération matérielle, y compris Vulkan, CUDA, ROCm, OpenVINO et SYCL.

github llama.cpp · il y a 16 j

llama.cpp Release b9670 : Corrections et nouvelles versions

La version llama.cpp b9670 inclut des corrections pour les cas limites NVFP4 dans llama-graph, notamment le déplacement des opérations MUL post-GEMM et la restriction de build_ffn aux combinaisons prises en charge. La version fournit des binaires pour macOS, Linux, Android, Windows et openEuler sur plusieurs architectures et options de backend, y compris CUDA, Vulkan, SYCL et OpenVINO.

github llama.cpp · il y a 16 j

llama.cpp Release b9667 Ajoute le Support de Vulkan et CUDA

La version b9667 de llama.cpp introduit le support de Vulkan avec S_v=16 via gated_delta_net. Elle inclut des binaires pour macOS, Linux, Android, Windows et openEuler sur plusieurs architectures, avec des options pour Vulkan, CUDA 12.4 et 13.3, ROCm, OpenVINO et SYCL.

github llama.cpp · il y a 16 j

llama.cpp release b9668 ajoute la mémoire visible hôte UMA et des binaires multiplateformes

La version b9668 de llama.cpp implémente des tampons de mémoire visible hôte UMA pour de meilleures performances sur les appareils UMA, sur la suggestion de 0cc4m. La release inclut des binaires pour macOS, Linux, Android, Windows et openEuler, prenant en charge CPU, Vulkan, ROCm, OpenVINO, SYCL et HIP, avec un package UI dédié.

github llama.cpp · il y a 16 j

llama.cpp release b9665 ajoute le drapeau --offline et de nouveaux binaires

La version b9665 de llama.cpp introduit un nouveau drapeau --offline pour le benchmarking. La release inclut des builds binaires pour macOS, Linux, Android, Windows et openEuler sur plusieurs architectures et options d'accélération matérielle, y compris Vulkan, CUDA, ROCm, OpenVINO et SYCL.

github llama.cpp · il y a 16 j

LLaMA.cpp Release b9663 Ajoute le Support SYCL et de Nouveaux Binaires

La version b9663 de LLaMA.cpp ajoute la prise en charge de OP EXPM1 et tous les cas de test unitaires pour FLOOR, TRUNC et ROUND. Elle inclut des binaires mis à jour pour macOS, Linux, Android, Windows et openEuler, avec le support de SYCL (FP32 et FP16), Vulkan, CUDA 12.4 et 13.3, ainsi que ROCm 7.2, accompagnée d'une interface utilisateur mise à jour.

github llama.cpp · il y a 16 j

sycl : prise en charge des MUL_MAT_ID MoE Q4_K/Q5_K/Q6_K réordonnés

La mise à jour sycl étend la prise en charge de la gestion des tenseurs d'experts réordonnés dans MoE MUL_MAT_ID à Q4_K, Q5_K et Q6_K. Les cas de réorganisation 3D non pris en charge basculent maintenant vers un fallback au lieu de provoquer un abort.

github llama.cpp · il y a 16 j

Vulkan ajoute l'op col2im_1d et prend en charge plusieurs plateformes

La version b9661 de llama.cpp ajoute le support GGML_OP_COL2IM_1D pour Vulkan, en utilisant une boucle de regroupement bornée au lieu d'un scan K complet avec modulo. Elle retourne nullptr pour les types non pris en charge et inclut des builds pour macOS, Linux, Android, Windows et openEuler sur CPU, Vulkan, CUDA et SYCL.