Tous les articles — korshunov.ai

Tous les articles Page 4 / 7

Notes de version MCP Python SDK v2.0.0a3

Le SDK Python du protocole Model Context Protocol (MCP) a publié sa troisième version alpha, v2.0.0a3, introduisant des changements significatifs au niveau du protocole et de l'architecture tout en maintenant la compatibilité ascendante pour les utilisateurs stables de la série 1.x.

github MCP (GitHub org) · il y a 5 j

Publication de la version 1.28.1 du SDK Python pour le Model Context Protocol

Le SDK Python du Model Context Protocol a publié la version 1.28.1, introduisant des mises à jour sur la gestion des flux et la sécurité du transport.

github llama.cpp · il y a 5 j

llama.cpp b9804 release : corrections de Mamba2 et nouveaux binaires

La version b9804 de llama.cpp introduit une correction pour l'architecture Mamba2 en supprimant un facteur d'expansion codé en dur de 2x et une vérification de paramètre invalide, permettant ainsi le support de n'importe quelle valeur d'expansion. Cette modification met à jour le script `convert_hf_to_gguf.py` pour rendre le paramètre expand optionnel avec une valeur par défaut de 2.

github llama.cpp · il y a 6 j

llama.cpp b9803 avec correction de profilage OpenCL

Le projet llama.cpp a publié la version b9803, qui inclut une correction pour OpenCL afin de vider les lots de profilage à l'arrêt pour les lots incomplets. Cette mise à jour fournit des binaires pour macOS, Linux, Windows, Android et openEuler sur divers backends matériels.

github llama.cpp · il y a 6 j

La version b9802 de llama.cpp fournit des binaires pour macOS, Linux, Windows et Android

Le projet llama.cpp a publié la version b9802, offrant des binaires préconstruits sur plusieurs systèmes d'exploitation et architectures matérielles. Cette mise à jour inclut le support du CPU, du GPU et des accélérateurs IA spécialisés sur des plateformes telles que macOS, Linux, Windows, Android et openEuler.

github SGLang · il y a 6 j

v0.5.14

L'article annonce la sortie de la version 0.5.14.

lab Claude Code Releases · il y a 6 j

Notes de version Claude Code v2.1.193

La version 2.1.193 de Claude Code introduit plusieurs améliorations pour la classification en mode automatique, l'enregistrement des télémétries et la gestion des agents en arrière-plan. Cette mise à jour inclut également des correctifs pour les problèmes d'état de l'interface utilisateur, la gestion de l'authentification dans les serveurs MCP et divers bugs liés au fonctionnement en arrière-plan.

lab Cohere Blog · il y a 6 j

Automatisation de la maintenance des forks avec des agents IA

Cet article décrit une méthode pour automatiser la maintenance des forks logiciels à l'aide d'agents de codage par IA, en l'appliquant au fork de Cohere de vLLM. L'approche réduit le temps nécessaire pour absorber les versions amont de plusieurs semaines à quelques jours en remplaçant l'intervention manuelle par une boucle de rétroaction automatisée.

lab Microsoft Research Blog · il y a 6 j

Comprendre le cerveau grâce à des explications et expériences pilotées par l'IA

Les chercheurs ont développé les Tests Causaux Génératifs (GCT), un cadre qui traduit des modèles de prédiction cérébrale basés sur des LLM non interprétables en hypothèses verbales concises et testables sur la fonction corticale. Cette méthode condense les paramètres du modèle en courtes phrases décrivant à quoi répondent des régions cérébrales spécifiques, comme la « préparation alimentaire », puis vérifie ces explications par le biais d'expériences IRMf ciblées.

lab Google — The Keyword (AI) · il y a 6 j

Google Finance quitte la bêta avec une nouvelle application Android

Google Finance quitte officiellement sa phase de bêta et lance une application dédiée pour les appareils Android.

github vLLM · il y a 6 j

v0.24.0rc2 : Correction de P/D avec le superviseur DP (#46628)

Cette version candidate corrige la fonctionnalité Prefill/Decode (P/D) en conjonction avec le superviseur de parallélisme des données (DP) au sein du projet vLLM.

lab Cohere Blog · il y a 6 j

Cohere automatise la réponse aux incidents avec North et Wiz via un serveur MCP personnalisé

Cohere a développé un agent de sécurité en utilisant sa plateforme d'IA entreprise, Cohere North, intégrée à la plateforme de sécurité cloud Wiz via un serveur Model Context Protocol (MCP) personnalisé. Cette architecture relie North à l'API GraphQL de Wiz via huit outils atomiques, permettant des workflows de réponse aux incidents automatisés à partir d'une seule invite. Le système effectue une analyse du rayon d'explosion des combinaisons toxiques en évaluant les chaînes d'attaque et en classant les risques en fonction de l'exposition internet et des niveaux de privilège en environ 20 secondes. Il automatise également l'enquête de bout en bout en récupérant les détails des problèmes, en créant des tickets Linear, en mettant à jour le statut de Wiz et en rédigeant des rapports structurés de réponse aux incidents. De plus, une automatisation hebdomadaire planifiée génère un bref sur la posture de sécurité chaque lundi matin sans intervention manuelle. Cette intégration élimine la boucle de tri précédente de 30 minutes à deux heures par découverte, permettant aux ingénieurs de se concentrer sur l'évaluation des analyses plutôt que sur les alertes brutes.

github llama.cpp · il y a 6 j

llama.cpp b9788 ajoute la parallélisation tensorielle SYCL pour les configurations à double GPU

La version b9788 de llama.cpp introduit le support de la parallélisation tensorielle via l'indicateur --split-mode tensor dans le backend SYCL. Cette implémentation permet la communication entre deux GPU en ajoutant les fonctions comm_init, comm_free et comm_allreduce_tensor au meta-backend. Pour deux appareils, elle utilise une stratégie d'all-reduce en anneau qui bascule entre memcpy direct FP32 pour les petits tenseurs et la compression BF16 pour les plus grands. Le code évite OneCCL en raison de sa limitation à un seul appareil par processus, utilisant plutôt des tampons persistants pour maintenir les invariants du pool SYCL. Les tests de performance sur deux GPU Intel Arc Pro B70 montrent des accélérations significatives par rapport au mode layer pour les modèles Llama-3.3-70B et Qwen3-Coder-Next-80B-A3B. La mise à jour inclut de nouveaux binaires pour macOS, Linux, Windows, Android et openEuler sur les cibles CPU, CUDA, ROCm, Vulkan et SYCL.

github llama.cpp · il y a 6 j

La version b9789 de llama.cpp corrige la quantification MoE et fournit des binaires multi-plateformes

Le projet llama.cpp a publié la version b9789, qui inclut une correction critique pour la quantification des modèles Mixture of Experts (MoE) avec prédiction multi-jeton. Cette mise à jour résout les problèmes identifiés dans la pull request #24986 afin de garantir un traitement approprié de ces architectures de modèles spécifiques. La version fournit des binaires préconstruits pour macOS Apple Silicon et Intel, ainsi qu'un iOS XCFramework. Les utilisateurs Linux peuvent télécharger des builds pour Ubuntu sur les backends CPU, Vulkan, ROCm 7.2, OpenVINO et SYCL. Le support Windows inclut les variantes CPU, CUDA 12.4 et 13.3, Vulkan, OpenVINO, SYCL et HIP. Des plateformes supplémentaires telles que Android arm64 et openEuler sont également prises en charge avec des configurations matérielles spécifiques.

lab OpenAI News · il y a 6 j

La recherche d'OpenAI montre que les agents IA transforment le travail

Un nouveau document de recherche d'OpenAI démontre comment les agents d'intelligence artificielle changent fondamentalement la nature du travail. L'étude met en évidence la capacité de ces agents à exécuter des tâches plus longues et plus complexes qu'auparavant. Cette avancée technologique est créditée d'avoir élargi la productivité dans une grande variété de rôles professionnels. Les résultats suggèrent un changement significatif dans la façon dont le travail est organisé et accompli grâce à l'automatisation. En gérant des flux de travail complexes, les agents IA permettent aux utilisateurs d'atteindre une plus grande efficacité. Le document sert de preuve de l'impact croissant des systèmes autonomes sur l'emploi moderne.

github llama.cpp · il y a 6 j

Correction des cas de test unitaires échoués pour conv_3d dans SYCL

Le dépôt llama.cpp a résolu un problème spécifique concernant le backend SYCL. Une demande de tirage a été soumise pour corriger les cas de test unitaires échoués associés à l'opération conv_3d. Cette mise à jour cible le projet ggml-org/llama.cpp sur GitHub. Les modifications corrigent les erreurs qui empêchaient précédemment l'exécution réussie de ces tests. Cette correction assure une meilleure stabilité pour les utilisateurs s'appuyant sur l'accélération matérielle basée sur SYCL.

github llama.cpp · il y a 7 j

La version b9786 de llama.cpp ajoute le support des lignes non contiguës via OpenCL

Le projet llama.cpp a publié la version b9786, introduisant le support des lignes non contiguës dans la normalisation via OpenCL. Cette mise à jour fait partie du développement continu par l'équipe ggml-org pour améliorer la compatibilité matérielle et les performances sur diverses plateformes. La version fournit des binaires pour macOS Apple Silicon, Mac Intel et iOS XCFrameworks. Les utilisateurs Linux peuvent accéder aux builds pour Ubuntu x64, arm64 et architectures s390x en utilisant les backends CPU, Vulkan, ROCm 7.2, OpenVINO et SYCL. Le support Android est disponible pour les appareils CPU arm64, tandis que Windows offre de nombreuses options incluant CPU, CUDA 12 et 13, Vulkan, OpenVINO, SYCL et HIP. La version liste également les builds désactivés pour KleidiAI sur les plateformes macOS et openEuler.

github llama.cpp · il y a 7 j

llama.cpp b9785 Release avec vérification renforcée des majuscules et binaires multi-plateformes

Le projet llama.cpp a publié la version b9785, incluant un changement de code pour durcir les vérifications des majuscules comme détaillé dans la pull request #24973. Cette mise à jour fournit des binaires précompilés pour macOS Apple Silicon, Mac Intel et iOS via un XCFramework, avec le support KleidiAI désactivé sur Apple Silicon. Les distributions Linux incluant Ubuntu sont prises en charge pour les backends CPU, Vulkan, ROCm 7.2, OpenVINO et SYCL sur les architectures x64, arm64 et s390x. Les utilisateurs d'Android peuvent accéder aux binaires CPU arm64, tandis que Windows offre des options étendues couvrant CPU, OpenCL Adreno, CUDA 12 et 13, Vulkan, OpenVINO, SYCL et HIP. La release inclut également des builds pour openEuler ciblant les processeurs x86 et aarch64 avec support ACL Graph. Un package UI autonome est disponible alongside les releases spécifiques à la plateforme pour faciliter l'inférence de modèles locaux.

lab Claude Code Releases · il y a 7 j

Notes de version de Claude Code v2.1.191

La version 2.1.191 de Claude Code introduit le support de /rewind, permettant aux utilisateurs de reprendre les conversations avant l'exécution d'une commande /clear. La mise à jour corrige plusieurs problèmes critiques, notamment la résurrection des agents en arrière-plan après leur arrêt et le saut de la position de défilement pendant les réponses en streaming. Elle corrige également le comportement où /voice affichait des messages d'erreur génériques et où les URL /login étaient tronquées dans Windows Terminal. Des améliorations significatives renforcent la fiabilité des serveurs MCP en ajoutant une logique de retry pour les erreurs réseau transitoires lors de la découverte des capacités et des flux OAuth. Les environnements headless ignorent désormais les popups navigateur pour OAuth, tandis que les autorisations réseau du sandbox sont mémorisées pendant toute la durée de la session. Les optimisations de performance réduisent l'utilisation du CPU pendant le streaming d'environ 37 % grâce à la consolidation des mises à jour de texte et atténuent la croissance de la mémoire lors des sessions longues due au cache de sortie du terminal.

github llama.cpp · il y a 7 j

LLaMA.cpp Release b9784 : Optimisations MM Hexagon et binaires multiplateformes

LLaMA.cpp publie la version b9784 avec des optimisations majeures pour les opérations MM basées sur Hexagon, incluant le repack de poids en tuiles 32x32, une meilleure gestion du dyn.quant et une gestion unifiée des paramètres de kernel. La release inclut de nouveaux binaires pour macOS (arm64 et x64), iOS, et plusieurs architectures Linux avec prise en charge de Vulkan, ROCm et OpenVINO.