Tous les articles — korshunov.ai

Tous les articles Page 1 / 4

v0.24.0

La version v0.24.0 inclut une mise à jour de l'intégration continue pour augmenter le délai de démarrage GSM8K des configurations MoE Refactor Qwen3 NVFP4.

lab OpenAI News · il y a 4 j

OpenAI présente en avant-première les modèles GPT-5.6 Sol, Terra et Luna

OpenAI a lancé un aperçu limité de la série GPT-5.6, introduisant trois nouveaux modèles : Sol comme modèle phare, Terra pour un équilibre dans le travail quotidien, et Luna pour des tâches rapides et abordables. L'entreprise prévoit de rendre ces modèles disponibles au grand public dans les prochaines semaines après cette phase initiale avec des partenaires de confiance.

lab Claude Code Releases · il y a 4 j

Notes de version de Claude Code v2.1.195

La version 2.1.195 de Claude Code introduit plusieurs correctifs et améliorations, notamment de nouvelles variables d'environnement pour le contrôle de la souris en mode plein écran et des corrections à la logique du matcheur de hooks.

github MCP (GitHub org) · il y a 5 j

Notes de version MCP Python SDK v2.0.0a3

Le SDK Python du protocole Model Context Protocol (MCP) a publié sa troisième version alpha, v2.0.0a3, introduisant des changements significatifs au niveau du protocole et de l'architecture tout en maintenant la compatibilité ascendante pour les utilisateurs stables de la série 1.x.

github MCP (GitHub org) · il y a 5 j

Publication de la version 1.28.1 du SDK Python pour le Model Context Protocol

Le SDK Python du Model Context Protocol a publié la version 1.28.1, introduisant des mises à jour sur la gestion des flux et la sécurité du transport.

github SGLang · il y a 5 j

v0.5.14

L'article annonce la sortie de la version 0.5.14.

lab Claude Code Releases · il y a 5 j

Notes de version Claude Code v2.1.193

La version 2.1.193 de Claude Code introduit plusieurs améliorations pour la classification en mode automatique, l'enregistrement des télémétries et la gestion des agents en arrière-plan. Cette mise à jour inclut également des correctifs pour les problèmes d'état de l'interface utilisateur, la gestion de l'authentification dans les serveurs MCP et divers bugs liés au fonctionnement en arrière-plan.

lab Cohere Blog · il y a 5 j

Automatisation de la maintenance des forks avec des agents IA

Cet article décrit une méthode pour automatiser la maintenance des forks logiciels à l'aide d'agents de codage par IA, en l'appliquant au fork de Cohere de vLLM. L'approche réduit le temps nécessaire pour absorber les versions amont de plusieurs semaines à quelques jours en remplaçant l'intervention manuelle par une boucle de rétroaction automatisée.

lab Microsoft Research Blog · il y a 5 j

Comprendre le cerveau grâce à des explications et expériences pilotées par l'IA

Les chercheurs ont développé les Tests Causaux Génératifs (GCT), un cadre qui traduit des modèles de prédiction cérébrale basés sur des LLM non interprétables en hypothèses verbales concises et testables sur la fonction corticale. Cette méthode condense les paramètres du modèle en courtes phrases décrivant à quoi répondent des régions cérébrales spécifiques, comme la « préparation alimentaire », puis vérifie ces explications par le biais d'expériences IRMf ciblées.

lab Google — The Keyword (AI) · il y a 5 j

Google Finance quitte la bêta avec une nouvelle application Android

Google Finance quitte officiellement sa phase de bêta et lance une application dédiée pour les appareils Android.

github vLLM · il y a 5 j

v0.24.0rc2 : Correction de P/D avec le superviseur DP (#46628)

Cette version candidate corrige la fonctionnalité Prefill/Decode (P/D) en conjonction avec le superviseur de parallélisme des données (DP) au sein du projet vLLM.

lab Cohere Blog · il y a 6 j

Cohere automatise la réponse aux incidents avec North et Wiz via un serveur MCP personnalisé

Cohere a développé un agent de sécurité en utilisant sa plateforme d'IA entreprise, Cohere North, intégrée à la plateforme de sécurité cloud Wiz via un serveur Model Context Protocol (MCP) personnalisé. Cette architecture relie North à l'API GraphQL de Wiz via huit outils atomiques, permettant des workflows de réponse aux incidents automatisés à partir d'une seule invite. Le système effectue une analyse du rayon d'explosion des combinaisons toxiques en évaluant les chaînes d'attaque et en classant les risques en fonction de l'exposition internet et des niveaux de privilège en environ 20 secondes. Il automatise également l'enquête de bout en bout en récupérant les détails des problèmes, en créant des tickets Linear, en mettant à jour le statut de Wiz et en rédigeant des rapports structurés de réponse aux incidents. De plus, une automatisation hebdomadaire planifiée génère un bref sur la posture de sécurité chaque lundi matin sans intervention manuelle. Cette intégration élimine la boucle de tri précédente de 30 minutes à deux heures par découverte, permettant aux ingénieurs de se concentrer sur l'évaluation des analyses plutôt que sur les alertes brutes.

lab OpenAI News · il y a 6 j

La recherche d'OpenAI montre que les agents IA transforment le travail

Un nouveau document de recherche d'OpenAI démontre comment les agents d'intelligence artificielle changent fondamentalement la nature du travail. L'étude met en évidence la capacité de ces agents à exécuter des tâches plus longues et plus complexes qu'auparavant. Cette avancée technologique est créditée d'avoir élargi la productivité dans une grande variété de rôles professionnels. Les résultats suggèrent un changement significatif dans la façon dont le travail est organisé et accompli grâce à l'automatisation. En gérant des flux de travail complexes, les agents IA permettent aux utilisateurs d'atteindre une plus grande efficacité. Le document sert de preuve de l'impact croissant des systèmes autonomes sur l'emploi moderne.

lab Claude Code Releases · il y a 6 j

Notes de version de Claude Code v2.1.191

La version 2.1.191 de Claude Code introduit le support de /rewind, permettant aux utilisateurs de reprendre les conversations avant l'exécution d'une commande /clear. La mise à jour corrige plusieurs problèmes critiques, notamment la résurrection des agents en arrière-plan après leur arrêt et le saut de la position de défilement pendant les réponses en streaming. Elle corrige également le comportement où /voice affichait des messages d'erreur génériques et où les URL /login étaient tronquées dans Windows Terminal. Des améliorations significatives renforcent la fiabilité des serveurs MCP en ajoutant une logique de retry pour les erreurs réseau transitoires lors de la découverte des capacités et des flux OAuth. Les environnements headless ignorent désormais les popups navigateur pour OAuth, tandis que les autorisations réseau du sandbox sont mémorisées pendant toute la durée de la session. Les optimisations de performance réduisent l'utilisation du CPU pendant le streaming d'environ 37 % grâce à la consolidation des mises à jour de texte et atténuent la croissance de la mémoire lors des sessions longues due au cache de sortie du terminal.

lab Google DeepMind Blog · il y a 7 j

Gemini 3.5 Flash ajoute la capacité d'utilisation de l'ordinateur

Google a introduit l'utilisation de l'ordinateur dans Gemini 3.5 Flash, permettant au modèle d'exécuter du code et d'interagir avec des outils externes. Cette fonctionnalité permet aux utilisateurs d'exécuter des tâches de programmation et d'accéder à des informations en temps réel grâce à des fonctions informatiques intégrées.

lab Claude Code Releases · il y a 7 j

v2.1.190 : Corrections de bugs et améliorations de fiabilité

La version 2.1.190 inclut des corrections de bugs et des améliorations de fiabilité. Aucune nouvelle fonctionnalité n'est annoncée dans cette mise à jour.

lab Mistral AI News · il y a 7 j

Nouveaux contrôles de connecteur pour la sécurité et l'accès des entreprises

Mistral Studio propose désormais des contrôles d'administration enrichis pour gérer l'accès aux connecteurs par espace de travail et par outil, permettant des permissions fines. Les fonctionnalités incluent des clés API avec des étendues, des connecteurs multi-comptes et un nouveau débogueur de connecteurs pour l'analyse des causes racines, le tout soutenant une intégration sécurisée et auditable avec les systèmes d'entreprise.

lab Microsoft Research Blog · il y a 7 j

Talos : Réanalyse génomique automatisée pour le diagnostic des maladies rares

Talos est un outil open-source qui automatise la réanalyse itérative des données génomiques afin d'identifier les diagnostics de maladies rares. Il a atteint un taux de récupération de 90 % des diagnostics dans le périmètre avec seulement 1,3 variants candidats par patient, et a fourni 241 nouveaux diagnostics parmi 5 000 patients non diagnostiqués, la plupart des nouvelles découvertes apparaissant dans les 32 jours suivant la publication des preuves.

lab OpenAI News · il y a 7 j

OpenAI et Broadcom dévoilent une puce d'inférence optimisée pour les LLM

OpenAI et Broadcom ont présenté Jalapeño, une puce IA personnalisée conçue pour l'inférence des grands modèles de langage. La puce vise à améliorer les performances, l'efficacité et la scalabilité des systèmes d'IA.

github vLLM · il y a 7 j

v0.24.0rc1 : Correction de la construction de l'histogramme topk sur SM75

vllm publie la version v0.24.0rc1, incluant une correction pour les problèmes de construction de l'histogramme topk sur SM75. Le changement a été cherry-pické depuis le commit 191826e et signé par Mohammad Miadh Angkad.