Tous les articles — korshunov.ai

Tous les articles Page 1 / 5

v0.24.0rc2 : Correction de P/D avec le superviseur DP (#46628)

Cette version candidate corrige la fonctionnalité Prefill/Decode (P/D) en conjonction avec le superviseur de parallélisme des données (DP) au sein du projet vLLM.

lab Cohere Blog · il y a 6 j

Cohere automatise la réponse aux incidents avec North et Wiz via un serveur MCP personnalisé

Cohere a développé un agent de sécurité en utilisant sa plateforme d'IA entreprise, Cohere North, intégrée à la plateforme de sécurité cloud Wiz via un serveur Model Context Protocol (MCP) personnalisé. Cette architecture relie North à l'API GraphQL de Wiz via huit outils atomiques, permettant des workflows de réponse aux incidents automatisés à partir d'une seule invite. Le système effectue une analyse du rayon d'explosion des combinaisons toxiques en évaluant les chaînes d'attaque et en classant les risques en fonction de l'exposition internet et des niveaux de privilège en environ 20 secondes. Il automatise également l'enquête de bout en bout en récupérant les détails des problèmes, en créant des tickets Linear, en mettant à jour le statut de Wiz et en rédigeant des rapports structurés de réponse aux incidents. De plus, une automatisation hebdomadaire planifiée génère un bref sur la posture de sécurité chaque lundi matin sans intervention manuelle. Cette intégration élimine la boucle de tri précédente de 30 minutes à deux heures par découverte, permettant aux ingénieurs de se concentrer sur l'évaluation des analyses plutôt que sur les alertes brutes.

lab OpenAI News · il y a 6 j

La recherche d'OpenAI montre que les agents IA transforment le travail

Un nouveau document de recherche d'OpenAI démontre comment les agents d'intelligence artificielle changent fondamentalement la nature du travail. L'étude met en évidence la capacité de ces agents à exécuter des tâches plus longues et plus complexes qu'auparavant. Cette avancée technologique est créditée d'avoir élargi la productivité dans une grande variété de rôles professionnels. Les résultats suggèrent un changement significatif dans la façon dont le travail est organisé et accompli grâce à l'automatisation. En gérant des flux de travail complexes, les agents IA permettent aux utilisateurs d'atteindre une plus grande efficacité. Le document sert de preuve de l'impact croissant des systèmes autonomes sur l'emploi moderne.

lab Claude Code Releases · il y a 6 j

Notes de version de Claude Code v2.1.191

La version 2.1.191 de Claude Code introduit le support de /rewind, permettant aux utilisateurs de reprendre les conversations avant l'exécution d'une commande /clear. La mise à jour corrige plusieurs problèmes critiques, notamment la résurrection des agents en arrière-plan après leur arrêt et le saut de la position de défilement pendant les réponses en streaming. Elle corrige également le comportement où /voice affichait des messages d'erreur génériques et où les URL /login étaient tronquées dans Windows Terminal. Des améliorations significatives renforcent la fiabilité des serveurs MCP en ajoutant une logique de retry pour les erreurs réseau transitoires lors de la découverte des capacités et des flux OAuth. Les environnements headless ignorent désormais les popups navigateur pour OAuth, tandis que les autorisations réseau du sandbox sont mémorisées pendant toute la durée de la session. Les optimisations de performance réduisent l'utilisation du CPU pendant le streaming d'environ 37 % grâce à la consolidation des mises à jour de texte et atténuent la croissance de la mémoire lors des sessions longues due au cache de sortie du terminal.

lab Google DeepMind Blog · il y a 7 j

Gemini 3.5 Flash ajoute la capacité d'utilisation de l'ordinateur

Google a introduit l'utilisation de l'ordinateur dans Gemini 3.5 Flash, permettant au modèle d'exécuter du code et d'interagir avec des outils externes. Cette fonctionnalité permet aux utilisateurs d'exécuter des tâches de programmation et d'accéder à des informations en temps réel grâce à des fonctions informatiques intégrées.

lab Claude Code Releases · il y a 7 j

v2.1.190 : Corrections de bugs et améliorations de fiabilité

La version 2.1.190 inclut des corrections de bugs et des améliorations de fiabilité. Aucune nouvelle fonctionnalité n'est annoncée dans cette mise à jour.

lab Mistral AI News · il y a 7 j

Nouveaux contrôles de connecteur pour la sécurité et l'accès des entreprises

Mistral Studio propose désormais des contrôles d'administration enrichis pour gérer l'accès aux connecteurs par espace de travail et par outil, permettant des permissions fines. Les fonctionnalités incluent des clés API avec des étendues, des connecteurs multi-comptes et un nouveau débogueur de connecteurs pour l'analyse des causes racines, le tout soutenant une intégration sécurisée et auditable avec les systèmes d'entreprise.

lab Microsoft Research Blog · il y a 7 j

Talos : Réanalyse génomique automatisée pour le diagnostic des maladies rares

Talos est un outil open-source qui automatise la réanalyse itérative des données génomiques afin d'identifier les diagnostics de maladies rares. Il a atteint un taux de récupération de 90 % des diagnostics dans le périmètre avec seulement 1,3 variants candidats par patient, et a fourni 241 nouveaux diagnostics parmi 5 000 patients non diagnostiqués, la plupart des nouvelles découvertes apparaissant dans les 32 jours suivant la publication des preuves.

lab OpenAI News · il y a 7 j

OpenAI et Broadcom dévoilent une puce d'inférence optimisée pour les LLM

OpenAI et Broadcom ont présenté Jalapeño, une puce IA personnalisée conçue pour l'inférence des grands modèles de langage. La puce vise à améliorer les performances, l'efficacité et la scalabilité des systèmes d'IA.

github vLLM · il y a 7 j

v0.24.0rc1 : Correction de la construction de l'histogramme topk sur SM75

vllm publie la version v0.24.0rc1, incluant une correction pour les problèmes de construction de l'histogramme topk sur SM75. Le changement a été cherry-pické depuis le commit 191826e et signé par Mohammad Miadh Angkad.

lab Claude Code Releases · il y a 8 j

Notes de version de Claude v2.1.187

Claude v2.1.187 introduit le blocage des identifiants de bac à sable, les restrictions de modèle configurées par l'organisation, la prise en charge des clics de souris en plein écran, et des correctifs pour les échecs de commandes, les blocages d'outils et la stabilité de l'interface utilisateur. Les mises à jour améliorent également la gestion des sorties structurées, le suivi de la profondeur des agents et la gestion des plugins, avec des améliorations de la compatibilité VSCode et terminal.

lab OpenAI News · il y a 8 j

OpenAI établit des normes IA partagées via la Fondation Appia

OpenAI, par le biais de la Fondation Appia, fait progresser les normes partagées pour l'IA avancée en développant des cadres d'évaluation, des pratiques de sécurité et en promouvant la coopération mondiale.

lab Anthropic News · il y a 8 j

Présentation de Claude Tag pour les équipes Slack

Claude Tag permet aux équipes de taguer @Claude dans Slack pour déléguer des tâches, avec un accès à des canaux sélectionnés, des outils et des bases de code. Il apprend du contexte du canal, fonctionne de manière asynchrone et prend l'initiative en mettant proactivement à jour les utilisateurs sur les informations pertinentes. Aujourd'hui, 65 % du code de l'équipe produit d'Anthropic est créé par Claude Tag interne, et il est désormais disponible en bêta pour les clients Claude Enterprise et Team.

lab OpenAI News · il y a 8 j

GPT-5 Pro aide à résoudre un mystère d'immunologie vieux de 3 ans

GPT-5 Pro a fourni des informations clés sur le comportement des lymphocytes T, résolvant une énigme immunologique vieille de 3 ans. Cette découverte pourrait faire avancer la recherche sur le cancer et les maladies auto-immunes.

lab Mistral AI News · il y a 8 j

Mistral publie OCR 4 avec support multilingue et sortie structurée

Mistral OCR 4 introduit des boîtes englobantes, la classification de blocs et des scores de confiance en ligne pour 170 langues réparties en 10 groupes linguistiques. Il surpasse les principaux systèmes OCR dans les évaluations de préférence humaine avec un taux de victoire de 72 % et obtient le meilleur score sur OlmOCRBench (85,20), tout en offrant un déploiement auto-hébergé dans un seul conteneur et en prenant en charge des cas d'utilisation enterprise comme RAG et l'ingestion de documents.

lab Cohere Blog · il y a 8 j

Les lacunes culturelles de l'IA exposent les utilisateurs mondiaux à une représentation erronée et à la marginalisation

Une enquête mondiale menée auprès de 81 utilisateurs d'IA dans 22 pays a révélé que 89,5 % des non-anglophones passent à l'anglais lors de l'utilisation de l'IA, invoquant une précision perçue. Plus d'un tiers a signalé que l'IA ne comprend pas leurs cultures, avec 63 % ayant subi des violations des normes culturelles, notamment des récits centrés sur l'Occident et un formalisme inapproprié. Les participants ont exprimé leur inquiétude quant au fait que l'IA marginalisera davantage leurs cultures, 67 % étant d'accord pour dire que l'IA réduira la diversité culturelle à des stéréotypes à l'avenir.

lab OpenAI News · il y a 8 j

Omio construit des voyages conversationnels natifs à l'IA

Omio exploite OpenAI pour améliorer les expériences de voyage conversationnelles. L'entreprise utilise l'IA pour accélérer le développement de produits et passer à un modèle d'affaires natif à l'IA.

lab Claude Code Releases · il y a 9 j

Notes de version de Claude v2.1.186

Claude v2.1.186 ajoute des commandes d'authentification CLI pour les serveurs MCP, le filtrage par statut dans les workflows et une section « Compétences » dans les paramètres des plugins. Il inclut de nombreuses corrections de bugs pour l'interface utilisateur, la gestion de session et le comportement de l'agent, ainsi que des améliorations du parsing YAML, de la gestion de la mémoire et de la validation des outils.

lab OpenAI News · il y a 9 j

Jason Liu utilise Codex pour la gestion de projets à long terme

Jason Liu démontre comment Codex aide à préserver le contexte et à gérer des projets complexes, permettant au travail de se poursuivre sans interruption au-delà d'une seule invite.

lab OpenAI News · il y a 9 j

OpenAI lance les outils de sécurité Daybreak

OpenAI a introduit Codex Security et GPT-5.5-Cyber dans le cadre de sa suite Daybreak. Ces outils visent à aider les organisations à identifier, valider et corriger les vulnérabilités à grande échelle.