Tous les articles — korshunov.ai

Tous les articles Page 1 / 12

Notes de version de crewAI 1.15.2a1

La version 1.15.2a1 de crewAI introduit plusieurs nouvelles fonctionnalités, corrections de bugs et mises à jour de documentation pour le framework d'orchestration d'agents.

lab Claude Code Releases · il y a 3 h

Notes de version de Claude Code v2.1.198

La mise à jour v2.1.198 de Claude Code introduit la disponibilité générale de Claude dans Chrome et améliore les capacités des agents en arrière-plan avec de nouveaux hooks de notification et des workflows de pull request automatisés.

lab Google — The Keyword (AI) · il y a 3 h

Des éducateurs et des leaders de l'industrie de NYC se réunissent chez Google pour façonner l'IA dans les salles de classe

Google, le Conseil des PDG des emplois de New York et Urban Assembly ont organisé un sommet sur l'IA pour 150 leaders de l'éducation et de l'industrie dans les bureaux de Google. L'événement a rassemblé des parties prenantes pour discuter et façonner l'avenir de l'intégration de l'intelligence artificielle au sein des environnements de classe.

lab Google — The Keyword (AI) · il y a 4 h

Les dernières nouvelles d'IA de Google annoncées en juin 2026

Cet article présente un résumé des mises à jour et annonces en intelligence artificielle publiées par Google au cours du mois de juin 2026.

github llama.cpp · il y a 4 h

La release b9859 de llama.cpp ajoute le support des noyaux précompilés OpenCL

La release b9859 de llama.cpp introduit la capacité de charger des noyaux binaires précompilés depuis des bibliothèques pour OpenCL, ciblant spécifiquement les GPU Adreno. Cette mise à jour fournit également des binaires pour macOS, Linux, Windows, Android et openEuler sur CPU, GPU et divers backends d'accélérateur.

lab xAI News · il y a 5 h

xAI lance un constructeur d'agents vocaux sans code pour Grok Voice

xAI a annoncé la version bêta de Voice Agent Builder, une plateforme sans code conçue pour configurer des agents vocaux de niveau production sur Grok Voice en moins de deux minutes. Cet outil permet aux opérateurs et développeurs de déployer des agents vocaux à fort volume sans avoir à construire la pile télécom ou IA sous-jacente à partir de zéro.

github llama.cpp · il y a 6 h

Publication de llama.cpp b9858 avec correction du chemin du modèle HF

Le projet llama.cpp a publié la version b9858, qui inclut un changement pour utiliser le split principal de Hugging Face comme chemin du modèle. Cette mise à jour résout l'issue #25181 concernant les chemins de chargement des modèles.

github llama.cpp · il y a 8 h

llama.cpp b9857 release : rework de Flash Attention et nouveaux binaires

La version b9857 de llama.cpp introduit une refonte complète de l'implémentation Hexagon Flash Attention, axée sur les optimisations et les améliorations de précision. Cette mise à jour comprend des modifications significatives des modules hex-mm et hex-fa, telles que le regroupement des tâches de quantification dans les threads principaux de matmul, la fusion avec les opérations ADD et l'optimisation du traitement des masques.

github llama.cpp · il y a 12 h

La version b9855 de llama.cpp ajoute l'optimisation AVX2 nvfp4 et de nouveaux binaires

Le projet llama.cpp a publié la version b9855, qui introduit une optimisation AVX2 pour le produit scalaire nvfp4 en utilisant une table de consultation (LUT) UE4M3 dans le backend ggml-cpu.

github llama.cpp · il y a 12 h

llama.cpp b9856 release avec restrict CUDA + PDL pour FA

Le projet llama.cpp a publié la version b9856, introduisant une utilisation cohérente du mot-clé `restrict` et de PDL pour Flash Attention dans CUDA. Cette mise à jour est accompagnée de binaires précompilés pour macOS, Linux, Android, Windows et openEuler sur divers backends matériels.

github llama.cpp · il y a 16 h

Supprimer le fallback de navigation PWA pour empêcher la mise en cache des requêtes d'endpoint API

La mise à jour supprime le mécanisme de fallback de navigation Progressive Web App (PWA). Ce changement est mis en œuvre spécifiquement pour empêcher la mise en cache non intentionnelle des requêtes d'endpoint API.

github llama.cpp · il y a 16 h

la version b9852 de llama.cpp ajoute le support de la quantisation q1_0 via OpenCL

Le projet llama.cpp a publié la version b9852, introduisant un support initial d'OpenCL pour le format de quantisation q1_0. Cette mise à jour inclut des capacités générales pour q1_0 et des implémentations spécifiques de GEMM/GEMV Adreno pour les appareils OpenCL.

lab Anthropic News · il y a 21 h

Anthropic redéploie Fable 5 suite aux contrôles à l'exportation américains

Anthropic restaure l'accès mondial à ses modèles Claude Fable 5 et Mythos 5 après que le gouvernement américain a levé les contrôles à l'exportation qui avaient suspendu la disponibilité pour tous les utilisateurs. Fable 5 sera disponible mondialement à partir du 1er juillet sur la plateforme Claude, avec des limites d'utilisation applicables jusqu'au 7 juillet avant de passer à un accès basé sur les crédits.

github llama.cpp · il y a 21 h

La version b9851 de llama.cpp corrige la troncature des entiers CUDA et fournit des binaires

Le projet llama.cpp a publié la version b9851, qui inclut une correction pour CUDA afin d'éviter les erreurs de troncature entière et de débordement dans le kernel flash_attn_mask_to_KV_max. Cette mise à jour traite des problèmes liés aux pas de masque KQ au sein du kernel spécifié.

github llama.cpp · il y a 21 h

llama.cpp b9850 release : corrections pour Qwen3 et nouveaux binaires

La version b9850 de llama.cpp introduit des mises à jour spécifiques du support des modèles, notamment l'enregistrement du tenseur t_layer_inp pour Qwen3Next, la correction de l'affectation d'entrée dans la boucle de traitement des couches, et la résolution des problèmes DFLASH pour qwen-coder-next. Elle ajoute également un tenseur pour la normalisation de l'attention dans le modèle Qwen3.

github MCP (GitHub org) · il y a 23 h

SDK Python MCP v2.0.0b1 publié avec prise en charge complète de la spécification 2026

Le SDK Python du Model Context Protocol (MCP) a publié sa première version bêta, v2.0.0b1, qui introduit une prise en charge complète de la spécification MCP 2026-07-28. Cette préversion est uniquement activable par l'utilisateur, garantissant que les installations standard continuent de se résoudre vers la branche stable 1.x.

lab Microsoft Research Blog · il y a 1 j

SkillOpt : Les compétences des agents comme paramètres entraînables

Microsoft Research présente SkillOpt, une méthode qui traite les fichiers de compétences des agents comme des paramètres entraînables en dehors d'un modèle cible figé, transformant l'édition manuelle des compétences en un processus d'optimisation contrôlé. Cette approche améliore la fiabilité et la cohérence des agents sans mettre à jour les poids du modèle sous-jacent.

lab Anthropic News · il y a 1 j

Claude Science, un poste de travail IA pour les scientifiques, est maintenant disponible

Anthropic a lancé Claude Science en bêta, un poste de travail IA conçu pour intégrer des outils scientifiques fragmentés dans un seul environnement de recherche. La plateforme vise à accélérer la découverte en fournissant des artefacts auditables, une mise à l'échelle flexible du calcul et des agents spécialisés pour des domaines tels que la génomique et la biologie structurale.

lab Anthropic News · il y a 1 j

Présentation de Claude Sonnet 5

Anthropic a publié Claude Sonnet 5, un nouveau modèle d'IA agentique conçu pour effectuer des tâches complexes de planification, d'utilisation d'outils et de codage autonome à un coût inférieur à celui des modèles précédents de classe Opus. Cette mise à jour réduit l'écart de performance avec Opus 4.8 tout en offrant des améliorations significatives en matière de raisonnement, de sécurité et d'exécution par rapport à son prédécesseur, Sonnet 4.6.

lab Claude Code Releases · il y a 1 j

Claude Code v2.1.197 introduit Claude Sonnet 5

Anthropic a publié la version 2.1.197 de Claude Code, qui met à jour le modèle par défaut vers Claude Sonnet 5. Ce nouveau modèle dispose d'une fenêtre de contexte native de 1M de tokens et est disponible avec une tarification promotionnelle jusqu'au 31 août.