Wmf - une nouvelle technique expérimentale
Le contenu de l'article a été supprimé par l'auteur, ne laissant aucune information substantielle concernant la technique.
Le contenu de l'article a été supprimé par l'auteur, ne laissant aucune information substantielle concernant la technique.
Un non-programmeur partage son expérience de mise en place d'une infrastructure de modèle linguistique large (LLM) local sur un MacBook M5 Max avec 128 Go de mémoire unifiée. L'utilisateur détaille sa pile logicielle, ses sélections de modèles et ses objectifs pour apprendre l'IA tout en établissant un système stable et accessible à distance.
Together AI présente neuf articles à l'ICML 2026 qui couvrent la pleine pile du développement de sa plateforme.
Cet article présente ScarfBench, un benchmark conçu pour évaluer les performances des agents IA lors de la migration d'applications Java d'entreprise entre différents frameworks. L'étude met en évidence la complexité de la migration de framework et propose une méthode d'évaluation standardisée pour évaluer les capacités des agents dans ce domaine.
La version 1.15.2a1 de crewAI introduit plusieurs nouvelles fonctionnalités, corrections de bugs et mises à jour de documentation pour le framework d'orchestration d'agents.
Le projet llama.cpp a publié la version b9852, introduisant un support initial d'OpenCL pour le format de quantisation q1_0. Cette mise à jour inclut des capacités générales pour q1_0 et des implémentations spécifiques de GEMM/GEMV Adreno pour les appareils OpenCL.
Anthropic restaure l'accès mondial à ses modèles Claude Fable 5 et Mythos 5 après que le gouvernement américain a levé les contrôles à l'exportation qui avaient suspendu la disponibilité pour tous les utilisateurs. Fable 5 sera disponible mondialement à partir du 1er juillet sur la plateforme Claude, avec des limites d'utilisation applicables jusqu'au 7 juillet avant de passer à un accès basé sur les crédits.
Le projet llama.cpp a publié la version b9851, qui inclut une correction pour CUDA afin d'éviter les erreurs de troncature entière et de débordement dans le kernel flash_attn_mask_to_KV_max. Cette mise à jour traite des problèmes liés aux pas de masque KQ au sein du kernel spécifié.
La version b9850 de llama.cpp introduit des mises à jour spécifiques du support des modèles, notamment l'enregistrement du tenseur t_layer_inp pour Qwen3Next, la correction de l'affectation d'entrée dans la boucle de traitement des couches, et la résolution des problèmes DFLASH pour qwen-coder-next. Elle ajoute également un tenseur pour la normalisation de l'attention dans le modèle Qwen3.
Le SDK Python du Model Context Protocol (MCP) a publié sa première version bêta, v2.0.0b1, qui introduit une prise en charge complète de la spécification MCP 2026-07-28. Cette préversion est uniquement activable par l'utilisateur, garantissant que les installations standard continuent de se résoudre vers la branche stable 1.x.
Microsoft Research présente SkillOpt, une méthode qui traite les fichiers de compétences des agents comme des paramètres entraînables en dehors d'un modèle cible figé, transformant l'édition manuelle des compétences en un processus d'optimisation contrôlé. Cette approche améliore la fiabilité et la cohérence des agents sans mettre à jour les poids du modèle sous-jacent.
Anthropic a lancé Claude Science en bêta, un poste de travail IA conçu pour intégrer des outils scientifiques fragmentés dans un seul environnement de recherche. La plateforme vise à accélérer la découverte en fournissant des artefacts auditables, une mise à l'échelle flexible du calcul et des agents spécialisés pour des domaines tels que la génomique et la biologie structurale.
Anthropic a publié Claude Sonnet 5, un nouveau modèle d'IA agentique conçu pour effectuer des tâches complexes de planification, d'utilisation d'outils et de codage autonome à un coût inférieur à celui des modèles précédents de classe Opus. Cette mise à jour réduit l'écart de performance avec Opus 4.8 tout en offrant des améliorations significatives en matière de raisonnement, de sécurité et d'exécution par rapport à son prédécesseur, Sonnet 4.6.
Anthropic a publié la version 2.1.197 de Claude Code, qui met à jour le modèle par défaut vers Claude Sonnet 5. Ce nouveau modèle dispose d'une fenêtre de contexte native de 1M de tokens et est disponible avec une tarification promotionnelle jusqu'au 31 août.
GeneBench-Pro est un benchmark conçu pour évaluer les modèles sur des tâches de raisonnement génomique complexe, présentant dix études de cas détaillées qui mettent en évidence des questions représentatives et du matériel d'appui. Chaque étude de cas fournit le prompt original, les ensembles de données et le contexte nécessaires pour évaluer la performance des modèles sur des défis biologiques spécifiques.
GeneBench-Pro est un benchmark de niveau recherche conçu pour mesurer la manière dont les agents IA gèrent l'ambiguïté et prennent des jugements déterminants en biologie computationnelle, élargissant le cadre du GeneBench original. Il comble les limites des évaluations actuelles en testant des capacités d'ordre supérieur telles que la gestion du bruit dans les données, la révision des hypothèses et la détermination du moment où les résultats sont prêts à servir de base à une décision.
Les ingénieurs d'OpenAI ont résolu des plantages C++ inexplicables dans leur infrastructure de données Rockset en identifiant deux causes distinctes : une corruption matérielle silencieuse sur un hôte Azure et une condition de course vieille de 18 ans dans GNU libunwind.
Les données de OpenAI Signals révèlent que l'adoption de ChatGPT s'élargit et s'intensifie à l'échelle mondiale, les utilisateurs envoyant 50 % de messages en plus par jour et doublant le nombre de tâches distinctes essayées six mois après leur inscription.
La version b9849 de llama.cpp introduit le support des littéraux IPv6 entre crochets dans les autorités d'URL, permettant au serveur d'analyser les formes [hôte]:port conformément à la RFC 3986. Cette mise à jour assure un formatage correct des journaux d'écoute, des en-têtes proxy et des reconstructions client tout en conservant l'adresse distante brute pour le suivi par requête.
Google a publié deux nouveaux modèles d'IA, Nano Banana 2 Lite et Gemini Omni Flash, conçus pour améliorer les capacités des développeurs dans la création d'applications intelligentes.