Together AI à l'ICML 2026 : recherche de pointe sur toute la pile
Together AI présente neuf articles à l'ICML 2026 qui couvrent la pleine pile du développement de sa plateforme.
Together AI présente neuf articles à l'ICML 2026 qui couvrent la pleine pile du développement de sa plateforme.
La version b9850 de llama.cpp introduit des mises à jour spécifiques du support des modèles, notamment l'enregistrement du tenseur t_layer_inp pour Qwen3Next, la correction de l'affectation d'entrée dans la boucle de traitement des couches, et la résolution des problèmes DFLASH pour qwen-coder-next. Elle ajoute également un tenseur pour la normalisation de l'attention dans le modèle Qwen3.
Anthropic a lancé Claude Science en bêta, un poste de travail IA conçu pour intégrer des outils scientifiques fragmentés dans un seul environnement de recherche. La plateforme vise à accélérer la découverte en fournissant des artefacts auditables, une mise à l'échelle flexible du calcul et des agents spécialisés pour des domaines tels que la génomique et la biologie structurale.
Anthropic a publié Claude Sonnet 5, un nouveau modèle d'IA agentique conçu pour effectuer des tâches complexes de planification, d'utilisation d'outils et de codage autonome à un coût inférieur à celui des modèles précédents de classe Opus. Cette mise à jour réduit l'écart de performance avec Opus 4.8 tout en offrant des améliorations significatives en matière de raisonnement, de sécurité et d'exécution par rapport à son prédécesseur, Sonnet 4.6.
Anthropic a publié la version 2.1.197 de Claude Code, qui met à jour le modèle par défaut vers Claude Sonnet 5. Ce nouveau modèle dispose d'une fenêtre de contexte native de 1M de tokens et est disponible avec une tarification promotionnelle jusqu'au 31 août.
GeneBench-Pro est un benchmark conçu pour évaluer les modèles sur des tâches de raisonnement génomique complexe, présentant dix études de cas détaillées qui mettent en évidence des questions représentatives et du matériel d'appui. Chaque étude de cas fournit le prompt original, les ensembles de données et le contexte nécessaires pour évaluer la performance des modèles sur des défis biologiques spécifiques.
GeneBench-Pro est un benchmark de niveau recherche conçu pour mesurer la manière dont les agents IA gèrent l'ambiguïté et prennent des jugements déterminants en biologie computationnelle, élargissant le cadre du GeneBench original. Il comble les limites des évaluations actuelles en testant des capacités d'ordre supérieur telles que la gestion du bruit dans les données, la révision des hypothèses et la détermination du moment où les résultats sont prêts à servir de base à une décision.
Les ingénieurs d'OpenAI ont résolu des plantages C++ inexplicables dans leur infrastructure de données Rockset en identifiant deux causes distinctes : une corruption matérielle silencieuse sur un hôte Azure et une condition de course vieille de 18 ans dans GNU libunwind.
Les données de OpenAI Signals révèlent que l'adoption de ChatGPT s'élargit et s'intensifie à l'échelle mondiale, les utilisateurs envoyant 50 % de messages en plus par jour et doublant le nombre de tâches distinctes essayées six mois après leur inscription.
La version b9849 de llama.cpp introduit le support des littéraux IPv6 entre crochets dans les autorités d'URL, permettant au serveur d'analyser les formes [hôte]:port conformément à la RFC 3986. Cette mise à jour assure un formatage correct des journaux d'écoute, des en-têtes proxy et des reconstructions client tout en conservant l'adresse distante brute pour le suivi par requête.
Google a publié deux nouveaux modèles d'IA, Nano Banana 2 Lite et Gemini Omni Flash, conçus pour améliorer les capacités des développeurs dans la création d'applications intelligentes.
L'article soutient que la spécialisation en apprentissage automatique est une tendance inévitable, poussée par la complexité croissante des modèles et le besoin d'expertise spécifique au domaine.
Le projet llama.cpp a publié la version b9848, qui inclut une correction critique pour le backend CUDA afin de résoudre les problèmes avec la fonction `get_rows_back` sur les tables dépassant 65535 lignes. Cette mise à jour corrige le clampage grid-y et les erreurs de stride qui affectaient précédemment les opérations sur de grandes tables.
Hugging Face a mis à jour ses pages de modèles pour afficher les résultats d'évaluation de l'initiative 'Every Eval', offrant une vue complète des performances des modèles sur divers benchmarks. Cette intégration permet aux utilisateurs d'accéder à un large éventail de métriques standardisées directement dans l'interface du hub de modèles.
Le projet llama.cpp a publié la version b9847, qui inclut une correction pour Gemma E4B MTP FlashAttention sur CUDA et la suppression d'une déclaration de template inutilisée.
L'auteur présente Trajlens, un linter open-source pour la catégorie LeRobotDataset sur Hugging Face Hub, et rapporte les résultats de l'audit de 100 datasets publics aléatoires tagués avec 'lerobot'. L'audit a révélé que seuls 19 datasets ont passé la validation, tandis que 13 ont échoué en raison de bugs spécifiques en amont et que 47 ont rencontré des erreurs de chargement ou des timeouts.
Une demande de fonctionnalité propose le Réseau Adversaire Épistémologique (EAN), une architecture conçue pour transformer l'IA d'un système reflétant le consensus institutionnel en un moteur de vérification décentralisé et multi-perspectives. Cette approche vise à éliminer les manœuvres de pouvoir politique et corporatif en supprimant tout modèle de « source de vérité » unique.
Un fil de discussion sur les forums Hugging Face demande aux utilisateurs quels modèles d'IA gratuits ou open-source ils utilisent actuellement pour le développement de chatbots et leurs raisons de préférence.
Un utilisateur des forums Hugging Face cherche des recommandations pour des modèles d'IA non censurés capables de raisonner sur des sujets complexes, citant une préférence pour les versions antérieures de GPT-4 par rapport aux itérations actuelles.
Le projet llama.cpp a publié la version b9846, qui inclut une optimisation du backend Vulkan pour Asahi Linux. Cette mise à jour annule la boucle de taille de bloc dans la multiplication matricielle afin d'améliorer la compatibilité et les performances sur le matériel Apple Silicon sous Linux.