Tous les articles
lab Anthropic News · il y a 2 j

Anthropic redéploie Fable 5 suite aux contrôles à l'exportation américains

Anthropic restaure l'accès mondial à ses modèles Claude Fable 5 et Mythos 5 après que le gouvernement américain a levé les contrôles à l'exportation qui avaient suspendu la disponibilité pour tous les utilisateurs. Fable 5 sera disponible mondialement à partir du 1er juillet sur la plateforme Claude, avec des limites d'utilisation applicables jusqu'au 7 juillet avant de passer à un accès basé sur les crédits.

github llama.cpp · il y a 2 j

llama.cpp b9850 release : corrections pour Qwen3 et nouveaux binaires

La version b9850 de llama.cpp introduit des mises à jour spécifiques du support des modèles, notamment l'enregistrement du tenseur t_layer_inp pour Qwen3Next, la correction de l'affectation d'entrée dans la boucle de traitement des couches, et la résolution des problèmes DFLASH pour qwen-coder-next. Elle ajoute également un tenseur pour la normalisation de l'attention dans le modèle Qwen3.

lab Microsoft Research Blog · il y a 2 j

SkillOpt : Les compétences des agents comme paramètres entraînables

Microsoft Research présente SkillOpt, une méthode qui traite les fichiers de compétences des agents comme des paramètres entraînables en dehors d'un modèle cible figé, transformant l'édition manuelle des compétences en un processus d'optimisation contrôlé. Cette approche améliore la fiabilité et la cohérence des agents sans mettre à jour les poids du modèle sous-jacent.

lab Anthropic News · il y a 2 j

Claude Science, un poste de travail IA pour les scientifiques, est maintenant disponible

Anthropic a lancé Claude Science en bêta, un poste de travail IA conçu pour intégrer des outils scientifiques fragmentés dans un seul environnement de recherche. La plateforme vise à accélérer la découverte en fournissant des artefacts auditables, une mise à l'échelle flexible du calcul et des agents spécialisés pour des domaines tels que la génomique et la biologie structurale.

lab Anthropic News · il y a 2 j

Présentation de Claude Sonnet 5

Anthropic a publié Claude Sonnet 5, un nouveau modèle d'IA agentique conçu pour effectuer des tâches complexes de planification, d'utilisation d'outils et de codage autonome à un coût inférieur à celui des modèles précédents de classe Opus. Cette mise à jour réduit l'écart de performance avec Opus 4.8 tout en offrant des améliorations significatives en matière de raisonnement, de sécurité et d'exécution par rapport à son prédécesseur, Sonnet 4.6.

lab OpenAI News · il y a 2 j

Dans GeneBench-Pro : 10 études de cas de raisonnement génomique complexe

GeneBench-Pro est un benchmark conçu pour évaluer les modèles sur des tâches de raisonnement génomique complexe, présentant dix études de cas détaillées qui mettent en évidence des questions représentatives et du matériel d'appui. Chaque étude de cas fournit le prompt original, les ensembles de données et le contexte nécessaires pour évaluer la performance des modèles sur des défis biologiques spécifiques.

lab OpenAI News · il y a 2 j

Présentation de GeneBench-Pro

GeneBench-Pro est un benchmark de niveau recherche conçu pour mesurer la manière dont les agents IA gèrent l'ambiguïté et prennent des jugements déterminants en biologie computationnelle, élargissant le cadre du GeneBench original. Il comble les limites des évaluations actuelles en testant des capacités d'ordre supérieur telles que la gestion du bruit dans les données, la révision des hypothèses et la détermination du moment où les résultats sont prêts à servir de base à une décision.