Tous les articles — korshunov.ai

Tous les articles Page 2 / 11

Présentation de GeneBench-Pro

GeneBench-Pro est un benchmark de niveau recherche conçu pour mesurer la manière dont les agents IA gèrent l'ambiguïté et prennent des jugements déterminants en biologie computationnelle, élargissant le cadre du GeneBench original. Il comble les limites des évaluations actuelles en testant des capacités d'ordre supérieur telles que la gestion du bruit dans les données, la révision des hypothèses et la détermination du moment où les résultats sont prêts à servir de base à une décision.

lab OpenAI News · il y a 1 j

Épidémiologie des core dumps : correction d'un bug vieux de 18 ans

Les ingénieurs d'OpenAI ont résolu des plantages C++ inexplicables dans leur infrastructure de données Rockset en identifiant deux causes distinctes : une corruption matérielle silencieuse sur un hôte Azure et une condition de course vieille de 18 ans dans GNU libunwind.

lab OpenAI News · il y a 1 j

Comment l'adoption de ChatGPT s'est élargie

Les données de OpenAI Signals révèlent que l'adoption de ChatGPT s'élargit et s'intensifie à l'échelle mondiale, les utilisateurs envoyant 50 % de messages en plus par jour et doublant le nombre de tâches distinctes essayées six mois après leur inscription.

github llama.cpp · il y a 1 j

llama.cpp b9849 release : gestion des URL IPv6 et nouveaux binaires

La version b9849 de llama.cpp introduit le support des littéraux IPv6 entre crochets dans les autorités d'URL, permettant au serveur d'analyser les formes [hôte]:port conformément à la RFC 3986. Cette mise à jour assure un formatage correct des journaux d'écoute, des en-têtes proxy et des reconstructions client tout en conservant l'adresse distante brute pour le suivi par requête.

lab Google DeepMind Blog · il y a 1 j

Commencez à développer avec Nano Banana 2 Lite et Gemini Omni Flash

Google a publié deux nouveaux modèles d'IA, Nano Banana 2 Lite et Gemini Omni Flash, conçus pour améliorer les capacités des développeurs dans la création d'applications intelligentes.

github llama.cpp · il y a 1 j

La version b9848 de llama.cpp corrige get_rows_back pour CUDA et fournit des binaires

Le projet llama.cpp a publié la version b9848, qui inclut une correction critique pour le backend CUDA afin de résoudre les problèmes avec la fonction `get_rows_back` sur les tables dépassant 65535 lignes. Cette mise à jour corrige le clampage grid-y et les erreurs de stride qui affectaient précédemment les opérations sur de grandes tables.

github llama.cpp · il y a 1 j

La version b9847 de llama.cpp corrige Gemma E4B MTP FlashAttention

Le projet llama.cpp a publié la version b9847, qui inclut une correction pour Gemma E4B MTP FlashAttention sur CUDA et la suppression d'une déclaration de template inutilisée.

github llama.cpp · il y a 1 j

llama.cpp b9846 avec optimisation matmul Vulkan pour Asahi Linux

Le projet llama.cpp a publié la version b9846, qui inclut une optimisation du backend Vulkan pour Asahi Linux. Cette mise à jour annule la boucle de taille de bloc dans la multiplication matricielle afin d'améliorer la compatibilité et les performances sur le matériel Apple Silicon sous Linux.

github llama.cpp · il y a 2 j

La version b9844 de llama.cpp ajoute le support NVFP4 et de nouveaux binaires

Le projet llama.cpp a publié la version b9844, qui introduit le support ggml-webgpu pour le format de quantification NVFP4. Cette mise à jour fournit également des binaires préconstruits pour macOS, iOS, Linux, Android, Windows et openEuler sur divers backends matériels.

lab Google — The Keyword (AI) · il y a 2 j

Débloquer la prochaine ère de productivité du Royaume-Uni : Construire une nation de pionniers de l'IA

Google UK a publié son dernier rapport sur l'impact économique détaillant les stratégies pour aider davantage de personnes à débloquer les avantages des technologies alimentées par l'IA dans le pays.

github llama.cpp · il y a 2 j

Publication de llama.cpp b9843 avec des binaires pour macOS, Linux et Windows

Le projet llama.cpp a publié la version b9843, fournissant des binaires précompilés pour macOS, Linux, Android, Windows et openEuler sur diverses architectures matérielles.

github LangGraph · il y a 2 j

Notes de version LangGraph 1.2.7

La version 1.2.7 de LangGraph a été publiée, apportant des corrections de bugs et des mises à jour de dépendances pour l'écosystème LangChain.

lab Microsoft Research Blog · il y a 2 j

Memora : Une représentation de mémoire harmonique équilibrant abstraction et spécificité

Microsoft Research présente Memora, un framework de mémoire agentique évolutif conçu pour équilibrer abstraction et spécificité pour les tâches d'IA à long terme. Le système découple le contenu riche de la mémoire des structures de récupération légères, établissant de nouveaux résultats state-of-the-art sur les benchmarks tout en utilisant jusqu'à 98 % moins de tokens de contexte.

lab Claude Code Releases · il y a 2 j

Notes de version de Claude Code v2.1.196

La version 2.1.196 de Claude Code introduit les modèles par défaut de l'organisation, les pièces jointes de fichiers cliquables et une sécurité améliorée pour les approbations des serveurs MCP. La mise à jour améliore également la fiabilité des sessions en arrière-plan, corrige divers problèmes de rapport d'état des agents et optimise l'utilisation des jetons dans les flux de travail de revue de code.

lab Google — The Keyword (AI) · il y a 2 j

Demander à un expert en IA : qu'est-ce que la pile complète ?

Un expert de Google explique le concept d'une approche full-stack pour l'intelligence artificielle. L'article souligne que cette méthodologie globale a servi de fondement aux travaux d'IA de Google pendant une longue période.

github llama.cpp · il y a 2 j

llama.cpp b9842 release : déduplication des presets et entrées de modèle en cache dans /v1/models

La version b9842 de llama.cpp introduit un changement pour dédupliquer les presets et les entrées de modèle en cache dans le point de terminaison /v1/models. Cette mise à jour est validée par Adrien Gallouët de Hugging Face.

lab Meta AI / FAIR Blog · il y a 2 j

Brain2Qwerty v2 atteint 61 % de précision lexicale dans le décodage non invasif du cerveau vers texte

Les chercheurs ont publié Brain2Qwerty v2, un pipeline d'IA non invasif qui décode des phrases en temps réel à partir d'enregistrements de magnétoencéphalographie (MEG) sans implants chirurgicaux. Le système atteint une précision lexicale globale de 61 % et jusqu'à 78 % pour les meilleurs participants, surpassant significativement les méthodes non invasives précédentes.

github llama.cpp · il y a 2 j

La version b9840 de llama.cpp ajoute le support de DeepSeek V4 et des binaires multi-plateformes

La version b9840 de llama.cpp introduit le support de conversion pour le modèle DeepSeek V4, incluant un traitement spécifique pour la variante Pro. Cette mise à jour intègre la nouvelle architecture dans la bibliothèque avec diverses optimisations internes et corrections de bugs.

lab OpenAI News · il y a 2 j

Cartographier l'opportunité de la main-d'œuvre européenne en IA

OpenAI Economic Research a étendu son cadre de transition des emplois liés à l'IA à l'Union européenne, en utilisant la taxonomie ESCO et les données d'Eurostat pour analyser comment les capacités de l'IA pourraient remodeler les marchés du travail dans les États membres.

github llama.cpp · il y a 2 j

llama.cpp b9839 avec correction du balayage Tailwind et binaires multi-plateformes

Le projet llama.cpp a publié la version b9839, qui inclut une correction pour restaurer le balayage Tailwind dans les worktrees ignorés. Cette mise à jour fournit des binaires précompilés pour macOS, Linux, Android, Windows et openEuler sur diverses architectures et backends d'accélération matérielle.