Tous les articles — korshunov.ai

Tous les articles Page 1 / 19

Context Gravity

Chris Diaz a partagé un nouveau projet appelé Context Gravity, actuellement disponible sur GitHub. L'auteur recherche des retours de la communauté sur le dépôt.

media Hugging Face Forums · il y a 15 h

Prism Transformer : Programmes de têtes progressifs pour le traitement d'attention hiérarchique

Le Prism Transformer introduit un programme de têtes progressif qui varie le nombre de têtes d'attention entre les couches, en commençant par moins de têtes plus larges dans les premières couches et en augmentant monotoniquement avec la profondeur. Cette approche défie l'allocation uniforme standard en répondant aux besoins structurels distincts des premières et dernières couches sans ajouter de surcharge architecturale.

github CrewAI · il y a 15 h

Notes de version LangChain v1.15.2a2

Cette mise à jour inclut de nouvelles fonctionnalités pour l'intégration Bedrock, la documentation des agents de flux et la navigation en streaming, ainsi que des corrections de bugs et des améliorations de documentation.

media Hugging Face Forums · il y a 16 h

Rêves fractals + Planification inspirée par la mécanique quantique : Un outil de découverte de connaissances auto-organisé avec DeepSeek Coder

L'auteur présente un outil de découverte de connaissances auto-organisé qui intègre la génération de motifs fractals et la superposition inspirée de la mécanique quantique pour améliorer l'exploration des espaces de connaissances par DeepSeek Coder. Le système optimise les trajectoires de recherche en stockant les chemins créatifs réussis sous forme de requêtes mises en cache plutôt qu'en mémoire, adaptant l'utilisation des ressources en fonction des contraintes matérielles.

media Hugging Face Forums · il y a 16 h

Wmf - une nouvelle technique expérimentale

Le contenu de l'article a été supprimé par l'auteur, ne laissant aucune information substantielle concernant la technique.

media Hugging Face Forums · il y a 16 h

LLM local sur MacBook M5 Pro - Complètement débutant !

Un non-programmeur partage son expérience de mise en place d'une infrastructure de modèle linguistique large (LLM) local sur un MacBook M5 Max avec 128 Go de mémoire unifiée. L'utilisateur détaille sa pile logicielle, ses sélections de modèles et ses objectifs pour apprendre l'IA tout en établissant un système stable et accessible à distance.

media Together AI Blog · il y a 17 h

Together AI à l'ICML 2026 : recherche de pointe sur toute la pile

Together AI présente neuf articles à l'ICML 2026 qui couvrent la pleine pile du développement de sa plateforme.

lab Hugging Face Blog · il y a 18 h

Hugging Face et Cerebras intègrent Gemma 4 dans l'IA vocale en temps réel

Hugging Face et Cerebras ont intégré le modèle Gemma 4 de Google dans leurs plateformes pour permettre des applications d'intelligence artificielle vocale en temps réel. Cette collaboration permet aux développeurs d'exploiter les capacités multimodales de Gemma 4 pour des tâches de traitement audio à faible latence.

media Together AI Blog · il y a 18 h

Annonce d'une levée de fonds de série C de 800 millions de dollars pour accélérer le passage à l'IA open source

L'entreprise a levé 800 millions de dollars dans le cadre d'un tour de table de série C visant à accélérer la transition vers l'intelligence artificielle open source.

lab Hugging Face Blog · il y a 18 h

ScarfBench : Évaluation des agents IA pour la migration de frameworks Java d'entreprise

Cet article présente ScarfBench, un benchmark conçu pour évaluer les performances des agents IA lors de la migration d'applications Java d'entreprise entre différents frameworks. L'étude met en évidence la complexité de la migration de framework et propose une méthode d'évaluation standardisée pour évaluer les capacités des agents dans ce domaine.

github CrewAI · il y a 19 h

Notes de version de crewAI 1.15.2a1

La version 1.15.2a1 de crewAI introduit plusieurs nouvelles fonctionnalités, corrections de bugs et mises à jour de documentation pour le framework d'orchestration d'agents.

lab Claude Code Releases · il y a 22 h

Notes de version de Claude Code v2.1.198

La mise à jour v2.1.198 de Claude Code introduit la disponibilité générale de Claude dans Chrome et améliore les capacités des agents en arrière-plan avec de nouveaux hooks de notification et des workflows de pull request automatisés.

lab Google — The Keyword (AI) · il y a 22 h

Des éducateurs et des leaders de l'industrie de NYC se réunissent chez Google pour façonner l'IA dans les salles de classe

Google, le Conseil des PDG des emplois de New York et Urban Assembly ont organisé un sommet sur l'IA pour 150 leaders de l'éducation et de l'industrie dans les bureaux de Google. L'événement a rassemblé des parties prenantes pour discuter et façonner l'avenir de l'intégration de l'intelligence artificielle au sein des environnements de classe.

lab Google — The Keyword (AI) · il y a 22 h

Les dernières nouvelles d'IA de Google annoncées en juin 2026

Cet article présente un résumé des mises à jour et annonces en intelligence artificielle publiées par Google au cours du mois de juin 2026.

github llama.cpp · il y a 23 h

La release b9859 de llama.cpp ajoute le support des noyaux précompilés OpenCL

La release b9859 de llama.cpp introduit la capacité de charger des noyaux binaires précompilés depuis des bibliothèques pour OpenCL, ciblant spécifiquement les GPU Adreno. Cette mise à jour fournit également des binaires pour macOS, Linux, Windows, Android et openEuler sur CPU, GPU et divers backends d'accélérateur.

lab xAI News · il y a 1 j

xAI lance un constructeur d'agents vocaux sans code pour Grok Voice

xAI a annoncé la version bêta de Voice Agent Builder, une plateforme sans code conçue pour configurer des agents vocaux de niveau production sur Grok Voice en moins de deux minutes. Cet outil permet aux opérateurs et développeurs de déployer des agents vocaux à fort volume sans avoir à construire la pile télécom ou IA sous-jacente à partir de zéro.

github llama.cpp · il y a 1 j

Publication de llama.cpp b9858 avec correction du chemin du modèle HF

Le projet llama.cpp a publié la version b9858, qui inclut un changement pour utiliser le split principal de Hugging Face comme chemin du modèle. Cette mise à jour résout l'issue #25181 concernant les chemins de chargement des modèles.

github llama.cpp · il y a 1 j

llama.cpp b9857 release : rework de Flash Attention et nouveaux binaires

La version b9857 de llama.cpp introduit une refonte complète de l'implémentation Hexagon Flash Attention, axée sur les optimisations et les améliorations de précision. Cette mise à jour comprend des modifications significatives des modules hex-mm et hex-fa, telles que le regroupement des tâches de quantification dans les threads principaux de matmul, la fusion avec les opérations ADD et l'optimisation du traitement des masques.

github llama.cpp · il y a 1 j

La version b9855 de llama.cpp ajoute l'optimisation AVX2 nvfp4 et de nouveaux binaires

Le projet llama.cpp a publié la version b9855, qui introduit une optimisation AVX2 pour le produit scalaire nvfp4 en utilisant une table de consultation (LUT) UE4M3 dans le backend ggml-cpu.

github llama.cpp · il y a 1 j

llama.cpp b9856 release avec restrict CUDA + PDL pour FA

Le projet llama.cpp a publié la version b9856, introduisant une utilisation cohérente du mot-clé `restrict` et de PDL pour Flash Attention dans CUDA. Cette mise à jour est accompagnée de binaires précompilés pour macOS, Linux, Android, Windows et openEuler sur divers backends matériels.