Tous les articles — korshunov.ai

Tous les articles Page 3 / 15

La version b9847 de llama.cpp corrige Gemma E4B MTP FlashAttention

Le projet llama.cpp a publié la version b9847, qui inclut une correction pour Gemma E4B MTP FlashAttention sur CUDA et la suppression d'une déclaration de template inutilisée.

media Hugging Face Forums · il y a 2 j

Trajlens : un validateur pour LeRobotDataset, 100 datasets Hub audités

L'auteur présente Trajlens, un linter open-source pour la catégorie LeRobotDataset sur Hugging Face Hub, et rapporte les résultats de l'audit de 100 datasets publics aléatoires tagués avec 'lerobot'. L'audit a révélé que seuls 19 datasets ont passé la validation, tandis que 13 ont échoué en raison de bugs spécifiques en amont et que 47 ont rencontré des erreurs de chargement ou des timeouts.

media Hugging Face Forums · il y a 2 j

Proposition d'architecture : Le Réseau Adversaire Épistémologique (EAN) pour l'IA open-source

Une demande de fonctionnalité propose le Réseau Adversaire Épistémologique (EAN), une architecture conçue pour transformer l'IA d'un système reflétant le consensus institutionnel en un moteur de vérification décentralisé et multi-perspectives. Cette approche vise à éliminer les manœuvres de pouvoir politique et corporatif en supprimant tout modèle de « source de vérité » unique.

media Hugging Face Forums · il y a 2 j

Discussion communautaire sur les LLM open-source pour le développement de chatbots

Un fil de discussion sur les forums Hugging Face demande aux utilisateurs quels modèles d'IA gratuits ou open-source ils utilisent actuellement pour le développement de chatbots et leurs raisons de préférence.

media Hugging Face Forums · il y a 2 j

Top 5 modèles que je peux faire tourner avec mon matériel ? Pas de lobotomie IA

Un utilisateur des forums Hugging Face cherche des recommandations pour des modèles d'IA non censurés capables de raisonner sur des sujets complexes, citant une préférence pour les versions antérieures de GPT-4 par rapport aux itérations actuelles.

github llama.cpp · il y a 2 j

llama.cpp b9846 avec optimisation matmul Vulkan pour Asahi Linux

Le projet llama.cpp a publié la version b9846, qui inclut une optimisation du backend Vulkan pour Asahi Linux. Cette mise à jour annule la boucle de taille de bloc dans la multiplication matricielle afin d'améliorer la compatibilité et les performances sur le matériel Apple Silicon sous Linux.

github llama.cpp · il y a 2 j

La version b9844 de llama.cpp ajoute le support NVFP4 et de nouveaux binaires

Le projet llama.cpp a publié la version b9844, qui introduit le support ggml-webgpu pour le format de quantification NVFP4. Cette mise à jour fournit également des binaires préconstruits pour macOS, iOS, Linux, Android, Windows et openEuler sur divers backends matériels.

media Hugging Face Forums · il y a 2 j

AgentSeal : Un audit de disponibilité des corpus pour SWE-bench Pro

L'outil d'audit AgentSeal v5 a évalué la disponibilité publique des artefacts dans le benchmark SWE-bench Pro afin d'évaluer les risques potentiels de contamination. L'étude a révélé que, bien que 12 instances aient montré une chevauchement de contenu déterministe et que 76 dépôts soient des membres probables du corpus, la plupart des preuves consistaient en des répliques publiques dont la date est inconnue plutôt qu'une contamination avérée antérieure à la coupure.

lab Google — The Keyword (AI) · il y a 2 j

Débloquer la prochaine ère de productivité du Royaume-Uni : Construire une nation de pionniers de l'IA

Google UK a publié son dernier rapport sur l'impact économique détaillant les stratégies pour aider davantage de personnes à débloquer les avantages des technologies alimentées par l'IA dans le pays.

github llama.cpp · il y a 2 j

Publication de llama.cpp b9843 avec des binaires pour macOS, Linux et Windows

Le projet llama.cpp a publié la version b9843, fournissant des binaires précompilés pour macOS, Linux, Android, Windows et openEuler sur diverses architectures matérielles.

github LangGraph · il y a 2 j

Notes de version LangGraph 1.2.7

La version 1.2.7 de LangGraph a été publiée, apportant des corrections de bugs et des mises à jour de dépendances pour l'écosystème LangChain.

media Hugging Face Forums · il y a 2 j

Guide bilingue open-source sur les mécaniques des Transformers publié

Un guide open-source, bilingue en anglais et en espagnol, détaillant le fonctionnement interne des Transformers a été publié. La ressource couvre les mathématiques exactes et les mécanismes derrière l'effondrement de l'attention et la compression du KV-cache.

media Hugging Face Forums · il y a 2 j

[Recherche] De la géométrie fonctionnelle à la grammaire dynamique : nouvelles audits LIMEN (V23–V24) sur 7 architectures

Le projet de recherche indépendant LIMEN analyse la dynamique interne de sept modèles Transformer open-source, révélant que l'ambiguïté sémantique modifie la géométrie de la trajectoire et découvrant une grammaire dynamique universelle à travers les architectures.

lab Microsoft Research Blog · il y a 2 j

Memora : Une représentation de mémoire harmonique équilibrant abstraction et spécificité

Microsoft Research présente Memora, un framework de mémoire agentique évolutif conçu pour équilibrer abstraction et spécificité pour les tâches d'IA à long terme. Le système découple le contenu riche de la mémoire des structures de récupération légères, établissant de nouveaux résultats state-of-the-art sur les benchmarks tout en utilisant jusqu'à 98 % moins de tokens de contexte.

lab Claude Code Releases · il y a 2 j

Notes de version de Claude Code v2.1.196

La version 2.1.196 de Claude Code introduit les modèles par défaut de l'organisation, les pièces jointes de fichiers cliquables et une sécurité améliorée pour les approbations des serveurs MCP. La mise à jour améliore également la fiabilité des sessions en arrière-plan, corrige divers problèmes de rapport d'état des agents et optimise l'utilisation des jetons dans les flux de travail de revue de code.

lab Hugging Face Blog · il y a 3 j

DiScoFormer : Un transformateur pour la densité et le score, à travers les distributions

L'article présente DiScoFormer, un modèle de transformateur unifié capable d'effectuer à la fois l'estimation de densité et des tâches de génération basées sur le score sur diverses distributions de données.

media Hugging Face Forums · il y a 3 j

Projet UCTF : Un programme de recherche ouvert sur les représentations d'entraînement IA natives aux machines

Le projet UCTF a été restructuré d'une proposition unique en un programme de recherche ouvert et axé sur les hypothèses, visant à déterminer si des représentations intermédiaires natives aux machines peuvent réduire la redondance sémantique interlangues dans l'entraînement d'IA multilingue.

media Hugging Face Forums · il y a 3 j

Erreur lors de la génération du certificat du cours Deep RL

Un utilisateur signale rencontrer une erreur lors de la tentative de génération d'un certificat de complétion pour le cours Deep RL sur Hugging Face. Le problème persiste malgré la saisie des détails requis (nom d'utilisateur et nom), sans qu'aucune guidance existante ne soit disponible en ligne.

lab Google — The Keyword (AI) · il y a 3 j

Demander à un expert en IA : qu'est-ce que la pile complète ?

Un expert de Google explique le concept d'une approche full-stack pour l'intelligence artificielle. L'article souligne que cette méthodologie globale a servi de fondement aux travaux d'IA de Google pendant une longue période.

github llama.cpp · il y a 3 j

llama.cpp b9842 release : déduplication des presets et entrées de modèle en cache dans /v1/models

La version b9842 de llama.cpp introduit un changement pour dédupliquer les presets et les entrées de modèle en cache dans le point de terminaison /v1/models. Cette mise à jour est validée par Adrien Gallouët de Hugging Face.