La version b9847 de llama.cpp corrige Gemma E4B MTP FlashAttention
Le projet llama.cpp a publié la version b9847, qui inclut une correction pour Gemma E4B MTP FlashAttention sur CUDA et la suppression d'une déclaration de template inutilisée.
Le projet llama.cpp a publié la version b9847, qui inclut une correction pour Gemma E4B MTP FlashAttention sur CUDA et la suppression d'une déclaration de template inutilisée.
L'auteur présente Trajlens, un linter open-source pour la catégorie LeRobotDataset sur Hugging Face Hub, et rapporte les résultats de l'audit de 100 datasets publics aléatoires tagués avec 'lerobot'. L'audit a révélé que seuls 19 datasets ont passé la validation, tandis que 13 ont échoué en raison de bugs spécifiques en amont et que 47 ont rencontré des erreurs de chargement ou des timeouts.
Une demande de fonctionnalité propose le Réseau Adversaire Épistémologique (EAN), une architecture conçue pour transformer l'IA d'un système reflétant le consensus institutionnel en un moteur de vérification décentralisé et multi-perspectives. Cette approche vise à éliminer les manœuvres de pouvoir politique et corporatif en supprimant tout modèle de « source de vérité » unique.
Un fil de discussion sur les forums Hugging Face demande aux utilisateurs quels modèles d'IA gratuits ou open-source ils utilisent actuellement pour le développement de chatbots et leurs raisons de préférence.
Un utilisateur des forums Hugging Face cherche des recommandations pour des modèles d'IA non censurés capables de raisonner sur des sujets complexes, citant une préférence pour les versions antérieures de GPT-4 par rapport aux itérations actuelles.
Le projet llama.cpp a publié la version b9846, qui inclut une optimisation du backend Vulkan pour Asahi Linux. Cette mise à jour annule la boucle de taille de bloc dans la multiplication matricielle afin d'améliorer la compatibilité et les performances sur le matériel Apple Silicon sous Linux.
Le projet llama.cpp a publié la version b9844, qui introduit le support ggml-webgpu pour le format de quantification NVFP4. Cette mise à jour fournit également des binaires préconstruits pour macOS, iOS, Linux, Android, Windows et openEuler sur divers backends matériels.
L'outil d'audit AgentSeal v5 a évalué la disponibilité publique des artefacts dans le benchmark SWE-bench Pro afin d'évaluer les risques potentiels de contamination. L'étude a révélé que, bien que 12 instances aient montré une chevauchement de contenu déterministe et que 76 dépôts soient des membres probables du corpus, la plupart des preuves consistaient en des répliques publiques dont la date est inconnue plutôt qu'une contamination avérée antérieure à la coupure.
Google UK a publié son dernier rapport sur l'impact économique détaillant les stratégies pour aider davantage de personnes à débloquer les avantages des technologies alimentées par l'IA dans le pays.
Le projet llama.cpp a publié la version b9843, fournissant des binaires précompilés pour macOS, Linux, Android, Windows et openEuler sur diverses architectures matérielles.
La version 1.2.7 de LangGraph a été publiée, apportant des corrections de bugs et des mises à jour de dépendances pour l'écosystème LangChain.
Un guide open-source, bilingue en anglais et en espagnol, détaillant le fonctionnement interne des Transformers a été publié. La ressource couvre les mathématiques exactes et les mécanismes derrière l'effondrement de l'attention et la compression du KV-cache.
Le projet de recherche indépendant LIMEN analyse la dynamique interne de sept modèles Transformer open-source, révélant que l'ambiguïté sémantique modifie la géométrie de la trajectoire et découvrant une grammaire dynamique universelle à travers les architectures.
Microsoft Research présente Memora, un framework de mémoire agentique évolutif conçu pour équilibrer abstraction et spécificité pour les tâches d'IA à long terme. Le système découple le contenu riche de la mémoire des structures de récupération légères, établissant de nouveaux résultats state-of-the-art sur les benchmarks tout en utilisant jusqu'à 98 % moins de tokens de contexte.
La version 2.1.196 de Claude Code introduit les modèles par défaut de l'organisation, les pièces jointes de fichiers cliquables et une sécurité améliorée pour les approbations des serveurs MCP. La mise à jour améliore également la fiabilité des sessions en arrière-plan, corrige divers problèmes de rapport d'état des agents et optimise l'utilisation des jetons dans les flux de travail de revue de code.
L'article présente DiScoFormer, un modèle de transformateur unifié capable d'effectuer à la fois l'estimation de densité et des tâches de génération basées sur le score sur diverses distributions de données.
Le projet UCTF a été restructuré d'une proposition unique en un programme de recherche ouvert et axé sur les hypothèses, visant à déterminer si des représentations intermédiaires natives aux machines peuvent réduire la redondance sémantique interlangues dans l'entraînement d'IA multilingue.
Un utilisateur signale rencontrer une erreur lors de la tentative de génération d'un certificat de complétion pour le cours Deep RL sur Hugging Face. Le problème persiste malgré la saisie des détails requis (nom d'utilisateur et nom), sans qu'aucune guidance existante ne soit disponible en ligne.
Un expert de Google explique le concept d'une approche full-stack pour l'intelligence artificielle. L'article souligne que cette méthodologie globale a servi de fondement aux travaux d'IA de Google pendant une longue période.
La version b9842 de llama.cpp introduit un changement pour dédupliquer les presets et les entrées de modèle en cache dans le point de terminaison /v1/models. Cette mise à jour est validée par Adrien Gallouët de Hugging Face.