Tous les articles — korshunov.ai

Tous les articles Page 1 / 19

La capacité n'est pas dans les poids : résultat empirique négatif sur la projection des poids MLP

Une étude empirique a révélé que la projection des poids MLP d'un modèle transformer vers un autre échoue à transférer la capacité sémantique. Chaque variante testée a obtenu de moins bons résultats que le modèle hôte non modifié, indiquant une limitation structurelle dans la projection des poids. Ces résultats remettent en question les affirmations publiques sur les capacités des modèles basées sur des benchmarks, montrant que de telles affirmations ne reflètent pas la géométrie interne réelle des poids.

media Hugging Face Forums · il y a 10 j

The Clockwork Dark : Un moteur de RPG narratif local-first piloté par l'IA

The Clockwork Dark est un moteur de RPG narratif local-first, piloté par l'IA, qui utilise une machine à états déterministe pour résoudre toutes les mécaniques de jeu. Il propose deux LLMs autonomes pour narrer l'histoire : l'un incarne une voix patiente du monde, l'autre un assistant dieu peu fiable. Le jeu offre aux joueurs le choix entre combattre la corruption surnaturelle envahissante ou embrasser une vie tranquille dans une boulangerie, les deux chemins étant considérés comme des fins valides.

media Hugging Face Forums · il y a 10 j

Bloqué indéfiniment sur 'démarrage' avec un conteneur Docker en cours d'exécution

Un utilisateur signale que son conteneur Docker avec R/Shiny sur rocker/r2u se construit avec succès et affiche 'Listening on http://0.0.0.0:7860' dans les logs, mais l'espace reste dans l'état 'démarrage' et est inaccessible. Le problème persiste malgré l'absence d'erreurs de code, et l'utilisateur sollicite une attention plus large, notant qu'il pourrait s'agir d'un problème côté plateforme avec Hugging Face.

media Hugging Face Forums · il y a 10 j

NOVA-VAD bat Silero, Pyannote et WebRTC sur l'audio bruyant avec une précision de 93 %

NOVA-VAD, un détecteur d'activité vocale léger et explicable, atteint une précision de 93 % sur l'audio bruyant du jeu de données UrbanSound8K, surpassant WebRTC (58 %), Pyannote (62 %) et Silero (87 %). Il utilise uniquement scikit-learn, ne nécessite pas de GPU et fournit l'importance des fonctionnalités et les scores de confiance en anglais simple.

media Hugging Face Forums · il y a 10 j

Comparaison de débogage à petite échelle d'OLMo-core avec greffon Engram

Une comparaison d'entraînement sur 200 étapes entre un modèle de base OLMo3 600M et une version avec un greffon Engram de style DeepSeek montre une perte d'entraînement et d'évaluation plus faible, une stabilisation plus rapide de la norme du gradient et un comportement d'apprentissage précoce amélioré. Le greffon Engram, injecté dans les couches 1 et 5, augmente les paramètres entraînables à ~1,7 Mrd mais ne maintient qu'une augmentation de 40k de paramètres actifs par token, indiquant une utilisation efficace de la mémoire.

media Hugging Face Forums · il y a 10 j

Les LLM comme accélérateurs épistémiques : le risque n'est pas seulement l'hallucination

Les LLM ne se contentent pas d'halluciner ; ils amplifient la surconfiance épistémique humaine en transformant des hypothèses faibles en affirmations cohérentes et polies avant que les preuves ne soient vérifiées. Cela crée un risque de certitude prématurée dans la recherche, les politiques publiques et d'autres domaines, non pas parce que les modèles mentent, mais parce qu'ils accélèrent les tendances humaines à privilégier des explications élégantes plutôt que l'incertitude.

media Hugging Face Forums · il y a 10 j

Cartes d'accélération IA Tenstorrent disponibles

Tenstorrent a publié les cartes d'accélération IA Wormhole et Blackhole. La section matérielle répertorie ces cartes, avec des discussions sur les modèles susceptibles d'être compatibles.

media Hugging Face Forums · il y a 10 j

Espace bloqué sur 'Redémarrage' pour un ancien commit pendant plus de 16 heures

Un Espace Hugging Face est resté bloqué affichant 'Redémarrage' sur le commit 8240352 pendant plus de 16 heures, malgré plusieurs commits plus récents construits avec succès. Le conteneur démarre correctement selon les logs, mais le trafic ne bascule jamais vers la nouvelle version, et les actions de récupération comme la reconstruction d'usine ou le redémarrage n'ont aucun effet.

github llama.cpp · il y a 10 j

llama.cpp Release b9751 : nouveaux binaires et correctifs

llama.cpp publie la version b9751 avec des binaires mis à jour pour macOS, Linux, Android, Windows et openEuler. Cette version inclut des correctifs pour l'utilisation de la mémoire et prend en charge plusieurs architectures ainsi que des options d'accélération matérielle telles que Vulkan, CUDA, OpenVINO et SYCL.

github llama.cpp · il y a 10 j

llama.cpp version b9752 : refonte du serveur et binaires multiplateformes

llama.cpp publie la version b9752 avec une refonte du serveur axée sur la construction par lots, incluant une meilleure gestion des cas de lot complet et des corrections de bugs. La publication inclut des binaires précompilés pour macOS, Linux, Android, Windows et openEuler, prenant en charge diverses architectures et frameworks d'accélération tels que CUDA, Vulkan, OpenVINO et SYCL.

github llama.cpp · il y a 10 j

llama.cpp Release b9753 : nouveaux binaires et suivi de progression

La version b9753 de llama.cpp introduit un meilleur suivi de progression pour le chargement des modèles de spécification, incluant une nouvelle liste « stages ». La release inclut des binaires pour macOS, Linux, Android, Windows et openEuler sur plusieurs architectures et options d'accélération matérielle, telles que Vulkan, CUDA, OpenVINO et SYCL.

github llama.cpp · il y a 10 j

llama.cpp version b9754 : nouveau parseur AC et binaires multiplateformes

La version b9754 de llama.cpp introduit un parseur AC pour une génération de grammaire plus stricte dans le module common/peg. La release inclut des binaires précompilés pour macOS, Linux, Android, Windows et openEuler, prenant en charge diverses architectures et technologies d'accélération telles que Vulkan, CUDA, OpenVINO et SYCL.

github llama.cpp · il y a 10 j

Ajouter la dépendance libandroid-spawn pour la compilation Android

La documentation de compilation Android a été mise à jour pour inclure une dépendance vers libandroid-spawn. Cet ajout vise à prendre en charge le processus de compilation dans l'environnement spécifié.

lab OpenAI News · il y a 10 j

Samsung déploie ChatGPT et Codex pour ses employés

Samsung Electronics a déployé ChatGPT Enterprise et Codex d'OpenAI auprès de sa main-d'œuvre mondiale. Ce déploiement représente l'une des plus grandes initiatives d'IA d'entreprise d'OpenAI à ce jour.

github llama.cpp · il y a 11 j

llama.cpp version b9750 : nouvelle instruction call et binaires multiplateformes

La version b9750 de llama.cpp introduit une implémentation de l'instruction call et annule un changement non intentionnel. La release inclut des binaires précompilés pour macOS, Linux, Android, Windows et openEuler sur plusieurs architectures et options d'accélération matérielle, dont Vulkan, CUDA, OpenVINO et SYCL.

github llama.cpp · il y a 11 j

llama.cpp publie la version b9748 avec de nouveaux binaires et fonctionnalités

llama.cpp publie la version b9748, ajoutant un champ "verbose" à son schéma et fournissant des binaires pour macOS, Linux, Android, Windows et openEuler. La release inclut le support CPU, Vulkan, OpenVINO, SYCL et ROCm sur plusieurs architectures, avec des builds iOS et Windows CUDA et Vulkan disponibles.

media Hugging Face Forums · il y a 11 j

Demande de suppression forcée d'un Space Hugging Face bloqué

L'utilisateur demande la suppression forcée du Space Hugging Face "kayinda/rxsteward" bloqué dans l'état "Building". Toutes les tentatives de suppression échouent avec des erreurs 403 ou des erreurs d'entrée invalide 400, empêchant la réutilisation du nom.

lab Hugging Face Blog · il y a 11 j

Pouvez-vous battre le LoRA en ajustement fin ?

Une nouvelle étude explore des alternatives au LoRA, la technique d'ajustement fin la plus populaire, évaluant si d'autres méthodes peuvent obtenir de meilleures performances avec moins de coût computationnel. La recherche trouve que bien que certaines approches montrent des promesses, aucune ne surpasse systématiquement le LoRA à travers diverses tâches et ensembles de données.

lab Google DeepMind Blog · il y a 11 j

Feuille de route du contrôle de l'IA pour la sécurité des systèmes internes

Une feuille de route du contrôle de l'IA a été introduite pour sécuriser les systèmes internes en intégrant des garde-fous traditionnels avec des capacités de surveillance en temps réel.

lab OpenAI News · il y a 11 j

GPT-5.5 Instant améliore les réponses de santé de ChatGPT

GPT-5.5 Instant améliore les réponses de santé et bien-être de ChatGPT grâce à un raisonnement plus robuste, une meilleure gestion du contexte, une communication plus claire et des évaluations informées par des médecins.