Tous les articles
media Hugging Face Forums · il y a 8 j

Un utilisateur s'enquiert du processus de renommage d'organisation sur Hugging Face

Un utilisateur a publié sur le forum de discussion de Hugging Face pour demander de l'aide concernant le renommage de son organisation. L'intéressé a indiqué avoir envoyé un email à website@huggingface.co le 15 juin, demandant un changement de DZER-Studios vers Vexion-LM. Malgré l'envoi de cette demande initiale, l'utilisateur signale n'avoir reçu aucune réponse et observe que le nom de l'organisation est resté inchangé. Par conséquent, l'auteur du message demande si les renommages d'organisation sont toujours pris en charge par la plateforme. Il demande également des conseils sur les méthodes alternatives pour contacter l'équipe concernant cette demande administrative spécifique.

media Hugging Face Forums · il y a 8 j

Enquête communautaire sur les méthodes de benchmarking des modèles

Un utilisateur du forum de discussion Hugging Face a posé une question demandant des conseils sur la manière de benchmarking des modèles d'apprentissage automatique. La demande a été initiée par un individu nouveau dans le domaine du fine-tuning et souhaite évaluer ses modèles après leur achèvement. Le message demande explicitement des méthodes ou stratégies établies que la communauté utilise à cette fin. Il met en évidence un besoin commun parmi les praticiens de comprendre les pratiques d'évaluation standard dans le développement de modèles. Le fil de discussion contient actuellement un seul post d'un seul participant. Aucun benchmark spécifique, métrique ou solution technique n'a été fourni dans le contenu visible de la source.

media Hugging Face Forums · il y a 8 j

Qwen3/Gemma3 Candle ignore les masques d'attention pour les lots de longueur égale en mode CPU

Un utilisateur a signalé un bug critique dans la bibliothèque text-embeddings-inference de Hugging Face affectant les modèles Qwen3 et Gemma3. Le problème se produit lors de l'inférence sur des CPUs avec des requêtes concurrentes, entraînant une dégradation significative de la précision. Plus précisément, le backend Candle ignore incorrectement les masques d'attention pour les lots où toutes les séquences d'entrée ont des longueurs égales. Ce défaut compromet la fiabilité des embeddings générés dans ces conditions spécifiques. Pour résoudre le problème, l'auteur a soumis une pull request contenant une correction qui a été rigoureusement testée sur ses machines locales. Le bug met en évidence des risques potentiels de stabilité pour les services d'embedding basés sur CPU gérant des entrées par lots.

github llama.cpp · il y a 8 j

LLaMA.cpp Release b9784 : Optimisations MM Hexagon et binaires multiplateformes

LLaMA.cpp publie la version b9784 avec des optimisations majeures pour les opérations MM basées sur Hexagon, incluant le repack de poids en tuiles 32x32, une meilleure gestion du dyn.quant et une gestion unifiée des paramètres de kernel. La release inclut de nouveaux binaires pour macOS (arm64 et x64), iOS, et plusieurs architectures Linux avec prise en charge de Vulkan, ROCm et OpenVINO.

lab Mistral AI News · il y a 8 j

Nouveaux contrôles de connecteur pour la sécurité et l'accès des entreprises

Mistral Studio propose désormais des contrôles d'administration enrichis pour gérer l'accès aux connecteurs par espace de travail et par outil, permettant des permissions fines. Les fonctionnalités incluent des clés API avec des étendues, des connecteurs multi-comptes et un nouveau débogueur de connecteurs pour l'analyse des causes racines, le tout soutenant une intégration sécurisée et auditable avec les systèmes d'entreprise.

lab Microsoft Research Blog · il y a 8 j

Talos : Réanalyse génomique automatisée pour le diagnostic des maladies rares

Talos est un outil open-source qui automatise la réanalyse itérative des données génomiques afin d'identifier les diagnostics de maladies rares. Il a atteint un taux de récupération de 90 % des diagnostics dans le périmètre avec seulement 1,3 variants candidats par patient, et a fourni 241 nouveaux diagnostics parmi 5 000 patients non diagnostiqués, la plupart des nouvelles découvertes apparaissant dans les 32 jours suivant la publication des preuves.

media Hugging Face Forums · il y a 8 j

Prototype de l'agent mobile Aiden en cours de développement

Aiden est un dispositif d'agent IA physique qui surveille l'écran d'un téléphone via HDMI et le contrôle par USB HID, permettant l'automatisation des applications sans jailbreak ni logiciel installé. Il prend en charge les LLM personnels (bring-your-own LLMs), fonctionne sans infrastructure backend ni collecte de données, et est publié sous licence AGPL en tant que carte de développement open-source.

github llama.cpp · il y a 8 j

vulkan-shaders-gen échoue désormais à la compilation en cas d'erreurs de compilation de shaders

L'outil vulkan-shaders-gen détecte désormais et échoue à la compilation lorsque la compilation des shaders échoue, empêchant la création d'une libggml-vulkan défectueuse. Cette correction résout un problème antérieur où le succès de la compilation masquait des échecs au moment de l'exécution, et inclut des améliorations de la gestion des erreurs et des indicateurs atomiques sur toutes les plateformes.