Tous les articles — korshunov.ai

Tous les articles Page 1 / 21

Kimi K2.7 Code est désormais généralement disponible sur GitHub Copilot

Le modèle Kimi K2.7 Code de Moonshot AI est désormais généralement disponible sur la plateforme GitHub Copilot.

Un utilisateur de Reddit demande si Ubuntu est la distribution Linux la plus compatible pour l'IA locale

Un utilisateur de la communauté r/LocalLLaMA passe sous Linux et cherche à confirmer si Ubuntu offre la meilleure compatibilité pour exécuter des charges de travail d'IA locale.

media Hugging Face Forums · il y a 12 h

Prise en charge des caractères Unicode lors des téléchargements sur le site web

Le site web de Hugging Face ne parvient pas à encoder correctement les caractères Unicode lors du téléchargement de fichiers individuels à partir d'un jeu de données, que ce soit via le bouton de téléchargement ou l'URL de résolution.

media Hugging Face Forums · il y a 12 h

Les agents LLM peuvent-ils développer une précognition ?

L'article soutient que les agents LLM actuels agissent souvent avec une conscience implicite des conséquences, ce qui est insuffisant pour les tâches consécutielles. Il propose la « précognition explicite » comme une couche d'architecture requise pour garantir que les agents modélisent les risques et prévoient les effets avant l'exécution.

media Hugging Face Forums · il y a 12 h

Quel modèle open-source est le meilleur pour les agents de support client ?

Un utilisateur du forum Hugging Face demande quel modèle d'IA gratuit est le meilleur choix pour construire un chatbot de support client ou un assistant virtuel. Le post ne contient aucune comparaison spécifique de modèles, résultats de test ou détails techniques.

media Hugging Face Forums · il y a 12 h

Erreur du compteur de téléchargement pour les modèles sur Hugging Face

Un utilisateur du forum communautaire de Hugging Face a signalé que les statistiques de téléchargement de son dépôt de modèle, InternScience/Agents-A1-FP8, sont restées à zéro bien qu'il ait été téléchargé deux jours plus tôt. L'utilisateur note que le dépôt inclut un fichier config.json et soupçonne qu'un problème technique empêche le compteur de se mettre à jour.

media Hugging Face Forums · il y a 12 h

Les utilisateurs signalent un retard de réponse du support facturation de Hugging Face

Un utilisateur du forum de discussion de Hugging Face signale que son e-mail adressé au service de facturation concernant une inscription non autorisée n'a pas reçu de réponse. La personne cherche à obtenir un remboursement pour le frais accidentel et note le manque de communication malgré le fait qu'elle ait déjà contacté l'équipe de support.

media Hugging Face Forums · il y a 12 h

Bonnes pratiques pour détecter et récupérer les deltas de jeux de données

Un utilisateur du forum Hugging Face demande des méthodes efficaces pour détecter quand de nouvelles données sont ajoutées ou qu'un jeu de données est mis à jour, dans le but de déclencher des pipelines sans retraiter l'intégralité du jeu de données.

media r/LocalLLaMA · il y a 12 h

Le Bonsai-8B 1-bit de PrismML bat IBM Granite sur l'appel d'outils CPU avec grammaire

Un benchmark du modèle Bonsai-8B 1-bit de PrismML contre le Granite d'IBM et d'autres LLMs révèle que Bonsai-8B atteint la plus haute précision d'appel d'outils lors de l'utilisation du décodage contraint par grammaire. Ce test, réalisé sur CPU avec llama.cpp, met en évidence le rôle critique des contraintes de sortie pour permettre aux petits modèles quantifiés de fonctionner efficacement pour les tâches d'agent.

media r/LocalLLaMA · il y a 12 h

Lemonade SDK publie RPG-HaloTales-V1 pour le jeu de rôle multimédia local

Le Lemonade SDK a publié un nouveau modèle nommé RPG-HaloTales-V1, conçu pour offrir une expérience de jeu de rôle multimédia que les utilisateurs peuvent exécuter localement.

media r/LocalLLaMA · il y a 12 h

Backend LLM local open-source pour les conversations entre PNJ

L'auteur a publié un backend de synthèse vocale entièrement local conçu pour les PNJ basés sur des grands modèles de langage (LLM), permettant des interactions directes entre PNJ sans dépendance au cloud. Le système intègre la reconnaissance vocale, un LLM local et la synthèse vocale pour permettre aux PNJ de converser, de conserver le contexte et d'influencer les interactions futures avec le joueur.

media r/LocalLLaMA · il y a 13 h

Meilleur modèle de codage pour une configuration 3x Spark ?

Un utilisateur cherche des recommandations pour le meilleur modèle de codage à exécuter sur une configuration matérielle dédiée composée de trois unités Asus Ascent GX10 (GB10), avec une attente de 5 à 10 utilisateurs en simultané.

media r/LocalLLaMA · il y a 13 h

Andi de Hugging Face démontre un pipeline vocal entièrement open-source utilisant Gemma 4 31B

Andi de Hugging Face a publié une démo entièrement open-source et gratuite qui crée un pipeline d'interaction vocale. Le système intègre parakeet de Nvidia, le modèle Gemma 4 31B servi par Cerebras, et une inférence personnalisée pour Qwen3TTS.

media r/LocalLLaMA · il y a 13 h

Z.ai lance ZCode pour défier Cursor, Claude Code et GitHub Copilot dans le codage IA

Z.ai a introduit ZCode, un nouvel outil de codage IA conçu pour concurrencer des plateformes établies comme Cursor, Claude Code et GitHub Copilot.

media r/LocalLLaMA · il y a 13 h

Mise à jour SimpleLLMChat 1.2.5 pour l'IA agentique sur Windows XP

Le développeur a publié la version 1.2.5 de SimpleLLMChat, un harnais d'IA agentique conçu pour fonctionner sur des machines héritées utilisant Windows XP et .NET 4.0.

media r/LocalLLaMA · il y a 13 h

Qu'y a-t-il dans votre RAG ?

Un utilisateur de Reddit remet en question l'utilité pratique de la Génération Augmentée par Récupération (RAG) pour des projets personnels impliquant du codage, de l'administration système et de petites bases de code. L'auteur soutient que les connaissances industrielles standard sont déjà bien couvertes par les modèles, tandis que des sources de données spécifiques comme les bases de code ou les références d'API sont soit trop petites pour nécessiter un indexage, soit trop grandes pour être gérées efficacement.

media r/LocalLLaMA · il y a 13 h

Le PDG de Palantir s'indigne contre les modèles fermés

Le PDG de Palantir, Alex Karp, a publiquement critiqué Anthropic et OpenAI pour avoir supposément surfacturé ses clients et mal utilisé leurs données. Cette position intervient alors que Palantir a récemment conclu un accord pour acheter des puces Nvidia afin d'exécuter des modèles locaux pour ses clients d'entreprise.

media r/LocalLLaMA · il y a 13 h

Une astuce économique pour une sortie structurée fiable : renvoyer l'erreur de validation dans la tentative suivante

Pour améliorer la fiabilité lors de la génération de sorties structurées à partir de grands modèles de langage, une méthode est proposée qui renvoie les erreurs de validation et la sortie précédente du modèle dans le prompt lors des tentatives suivantes. Cette approche transforme le processus de régénération aléatoire des réponses en une correction automatique des erreurs spécifiques par édition de la tentative précédente.

media Hugging Face Forums · il y a 18 h

Écart entre les slots ZeroGPU signalés et les Spaces listés

Un utilisateur a rencontré une erreur de quota indiquant que 17 slots ZeroGPU étaient en utilisation contre une limite de 10, bien qu'il ne liste que 8 Spaces demandant le matériel zero-a10g.

media Hugging Face Forums · il y a 18 h

Un utilisateur rencontre une SecretsInjectionError lors du déploiement de SAM3 sur Azure

Un utilisateur signale avoir rencontré une SecretsInjectionError lors de la tentative de déploiement du modèle Meta SAM3 sur Microsoft Azure à l'aide de l'exemple Hugging Face Foundry. L'erreur se produit pendant la phase de configuration et d'installation lors de l'appel de l'API déployée.