Tous les articles — korshunov.ai

Tous les articles Page 1 / 21

Comprendre pour participer

Geoffrey Litt soutient que les développeurs doivent comprendre en profondeur le code généré par les agents de codage pour éviter la dette cognitive et rester des participants actifs dans le processus créatif.

media r/LocalLLaMA · il y a 2 h

OpenLumara relie désormais n'importe quelle interface utilisateur aux modèles locaux via un point de terminaison OpenAI

Le framework open source OpenLumara prend désormais en charge la connexion à n'importe quelle interface utilisateur capable de communiquer avec un point de terminaison OpenAI, tel que KoboldLite et OpenWebUI. Cette mise à jour permet aux utilisateurs d'intégrer le harnais efficace en tokens dans leurs workflows existants sans modifier leur frontend préféré.

media r/LocalLLaMA · il y a 2 h

Quelqu'un utilise-t-il des LLM locaux pour la génération de données spatiales ou de plans urbains à grande échelle dans un logiciel comme QGIS ?

Un utilisateur cherche des recommandations pour des modèles linguistiques locaux capables de générer des données structurelles à grande échelle, telles que des plans urbains entiers, des réseaux routiers et des systèmes de grille complexes.

media r/LocalLLaMA · il y a 4 h

Dual R9700 : Meilleure formule pour Qwen3.6 27B ?

Un utilisateur examine l'optimisation du modèle Qwen3.6-27B sur une configuration dual AMD Radeon R9700 en utilisant llama.cpp, comparant les performances entre les backends Vulkan et ROCm.

media r/LocalLLaMA · il y a 4 h

Les noyaux WebGPU pour Gemma 4 atteignent 255 tok/s

Xenova a publié des noyaux WebGPU pour Gemma 4, atteignant une performance de 255 tokens par seconde. Cette optimisation permet aux modèles denses de s'exécuter à des vitesses dépassant 100 T/s dans les navigateurs web.

blog Simon Willison · il y a 5 h

Utilisation de DSPy pour évaluer et améliorer les invites système SQL de l'agent Datasette

Simon Willison a utilisé Claude Code avec le modèle Fable 5 pour automatiser l'évaluation et l'optimisation des invites système de l'agent Datasette, en ciblant spécifiquement sa fonctionnalité d'exécution de requêtes SQL en lecture seule. Le processus impliquait l'installation de la dernière version alpha de Datasette et de DSPy afin d'identifier les faiblesses dans la manière dont l'agent gère les informations de schéma.

media r/LocalLLaMA · il y a 8 h

L'analyse de 2,3k applications IA locales révèle 82 catégories et des cas d'utilisation diversifiés

Une analyse du Mac App Store a identifié 2 259 applications IA locales sur plus de 20 000 entrées scrapées, mettant en évidence un écosystème croissant d'outils de niche qui emballent des modèles avec des workflows spécifiques. L'enquête couvre 82 catégories distinctes, allant des tâches courantes comme la transcription et l'OCR à des fonctions spécialisées telles que le style vestimentaire et l'assistance santé pour animaux.

media r/LocalLLaMA · il y a 9 h

Gemma-4-31B affiné pour le copywriting : +290 Elo sur EqBench3

Un utilisateur a publié un affinage étroit du modèle Gemma-4-31B-it, spécifiquement optimisé pour les tâches de copywriting et d'écriture créative. Le modèle a été entraîné à éliminer les clichés marketing génériques et à adopter un style de réponse directe caractérisé par des détails concrets et des appels à l'action serrés.

media r/LocalLLaMA · il y a 9 h

Exécution de MiniMax M2.7 Q3 XL sur 6x GPUs NVIDIA P40

Un utilisateur détaille le déploiement réussi du modèle MiniMax M2.7 Q3_K_XL sur six GPU NVIDIA Tesla P40, fournissant une configuration matérielle complète et des paramètres d'inférence optimisés pour l'hébergement local de LLM.

github llama.cpp · il y a 12 h

La release b9860 de llama.cpp ajoute l'API llama_ftype_name

Le projet llama.cpp a publié la version b9860, introduisant une nouvelle fonction d'API C publique nommée `llama_ftype_name` pour exposer le nom du type de fichier modèle (quantification).

media r/LocalLLaMA · il y a 12 h

Des agents écrivent collaborativement un wiki massif sur l'apprentissage par renforcement pour les LLM (plus de 200 articles jusqu'à présent) et tout le monde peut rejoindre

Un projet collaboratif est en cours où des agents IA compilent un wiki complet sur l'apprentissage par renforcement pour les grands modèles de langage, ayant déjà traité plus de 200 articles de recherche.

media r/LocalLLaMA · il y a 12 h

Publication Reddit exhortant à apprécier les développeurs open source

Un utilisateur de Reddit met en lumière la nécessité critique d'exprimer sa gratitude envers les contributeurs open-source, citant les récentes mises à jour rapides de vLLM comme exemple parfait d'effort communautaire.

media r/LocalLLaMA · il y a 12 h

Reconstruction de Gemma 4 31b... mieux... en tant que 26b...

Un développeur expose un plan pour reconstruire le modèle Gemma 4 31B en réduisant son nombre de paramètres à environ 26B tout en visant une performance améliorée. Le projet implique des changements d'architecture, des techniques d'entraînement spécifiques et la curation de jeux de données pour créer un modèle plus petit et plus efficace.

media r/LocalLLaMA · il y a 12 h

poolside/Laguna-XS-2.1

L'article annonce la sortie de Laguna-XS-2.1, un modèle disponible sur Hugging Face sous l'organisation poolside.

media r/LocalLLaMA · il y a 12 h

Kimi K2.7 Code est désormais généralement disponible sur GitHub Copilot

Le modèle Kimi K2.7 Code de Moonshot AI est désormais généralement disponible sur la plateforme GitHub Copilot.

media r/LocalLLaMA · il y a 13 h

Un utilisateur de Reddit demande si Ubuntu est la distribution Linux la plus compatible pour l'IA locale

Un utilisateur de la communauté r/LocalLLaMA passe sous Linux et cherche à confirmer si Ubuntu offre la meilleure compatibilité pour exécuter des charges de travail d'IA locale.

media Hugging Face Forums · il y a 13 h

Prise en charge des caractères Unicode lors des téléchargements sur le site web

Le site web de Hugging Face ne parvient pas à encoder correctement les caractères Unicode lors du téléchargement de fichiers individuels à partir d'un jeu de données, que ce soit via le bouton de téléchargement ou l'URL de résolution.

media Hugging Face Forums · il y a 13 h

Les agents LLM peuvent-ils développer une précognition ?

L'article soutient que les agents LLM actuels agissent souvent avec une conscience implicite des conséquences, ce qui est insuffisant pour les tâches consécutielles. Il propose la « précognition explicite » comme une couche d'architecture requise pour garantir que les agents modélisent les risques et prévoient les effets avant l'exécution.

media Hugging Face Forums · il y a 13 h

Quel modèle open-source est le meilleur pour les agents de support client ?

Un utilisateur du forum Hugging Face demande quel modèle d'IA gratuit est le meilleur choix pour construire un chatbot de support client ou un assistant virtuel. Le post ne contient aucune comparaison spécifique de modèles, résultats de test ou détails techniques.

media Hugging Face Forums · il y a 13 h

Erreur du compteur de téléchargement pour les modèles sur Hugging Face

Un utilisateur du forum communautaire de Hugging Face a signalé que les statistiques de téléchargement de son dépôt de modèle, InternScience/Agents-A1-FP8, sont restées à zéro bien qu'il ait été téléchargé deux jours plus tôt. L'utilisateur note que le dépôt inclut un fichier config.json et soupçonne qu'un problème technique empêche le compteur de se mettre à jour.