Tous les articles — korshunov.ai

Tous les articles Page 1 / 19

Nous commençons tous quelque part

Un développeur avec plus de 25 ans d'expérience dans les technologies web transitionne vers l'ingénierie de l'IA pour aller au-delà de l'utilisation d'outils et comprendre comment construire avec eux.

media Hugging Face Forums · il y a 3 j

Utilisateur incapable de redémarrer un Espace privé Hugging Face en raison d'une erreur 503

Un utilisateur signale que son Espace privé Hugging Face, spécifiquement 'Ark-kun/tangent', a cessé de fonctionner brusquement et ne peut pas être redémarré. Les tentatives de redémarrage ou de réinitialisation d'usine échouent toutes avec une erreur « 503. Quelque chose s'est mal passé lors du redémarrage de cet Espace ».

media Hugging Face Forums · il y a 3 j

Expérience pratique avec les surrogats ML pour les simulations CFD et FEA ?

Un professionnel de la simulation ingénierie cherche des expériences de déploiement en conditions réelles d'approximateurs (surrogates) basés sur le machine learning pour réduire le coût des exécutions coûteuses de solveurs de Dynamique des Fluides Numérique (CFD) et d'Analyse par Éléments Finis (FEA).

github llama.cpp · il y a 3 j

La version b9840 de llama.cpp ajoute le support de DeepSeek V4 et des binaires multi-plateformes

La version b9840 de llama.cpp introduit le support de conversion pour le modèle DeepSeek V4, incluant un traitement spécifique pour la variante Pro. Cette mise à jour intègre la nouvelle architecture dans la bibliothèque avec diverses optimisations internes et corrections de bugs.

lab OpenAI News · il y a 3 j

Cartographier l'opportunité de la main-d'œuvre européenne en IA

OpenAI Economic Research a étendu son cadre de transition des emplois liés à l'IA à l'Union européenne, en utilisant la taxonomie ESCO et les données d'Eurostat pour analyser comment les capacités de l'IA pourraient remodeler les marchés du travail dans les États membres.

github llama.cpp · il y a 3 j

llama.cpp b9839 avec correction du balayage Tailwind et binaires multi-plateformes

Le projet llama.cpp a publié la version b9839, qui inclut une correction pour restaurer le balayage Tailwind dans les worktrees ignorés. Cette mise à jour fournit des binaires précompilés pour macOS, Linux, Android, Windows et openEuler sur diverses architectures et backends d'accélération matérielle.

github llama.cpp · il y a 3 j

llama.cpp b9838 Release : Builds pour macOS, Linux, Windows, Android

Le projet llama.cpp a publié la version b9838, fournissant des binaires préconstruits pour un large éventail de systèmes d'exploitation et d'accélérateurs matériels. Cette version inclut le support du CPU, du GPU (CUDA, Vulkan, ROCm, OpenCL) et des accélérateurs IA spécialisés sur macOS, Linux, Windows, Android et openEuler.

media Hugging Face Forums · il y a 3 j

L'architecture de contexte générationnel : résoudre la pourriture du contexte des LLM

L'architecture de contexte générationnel (GCA) propose de traiter la fenêtre de contexte d'un LLM comme une durée de vie finie plutôt que comme un stockage infini afin de résoudre la « pourriture du contexte » et la dilution de l'attention dans les systèmes multi-agents. En imposant une mortalité artificielle, les agents sont terminés avant que leurs performances ne se dégradent, transmettant leur état aux nouvelles générations via un coffre-fort Markdown en fichier plat.

media Hugging Face Forums · il y a 3 j

Analyse de la dynamique des états cachés à travers 7 LLM open-weight révèle des motifs fonctionnels récurrents

Un chercheur indépendant a analysé l'évolution des représentations cachées pendant l'inférence sur sept modèles open-weight, dont GPT-2, OPT-125M et Llama-3.2-1B, pour identifier des régimes dynamiques internes au-delà des benchmarks de sortie standard.

media Hugging Face Forums · il y a 3 j

Explorer les régimes fonctionnels à l'intérieur des petits modèles de langage

Ce projet de recherche indépendant caractérise la dynamique interne de sept modèles de langage de taille petite et moyenne en analysant comment les représentations cachées évoluent pendant l'inférence, plutôt que de s'appuyer sur des benchmarks de sortie standard. L'étude examine le comportement dynamique, l'organisation fonctionnelle et la géométrie des représentations pour identifier des motifs reproductibles à travers différentes architectures.

media Hugging Face Forums · il y a 3 j

Prédicteur de la Coupe du Monde 2026

Un développeur a créé un outil de prédiction pour la Coupe du Monde 2026 qui utilise des données historiques pour simuler les résultats du tournoi. L'application fournit des probabilités de victoire et des prédictions de score pour n'importe quelle paire d'équipes nationales, basées sur des motifs appris à partir d'environ 50 000 matchs internationaux couvrant plus d'un siècle.

media Hugging Face Forums · il y a 3 j

Un guide complet et bilingue sur les Transformers : Des fondements à la compression du KV-cache et à la dynamique de l'attention

Carles Marin a publié un guide open-source, bilingue (anglais et espagnol), qui relie les fondements mathématiques des architectures Transformer à leur implémentation pratique. La ressource se concentre sur la mécanique de bas niveau, en fournissant du code reproductible et des éléments interactifs pour expliquer des sujets complexes.

media Hugging Face Forums · il y a 3 j

Guide bilingue open-source sur les mécaniques des Transformers publié

Un guide open-source et bilingue (anglais/espagnol) détaillant le fonctionnement interne des Transformers a été publié. La ressource couvre les mathématiques exactes et les mécanismes derrière des concepts tels que l'effondrement de l'attention et la compression du KV-cache.

lab OpenAI News · il y a 4 j

HP Inc. lance un partenariat stratégique avec OpenAI sur la technologie Frontier

HP Inc. intensifie son partenariat stratégique avec OpenAI à la suite de pilotes réussis, déployant l'IA dans les expériences client, la productivité des employés et le développement logiciel. L'entreprise utilise la plateforme OpenAI Frontier comme modèle d'exploitation unifié pour gouverner le contexte, les autorisations et l'évaluation alors qu'elle passe de cas d'utilisation expérimentaux à une production à l'échelle de l'entreprise.

github llama.cpp · il y a 4 j

La version b9837 de llama.cpp ajoute le drapeau --reasoning-preserve et de nouveaux binaires

Le projet llama.cpp a publié la version b9837, qui introduit un nouveau drapeau `--reasoning-preserve` pour le modèle de chat Jinja afin de conserver les jetons de raisonnement. Cette mise à jour inclut également des messages d'aide corrigés et fournit des binaires préconstruits pour macOS, Linux, Windows, Android et openEuler sur divers backends matériels.

media Hugging Face Forums · il y a 4 j

HoLo-ToLk : Des modèles de parole sans tokenizers sur une base HSL à 0 paramètre

L'auteur présente HoLo-ToLk, un projet de recherche qui construit des modèles de parole vers texte (STT) et de texte vers parole (TTS) en utilisant la base d'octets HSL à zéro paramètre sans tokenizers ni embeddings d'apprentissage. Le travail démontre que les octets HSL bruts peuvent servir de signal viable pour le traitement audio lorsqu'ils sont combinés avec des modifications architecturales spécifiques.

github llama.cpp · il y a 4 j

llama.cpp b9835 avec corrections de l'arrêt de l'interface utilisateur et du saut de raisonnement

Le projet llama.cpp a publié la version b9835, qui inclut une correction pour les fonctionnalités d'arrêt et de saut de raisonnement en mode mono-modèle. Cette mise à jour résout des problèmes spécifiques au sein de l'interface utilisateur afin d'améliorer le contrôle pendant l'inférence du modèle.

media Hugging Face Forums · il y a 4 j

Enquête hypothétique sur l'apprentissage du code binaire par l'IA

Un utilisateur de forum pose une question spéculative concernant le fait d'entraîner des réseaux neuronaux ou des systèmes d'IA à comprendre le code binaire, ce qui pourrait-il améliorer significativement leurs capacités globales, en particulier dans les tâches de codage.

media Hugging Face Forums · il y a 4 j

Concept : Échanger des données pour entraîner des modèles d'IA

Un utilisateur propose un concept de site web où les individus échangent des données contre des données pour entraîner des modèles d'IA, éliminant ainsi le besoin de transactions monétaires. Le système fonctionne sur une économie basée sur les crédits où les utilisateurs commencent avec un montant fixe de crédits et publient des primes pour des besoins spécifiques en données.

github llama.cpp · il y a 4 j

llama.cpp b9833 release : analyseur MiniCPM5 et binaires multi-plateformes

Le projet llama.cpp a publié la version b9833, introduisant un analyseur dédié pour le modèle MiniCPM5 ainsi que diverses corrections de bugs et refactorisations. Cette mise à jour inclut la prise en charge de l'analyse des appels d'outils, la simplification de la grammaire et la correction du comportement de l'API Jinja pour assurer la compatibilité avec les normes Jinja2.