Tous les articles
media Hugging Face Forums · il y a 3 j

L'architecture de contexte générationnel : résoudre la pourriture du contexte des LLM

L'architecture de contexte générationnel (GCA) propose de traiter la fenêtre de contexte d'un LLM comme une durée de vie finie plutôt que comme un stockage infini afin de résoudre la « pourriture du contexte » et la dilution de l'attention dans les systèmes multi-agents. En imposant une mortalité artificielle, les agents sont terminés avant que leurs performances ne se dégradent, transmettant leur état aux nouvelles générations via un coffre-fort Markdown en fichier plat.

lab OpenAI News · il y a 4 j

HP Inc. lance un partenariat stratégique avec OpenAI sur la technologie Frontier

HP Inc. intensifie son partenariat stratégique avec OpenAI à la suite de pilotes réussis, déployant l'IA dans les expériences client, la productivité des employés et le développement logiciel. L'entreprise utilise la plateforme OpenAI Frontier comme modèle d'exploitation unifié pour gouverner le contexte, les autorisations et l'évaluation alors qu'elle passe de cas d'utilisation expérimentaux à une production à l'échelle de l'entreprise.

media Hugging Face Forums · il y a 4 j

HoLo-ToLk : Des modèles de parole sans tokenizers sur une base HSL à 0 paramètre

L'auteur présente HoLo-ToLk, un projet de recherche qui construit des modèles de parole vers texte (STT) et de texte vers parole (TTS) en utilisant la base d'octets HSL à zéro paramètre sans tokenizers ni embeddings d'apprentissage. Le travail démontre que les octets HSL bruts peuvent servir de signal viable pour le traitement audio lorsqu'ils sont combinés avec des modifications architecturales spécifiques.

media Hugging Face Forums · il y a 4 j

Concept : Échanger des données pour entraîner des modèles d'IA

Un utilisateur propose un concept de site web où les individus échangent des données contre des données pour entraîner des modèles d'IA, éliminant ainsi le besoin de transactions monétaires. Le système fonctionne sur une économie basée sur les crédits où les utilisateurs commencent avec un montant fixe de crédits et publient des primes pour des besoins spécifiques en données.

github llama.cpp · il y a 4 j

La version b9830 de llama.cpp ajoute le drapeau --offline et corrige un bug mémoire

La version b9830 de llama.cpp introduit la possibilité d'utiliser le drapeau --offline avec la commande llama download, permettant aux scripts de vérifier les modèles en cache sans accès réseau. Cette mise à jour résout également une vulnérabilité use-after-free latente dans le callback on_done de la tâche URL où first_path était incorrectement capturé par référence.