Tous les articles — korshunov.ai

Tous les articles Page 1 / 13

llama.cpp b9842 release : déduplication des presets et entrées de modèle en cache dans /v1/models

La version b9842 de llama.cpp introduit un changement pour dédupliquer les presets et les entrées de modèle en cache dans le point de terminaison /v1/models. Cette mise à jour est validée par Adrien Gallouët de Hugging Face.

lab Meta AI / FAIR Blog · il y a 3 j

Brain2Qwerty v2 atteint 61 % de précision lexicale dans le décodage non invasif du cerveau vers texte

Les chercheurs ont publié Brain2Qwerty v2, un pipeline d'IA non invasif qui décode des phrases en temps réel à partir d'enregistrements de magnétoencéphalographie (MEG) sans implants chirurgicaux. Le système atteint une précision lexicale globale de 61 % et jusqu'à 78 % pour les meilleurs participants, surpassant significativement les méthodes non invasives précédentes.

github llama.cpp · il y a 3 j

La version b9840 de llama.cpp ajoute le support de DeepSeek V4 et des binaires multi-plateformes

La version b9840 de llama.cpp introduit le support de conversion pour le modèle DeepSeek V4, incluant un traitement spécifique pour la variante Pro. Cette mise à jour intègre la nouvelle architecture dans la bibliothèque avec diverses optimisations internes et corrections de bugs.

lab OpenAI News · il y a 3 j

Cartographier l'opportunité de la main-d'œuvre européenne en IA

OpenAI Economic Research a étendu son cadre de transition des emplois liés à l'IA à l'Union européenne, en utilisant la taxonomie ESCO et les données d'Eurostat pour analyser comment les capacités de l'IA pourraient remodeler les marchés du travail dans les États membres.

github llama.cpp · il y a 3 j

llama.cpp b9839 avec correction du balayage Tailwind et binaires multi-plateformes

Le projet llama.cpp a publié la version b9839, qui inclut une correction pour restaurer le balayage Tailwind dans les worktrees ignorés. Cette mise à jour fournit des binaires précompilés pour macOS, Linux, Android, Windows et openEuler sur diverses architectures et backends d'accélération matérielle.

github llama.cpp · il y a 3 j

llama.cpp b9838 Release : Builds pour macOS, Linux, Windows, Android

Le projet llama.cpp a publié la version b9838, fournissant des binaires préconstruits pour un large éventail de systèmes d'exploitation et d'accélérateurs matériels. Cette version inclut le support du CPU, du GPU (CUDA, Vulkan, ROCm, OpenCL) et des accélérateurs IA spécialisés sur macOS, Linux, Windows, Android et openEuler.

lab OpenAI News · il y a 3 j

HP Inc. lance un partenariat stratégique avec OpenAI sur la technologie Frontier

HP Inc. intensifie son partenariat stratégique avec OpenAI à la suite de pilotes réussis, déployant l'IA dans les expériences client, la productivité des employés et le développement logiciel. L'entreprise utilise la plateforme OpenAI Frontier comme modèle d'exploitation unifié pour gouverner le contexte, les autorisations et l'évaluation alors qu'elle passe de cas d'utilisation expérimentaux à une production à l'échelle de l'entreprise.

github llama.cpp · il y a 3 j

La version b9837 de llama.cpp ajoute le drapeau --reasoning-preserve et de nouveaux binaires

Le projet llama.cpp a publié la version b9837, qui introduit un nouveau drapeau `--reasoning-preserve` pour le modèle de chat Jinja afin de conserver les jetons de raisonnement. Cette mise à jour inclut également des messages d'aide corrigés et fournit des binaires préconstruits pour macOS, Linux, Windows, Android et openEuler sur divers backends matériels.

github llama.cpp · il y a 3 j

llama.cpp b9835 avec corrections de l'arrêt de l'interface utilisateur et du saut de raisonnement

Le projet llama.cpp a publié la version b9835, qui inclut une correction pour les fonctionnalités d'arrêt et de saut de raisonnement en mode mono-modèle. Cette mise à jour résout des problèmes spécifiques au sein de l'interface utilisateur afin d'améliorer le contrôle pendant l'inférence du modèle.

github llama.cpp · il y a 3 j

llama.cpp b9833 release : analyseur MiniCPM5 et binaires multi-plateformes

Le projet llama.cpp a publié la version b9833, introduisant un analyseur dédié pour le modèle MiniCPM5 ainsi que diverses corrections de bugs et refactorisations. Cette mise à jour inclut la prise en charge de l'analyse des appels d'outils, la simplification de la grammaire et la correction du comportement de l'API Jinja pour assurer la compatibilité avec les normes Jinja2.

github llama.cpp · il y a 3 j

La version b9832 de llama.cpp ajoute le drapeau de débogage --dump-prog

Le projet llama.cpp a publié la version b9832, introduisant une nouvelle option en ligne de commande `--dump-prog` pour le moteur de templates Jinja afin d'aider au débogage. Cette mise à jour inclut également des binaires précompilés pour macOS, Linux, Android, Windows et openEuler sur diverses architectures CPU et GPU.

github llama.cpp · il y a 4 j

La version b9831 de llama.cpp ajoute le support DFlash et de nouveaux binaires

La version b9831 de llama.cpp introduit le support de DFlash v2, incluant l'attention à fenêtre glissante par type de couche, ainsi qu'un ensemble complet de binaires préconstruits pour plusieurs plateformes.

github llama.cpp · il y a 4 j

La version b9830 de llama.cpp ajoute le drapeau --offline et corrige un bug mémoire

La version b9830 de llama.cpp introduit la possibilité d'utiliser le drapeau --offline avec la commande llama download, permettant aux scripts de vérifier les modèles en cache sans accès réseau. Cette mise à jour résout également une vulnérabilité use-after-free latente dans le callback on_done de la tâche URL où first_path était incorrectement capturé par référence.

github llama.cpp · il y a 4 j

llama.cpp b9829 Release : journaux réduits et binaires multi-plateformes

Le projet llama.cpp a publié la version b9829, qui inclut une réduction de la sortie des journaux dans le serveur, les composants communs et les modules de décodage spéculatif. Cette mise à jour standardise également les conventions de nommage en remplaçant CMN_ par COM_.

github llama.cpp · il y a 4 j

llama.cpp b9828 release : améliorations de l'attention flash OpenCL et nouveaux binaires

La version b9828 de llama.cpp introduit des améliorations significatives d'OpenCL, en particulier une refonte des noyaux Flash Attention pour les précisions f16 et f32. Cette mise à jour inclut de nouveaux noyaux de prépassage de préfixe ainsi que la prise en charge des formats de quantification q4_0 et q8_0.

github llama.cpp · il y a 5 j

La version b9827 de llama.cpp ajoute une optimisation de copie asynchrone 2D CUDA

La version b9827 de llama.cpp introduit une optimisation de performance pour CUDA en ajoutant un chemin rapide cudaMemcpy2DAsync à la fonction ggml_cuda_cpy. Ce changement accélère les copies échelonnées de même type et même forme où les tenseurs ne sont pas entièrement contigus mais chaque ligne l'est, remplaçant des noyaux de copie scalaire élément par élément plus lents.

github llama.cpp · il y a 5 j

llama.cpp b9825 Release : Correction Vulkan et binaires multiplateformes

Le projet llama.cpp a publié la version b9825, qui inclut une correction pour l'opérateur d'étape Vulkan lors du traitement des entrées nulles. Cette mise à jour fournit des binaires précompilés pour macOS, Linux, Windows, Android et openEuler sur divers backends matériels.

github llama.cpp · il y a 5 j

llama.cpp b9826 avec correction de la norme SYCL

Le projet llama.cpp a publié la version b9826, qui inclut une correction pour des cas de tests unitaires échoués liés à la fonction norm dans SYCL. Cette mise à jour fournit des binaires précompilés et des frameworks sur plusieurs plateformes et accélérateurs matériels.

github CrewAI · il y a 5 j

Notes de version de crewAI 1.15.1

La mise à jour de la version 1.15.1 de crewAI introduit de nouvelles fonctionnalités pour l'initialisation et le déploiement des projets, ainsi que plusieurs corrections de bugs et améliorations de la documentation.

github llama.cpp · il y a 5 j

llama.cpp b9822 release avec binaires macOS, Linux, Windows

Le projet llama.cpp a publié la version b9822, fournissant des binaires préconstruits pour macOS, iOS, Linux, Android et Windows. Cette mise à jour inclut une correction pour l'option --no-common de test-chat-template et distribue les builds sur diverses architectures matérielles et accélérateurs.