v0.24.0
La version v0.24.0 inclut une mise à jour de l'intégration continue pour augmenter le délai de démarrage GSM8K des configurations MoE Refactor Qwen3 NVFP4.
La version v0.24.0 inclut une mise à jour de l'intégration continue pour augmenter le délai de démarrage GSM8K des configurations MoE Refactor Qwen3 NVFP4.
OpenAI a lancé un aperçu limité de la série GPT-5.6, introduisant trois nouveaux modèles : Sol comme modèle phare, Terra pour un équilibre dans le travail quotidien, et Luna pour des tâches rapides et abordables. L'entreprise prévoit de rendre ces modèles disponibles au grand public dans les prochaines semaines après cette phase initiale avec des partenaires de confiance.
Le projet llama.cpp a publié la version b9821, qui introduit des mises à jour de l'interface en ligne de commande permettant aux utilisateurs d'invoquer les indicateurs --version, --licenses et --help. Cette version fournit un ensemble complet de binaires préconstruits pour macOS, Linux, Android, Windows et openEuler sur divers accélérateurs matériels.
La version 2.1.195 de Claude Code introduit plusieurs correctifs et améliorations, notamment de nouvelles variables d'environnement pour le contrôle de la souris en mode plein écran et des corrections à la logique du matcheur de hooks.
La version b9820 de llama.cpp introduit des améliorations de performances en réintroduisant moins de synchronisations lors du calcul fractionné, ciblant spécifiquement les backends CUDA. Cette mise à jour fournit également des binaires précompilés pour macOS, Linux, Windows, Android et openEuler sur CPU, GPU et accélérateurs matériels spécialisés.
Le projet llama.cpp a publié la version b9816, qui inclut une synchronisation avec la bibliothèque ggml. Cette mise à jour fournit des binaires préconstruits pour les plateformes macOS, iOS, Linux, Windows, Android et openEuler.
La version b9817 de llama.cpp met à jour le backend OpenVINO vers la version 2026.2.1 et rend ses packages de release autonomes. Cette mise à jour inclut plusieurs améliorations d'opérateurs au sein du backend OpenVINO, telles que la suppression des ensembles compute_op_type codés en dur et l'activation de softmax avec entrée sink.
La version b9813 de llama.cpp introduit le support Vulkan pour le matériel Intel Xe-LPG Plus en ajoutant l'énumération d'architecture INTEL_XE1 et en activant coopmat1. Cette mise à jour traite les commentaires de code précédents, renomme l'identifiant d'architecture et inclut une vérification des pilotes Windows.
Le projet llama.cpp a publié la version b9814, qui inclut une optimisation de l'opération `mul_mat_vecq` dans Vulkan ciblant spécifiquement le GPU AMD mi50. Cette mise à jour est accompagnée d'un ensemble complet de binaires précompilés pour plusieurs systèmes d'exploitation et architectures matérielles.
Le SDK Python du protocole Model Context Protocol (MCP) a publié sa troisième version alpha, v2.0.0a3, introduisant des changements significatifs au niveau du protocole et de l'architecture tout en maintenant la compatibilité ascendante pour les utilisateurs stables de la série 1.x.
Le projet llama.cpp a publié la version b9811, qui inclut une correction pour un bug du compilateur affectant le chemin conv2d coopmat2 dans Vulkan. Ce contournement est également appliqué à l'implémentation CONV_3D sur la base des suggestions de l'ingénieur NVIDIA Jeff Bolz.
Le projet llama.cpp a publié la version b9810, introduisant un mappage CUDA pour `cublasSgemmBatched` dans les en-têtes fournisseurs HIP/MUSA. Cette mise à jour est accompagnée d'un ensemble complet de binaires préconstruits pour les plateformes macOS, Linux, Windows, Android et openEuler.
Le SDK Python du Model Context Protocol a publié la version 1.28.1, introduisant des mises à jour sur la gestion des flux et la sécurité du transport.
La version b9804 de llama.cpp introduit une correction pour l'architecture Mamba2 en supprimant un facteur d'expansion codé en dur de 2x et une vérification de paramètre invalide, permettant ainsi le support de n'importe quelle valeur d'expansion. Cette modification met à jour le script `convert_hf_to_gguf.py` pour rendre le paramètre expand optionnel avec une valeur par défaut de 2.
La version 1.15.0 de crewAI introduit des améliorations significatives aux définitions de Flow, y compris le chargement déclaratif unifié, le support inline des crews et de nouvelles actions composites comme `each` et les actions à agent unique.
Le projet llama.cpp a publié la version b9803, qui inclut une correction pour OpenCL afin de vider les lots de profilage à l'arrêt pour les lots incomplets. Cette mise à jour fournit des binaires pour macOS, Linux, Windows, Android et openEuler sur divers backends matériels.
La plateforme AutoGPT a publié la version 0.6.65, introduisant des mises à jour significatives du système Copilot, de la navigation de l'interface utilisateur et de la fiabilité de l'infrastructure.
Le projet llama.cpp a publié la version b9802, offrant des binaires préconstruits sur plusieurs systèmes d'exploitation et architectures matérielles. Cette mise à jour inclut le support du CPU, du GPU et des accélérateurs IA spécialisés sur des plateformes telles que macOS, Linux, Windows, Android et openEuler.
L'article annonce la sortie de la version 0.5.14.
La version 2.1.193 de Claude Code introduit plusieurs améliorations pour la classification en mode automatique, l'enregistrement des télémétries et la gestion des agents en arrière-plan. Cette mise à jour inclut également des correctifs pour les problèmes d'état de l'interface utilisateur, la gestion de l'authentification dans les serveurs MCP et divers bugs liés au fonctionnement en arrière-plan.