Tous les articles — korshunov.ai

Tous les articles Page 1 / 10

llama.cpp Release b9743 Ajoute de Nouveaux Binaires et le Support GPU

La version b9743 de llama.cpp introduit de nouveaux binaires pour macOS, Linux, Android, Windows et openEuler sur plusieurs architectures. La release inclut le support pour Vulkan, CUDA 12.4 et 13.3, OpenVINO, SYCL et ROCm, avec une interface utilisateur mise à jour et des règles d'espacement du parser améliorées via l'alignement du schéma JSON vers la grammaire.

lab Claude Code Releases · il y a 11 j

Indicateur de blocage de flux mis à jour dans la v2.1.185

L'indicateur de blocage de flux affiche désormais « En attente de la réponse de l'API · nouvelle tentative dans … » et s'active après 20 secondes de silence, remplaçant le message et le délai précédents.

github llama.cpp · il y a 11 j

llama.cpp Release b9741 Ajoute de Nouveaux Binaires et Support

llama.cpp version b9741 introduit de nouveaux binaires pour macOS, Linux, Android, Windows et openEuler sur plusieurs architectures. La release inclut le support pour Vulkan, CUDA 12.4 et 13.3, OpenVINO, SYCL et ROCm, avec des versions mises à jour pour iOS et Ubuntu.

github llama.cpp · il y a 11 j

Correction pour les échecs aléatoires de test-args-parser sur Windows

Un correctif adresse les échecs aléatoires dans test-args-parser sur Windows en modifiant la surcharge argv pour qu'elle ne s'applique que lorsque argc correspond, empêchant ainsi l'écrasement des arguments programmatiques. Cela corrige une assertion fastfail dans le workflow OpenVINO sous Windows tout en préservant la gestion UTF-8 pour les vrais binaires.

github llama.cpp · il y a 11 j

LLaMA.cpp Release b9739 Ajoute le Support Win OpenCL Adreno ARM64

La version b9739 de LLaMA.cpp ajoute la prise en charge d'OpenCL Adreno pour Windows ARM64. La release inclut des binaires pour macOS, Linux, Android, Windows et openEuler sur plusieurs architectures et API, dont Vulkan, CUDA, OpenVINO et SYCL.

github llama.cpp · il y a 11 j

llama.cpp version b9738 : correction de la transmission des en-têtes d'authentification CORS et nouveaux binaires

La version b9738 de llama.cpp corrige le proxy CORS pour éviter la transmission des en-têtes d'authentification. La release inclut des builds binaires pour macOS, Linux, Android, Windows et openEuler sur plusieurs architectures et options d'accélération matérielle, notamment Vulkan, CUDA, OpenVINO et SYCL.

github llama.cpp · il y a 11 j

ggml optimise AMX avec aplatissement de partition

Le projet ggml a optimisé les performances d'AMX en aplatissant la partition sur n_batch * M, garantissant que tous les threads participent à la quantification. Cette amélioration augmente la vitesse jusqu'à 1,47x sur divers modèles et configurations matérielles sur les plateformes CPU et GPU, avec des résultats montrant des gains constants dans le temps d'inférence.

github llama.cpp · il y a 11 j

Correction de l'indexeur DSA de GLM-5.2 : tenseurs marqués non requis

L'indexeur DSA du modèle GLM-5.2 a été incorrectement chargé sur toutes les couches, provoquant des échecs dus à des tenseurs manquants. La mise à jour marque les tenseurs de l'indexeur comme TENSOR_NOT_REQUIRED, permettant aux couches sans indexeur de se charger en tant que nullptr et activant l'attention MLA complète. DeepSeek-V3.2, avec un indexage uniforme, n'est pas affecté.

github llama.cpp · il y a 11 j

Interface web préconstruite pour s390x dans Docker

Une demande de tirage a été soumise pour ajouter une interface web préconstruite pour l'architecture s390x dans Docker. Le changement est actuellement en attente de publication et n'a pas encore été publié.

github llama.cpp · il y a 12 j

LLaMA.cpp Release b9732 : Nouveaux binaires et mises à jour

LLaMA.cpp publie la version b9732 avec des binaires mis à jour pour macOS, Linux, Android, Windows et openEuler. La release inclut une refonte de la communication enfant-vers-routeur, des corrections sur la gestion du réveil, une amélioration de update_status(), et de la documentation. Les nouvelles builds supportent Vulkan, ROCm, OpenVINO, SYCL et CUDA 12/13 sur plusieurs architectures.

github llama.cpp · il y a 12 j

ggml-webgpu ajoute des commutateurs d'adaptateur F16 pour Vulkan et NVIDIA

Le projet ggml-webgpu a ajouté des commutateurs d'adaptateur pour la prise en charge de la demi-précision (F16) sur les GPU Vulkan et NVIDIA. Cette mise à jour permet d'améliorer les performances sur le matériel compatible sur plusieurs plateformes, y compris macOS, Linux, Android, Windows et openEuler, avec des builds spécifiques disponibles pour les architectures ARM et x64.

github llama.cpp · il y a 12 j

llama.cpp Release b9731 : Optimisation des performances et binaires multiplateformes

La version b9731 de llama.cpp introduit une optimisation utilisant std::partial_sort pour réduire la surcharge du tri des tokens, améliorant les performances de 8.555ms à 0.704ms pour la sélection des top-n tokens. La release inclut des binaires précompilés pour macOS, Linux, Android, Windows et openEuler sur plusieurs architectures et options d'accélération matérielle.

github llama.cpp · il y a 12 j

llama.cpp version b9730 : correctifs et nouveaux binaires

La version b9730 de llama.cpp inclut des correctifs pour la gestion de l'UTF-8 sous Windows et des améliorations de ggml_fopen et de l'interface CLI. La publication fournit des binaires pour macOS, Linux, Android, Windows et openEuler sur plusieurs architectures et options d'accélération matérielle, notamment Vulkan, CUDA, OpenVINO et SYCL.

github llama.cpp · il y a 12 j

LLaMA.cpp Release b9729 : nouveaux binaires et prise en charge de plateformes

LLaMA.cpp publie la version b9729 avec des binaires pour macOS, Linux, Android, Windows et openEuler sur plusieurs architectures. La release inclut le support CPU, Vulkan, OpenVINO, SYCL et ROCm, ainsi qu'un nouveau package UI. Les références internes à 'webui' ont été supprimées.

github llama.cpp · il y a 12 j

LLaMA.cpp Release b9728 Ajoute le Support des Lignes de Commentaire et des Binaires Multi-plateformes

La version b9728 de LLaMA.cpp introduit le support des lignes de commentaire dans la configuration --api-key-file. La release inclut des binaires pré-construits pour macOS, Linux, Android, Windows et openEuler sur plusieurs architectures et options d'accélération matérielle, y compris Vulkan, CUDA, OpenVINO et SYCL.

github llama.cpp · il y a 12 j

llama.cpp version b9726 ajoute l'argument --agent et de nouveaux binaires pour plateformes

La version b9726 de llama.cpp introduit un nouvel argument --agent et supprime la compatibilité redondante du nommage webui. La release inclut des binaires précompilés pour macOS, Linux, Android, Windows et openEuler sur plusieurs architectures et options d'accélération matérielle.

github llama.cpp · il y a 12 j

llama.cpp Release b9727 : Mise à jour vers cpp-httplib 0.48.0

La version b9727 de llama.cpp met à jour cpp-httplib vers la version 0.48.0. La release inclut des binaires pour macOS, Linux, Android, Windows et openEuler sur plusieurs architectures et options d'accélération matérielle, y compris Vulkan, CUDA, OpenVINO et SYCL.

github llama.cpp · il y a 12 j

Docker : Construire l'interface utilisateur (#24794)

Le projet Docker a ajouté la prise en charge de la construction du composant UI. Cette mise à jour inclut également l'utilisation de la variable APP_VERSION existante dans la configuration du conteneur.

github llama.cpp · il y a 12 j

llama.cpp Release b9724 avec corrections de bugs et binaires multiplateformes

La version llama.cpp b9724 inclut plusieurs corrections de bugs et améliorations, telles que des correctifs de build, l'évitement du dépassement dans la fonction area(), et un contrôle de cohérence dans get_u32(). La release fournit des binaires préconstruits pour macOS (arm64 et x64), Linux (x64, arm64, s390x, Vulkan, ROCm, OpenVINO, SYCL), Android (arm64), Windows (x64, arm64, CUDA 12/13, Vulkan, OpenVINO, SYCL, HIP), et openEuler (x86 et aarch64 avec support ACL Graph), ainsi qu'un package UI.

github llama.cpp · il y a 12 j

llama.cpp release b9723 ajoute le support pour Qwen3.5 et Qwen3.6 Eagle3

La version b9723 de llama.cpp introduit la prise en charge des modèles Qwen3.5 et Qwen3.6 via Eagle3. La publication inclut la restauration différée des points de contrôle de frontière pour les modèles hybrides et des mises à jour des conventions d'API et de nommage. Des builds binaires sont disponibles pour les plateformes macOS, Linux, Android, Windows et openEuler, avec des options pour CPU, Vulkan, OpenVINO, SYCL et ROCm.