Tous les articles — korshunov.ai

Tous les articles Page 1 / 10

LLaMA.cpp Release b9722 : Corrections et binaires multiplateformes

La version b9722 de LLaMA.cpp corrige un problème de valeur n_discard non bornée dans la gestion du contexte serveur. La release inclut des binaires précompilés pour macOS, Linux, Android, Windows et openEuler, prenant en charge diverses architectures et frameworks d'accélération tels que Vulkan, CUDA, OpenVINO et SYCL.

github llama.cpp · il y a 12 j

llama.cpp version b9718 : sélection de slot consolidée et nouveaux binaires

la version llama.cpp b9718 consolide la sélection de slot dans une seule fonction, get_available_slot, tout en conservant les vérifications de similarité LCP pour les mises à jour du cache d'invite. La publication inclut des builds binaires pour macOS, Linux, Android, Windows et openEuler sur plusieurs architectures et options d'accélération matérielle.

github llama.cpp · il y a 12 j

llama.cpp Release b9721 Disponible sur Plusieurs Plateformes

llama.cpp a publié la version b9721, offrant des binaires pour macOS, Linux, Android, Windows et openEuler sur diverses architectures. La release inclut le support CPU, Vulkan, ROCm, OpenVINO, SYCL et HIP, avec un package UI dédié. Une fonctionnalité pour Apple Silicon avec KleidiAI est actuellement désactivée.

github llama.cpp · il y a 12 j

ggml-cpu ajoute le support des queues K pour Power10 MMA Q8/Q4

ggml-cpu prend désormais en charge les queues K dans la multiplication matricielle MMA Q8/Q4 de Power10, supprimant l'exigence selon laquelle K doit être divisible par kc. Cela permet à davantage de charges de travail d'utiliser le noyau MMA et réduit le recours à mnpack.

github OpenAI Agents SDK · il y a 12 j

Notes de version v0.17.6

La version v0.17.6 ajoute des garde-fous pour les entrées d'outils préapprouvés et des données personnalisées uniquement via le SDK pour les sorties d'outils. Elle applique également un contrat strictement compatible avec JSON pour les sorties d'outils et supprime les avertissements superflus sur les espaces blancs dans les noms d'outils. @siddiksawani a apporté sa première contribution dans cette version.

github llama.cpp · il y a 12 j

llama.cpp Release b9716 Adds Batching Support for InternVL

La version b9716 de llama.cpp introduit la prise en charge du traitement par lots pour InternVL, améliorant les performances du modèle grâce à un traitement efficace par lots. La release inclut des builds binaires pour macOS, Linux, Android, Windows et openEuler sur plusieurs architectures et options d'accélération matérielle, y compris Vulkan, OpenVINO, SYCL et ROCm.

github llama.cpp · il y a 12 j

llama.cpp publie b9713 avec de nouveaux binaires et fonctionnalités

llama.cpp a publié la version b9713, ajoutant le support du batching à mtmd-cli et des tests vidéo. La release inclut des binaires pour macOS, Linux, Android, Windows et openEuler sur plusieurs architectures et options d'accélération matérielle, y compris Vulkan, CUDA, OpenVINO et SYCL.

github llama.cpp · il y a 12 j

llama.cpp version b9714 ajoute l'en-tête X-Accel-Buffering et de nouveaux binaires

La version b9714 de llama.cpp ajoute l'en-tête "X-Accel-Buffering": "no" aux points de terminaison en streaming pour empêcher Nginx de mettre en tampon les réponses, ce qui résout les problèmes de streaming avec des applications comme le harnais de codage Pi. La version inclut des binaires pour macOS, Linux, Android, Windows et openEuler sur plusieurs architectures et options d'accélération matérielle.

github llama.cpp · il y a 12 j

LLaMA.cpp Release b9715 Adds CUDA Col2Im 1D and Multiple Platform Binaries

La version b9715 de LLaMA.cpp introduit le support CUDA pour GGML_OP_COL2IM_1D, en s'appuyant sur une implémentation CPU. La release inclut des binaires pour macOS, Linux, Android, Windows et openEuler sur plusieurs architectures et frameworks d'accélération, y compris Vulkan, ROCm, OpenVINO et SYCL.

github llama.cpp · il y a 12 j

llama.cpp version b9711 : nouveaux binaires et mises à jour

llama.cpp publie la version b9711 avec des binaires mis à jour pour macOS, Linux, Android, Windows et openEuler. La version inclut le support de ARM64, x64, Vulkan, ROCm, OpenVINO, SYCL et HIP, avec des binaires dédiés pour l'accélération CPU et GPU. Un nouveau package UI est également disponible.

github llama.cpp · il y a 12 j

llama.cpp release b9712 corrige la build UI avec des sources en lecture seule

La version b9712 de llama.cpp inclut une correction pour les problèmes de build de l'interface utilisateur causés par des fichiers source en lecture seule. La release fournit des binaires précompilés pour macOS, Linux, Android, Windows et openEuler sur plusieurs architectures et options d'accélération matérielle, y compris Vulkan, CUDA, OpenVINO et SYCL.

lab Claude Code Releases · il y a 13 j

Notes de version v2.1.183

v2.1.183 améliore la sécurité du mode automatique en bloquant les commandes git et destroy destructrices sans consentement explicite de l'utilisateur. Il ajoute des avertissements de dépréciation pour les modèles, introduit attribution.sessionUrl pour masquer les liens de session, et corrige plusieurs problèmes incluant le comportement du terminal, les performances du sous-agent et la gestion des entrées dans les environnements web et tmux.

github llama.cpp · il y a 13 j

llama.cpp release b9707 ajoute la validation de schéma et de nouveaux binaires

La version b9707 de llama.cpp introduit la validation de schéma et des améliorations des messages d'erreur. Elle inclut des builds binaires pour macOS, Linux, Android, Windows et openEuler sur plusieurs architectures et options d'accélération matérielle.

github LangGraph · il y a 13 j

LangGraph publie la version 1.2.6

LangGraph publie la version 1.2.6, corrigeant une régression où les sous-graphes imbriqués héritaient incorrectement de parent checkpoint_ns. La mise à jour améliore également l'annulation des sous-graphes en cours lors des interruptions de stream et inclut une mise à jour de la version CLI vers 0.4.30.

github llama.cpp · il y a 13 j

llama.cpp Release b9703 : Mises à jour et téléchargements binaires

llama.cpp version b9703 inclut une refonte de la gestion des presets du serveur, supprimant le support des presets HF distants et les fonctions dépréciées. La release fournit des binaires pour macOS, Linux, Android, Windows et openEuler sur plusieurs architectures et options d'accélération matérielle, y compris Vulkan, CUDA, OpenVINO et SYCL.

github llama.cpp · il y a 13 j

llama.cpp release b9704 : corrige la gestion de la grammaire invalide et ajoute de nouveaux binaires

La version llama.cpp b9704 renvoie désormais HTTP 400 pour une grammaire invalide au lieu de supprimer silencieusement les contraintes. La release inclut des binaires pour macOS, Linux, Android, Windows et openEuler sur plusieurs architectures et accélérateurs matériels, avec le support de Vulkan, ROCm, OpenVINO, SYCL et CUDA.

github llama.cpp · il y a 13 j

llama.cpp Release b9702 : Corrections et nouveaux binaires

La version llama.cpp b9702 inclut une correction pour les arguments du routeur qui n'étaient pas transmis aux instances enfants. La release fournit des binaires pour macOS, Linux, Android, Windows et openEuler sur plusieurs architectures et options d'accélération matérielle, y compris Vulkan, ROCm, OpenVINO et SYCL.

github llama.cpp · il y a 13 j

llama.cpp version b9701 : nouveau préprocesseur et binaires multiplateformes

La version b9701 de llama.cpp introduit un préprocesseur refondu avec une nouvelle fonctionnalité mtmd_image_preproc_out et une documentation développeur mise à jour. La release inclut des binaires pour macOS, Linux, Android, Windows et openEuler sur plusieurs architectures et options d'accélération matérielle, notamment Vulkan, CUDA, OpenVINO et SYCL.

github llama.cpp · il y a 13 j

llama.cpp version b9700 : nouveaux binaires et mises à jour de l'API SYCL

La version b9700 de llama.cpp introduit un support SYCL mis à jour avec des indicateurs d'API renommés : GGML_SYCL_SUPPORT_LEVEL_ZERO renommé en GGML_SYCL_SUPPORT_LEVEL_ZERO_API et GGML_SYCL_ENABLE_LEVEL_ZERO renommé en GGML_SYCL_USE_LEVEL_ZERO_API. La version inclut des binaires pour macOS, Linux, Android, Windows et openEuler sur plusieurs architectures et options d'accélération matérielle, y compris Vulkan, ROCm, OpenVINO et SYCL.

github llama.cpp · il y a 13 j

LLaMA.cpp Release b9698 Adds Self-Update Support and Multiple Platform Binaries

LLaMA.cpp version b9698 enables self-updates only when built with llama-install.sh. The release includes binaries for macOS, Linux, Android, Windows, and openEuler across multiple architectures and hardware acceleration options, including Vulkan, CUDA, OpenVINO, and SYCL.