Tous les articles
github llama.cpp · il y a 12 j

llama.cpp version b9714 ajoute l'en-tête X-Accel-Buffering et de nouveaux binaires

La version b9714 de llama.cpp ajoute l'en-tête "X-Accel-Buffering": "no" aux points de terminaison en streaming pour empêcher Nginx de mettre en tampon les réponses, ce qui résout les problèmes de streaming avec des applications comme le harnais de codage Pi. La version inclut des binaires pour macOS, Linux, Android, Windows et openEuler sur plusieurs architectures et options d'accélération matérielle.

lab Claude Code Releases · il y a 13 j

Notes de version v2.1.183

v2.1.183 améliore la sécurité du mode automatique en bloquant les commandes git et destroy destructrices sans consentement explicite de l'utilisateur. Il ajoute des avertissements de dépréciation pour les modèles, introduit attribution.sessionUrl pour masquer les liens de session, et corrige plusieurs problèmes incluant le comportement du terminal, les performances du sous-agent et la gestion des entrées dans les environnements web et tmux.

github llama.cpp · il y a 13 j

llama.cpp version b9700 : nouveaux binaires et mises à jour de l'API SYCL

La version b9700 de llama.cpp introduit un support SYCL mis à jour avec des indicateurs d'API renommés : GGML_SYCL_SUPPORT_LEVEL_ZERO renommé en GGML_SYCL_SUPPORT_LEVEL_ZERO_API et GGML_SYCL_ENABLE_LEVEL_ZERO renommé en GGML_SYCL_USE_LEVEL_ZERO_API. La version inclut des binaires pour macOS, Linux, Android, Windows et openEuler sur plusieurs architectures et options d'accélération matérielle, y compris Vulkan, ROCm, OpenVINO et SYCL.