llama.cpp b9826 发布,修复 SYCL 的归一化问题
llama.cpp 项目已发布 b9826 版本,其中包含对 SYCL 中归一化函数相关单元测试失败问题的修复。此更新提供了跨多个平台和硬件加速器的预构建二进制文件和框架。
llama.cpp 项目已发布 b9826 版本,其中包含对 SYCL 中归一化函数相关单元测试失败问题的修复。此更新提供了跨多个平台和硬件加速器的预构建二进制文件和框架。
crewAI 版本 1.15.1 更新引入了用于项目初始化和部署的新功能,以及多项错误修复和文档改进。
llama.cpp 项目已发布 b9822 版本,提供了适用于 macOS、iOS、Linux、Android 和 Windows 的预构建二进制文件。此更新修复了 test-chat-template --no-common 选项的问题,并在各种硬件架构和加速器上分发构建版本。
llama.cpp 项目已发布 b9823 版本,提供适用于 macOS、iOS、Linux、Android、Windows 和 openEuler 平台的预构建二进制文件。此版本的一个关键变更是在 check-release 流水线中新增了 Windows OpenVINO 构建。
llama.cpp 项目发布了 b9824 版本,其中包括对 rpc-server 和 export-graph-ops 二进制的改进。`export-graph-ops` 工具已重命名以遵循测试命名约定,而 `rpc-server` 已重命名为 `ggml-rpc-server` 以避免系统目录中的冲突。
CrewAI 1.15.1a1 更新引入了新的遥测跟踪,强制执行 CrewAI 的显式项目定义,并改进了 CLI 部署工作流。
v0.24.0 版本更新包括一项持续集成更改,旨在提高 MoE Refactor Qwen3 NVFP4 配置的 GSM8K 启动超时时间。
OpenAI 已启动 GPT-5.6 系列的有限预览,推出三款新模型:旗舰级 Sol、用于平衡日常工作的 Terra,以及用于快速且经济实惠任务的 Luna。该公司计划在与受信任的合作伙伴完成这一初始阶段后,在未来几周内使这些模型全面可用。
llama.cpp 项目发布了 b9821 版本,引入了命令行界面更新,允许用户调用 --version、--licenses 和 --help 标志。此版本提供了适用于 macOS、Linux、Android、Windows 和 openEuler 的预构建二进制文件集合,支持多种硬件加速器。
Claude Code 版本 2.1.195 引入了多项修复和改进,包括在全屏模式下用于鼠标控制的新环境变量以及对钩子匹配器逻辑的修正。
llama.cpp b9820 版本通过重新引入在拆分计算期间更少的同步操作来引入性能改进,特别针对 CUDA 后端。此更新还为 macOS、Linux、Windows、Android 和 openEuler 提供了预构建的二进制文件,涵盖 CPU、GPU 和专业硬件加速器。
llama.cpp 项目已发布 b9816 版本,其中包括与 ggml 库的同步。此更新提供了适用于 macOS、iOS、Linux、Windows、Android 和 openEuler 平台的预构建二进制文件。
llama.cpp b9817 版本将 OpenVINO 后端更新至 2026.2.1 版本,并使发布包自包含。此更新包括 OpenVINO 后端中的多项算子改进,例如移除硬编码的 compute_op_type 集合并启用带有 sink 输入的 softmax。
llama.cpp b9813 版本通过添加 INTEL_XE1 架构枚举并启用 coopmat1,为 Intel Xe-LPG Plus 硬件引入了 Vulkan 支持。此更新解决了之前的代码注释,重命名了架构标识符,并包含了 Windows 驱动程序检查。
llama.cpp 项目已发布版本 b9814,其中包含针对 AMD mi50 GPU 的 `mul_mat_vecq` 操作的 Vulkan 优化。此次更新附带了跨多个操作系统和硬件架构的全面预构建二进制文件。
Model Context Protocol (MCP) Python SDK 已发布其第三个 Alpha 版本 v2.0.0a3,在保持对稳定版 1.x 用户向后兼容的同时,引入了重大的协议和架构变更。
llama.cpp 项目已发布版本 b9811,其中包含针对 Vulkan 中 conv2d coopmat2 路径的编译器 bug 的修复。根据 NVIDIA 工程师 Jeff Bolz 的建议,此修复方案也应用于基于 CONV_3D 的实现。
llama.cpp 项目发布了 b9810 版本,在 HIP/MUSA 供应商头文件中引入了 `cublasSgemmBatched` 的 CUDA 映射。此次更新附带了适用于 macOS、Linux、Windows、Android 和 openEuler 平台的全面预构建二进制文件。
模型上下文协议 Python SDK 已发布 1.28.1 版本,引入了流处理和传输安全方面的更新。
llama.cpp b9804 版本通过移除硬编码的 2x 扩展因子和无效的参数检查,引入了对 Mamba2 架构的修复,从而支持任意 expand 值。此更改更新了 `convert_hf_to_gguf.py` 脚本,使 expand 参数变为可选,默认值为 2。