llama.cpp b9829 版本发布:减少日志输出与多平台二进制文件
llama.cpp 项目发布了 b9829 版本,其中包括对服务器、通用组件和推测解码模块的日志输出进行精简。此次更新还通过用 COM_ 替换 CMN_ 来标准化命名约定。
llama.cpp 项目发布了 b9829 版本,其中包括对服务器、通用组件和推测解码模块的日志输出进行精简。此次更新还通过用 COM_ 替换 CMN_ 来标准化命名约定。
llama.cpp b9828 版本引入了显著的 OpenCL 增强功能,特别是重写了针对 f16 和 f32 精度的 Flash Attention 内核。此更新包括新的预填充预处理内核以及对 q4_0 和 q8_0 量化格式的支持。
llama.cpp b9827 版本通过向 ggml_cuda_cpy 函数添加 cudaMemcpy2DAsync 快速路径,引入了针对 CUDA 的性能优化。此更改加速了相同类型、相同形状的步长复制操作,其中张量不完全连续但每行是连续的,从而替换了较慢的元素级标量复制内核。
llama.cpp 项目已发布 b9825 版本,其中包含对处理零输入时 Vulkan step 算子的修复。此更新提供了适用于 macOS、Linux、Windows、Android 和 openEuler 的预构建二进制文件,覆盖多种硬件后端。
llama.cpp 项目已发布 b9826 版本,其中包含对 SYCL 中归一化函数相关单元测试失败问题的修复。此更新提供了跨多个平台和硬件加速器的预构建二进制文件和框架。
llama.cpp 项目已发布 b9822 版本,提供了适用于 macOS、iOS、Linux、Android 和 Windows 的预构建二进制文件。此更新修复了 test-chat-template --no-common 选项的问题,并在各种硬件架构和加速器上分发构建版本。
llama.cpp 项目已发布 b9823 版本,提供适用于 macOS、iOS、Linux、Android、Windows 和 openEuler 平台的预构建二进制文件。此版本的一个关键变更是在 check-release 流水线中新增了 Windows OpenVINO 构建。
llama.cpp 项目发布了 b9824 版本,其中包括对 rpc-server 和 export-graph-ops 二进制的改进。`export-graph-ops` 工具已重命名以遵循测试命名约定,而 `rpc-server` 已重命名为 `ggml-rpc-server` 以避免系统目录中的冲突。
v0.24.0 版本更新包括一项持续集成更改,旨在提高 MoE Refactor Qwen3 NVFP4 配置的 GSM8K 启动超时时间。
OpenAI 已启动 GPT-5.6 系列的有限预览,推出三款新模型:旗舰级 Sol、用于平衡日常工作的 Terra,以及用于快速且经济实惠任务的 Luna。该公司计划在与受信任的合作伙伴完成这一初始阶段后,在未来几周内使这些模型全面可用。
llama.cpp 项目发布了 b9821 版本,引入了命令行界面更新,允许用户调用 --version、--licenses 和 --help 标志。此版本提供了适用于 macOS、Linux、Android、Windows 和 openEuler 的预构建二进制文件集合,支持多种硬件加速器。
Claude Code 版本 2.1.195 引入了多项修复和改进,包括在全屏模式下用于鼠标控制的新环境变量以及对钩子匹配器逻辑的修正。
llama.cpp b9820 版本通过重新引入在拆分计算期间更少的同步操作来引入性能改进,特别针对 CUDA 后端。此更新还为 macOS、Linux、Windows、Android 和 openEuler 提供了预构建的二进制文件,涵盖 CPU、GPU 和专业硬件加速器。
llama.cpp 项目已发布 b9816 版本,其中包括与 ggml 库的同步。此更新提供了适用于 macOS、iOS、Linux、Windows、Android 和 openEuler 平台的预构建二进制文件。
llama.cpp b9817 版本将 OpenVINO 后端更新至 2026.2.1 版本,并使发布包自包含。此更新包括 OpenVINO 后端中的多项算子改进,例如移除硬编码的 compute_op_type 集合并启用带有 sink 输入的 softmax。
llama.cpp b9813 版本通过添加 INTEL_XE1 架构枚举并启用 coopmat1,为 Intel Xe-LPG Plus 硬件引入了 Vulkan 支持。此更新解决了之前的代码注释,重命名了架构标识符,并包含了 Windows 驱动程序检查。
llama.cpp 项目已发布版本 b9814,其中包含针对 AMD mi50 GPU 的 `mul_mat_vecq` 操作的 Vulkan 优化。此次更新附带了跨多个操作系统和硬件架构的全面预构建二进制文件。
Model Context Protocol (MCP) Python SDK 已发布其第三个 Alpha 版本 v2.0.0a3,在保持对稳定版 1.x 用户向后兼容的同时,引入了重大的协议和架构变更。
llama.cpp 项目已发布版本 b9811,其中包含针对 Vulkan 中 conv2d coopmat2 路径的编译器 bug 的修复。根据 NVIDIA 工程师 Jeff Bolz 的建议,此修复方案也应用于基于 CONV_3D 的实现。
模型上下文协议 Python SDK 已发布 1.28.1 版本,引入了流处理和传输安全方面的更新。