全部文章 — korshunov.ai

全部文章页 3 / 6

github llama.cpp · 3 天前

llama.cpp b9829 版本发布：减少日志输出与多平台二进制文件

llama.cpp 项目发布了 b9829 版本，其中包括对服务器、通用组件和推测解码模块的日志输出进行精简。此次更新还通过用 COM_ 替换 CMN_ 来标准化命名约定。

github llama.cpp · 4 天前

llama.cpp b9828 版本发布：OpenCL Flash Attention 改进及新二进制文件

llama.cpp b9828 版本引入了显著的 OpenCL 增强功能，特别是重写了针对 f16 和 f32 精度的 Flash Attention 内核。此更新包括新的预填充预处理内核以及对 q4_0 和 q8_0 量化格式的支持。

github llama.cpp · 4 天前

llama.cpp b9827 版本添加了 CUDA 2D 异步复制优化

llama.cpp b9827 版本通过向 ggml_cuda_cpy 函数添加 cudaMemcpy2DAsync 快速路径，引入了针对 CUDA 的性能优化。此更改加速了相同类型、相同形状的步长复制操作，其中张量不完全连续但每行是连续的，从而替换了较慢的元素级标量复制内核。

github llama.cpp · 4 天前

llama.cpp b9825 发布：Vulkan 修复与跨平台二进制文件

llama.cpp 项目已发布 b9825 版本，其中包含对处理零输入时 Vulkan step 算子的修复。此更新提供了适用于 macOS、Linux、Windows、Android 和 openEuler 的预构建二进制文件，覆盖多种硬件后端。

github llama.cpp · 4 天前

llama.cpp b9826 发布，修复 SYCL 的归一化问题

llama.cpp 项目已发布 b9826 版本，其中包含对 SYCL 中归一化函数相关单元测试失败问题的修复。此更新提供了跨多个平台和硬件加速器的预构建二进制文件和框架。

github llama.cpp · 4 天前

llama.cpp b9822 版本发布，提供 macOS、Linux、Windows 二进制文件

llama.cpp 项目已发布 b9822 版本，提供了适用于 macOS、iOS、Linux、Android 和 Windows 的预构建二进制文件。此更新修复了 test-chat-template --no-common 选项的问题，并在各种硬件架构和加速器上分发构建版本。

github llama.cpp · 4 天前

llama.cpp b9823 发布新增 Windows OpenVINO 并更新二进制文件

llama.cpp 项目已发布 b9823 版本，提供适用于 macOS、iOS、Linux、Android、Windows 和 openEuler 平台的预构建二进制文件。此版本的一个关键变更是在 check-release 流水线中新增了 Windows OpenVINO 构建。

github llama.cpp · 4 天前

llama.cpp b9824 发布：二进制文件重命名与新构建

llama.cpp 项目发布了 b9824 版本，其中包括对 rpc-server 和 export-graph-ops 二进制的改进。`export-graph-ops` 工具已重命名以遵循测试命名约定，而 `rpc-server` 已重命名为 `ggml-rpc-server` 以避免系统目录中的冲突。

github vLLM · 5 天前

v0.24.0

v0.24.0 版本更新包括一项持续集成更改，旨在提高 MoE Refactor Qwen3 NVFP4 配置的 GSM8K 启动超时时间。

lab OpenAI News · 5 天前

OpenAI 预览 GPT-5.6 Sol、Terra 和 Luna 模型

OpenAI 已启动 GPT-5.6 系列的有限预览，推出三款新模型：旗舰级 Sol、用于平衡日常工作的 Terra，以及用于快速且经济实惠任务的 Luna。该公司计划在与受信任的合作伙伴完成这一初始阶段后，在未来几周内使这些模型全面可用。

github llama.cpp · 5 天前

llama.cpp b9821 发布：CLI 标志和多平台二进制文件

llama.cpp 项目发布了 b9821 版本，引入了命令行界面更新，允许用户调用 --version、--licenses 和 --help 标志。此版本提供了适用于 macOS、Linux、Android、Windows 和 openEuler 的预构建二进制文件集合，支持多种硬件加速器。

lab Claude Code Releases · 5 天前

Claude Code v2.1.195 发布说明

Claude Code 版本 2.1.195 引入了多项修复和改进，包括在全屏模式下用于鼠标控制的新环境变量以及对钩子匹配器逻辑的修正。

github llama.cpp · 5 天前

llama.cpp b9820 发布：减少 CUDA 同步并新增二进制文件

llama.cpp b9820 版本通过重新引入在拆分计算期间更少的同步操作来引入性能改进，特别针对 CUDA 后端。此更新还为 macOS、Linux、Windows、Android 和 openEuler 提供了预构建的二进制文件，涵盖 CPU、GPU 和专业硬件加速器。

github llama.cpp · 5 天前

llama.cpp b9816 版本发布：与 ggml 同步及新增二进制文件

llama.cpp 项目已发布 b9816 版本，其中包括与 ggml 库的同步。此更新提供了适用于 macOS、iOS、Linux、Windows、Android 和 openEuler 平台的预构建二进制文件。

github llama.cpp · 5 天前

llama.cpp b9817 发布：OpenVINO 2026.2.1 更新与算子改进

llama.cpp b9817 版本将 OpenVINO 后端更新至 2026.2.1 版本，并使发布包自包含。此更新包括 OpenVINO 后端中的多项算子改进，例如移除硬编码的 compute_op_type 集合并启用带有 sink 输入的 softmax。

github llama.cpp · 5 天前

llama.cpp b9813 发布增加对 Intel Xe-LPG Plus Vulkan 的支持

llama.cpp b9813 版本通过添加 INTEL_XE1 架构枚举并启用 coopmat1，为 Intel Xe-LPG Plus 硬件引入了 Vulkan 支持。此更新解决了之前的代码注释，重命名了架构标识符，并包含了 Windows 驱动程序检查。

github llama.cpp · 5 天前

llama.cpp b9814 发布，为 mi50 提供 Vulkan 优化

llama.cpp 项目已发布版本 b9814，其中包含针对 AMD mi50 GPU 的 `mul_mat_vecq` 操作的 Vulkan 优化。此次更新附带了跨多个操作系统和硬件架构的全面预构建二进制文件。

github MCP (GitHub org) · 5 天前

MCP Python SDK v2.0.0a3 发布说明

Model Context Protocol (MCP) Python SDK 已发布其第三个 Alpha 版本 v2.0.0a3，在保持对稳定版 1.x 用户向后兼容的同时，引入了重大的协议和架构变更。

github llama.cpp · 5 天前

llama.cpp b9811 发布，包含 Vulkan 编译器修复方案

llama.cpp 项目已发布版本 b9811，其中包含针对 Vulkan 中 conv2d coopmat2 路径的编译器 bug 的修复。根据 NVIDIA 工程师 Jeff Bolz 的建议，此修复方案也应用于基于 CONV_3D 的实现。

github MCP (GitHub org) · 5 天前

模型上下文协议 Python SDK v1.28.1 发布

模型上下文协议 Python SDK 已发布 1.28.1 版本，引入了流处理和传输安全方面的更新。