全部文章 — korshunov.ai

全部文章页 1 / 11

OpenAI 预览 GPT-5.6 Sol、Terra 和 Luna 模型

OpenAI 已启动 GPT-5.6 系列的有限预览，推出三款新模型：旗舰级 Sol、用于平衡日常工作的 Terra，以及用于快速且经济实惠任务的 Luna。该公司计划在与受信任的合作伙伴完成这一初始阶段后，在未来几周内使这些模型全面可用。

github llama.cpp · 5 天前

llama.cpp b9816 版本发布：与 ggml 同步及新增二进制文件

llama.cpp 项目已发布 b9816 版本，其中包括与 ggml 库的同步。此更新提供了适用于 macOS、iOS、Linux、Windows、Android 和 openEuler 平台的预构建二进制文件。

github llama.cpp · 5 天前

llama.cpp b9817 发布：OpenVINO 2026.2.1 更新与算子改进

llama.cpp b9817 版本将 OpenVINO 后端更新至 2026.2.1 版本，并使发布包自包含。此更新包括 OpenVINO 后端中的多项算子改进，例如移除硬编码的 compute_op_type 集合并启用带有 sink 输入的 softmax。

github llama.cpp · 5 天前

llama.cpp b9813 发布增加对 Intel Xe-LPG Plus Vulkan 的支持

llama.cpp b9813 版本通过添加 INTEL_XE1 架构枚举并启用 coopmat1，为 Intel Xe-LPG Plus 硬件引入了 Vulkan 支持。此更新解决了之前的代码注释，重命名了架构标识符，并包含了 Windows 驱动程序检查。

github llama.cpp · 5 天前

llama.cpp b9814 发布，为 mi50 提供 Vulkan 优化

llama.cpp 项目已发布版本 b9814，其中包含针对 AMD mi50 GPU 的 `mul_mat_vecq` 操作的 Vulkan 优化。此次更新附带了跨多个操作系统和硬件架构的全面预构建二进制文件。

github MCP (GitHub org) · 5 天前

MCP Python SDK v2.0.0a3 发布说明

Model Context Protocol (MCP) Python SDK 已发布其第三个 Alpha 版本 v2.0.0a3，在保持对稳定版 1.x 用户向后兼容的同时，引入了重大的协议和架构变更。

github llama.cpp · 5 天前

llama.cpp b9811 发布，包含 Vulkan 编译器修复方案

llama.cpp 项目已发布版本 b9811，其中包含针对 Vulkan 中 conv2d coopmat2 路径的编译器 bug 的修复。根据 NVIDIA 工程师 Jeff Bolz 的建议，此修复方案也应用于基于 CONV_3D 的实现。

github llama.cpp · 5 天前

llama.cpp b9810 版本发布，新增 cublasSgemmBatched 映射及新二进制文件

llama.cpp 项目发布了 b9810 版本，在 HIP/MUSA 供应商头文件中引入了 `cublasSgemmBatched` 的 CUDA 映射。此次更新附带了适用于 macOS、Linux、Windows、Android 和 openEuler 平台的全面预构建二进制文件。

github MCP (GitHub org) · 5 天前

模型上下文协议 Python SDK v1.28.1 发布

模型上下文协议 Python SDK 已发布 1.28.1 版本，引入了流处理和传输安全方面的更新。

github llama.cpp · 6 天前

llama.cpp b9804 发布：Mamba2 修复与新增二进制文件

llama.cpp b9804 版本通过移除硬编码的 2x 扩展因子和无效的参数检查，引入了对 Mamba2 架构的修复，从而支持任意 expand 值。此更改更新了 `convert_hf_to_gguf.py` 脚本，使 expand 参数变为可选，默认值为 2。

github llama.cpp · 6 天前

llama.cpp b9803 版本发布，修复 OpenCL 性能分析问题

llama.cpp 项目已发布 b9803 版本，其中包含针对 OpenCL 的修复，用于在关闭时刷新不完整批次的性能分析数据。此更新为 macOS、Linux、Windows、Android 和 openEuler 提供了跨各种硬件后端的二进制文件。

github llama.cpp · 6 天前

llama.cpp b9802 版本提供 macOS、Linux、Windows 和 Android 的二进制文件

llama.cpp 项目已发布 b9802 版本，提供跨多个操作系统和硬件架构的预构建二进制文件。此更新支持在 macOS、Linux、Windows、Android 和 openEuler 等平台上的 CPU、GPU 以及专用 AI 加速器。

github SGLang · 6 天前

v0.5.14

本文宣布了版本 0.5.14 的发布。

lab Claude Code Releases · 6 天前

Claude Code v2.1.193 发布说明

Claude Code 版本 2.1.193 引入了多项增强功能，涵盖自动模式分类、遥测日志记录和后台代理管理。此更新还包括对 UI 状态问题、MCP 服务器中的身份验证处理以及各种后台处理错误的修复。

lab Cohere Blog · 6 天前

使用 AI 代理自动化分支维护

本文介绍了一种利用 AI 编码代理自动化软件分支维护的方法，并将其应用于 Cohere 对 vLLM 的分支。该方法通过用自动反馈循环取代人工干预，将吸收上游版本所需的时间从数周缩短至数天。

lab Microsoft Research Blog · 6 天前

利用AI驱动的解释和实验理解大脑

研究人员开发了生成式因果测试（GCT），这是一种将不可解释的基于LLM的大脑预测模型转化为关于皮层功能的简洁、可检验的口头假设的框架。该方法将模型参数提炼为描述特定脑区响应内容的简短短语，例如“食物准备”，然后通过针对性的fMRI实验验证这些解释。

lab Google — The Keyword (AI) · 6 天前

Google Finance 结束测试版，推出全新安卓应用

Google Finance 正式告别测试阶段，并为安卓设备推出专属应用程序。

github vLLM · 6 天前

v0.24.0rc2：修复与 DP 监督器配合使用的 P/D 问题 (#46628)

此候选版本解决了 vLLM 项目中 Prefill/Decode (P/D) 功能与数据并行 (DP) 监督器协同工作时的修复。

lab Cohere Blog · 6 天前

Cohere 通过自定义 MCP 服务器与 North 和 Wiz 自动化事件响应

Cohere 使用其企业 AI 平台 Cohere North 开发了一个安全代理，并通过自定义模型上下文协议（MCP）服务器与云安全平台 Wiz 集成。该架构通过八个原子工具将 North 连接到 Wiz 的 GraphQL API，从而实现从单个提示词启动的自动化事件响应工作流。该系统通过评估攻击链并根据互联网暴露程度和权限级别对风险进行排序，在大约 20 秒内完成毒性组合爆炸半径分析。它还通过检索问题详情、创建 Linear 工单、更新 Wiz 状态以及起草结构化事件响应报告来自动化端到端调查。此外，每周定时自动化会在每周一早上自动生成安全态势简报，无需人工干预。此集成消除了之前每个发现需要 30 分钟到两小时的分类循环，使工程师能够专注于评估结果而非原始警报。

github llama.cpp · 7 天前

llama.cpp b9788 为双 GPU 配置添加 SYCL 张量并行支持

llama.cpp 的 b9788 版本在 SYCL 后端中通过 --split-mode tensor 标志引入了对张量并行的支持。该实现通过在 meta-backend 中添加 comm_init、comm_free 和 comm_allreduce_tensor 函数，实现了双 GPU 通信。对于两个设备，它使用环形 all-reduce 策略，对小张量采用 FP32 直接 memcpy，对较大的张量则采用 BF16 压缩。由于 OneCCL 存在每个进程只能使用单个设备的限制，代码避免了使用 OneCCL，而是使用持久化缓冲区来维持 SYCL 池的不变性。在双 Intel Arc Pro B70 GPU 上进行的性能测试显示，对于 Llama-3.3-70B 和 Qwen3-Coder-Next-80B-A3B 模型，与 layer 模式相比有显著的速度提升。此次更新包括适用于 macOS、Linux、Windows、Android 和 openEuler 的新二进制文件，覆盖 CPU、CUDA、ROCm、Vulkan 和 SYCL 目标平台。