llama.cpp b9827 版本添加了 CUDA 2D 异步复制优化
llama.cpp b9827 版本通过向 ggml_cuda_cpy 函数添加 cudaMemcpy2DAsync 快速路径,引入了针对 CUDA 的性能优化。此更改加速了相同类型、相同形状的步长复制操作,其中张量不完全连续但每行是连续的,从而替换了较慢的元素级标量复制内核。
llama.cpp b9827 版本通过向 ggml_cuda_cpy 函数添加 cudaMemcpy2DAsync 快速路径,引入了针对 CUDA 的性能优化。此更改加速了相同类型、相同形状的步长复制操作,其中张量不完全连续但每行是连续的,从而替换了较慢的元素级标量复制内核。
llama.cpp 项目已发布 b9825 版本,其中包含对处理零输入时 Vulkan step 算子的修复。此更新提供了适用于 macOS、Linux、Windows、Android 和 openEuler 的预构建二进制文件,覆盖多种硬件后端。
llama.cpp 项目已发布 b9826 版本,其中包含对 SYCL 中归一化函数相关单元测试失败问题的修复。此更新提供了跨多个平台和硬件加速器的预构建二进制文件和框架。
llama.cpp 项目已发布 b9822 版本,提供了适用于 macOS、iOS、Linux、Android 和 Windows 的预构建二进制文件。此更新修复了 test-chat-template --no-common 选项的问题,并在各种硬件架构和加速器上分发构建版本。
llama.cpp 项目已发布 b9823 版本,提供适用于 macOS、iOS、Linux、Android、Windows 和 openEuler 平台的预构建二进制文件。此版本的一个关键变更是在 check-release 流水线中新增了 Windows OpenVINO 构建。
llama.cpp 项目发布了 b9824 版本,其中包括对 rpc-server 和 export-graph-ops 二进制的改进。`export-graph-ops` 工具已重命名以遵循测试命名约定,而 `rpc-server` 已重命名为 `ggml-rpc-server` 以避免系统目录中的冲突。
v0.24.0 版本更新包括一项持续集成更改,旨在提高 MoE Refactor Qwen3 NVFP4 配置的 GSM8K 启动超时时间。
OpenAI 已启动 GPT-5.6 系列的有限预览,推出三款新模型:旗舰级 Sol、用于平衡日常工作的 Terra,以及用于快速且经济实惠任务的 Luna。该公司计划在与受信任的合作伙伴完成这一初始阶段后,在未来几周内使这些模型全面可用。
Claude Code 版本 2.1.195 引入了多项修复和改进,包括在全屏模式下用于鼠标控制的新环境变量以及对钩子匹配器逻辑的修正。
Model Context Protocol (MCP) Python SDK 已发布其第三个 Alpha 版本 v2.0.0a3,在保持对稳定版 1.x 用户向后兼容的同时,引入了重大的协议和架构变更。
模型上下文协议 Python SDK 已发布 1.28.1 版本,引入了流处理和传输安全方面的更新。
本文宣布了版本 0.5.14 的发布。
Claude Code 版本 2.1.193 引入了多项增强功能,涵盖自动模式分类、遥测日志记录和后台代理管理。此更新还包括对 UI 状态问题、MCP 服务器中的身份验证处理以及各种后台处理错误的修复。
本文介绍了一种利用 AI 编码代理自动化软件分支维护的方法,并将其应用于 Cohere 对 vLLM 的分支。该方法通过用自动反馈循环取代人工干预,将吸收上游版本所需的时间从数周缩短至数天。
研究人员开发了生成式因果测试(GCT),这是一种将不可解释的基于LLM的大脑预测模型转化为关于皮层功能的简洁、可检验的口头假设的框架。该方法将模型参数提炼为描述特定脑区响应内容的简短短语,例如“食物准备”,然后通过针对性的fMRI实验验证这些解释。
Google Finance 正式告别测试阶段,并为安卓设备推出专属应用程序。
此候选版本解决了 vLLM 项目中 Prefill/Decode (P/D) 功能与数据并行 (DP) 监督器协同工作时的修复。
Cohere 使用其企业 AI 平台 Cohere North 开发了一个安全代理,并通过自定义模型上下文协议(MCP)服务器与云安全平台 Wiz 集成。该架构通过八个原子工具将 North 连接到 Wiz 的 GraphQL API,从而实现从单个提示词启动的自动化事件响应工作流。该系统通过评估攻击链并根据互联网暴露程度和权限级别对风险进行排序,在大约 20 秒内完成毒性组合爆炸半径分析。它还通过检索问题详情、创建 Linear 工单、更新 Wiz 状态以及起草结构化事件响应报告来自动化端到端调查。此外,每周定时自动化会在每周一早上自动生成安全态势简报,无需人工干预。此集成消除了之前每个发现需要 30 分钟到两小时的分类循环,使工程师能够专注于评估结果而非原始警报。
OpenAI 发布的一篇新研究论文展示了人工智能代理如何从根本上改变工作的性质。该研究强调了这些代理执行比以往更长时间、更复杂任务的能力。这一技术进步被认为在多种职业角色中扩大了生产力。研究结果表明,通过自动化,劳动的组织方式和执行方式发生了重大转变。通过处理复杂的工作流程,AI 代理使用户能够实现更高的效率。该论文作为自主系统对现代就业日益增长影响的证据。
Claude Code 版本 2.1.191 引入了 /rewind 支持,允许用户从执行 /clear 命令之前的对话处恢复。此次更新修复了多个关键问题,包括后台代理在停止后被重新唤醒以及流式响应期间滚动位置跳跃的问题。它还修正了 /voice 显示通用错误消息以及在 Windows Terminal 中 /login URL 被截断的行为。通过为能力发现和 OAuth 流程中的瞬态网络错误添加重试逻辑,显著提升了 MCP 服务器的可靠性。无头环境现在会跳过 OAuth 的浏览器弹窗,而沙盒网络权限将在会话期间保持记住状态。性能优化通过文本更新合并,将流式处理期间的 CPU 使用率降低了约 37%,并缓解了终端输出缓存导致的长会话内存增长问题。