llama.cpp b9840 版本增加对 DeepSeek V4 的支持及多平台二进制文件
llama.cpp b9840 版本引入了对 DeepSeek V4 模型的转换支持,包括对 Pro 变体的特定处理。此次更新将新架构集成到库中,并伴随各种内部优化和错误修复。
llama.cpp b9840 版本引入了对 DeepSeek V4 模型的转换支持,包括对 Pro 变体的特定处理。此次更新将新架构集成到库中,并伴随各种内部优化和错误修复。
OpenAI经济研究已将AI就业转型框架扩展至欧盟,利用ESCO分类法和Eurostat数据来分析AI能力如何重塑各成员国的劳动力市场。
llama.cpp 项目已发布 b9839 版本,其中包含修复被忽略工作树中 Tailwind 扫描的更新。此更新为 macOS、Linux、Android、Windows 和 openEuler 提供了预构建的二进制文件,支持多种架构和硬件加速后端。
在试点项目取得成功后,惠普公司正在扩大其与OpenAI的战略合作,将人工智能部署到客户体验、员工生产力和软件开发中。该公司利用OpenAI Frontier平台作为统一的运营模式,以管理上下文、权限和评估,从而从实验性用例转向企业级生产。
v0.24.0 版本更新包括一项持续集成更改,旨在提高 MoE Refactor Qwen3 NVFP4 配置的 GSM8K 启动超时时间。
OpenAI 已启动 GPT-5.6 系列的有限预览,推出三款新模型:旗舰级 Sol、用于平衡日常工作的 Terra,以及用于快速且经济实惠任务的 Luna。该公司计划在与受信任的合作伙伴完成这一初始阶段后,在未来几周内使这些模型全面可用。
Claude Code 版本 2.1.195 引入了多项修复和改进,包括在全屏模式下用于鼠标控制的新环境变量以及对钩子匹配器逻辑的修正。
Model Context Protocol (MCP) Python SDK 已发布其第三个 Alpha 版本 v2.0.0a3,在保持对稳定版 1.x 用户向后兼容的同时,引入了重大的协议和架构变更。
模型上下文协议 Python SDK 已发布 1.28.1 版本,引入了流处理和传输安全方面的更新。
本文宣布了版本 0.5.14 的发布。
Claude Code 版本 2.1.193 引入了多项增强功能,涵盖自动模式分类、遥测日志记录和后台代理管理。此更新还包括对 UI 状态问题、MCP 服务器中的身份验证处理以及各种后台处理错误的修复。
本文介绍了一种利用 AI 编码代理自动化软件分支维护的方法,并将其应用于 Cohere 对 vLLM 的分支。该方法通过用自动反馈循环取代人工干预,将吸收上游版本所需的时间从数周缩短至数天。
研究人员开发了生成式因果测试(GCT),这是一种将不可解释的基于LLM的大脑预测模型转化为关于皮层功能的简洁、可检验的口头假设的框架。该方法将模型参数提炼为描述特定脑区响应内容的简短短语,例如“食物准备”,然后通过针对性的fMRI实验验证这些解释。
Google Finance 正式告别测试阶段,并为安卓设备推出专属应用程序。
此候选版本解决了 vLLM 项目中 Prefill/Decode (P/D) 功能与数据并行 (DP) 监督器协同工作时的修复。
Cohere 使用其企业 AI 平台 Cohere North 开发了一个安全代理,并通过自定义模型上下文协议(MCP)服务器与云安全平台 Wiz 集成。该架构通过八个原子工具将 North 连接到 Wiz 的 GraphQL API,从而实现从单个提示词启动的自动化事件响应工作流。该系统通过评估攻击链并根据互联网暴露程度和权限级别对风险进行排序,在大约 20 秒内完成毒性组合爆炸半径分析。它还通过检索问题详情、创建 Linear 工单、更新 Wiz 状态以及起草结构化事件响应报告来自动化端到端调查。此外,每周定时自动化会在每周一早上自动生成安全态势简报,无需人工干预。此集成消除了之前每个发现需要 30 分钟到两小时的分类循环,使工程师能够专注于评估结果而非原始警报。
OpenAI 发布的一篇新研究论文展示了人工智能代理如何从根本上改变工作的性质。该研究强调了这些代理执行比以往更长时间、更复杂任务的能力。这一技术进步被认为在多种职业角色中扩大了生产力。研究结果表明,通过自动化,劳动的组织方式和执行方式发生了重大转变。通过处理复杂的工作流程,AI 代理使用户能够实现更高的效率。该论文作为自主系统对现代就业日益增长影响的证据。
Claude Code 版本 2.1.191 引入了 /rewind 支持,允许用户从执行 /clear 命令之前的对话处恢复。此次更新修复了多个关键问题,包括后台代理在停止后被重新唤醒以及流式响应期间滚动位置跳跃的问题。它还修正了 /voice 显示通用错误消息以及在 Windows Terminal 中 /login URL 被截断的行为。通过为能力发现和 OAuth 流程中的瞬态网络错误添加重试逻辑,显著提升了 MCP 服务器的可靠性。无头环境现在会跳过 OAuth 的浏览器弹窗,而沙盒网络权限将在会话期间保持记住状态。性能优化通过文本更新合并,将流式处理期间的 CPU 使用率降低了约 37%,并缓解了终端输出缓存导致的长会话内存增长问题。
Google 在 Gemini 3.5 Flash 中引入了计算机使用功能,使模型能够执行代码并与外部工具交互。该功能允许用户通过集成的计算功能运行编程任务并访问实时信息。
版本 2.1.190 包括错误修复和可靠性改进。此更新中没有宣布新功能。