全部文章 — korshunov.ai

全部文章页 5 / 11

llama.cpp b9789 版本修复 MoE 量化并提供多平台二进制文件

llama.cpp 项目发布了 b9789 版本，其中包括对使用多令牌预测（multi-token prediction）量化混合专家（MoE）模型的关键修复。此更新解决了拉取请求 #24986 中识别的问题，以确保正确处理这些特定的模型架构。该版本提供了适用于 macOS Apple Silicon 和 Intel 的预构建二进制文件，以及一个 iOS XCFramework。Linux 用户可以下载适用于 Ubuntu 的构建版本，支持 CPU、Vulkan、ROCm 7.2、OpenVINO 和 SYCL 后端。Windows 支持包括 CPU、CUDA 12.4 和 13.3、Vulkan、OpenVINO、SYCL 和 HIP 变体。Android arm64 和 openEuler 等其他平台也通过特定的硬件配置得到支持。

lab OpenAI News · 7 天前

OpenAI 研究表明 AI 代理正在改变工作

OpenAI 发布的一篇新研究论文展示了人工智能代理如何从根本上改变工作的性质。该研究强调了这些代理执行比以往更长时间、更复杂任务的能力。这一技术进步被认为在多种职业角色中扩大了生产力。研究结果表明，通过自动化，劳动的组织方式和执行方式发生了重大转变。通过处理复杂的工作流程，AI 代理使用户能够实现更高的效率。该论文作为自主系统对现代就业日益增长影响的证据。

github llama.cpp · 7 天前

修复 SYCL 中 conv_3d 的失败单元测试用例

llama.cpp 仓库已解决与 SYCL 后端相关的一个特定问题。已提交一个拉取请求，以修复与 conv_3d 操作相关的失败单元测试用例。此更新针对 GitHub 上的 ggml-org/llama.cpp 项目。这些更改解决了之前阻止测试成功执行的错误。此修复确保依赖 SYCL 硬件加速的用户获得更好的稳定性。

github llama.cpp · 7 天前

llama.cpp b9786 版本发布，新增 OpenCL 非连续行支持

llama.cpp 项目已发布 b9786 版本，通过 OpenCL 引入了对归一化中非连续行的支持。此次更新是 ggml-org 团队持续开发的一部分，旨在增强跨各种平台的硬件兼容性和性能。该版本提供了适用于 macOS Apple Silicon、Intel Mac 和 iOS XCFrameworks 的二进制文件。Linux 用户可以使用 CPU、Vulkan、ROCm 7.2、OpenVINO 和 SYCL 后端访问针对 Ubuntu x64、arm64 和 s390x 架构的构建版本。Android 支持适用于 arm64 CPU 设备，而 Windows 提供了广泛的选择，包括 CPU、CUDA 12 和 13、Vulkan、OpenVINO、SYCL 和 HIP。该版本还列出了在 macOS 和 openEuler 平台上禁用的 KleidiAI 构建。

github llama.cpp · 7 天前

llama.cpp b9785 发布，包含加固的大小写检查与多平台二进制文件

llama.cpp 项目已发布版本 b9785，其中包含一项代码更改，用于加固大小写检查，详见拉取请求 #24973。此次更新提供了适用于 macOS Apple Silicon、Intel Mac 以及通过 XCFramework 提供的 iOS 的预构建二进制文件，在 Apple Silicon 上禁用了 KleidiAI 支持。Linux 发行版（包括 Ubuntu）支持 CPU、Vulkan、ROCm 7.2、OpenVINO 和 SYCL 后端，涵盖 x64、arm64 和 s390x 架构。Android 用户可获取 arm64 CPU 二进制文件，而 Windows 提供广泛的选择，涵盖 CPU、OpenCL Adreno、CUDA 12 和 13、Vulkan、OpenVINO、SYCL 和 HIP。该版本还包括针对 x86 和 aarch64 处理器并支持 ACL Graph 的 openEuler 构建。除了各平台特定的发布外，还提供了一个独立的 UI 包，以方便本地模型推理。

lab Claude Code Releases · 7 天前

Claude Code v2.1.191 版本说明

Claude Code 版本 2.1.191 引入了 /rewind 支持，允许用户从执行 /clear 命令之前的对话处恢复。此次更新修复了多个关键问题，包括后台代理在停止后被重新唤醒以及流式响应期间滚动位置跳跃的问题。它还修正了 /voice 显示通用错误消息以及在 Windows Terminal 中 /login URL 被截断的行为。通过为能力发现和 OAuth 流程中的瞬态网络错误添加重试逻辑，显著提升了 MCP 服务器的可靠性。无头环境现在会跳过 OAuth 的浏览器弹窗，而沙盒网络权限将在会话期间保持记住状态。性能优化通过文本更新合并，将流式处理期间的 CPU 使用率降低了约 37%，并缓解了终端输出缓存导致的长会话内存增长问题。

github llama.cpp · 7 天前

LLaMA.cpp 发布 b9784：Hexagon MM 优化与跨平台二进制文件

LLaMA.cpp 发布了版本 b9784，对基于 Hexagon 的 MM 操作进行了重大优化，包括 32x32 分块权重重排、改进的 dyn.quant 处理以及统一的内核参数管理。该版本包含适用于 macOS（arm64 和 x64）、iOS 以及多种 Linux 架构的新二进制文件，支持 Vulkan、ROCm 和 OpenVINO。

github llama.cpp · 7 天前

llama.cpp 发布 b9782，包含新二进制文件和支持

llama.cpp 发布了版本 b9782，包括适用于 macOS、Linux、Android、Windows 和 openEuler 的二进制文件。此次更新增加了对 Vulkan、OpenVINO、SYCL、ROCm 和 CUDA 在多架构上的支持，并更新了 UI 以及禁用了 KleidiAI 和 openEuler 支持等功能。

lab Google DeepMind Blog · 7 天前

Gemini 3.5 Flash 新增计算机使用能力

Google 在 Gemini 3.5 Flash 中引入了计算机使用功能，使模型能够执行代码并与外部工具交互。该功能允许用户通过集成的计算功能运行编程任务并访问实时信息。

lab Claude Code Releases · 7 天前

v2.1.190：错误修复和可靠性改进

版本 2.1.190 包括错误修复和可靠性改进。此更新中没有宣布新功能。

github llama.cpp · 7 天前

llama.cpp 发布 b9781，支持 Vulkan 和多平台

llama.cpp 发布了版本 b9781，为 Linux 和 Windows 添加了 Vulkan 支持，并扩展到包括 ARM64 和 x64 在内的多种架构，覆盖 macOS、Linux、Android 和 Windows。该版本包含 CPU、CUDA、OpenVINO、SYCL 和 ROCm 构建版本，并提供 UI 组件。

lab Mistral AI News · 7 天前

企业安全与访问的新连接器控制功能

Mistral Studio 现在提供丰富的管理员控制功能，可按工作区和工具管理连接器访问权限，实现细粒度权限控制。功能包括带作用域的 API 密钥、多账户连接器以及用于根本原因分析的新版 Connectors Debugger，所有这些都支持与企业系统的安全、可审计集成。

lab Microsoft Research Blog · 7 天前

Talos：罕见病诊断的自动化基因组重分析

Talos 是一款开源工具，可自动化地对基因组数据进行迭代重分析，以识别罕见病诊断。它在每位患者仅产生 1.3 个候选变异的情况下，实现了 90% 的目标内诊断恢复率，并为 5,000 名未确诊患者提供了 241 例新诊断，其中大多数新发现出现在证据发表后的 32 天内。

lab OpenAI News · 7 天前

OpenAI与博通推出专为大语言模型优化的推理芯片

OpenAI和博通推出了Jalapeño，这是一款专为大型语言模型推理设计的定制AI芯片。该芯片旨在提升AI系统的性能、效率和可扩展性。

github llama.cpp · 8 天前

vulkan-shaders-gen 现在在着色器编译错误时构建失败

当着色器编译失败时，vulkan-shaders-gen 工具现在会检测并导致构建失败，从而防止生成损坏的 libggml-vulkan。此修复解决了一个先前的问题：构建成功掩盖了运行时故障，并改进了跨平台的错误处理和原子标志管理。

github llama.cpp · 8 天前

LLaMA.cpp 发布 b9777，新增模型与跨平台二进制文件

LLaMA.cpp 发布 b9777，新增了 LFM2.5-ColBERT-350M 和 LFM2.5-Embedding-350M 模型。该版本包含适用于 macOS、Linux、Android、Windows 和 openEuler 的预构建二进制文件，支持多种架构以及 CUDA、Vulkan、OpenVINO 和 SYCL 等加速技术。

github vLLM · 8 天前

v0.24.0rc1：修复 SM75 上的 topk 直方图构建问题

vllm 发布了 v0.24.0rc1，其中包括对 SM75 上 topk 直方图构建问题的修复。该更改是从提交 191826e 中 cherry-pick 的，并由 Mohammad Miadh Angkad 签署确认。

github OpenAI Agents SDK · 8 天前

openai-agents-python v0.17.7 发布

openai-agents-python 库的 0.17.7 版本包含新功能，如可配置的 WebSocket 最大大小和缓冲式 Chat Completions 工具调用流式传输。此外，还修复了包括沙箱缓冲、错误处理以及工具调度在内的多个问题，并更新了文档和改进的错误消息。

github llama.cpp · 8 天前

llama.cpp 发布 b9776，新增 Vulkan 和多硬件支持

llama.cpp 版本 b9776 为 Linux 和 Windows 引入了 Vulkan 支持，并在 macOS、Linux、Android 和 Windows 上提供 CPU、OpenCL、CUDA 和 SYCL 变体。该版本还包含对 OpenVINO 和 ROCm 的支持，UI 以独立包形式提供。

lab Claude Code Releases · 8 天前

Claude v2.1.187 发布说明

Claude v2.1.187 引入了沙盒凭据阻止、组织配置模型限制、全屏模式下的鼠标点击支持，并修复了命令失败、工具挂起和 UI 稳定性问题。更新还改进了结构化输出处理、代理深度跟踪和插件管理，增强了 VSCode 和终端兼容性。