全部文章
github llama.cpp · 7 天前

llama.cpp b9789 版本修复 MoE 量化并提供多平台二进制文件

llama.cpp 项目发布了 b9789 版本,其中包括对使用多令牌预测(multi-token prediction)量化混合专家(MoE)模型的关键修复。此更新解决了拉取请求 #24986 中识别的问题,以确保正确处理这些特定的模型架构。该版本提供了适用于 macOS Apple Silicon 和 Intel 的预构建二进制文件,以及一个 iOS XCFramework。Linux 用户可以下载适用于 Ubuntu 的构建版本,支持 CPU、Vulkan、ROCm 7.2、OpenVINO 和 SYCL 后端。Windows 支持包括 CPU、CUDA 12.4 和 13.3、Vulkan、OpenVINO、SYCL 和 HIP 变体。Android arm64 和 openEuler 等其他平台也通过特定的硬件配置得到支持。

lab OpenAI News · 7 天前

OpenAI 研究表明 AI 代理正在改变工作

OpenAI 发布的一篇新研究论文展示了人工智能代理如何从根本上改变工作的性质。该研究强调了这些代理执行比以往更长时间、更复杂任务的能力。这一技术进步被认为在多种职业角色中扩大了生产力。研究结果表明,通过自动化,劳动的组织方式和执行方式发生了重大转变。通过处理复杂的工作流程,AI 代理使用户能够实现更高的效率。该论文作为自主系统对现代就业日益增长影响的证据。

github llama.cpp · 7 天前

llama.cpp b9786 版本发布,新增 OpenCL 非连续行支持

llama.cpp 项目已发布 b9786 版本,通过 OpenCL 引入了对归一化中非连续行的支持。此次更新是 ggml-org 团队持续开发的一部分,旨在增强跨各种平台的硬件兼容性和性能。该版本提供了适用于 macOS Apple Silicon、Intel Mac 和 iOS XCFrameworks 的二进制文件。Linux 用户可以使用 CPU、Vulkan、ROCm 7.2、OpenVINO 和 SYCL 后端访问针对 Ubuntu x64、arm64 和 s390x 架构的构建版本。Android 支持适用于 arm64 CPU 设备,而 Windows 提供了广泛的选择,包括 CPU、CUDA 12 和 13、Vulkan、OpenVINO、SYCL 和 HIP。该版本还列出了在 macOS 和 openEuler 平台上禁用的 KleidiAI 构建。

github llama.cpp · 7 天前

llama.cpp b9785 发布,包含加固的大小写检查与多平台二进制文件

llama.cpp 项目已发布版本 b9785,其中包含一项代码更改,用于加固大小写检查,详见拉取请求 #24973。此次更新提供了适用于 macOS Apple Silicon、Intel Mac 以及通过 XCFramework 提供的 iOS 的预构建二进制文件,在 Apple Silicon 上禁用了 KleidiAI 支持。Linux 发行版(包括 Ubuntu)支持 CPU、Vulkan、ROCm 7.2、OpenVINO 和 SYCL 后端,涵盖 x64、arm64 和 s390x 架构。Android 用户可获取 arm64 CPU 二进制文件,而 Windows 提供广泛的选择,涵盖 CPU、OpenCL Adreno、CUDA 12 和 13、Vulkan、OpenVINO、SYCL 和 HIP。该版本还包括针对 x86 和 aarch64 处理器并支持 ACL Graph 的 openEuler 构建。除了各平台特定的发布外,还提供了一个独立的 UI 包,以方便本地模型推理。

lab Claude Code Releases · 7 天前

Claude Code v2.1.191 版本说明

Claude Code 版本 2.1.191 引入了 /rewind 支持,允许用户从执行 /clear 命令之前的对话处恢复。此次更新修复了多个关键问题,包括后台代理在停止后被重新唤醒以及流式响应期间滚动位置跳跃的问题。它还修正了 /voice 显示通用错误消息以及在 Windows Terminal 中 /login URL 被截断的行为。通过为能力发现和 OAuth 流程中的瞬态网络错误添加重试逻辑,显著提升了 MCP 服务器的可靠性。无头环境现在会跳过 OAuth 的浏览器弹窗,而沙盒网络权限将在会话期间保持记住状态。性能优化通过文本更新合并,将流式处理期间的 CPU 使用率降低了约 37%,并缓解了终端输出缓存导致的长会话内存增长问题。