LLaMA.cpp 发布 b9697:新二进制文件与更新
LLaMA.cpp 发布了版本 b9697,包含适用于 macOS、Linux、Android、Windows 和 openEuler 的更新二进制文件。该版本支持 ARM64、x64、Vulkan、CUDA 12 和 13、OpenVINO、SYCL 和 ROCm,并修复了发布检查中的消息解析问题。
LLaMA.cpp 发布了版本 b9697,包含适用于 macOS、Linux、Android、Windows 和 openEuler 的更新二进制文件。该版本支持 ARM64、x64、Vulkan、CUDA 12 和 13、OpenVINO、SYCL 和 ROCm,并修复了发布检查中的消息解析问题。
2026年6月18日发布的autogpt-platform-beta-v0.6.64版本引入了新功能,如AutoPilot上下文面板和全局搜索,同时增强了图保存、缓存和构建器性能。还包括安全加固、修复LLM提供商问题的错误以及UI改进,例如高分辨率触摸图标。
CrewAI v1.14.8a 将脚本和代理操作引入 FlowDefinition,添加 DMN 模式支持,并启用无需 Python 代码的流程执行。它还包含对 JSON-first 代理和 ZIP 部署回退的实验性支持,以及改进的内存重置和令牌使用跟踪。
llama.cpp 版本 b9693 在其 concat kernel 中引入了 BF16 支持,并为 macOS、Linux、Android、Windows 和 openEuler 提供了预构建的二进制文件。该版本包含 CPU、Vulkan、ROCm、OpenVINO、SYCL 和 HIP 变体,涵盖多种架构,并提供专用的 UI 包。
llama.cpp 已发布版本 b9694,包含适用于 macOS、Linux、Android、Windows 和 openEuler 的二进制文件。该版本支持多种架构和加速选项,如 CUDA、Vulkan、OpenVINO、SYCL 和 ROCm。还修复了 Windows x64 OpenVINO 发布链接的问题。
Claude Code v2.1.181 引入了通过 /config thinking=false 等提示语法设置配置的功能,增加了 macOS 上的沙盒 Apple Events 支持,并改进了流式传输、自动重试和子代理行为。此外,还修复了跨平台启动、文件处理、剪贴板和 UI 响应性方面的众多问题。
ggml-cpu 项目现在基于对 -mcpu=power11 的编译器支持,在 ggml 中条件性地启用 POWER11 后端。这防止了当前 GCC/Clang 工具链上的构建失败,同时保持了向前兼容性。CMakeLists.txt 的更新支持此更改,并且 -mcpu=power10 用于 P10 和 P11 架构。
llama.cpp version b9692 introduces new binaries for macOS, Linux, Android, Windows, and openEuler across multiple architectures. The release includes updates to support Vulkan, ROCm, OpenVINO, SYCL, and HIP, with fixes to remove batch dim usage in llava_uhd.
llama.cpp中的Metal后端已扩展,以支持concat算子的f16和bf16张量类型,此外还保留现有的f32和i32支持。此更新包括专用的内核模板、更新的管道获取器以及改进的基于类型的内核分发,并得到了pi:llama.cpp/Qwen3.6-27B的帮助。
llama.cpp 版本 b9690 引入了一个 rope_back 算子,该算子通过重用现有的 rope 内核并使用函数常量来切换前向/后向旋转来实现。此次发布包含了适用于 macOS、Linux、Android、Windows 和 openEuler 的预构建二进制文件,支持多种架构和硬件加速选项,包括 Vulkan、CUDA、ROCm、OpenVINO 和 SYCL。
llama.cpp version b9687 introduces new binaries for macOS, Linux, Android, Windows, and openEuler across multiple architectures. The release includes support for Vulkan, ROCm, OpenVINO, SYCL, and HIP, with updates to improve device validation and performance on available hardware.
llama.cpp 发布版本 b9688,新增模型管理和 SSE 实时更新 API。该版本包含适用于 macOS、Linux、Android、Windows 和 openEuler 的预编译二进制文件,支持各种架构以及 Vulkan、CUDA、OpenVINO 和 SYCL 等加速框架。
LLaMA.cpp version b9685 introduces SYCL-based dev2dev memcpy functionality, moving GGML_SYCL_DEV2DEV_MEMCPY to runtime table and improving peer-to-peer communication detection. The release includes precompiled binaries for macOS, Linux, Android, Windows, and openEuler across multiple architectures and APIs including Vulkan, ROCm, OpenVINO, and SYCL (FP32/FP16).
llama.cpp 版本 b9686 修复了在使用 Eagle3 模型处理长提示时发生的段错误。该版本包含适用于 macOS、Linux、Android、Windows 和 openEuler 的二进制文件,支持多种架构和硬件加速选项,包括 Vulkan、CUDA、OpenVINO 和 SYCL。
LLaMA.cpp release b9684 introduces a new 3D convolution operation (conv_3d) and includes optimized implementations. The release provides prebuilt binaries for macOS, Linux, Android, Windows, and openEuler across various architectures and hardware acceleration options, including SYCL, Vulkan, CUDA, and OpenVINO.
llama.cpp b9682 版本为 Linux 和 Windows 引入了 Vulkan 支持,实现了 GPU 加速。该版本包含适用于 macOS、Linux、Android、Windows 和 openEuler 的二进制文件,涵盖多种架构,并提供 CPU 和 GPU 选项,包括 CUDA、OpenVINO、SYCL 和 ROCm。
LLaMA.cpp b9678 版本包含对 mul_mat_f16_f32_l4 的解码优化,并引入了适用于 macOS、Linux、Android、Windows 和 openEuler 的新构建。该版本在多种架构上提供 CPU、Vulkan、ROCm、OpenVINO、SYCL 和 HIP 支持,并提供专用的 UI 包。
llama.cpp 版本 b9677 更新了日志记录以强制执行 max_capacity,并移除了队列扩展逻辑。该版本包含适用于 macOS、Linux、Android、Windows 和 openEuler 的二进制文件,支持多种架构和硬件加速选项,包括 Vulkan、CUDA、OpenVINO 和 SYCL。
LLaMA.cpp 版本 b9674 修复了 MoE 预填充期间 SYCL 的异步 memcpy 中的释放后使用错误。该版本包括适用于 macOS、Linux、Android、Windows 和 openEuler 的二进制文件,支持跨多种架构的 CPU、Vulkan、ROCm、OpenVINO、SYCL 和 CUDA。
llama.cpp 版本 b9675 为 SQR、SQRT、LOG、SIN、COS 和 CLAMP 等操作启用了 FP16 支持。该版本包含适用于 macOS、Linux、Android、Windows 和 openEuler 的二进制文件,覆盖多种架构,并支持 Vulkan、ROCm、OpenVINO、SYCL(FP16 和 FP32)以及 CUDA 12.4 和 13.3。