llama.cpp 发布 b9690,包含 rope_back 算子和跨平台二进制文件
llama.cpp 版本 b9690 引入了一个 rope_back 算子,该算子通过重用现有的 rope 内核并使用函数常量来切换前向/后向旋转来实现。此次发布包含了适用于 macOS、Linux、Android、Windows 和 openEuler 的预构建二进制文件,支持多种架构和硬件加速选项,包括 Vulkan、CUDA、ROCm、OpenVINO 和 SYCL。
llama.cpp 版本 b9690 引入了一个 rope_back 算子,该算子通过重用现有的 rope 内核并使用函数常量来切换前向/后向旋转来实现。此次发布包含了适用于 macOS、Linux、Android、Windows 和 openEuler 的预构建二进制文件,支持多种架构和硬件加速选项,包括 Vulkan、CUDA、ROCm、OpenVINO 和 SYCL。
llama.cpp version b9687 introduces new binaries for macOS, Linux, Android, Windows, and openEuler across multiple architectures. The release includes support for Vulkan, ROCm, OpenVINO, SYCL, and HIP, with updates to improve device validation and performance on available hardware.
llama.cpp 发布版本 b9688,新增模型管理和 SSE 实时更新 API。该版本包含适用于 macOS、Linux、Android、Windows 和 openEuler 的预编译二进制文件,支持各种架构以及 Vulkan、CUDA、OpenVINO 和 SYCL 等加速框架。
LLaMA.cpp version b9685 introduces SYCL-based dev2dev memcpy functionality, moving GGML_SYCL_DEV2DEV_MEMCPY to runtime table and improving peer-to-peer communication detection. The release includes precompiled binaries for macOS, Linux, Android, Windows, and openEuler across multiple architectures and APIs including Vulkan, ROCm, OpenVINO, and SYCL (FP32/FP16).
llama.cpp 版本 b9686 修复了在使用 Eagle3 模型处理长提示时发生的段错误。该版本包含适用于 macOS、Linux、Android、Windows 和 openEuler 的二进制文件,支持多种架构和硬件加速选项,包括 Vulkan、CUDA、OpenVINO 和 SYCL。
LLaMA.cpp release b9684 introduces a new 3D convolution operation (conv_3d) and includes optimized implementations. The release provides prebuilt binaries for macOS, Linux, Android, Windows, and openEuler across various architectures and hardware acceleration options, including SYCL, Vulkan, CUDA, and OpenVINO.
llama.cpp b9682 版本为 Linux 和 Windows 引入了 Vulkan 支持,实现了 GPU 加速。该版本包含适用于 macOS、Linux、Android、Windows 和 openEuler 的二进制文件,涵盖多种架构,并提供 CPU 和 GPU 选项,包括 CUDA、OpenVINO、SYCL 和 ROCm。
LLaMA.cpp b9678 版本包含对 mul_mat_f16_f32_l4 的解码优化,并引入了适用于 macOS、Linux、Android、Windows 和 openEuler 的新构建。该版本在多种架构上提供 CPU、Vulkan、ROCm、OpenVINO、SYCL 和 HIP 支持,并提供专用的 UI 包。
llama.cpp 版本 b9677 更新了日志记录以强制执行 max_capacity,并移除了队列扩展逻辑。该版本包含适用于 macOS、Linux、Android、Windows 和 openEuler 的二进制文件,支持多种架构和硬件加速选项,包括 Vulkan、CUDA、OpenVINO 和 SYCL。
LLaMA.cpp 版本 b9674 修复了 MoE 预填充期间 SYCL 的异步 memcpy 中的释放后使用错误。该版本包括适用于 macOS、Linux、Android、Windows 和 openEuler 的二进制文件,支持跨多种架构的 CPU、Vulkan、ROCm、OpenVINO、SYCL 和 CUDA。
llama.cpp 版本 b9675 为 SQR、SQRT、LOG、SIN、COS 和 CLAMP 等操作启用了 FP16 支持。该版本包含适用于 macOS、Linux、Android、Windows 和 openEuler 的二进制文件,覆盖多种架构,并支持 Vulkan、ROCm、OpenVINO、SYCL(FP16 和 FP32)以及 CUDA 12.4 和 13.3。
llama.cpp 发布了版本 b9680,包含更新的 Vulkan 支持以及适用于 macOS、Linux、Android、Windows 和 openEuler 的新二进制文件。该版本包括多种架构的 CPU 和 GPU 变体,支持 Vulkan、CUDA、OpenVINO、SYCL 和 ROCm。
llama.cpp 版本 b9673 引入了用于 ≥1GB GPU 缓冲区的可选 USM 系统分配功能,在设备支持可用时启用 VRAM 超卖。该功能需要 GGML_SYCL_USM_SYSTEM 环境变量,默认处于禁用状态,如果不支持则回退到常规分配。
v2.1.179 修复了流式连接中断、WSL2 中的鼠标滚轮滚动问题,以及导致 Bash 工具描述过多的沙箱 glob 错误。同时解决了反馈调查错误、促销横幅堆叠以及子代理视图中的焦点问题,并改进了远程会话中的插件加载。
llama.cpp 发布了版本 b9660,修复了 LFM2 工具调用解析中的双重转义问题。此次更新包括适用于 macOS、Linux、Android、Windows 和 openEuler 的二进制文件,涵盖多种架构和硬件加速选项,并附带专用 UI 包。
langgraph-cli 版本 0.4.30 现已可用,支持兼容的 API 版本范围。此次发布还包括标准化的 README.md 结构,以提升文档的一致性。
Claude v2.1.178 引入了使用 Tool(param:value) 语法的新权限规则,改进了嵌套目录中的工作流和技能加载,并增强了自动模式和错误消息。它修复了包括崩溃、身份验证错误以及 Chrome 和 VSCode 中的 UI 行为在内的关键问题,同时优化了工具提示和撤销功能。
llama.cpp 已发布版本 b9672,将 BoringSSL 更新至 0.20260616.0。该版本包含适用于 macOS、Linux、Android、Windows 和 openEuler 的二进制文件,支持多种架构和硬件加速选项,包括 Vulkan、CUDA、ROCm、OpenVINO 和 SYCL。
已为版本 1.38.0 创建了发布分支。这标志着更新发布流程的开始。
llama.cpp 版本 b9669 为 Eagle3 添加了后端采样支持。该版本包含适用于 macOS、Linux、Android、Windows 和 openEuler 的二进制文件,覆盖多种架构和硬件加速选项,包括 Vulkan、CUDA、ROCm、OpenVINO 和 SYCL。