llama.cpp 发布 b9686:修复 Eagle3 长提示导致的段错误
llama.cpp 版本 b9686 修复了在使用 Eagle3 模型处理长提示时发生的段错误。该版本包含适用于 macOS、Linux、Android、Windows 和 openEuler 的二进制文件,支持多种架构和硬件加速选项,包括 Vulkan、CUDA、OpenVINO 和 SYCL。
llama.cpp 版本 b9686 修复了在使用 Eagle3 模型处理长提示时发生的段错误。该版本包含适用于 macOS、Linux、Android、Windows 和 openEuler 的二进制文件,支持多种架构和硬件加速选项,包括 Vulkan、CUDA、OpenVINO 和 SYCL。
LLaMA.cpp release b9684 introduces a new 3D convolution operation (conv_3d) and includes optimized implementations. The release provides prebuilt binaries for macOS, Linux, Android, Windows, and openEuler across various architectures and hardware acceleration options, including SYCL, Vulkan, CUDA, and OpenVINO.
llama.cpp b9682 版本为 Linux 和 Windows 引入了 Vulkan 支持,实现了 GPU 加速。该版本包含适用于 macOS、Linux、Android、Windows 和 openEuler 的二进制文件,涵盖多种架构,并提供 CPU 和 GPU 选项,包括 CUDA、OpenVINO、SYCL 和 ROCm。
LLaMA.cpp b9678 版本包含对 mul_mat_f16_f32_l4 的解码优化,并引入了适用于 macOS、Linux、Android、Windows 和 openEuler 的新构建。该版本在多种架构上提供 CPU、Vulkan、ROCm、OpenVINO、SYCL 和 HIP 支持,并提供专用的 UI 包。
llama.cpp 版本 b9677 更新了日志记录以强制执行 max_capacity,并移除了队列扩展逻辑。该版本包含适用于 macOS、Linux、Android、Windows 和 openEuler 的二进制文件,支持多种架构和硬件加速选项,包括 Vulkan、CUDA、OpenVINO 和 SYCL。
LLaMA.cpp 版本 b9674 修复了 MoE 预填充期间 SYCL 的异步 memcpy 中的释放后使用错误。该版本包括适用于 macOS、Linux、Android、Windows 和 openEuler 的二进制文件,支持跨多种架构的 CPU、Vulkan、ROCm、OpenVINO、SYCL 和 CUDA。
llama.cpp 版本 b9675 为 SQR、SQRT、LOG、SIN、COS 和 CLAMP 等操作启用了 FP16 支持。该版本包含适用于 macOS、Linux、Android、Windows 和 openEuler 的二进制文件,覆盖多种架构,并支持 Vulkan、ROCm、OpenVINO、SYCL(FP16 和 FP32)以及 CUDA 12.4 和 13.3。
llama.cpp 发布了版本 b9680,包含更新的 Vulkan 支持以及适用于 macOS、Linux、Android、Windows 和 openEuler 的新二进制文件。该版本包括多种架构的 CPU 和 GPU 变体,支持 Vulkan、CUDA、OpenVINO、SYCL 和 ROCm。
llama.cpp 版本 b9673 引入了用于 ≥1GB GPU 缓冲区的可选 USM 系统分配功能,在设备支持可用时启用 VRAM 超卖。该功能需要 GGML_SYCL_USM_SYSTEM 环境变量,默认处于禁用状态,如果不支持则回退到常规分配。
v2.1.179 修复了流式连接中断、WSL2 中的鼠标滚轮滚动问题,以及导致 Bash 工具描述过多的沙箱 glob 错误。同时解决了反馈调查错误、促销横幅堆叠以及子代理视图中的焦点问题,并改进了远程会话中的插件加载。
llama.cpp 发布了版本 b9660,修复了 LFM2 工具调用解析中的双重转义问题。此次更新包括适用于 macOS、Linux、Android、Windows 和 openEuler 的二进制文件,涵盖多种架构和硬件加速选项,并附带专用 UI 包。
langgraph-cli 版本 0.4.30 现已可用,支持兼容的 API 版本范围。此次发布还包括标准化的 README.md 结构,以提升文档的一致性。
Claude v2.1.178 引入了使用 Tool(param:value) 语法的新权限规则,改进了嵌套目录中的工作流和技能加载,并增强了自动模式和错误消息。它修复了包括崩溃、身份验证错误以及 Chrome 和 VSCode 中的 UI 行为在内的关键问题,同时优化了工具提示和撤销功能。
llama.cpp 已发布版本 b9672,将 BoringSSL 更新至 0.20260616.0。该版本包含适用于 macOS、Linux、Android、Windows 和 openEuler 的二进制文件,支持多种架构和硬件加速选项,包括 Vulkan、CUDA、ROCm、OpenVINO 和 SYCL。
已为版本 1.38.0 创建了发布分支。这标志着更新发布流程的开始。
llama.cpp 版本 b9669 为 Eagle3 添加了后端采样支持。该版本包含适用于 macOS、Linux、Android、Windows 和 openEuler 的二进制文件,覆盖多种架构和硬件加速选项,包括 Vulkan、CUDA、ROCm、OpenVINO 和 SYCL。
llama.cpp release b9670 包含对 llama-graph 中 NVFP4 边缘情况的修复,例如移动 GEMM 后的 MUL 操作并将 build_ffn 限制为支持的组合。该版本提供了适用于 macOS、Linux、Android、Windows 和 openEuler 的二进制文件,涵盖多种架构和后端选项,包括 CUDA、Vulkan、SYCL 和 OpenVINO。
llama.cpp release b9667 introduces Vulkan support with S_v=16 via gated_delta_net. It includes binaries for macOS, Linux, Android, Windows, and openEuler across multiple architectures, with options for Vulkan, CUDA 12.4 and 13.3, ROCm, OpenVINO, and SYCL.
llama.cpp 版本 b9668 实现了 UMA 主机可见内存缓冲区,以改善 UMA 设备上的性能,基于 0cc4m 的建议。该版本包含适用于 macOS、Linux、Android、Windows 和 openEuler 的二进制文件,支持 CPU、Vulkan、ROCm、OpenVINO、SYCL 和 HIP,并附带专用 UI 包。
llama.cpp 版本 b9665 引入了用于基准测试的新 --offline 标志。该版本包含适用于 macOS、Linux、Android、Windows 和 openEuler 的二进制构建,支持多种架构和硬件加速选项,包括 Vulkan、CUDA、ROCm、OpenVINO 和 SYCL。