LLaMA.cpp 发布 b9674:修复异步 memcpy 错误并添加新二进制文件
LLaMA.cpp 版本 b9674 修复了 MoE 预填充期间 SYCL 的异步 memcpy 中的释放后使用错误。该版本包括适用于 macOS、Linux、Android、Windows 和 openEuler 的二进制文件,支持跨多种架构的 CPU、Vulkan、ROCm、OpenVINO、SYCL 和 CUDA。
LLaMA.cpp 版本 b9674 修复了 MoE 预填充期间 SYCL 的异步 memcpy 中的释放后使用错误。该版本包括适用于 macOS、Linux、Android、Windows 和 openEuler 的二进制文件,支持跨多种架构的 CPU、Vulkan、ROCm、OpenVINO、SYCL 和 CUDA。
llama.cpp 版本 b9675 为 SQR、SQRT、LOG、SIN、COS 和 CLAMP 等操作启用了 FP16 支持。该版本包含适用于 macOS、Linux、Android、Windows 和 openEuler 的二进制文件,覆盖多种架构,并支持 Vulkan、ROCm、OpenVINO、SYCL(FP16 和 FP32)以及 CUDA 12.4 和 13.3。
llama.cpp 发布了版本 b9680,包含更新的 Vulkan 支持以及适用于 macOS、Linux、Android、Windows 和 openEuler 的新二进制文件。该版本包括多种架构的 CPU 和 GPU 变体,支持 Vulkan、CUDA、OpenVINO、SYCL 和 ROCm。
llama.cpp 版本 b9673 引入了用于 ≥1GB GPU 缓冲区的可选 USM 系统分配功能,在设备支持可用时启用 VRAM 超卖。该功能需要 GGML_SYCL_USM_SYSTEM 环境变量,默认处于禁用状态,如果不支持则回退到常规分配。
v2.1.179 修复了流式连接中断、WSL2 中的鼠标滚轮滚动问题,以及导致 Bash 工具描述过多的沙箱 glob 错误。同时解决了反馈调查错误、促销横幅堆叠以及子代理视图中的焦点问题,并改进了远程会话中的插件加载。
llama.cpp 发布了版本 b9660,修复了 LFM2 工具调用解析中的双重转义问题。此次更新包括适用于 macOS、Linux、Android、Windows 和 openEuler 的二进制文件,涵盖多种架构和硬件加速选项,并附带专用 UI 包。
langgraph-cli 版本 0.4.30 现已可用,支持兼容的 API 版本范围。此次发布还包括标准化的 README.md 结构,以提升文档的一致性。
Claude v2.1.178 引入了使用 Tool(param:value) 语法的新权限规则,改进了嵌套目录中的工作流和技能加载,并增强了自动模式和错误消息。它修复了包括崩溃、身份验证错误以及 Chrome 和 VSCode 中的 UI 行为在内的关键问题,同时优化了工具提示和撤销功能。
llama.cpp 已发布版本 b9672,将 BoringSSL 更新至 0.20260616.0。该版本包含适用于 macOS、Linux、Android、Windows 和 openEuler 的二进制文件,支持多种架构和硬件加速选项,包括 Vulkan、CUDA、ROCm、OpenVINO 和 SYCL。
已为版本 1.38.0 创建了发布分支。这标志着更新发布流程的开始。
llama.cpp 版本 b9669 为 Eagle3 添加了后端采样支持。该版本包含适用于 macOS、Linux、Android、Windows 和 openEuler 的二进制文件,覆盖多种架构和硬件加速选项,包括 Vulkan、CUDA、ROCm、OpenVINO 和 SYCL。
llama.cpp release b9670 包含对 llama-graph 中 NVFP4 边缘情况的修复,例如移动 GEMM 后的 MUL 操作并将 build_ffn 限制为支持的组合。该版本提供了适用于 macOS、Linux、Android、Windows 和 openEuler 的二进制文件,涵盖多种架构和后端选项,包括 CUDA、Vulkan、SYCL 和 OpenVINO。
llama.cpp release b9667 introduces Vulkan support with S_v=16 via gated_delta_net. It includes binaries for macOS, Linux, Android, Windows, and openEuler across multiple architectures, with options for Vulkan, CUDA 12.4 and 13.3, ROCm, OpenVINO, and SYCL.
llama.cpp 版本 b9668 实现了 UMA 主机可见内存缓冲区,以改善 UMA 设备上的性能,基于 0cc4m 的建议。该版本包含适用于 macOS、Linux、Android、Windows 和 openEuler 的二进制文件,支持 CPU、Vulkan、ROCm、OpenVINO、SYCL 和 HIP,并附带专用 UI 包。
llama.cpp 版本 b9665 引入了用于基准测试的新 --offline 标志。该版本包含适用于 macOS、Linux、Android、Windows 和 openEuler 的二进制构建,支持多种架构和硬件加速选项,包括 Vulkan、CUDA、ROCm、OpenVINO 和 SYCL。
LLaMA.cpp b9663 版本添加了 OP EXPM1 支持,以及 FLOOR、TRUNC 和 ROUND 的所有单元测试用例。它包含了适用于 macOS、Linux、Android、Windows 和 openEuler 的更新二进制文件,支持 SYCL(FP32 和 FP16)、Vulkan、CUDA 12.4 和 13.3 以及 ROCm 7.2,并更新了 UI。
sycl 更新扩展了对 MoE MUL_MAT_ID 中重排序专家张量处理的支持,涵盖 Q4_K、Q5_K 和 Q6_K。不支持的 3D 重排序情况现在会回退而不是中止。
llama.cpp 发布版 b9661 为 Vulkan 添加了 GGML_OP_COL2IM_1D 支持,使用有界收集循环代替带取模的全 K 扫描。它对不支持的类型返回 nullptr,并为 macOS、Linux、Android、Windows 和 openEuler 提供了构建版本,涵盖 CPU、Vulkan、CUDA 和 SYCL。