全部文章 — korshunov.ai

全部文章页 1 / 13

llama.cpp 发布 b9686：修复 Eagle3 长提示导致的段错误

llama.cpp 版本 b9686 修复了在使用 Eagle3 模型处理长提示时发生的段错误。该版本包含适用于 macOS、Linux、Android、Windows 和 openEuler 的二进制文件，支持多种架构和硬件加速选项，包括 Vulkan、CUDA、OpenVINO 和 SYCL。

github llama.cpp · 14 天前

LLaMA.cpp Release b9684 Adds Conv_3D and Multiple Platform Binaries

LLaMA.cpp release b9684 introduces a new 3D convolution operation (conv_3d) and includes optimized implementations. The release provides prebuilt binaries for macOS, Linux, Android, Windows, and openEuler across various architectures and hardware acceleration options, including SYCL, Vulkan, CUDA, and OpenVINO.

github llama.cpp · 14 天前

llama.cpp b9682 版本发布，新增 Vulkan 支持和多平台二进制文件

llama.cpp b9682 版本为 Linux 和 Windows 引入了 Vulkan 支持，实现了 GPU 加速。该版本包含适用于 macOS、Linux、Android、Windows 和 openEuler 的二进制文件，涵盖多种架构，并提供 CPU 和 GPU 选项，包括 CUDA、OpenVINO、SYCL 和 ROCm。

github llama.cpp · 14 天前

LLaMA.cpp b9678 版本发布，新增优化与跨平台构建

LLaMA.cpp b9678 版本包含对 mul_mat_f16_f32_l4 的解码优化，并引入了适用于 macOS、Linux、Android、Windows 和 openEuler 的新构建。该版本在多种架构上提供 CPU、Vulkan、ROCm、OpenVINO、SYCL 和 HIP 支持，并提供专用的 UI 包。

github llama.cpp · 14 天前

llama.cpp 发布 b9677：更新与跨平台二进制文件

llama.cpp 版本 b9677 更新了日志记录以强制执行 max_capacity，并移除了队列扩展逻辑。该版本包含适用于 macOS、Linux、Android、Windows 和 openEuler 的二进制文件，支持多种架构和硬件加速选项，包括 Vulkan、CUDA、OpenVINO 和 SYCL。

github llama.cpp · 14 天前

LLaMA.cpp 发布 b9674：修复异步 memcpy 错误并添加新二进制文件

LLaMA.cpp 版本 b9674 修复了 MoE 预填充期间 SYCL 的异步 memcpy 中的释放后使用错误。该版本包括适用于 macOS、Linux、Android、Windows 和 openEuler 的二进制文件，支持跨多种架构的 CPU、Vulkan、ROCm、OpenVINO、SYCL 和 CUDA。

github llama.cpp · 14 天前

llama.cpp b9675 版本发布，新增 FP16 支持和多平台二进制文件

llama.cpp 版本 b9675 为 SQR、SQRT、LOG、SIN、COS 和 CLAMP 等操作启用了 FP16 支持。该版本包含适用于 macOS、Linux、Android、Windows 和 openEuler 的二进制文件，覆盖多种架构，并支持 Vulkan、ROCm、OpenVINO、SYCL（FP16 和 FP32）以及 CUDA 12.4 和 13.3。

github llama.cpp · 14 天前

llama.cpp 发布 b9680：新二进制文件和 Vulkan 支持

llama.cpp 发布了版本 b9680，包含更新的 Vulkan 支持以及适用于 macOS、Linux、Android、Windows 和 openEuler 的新二进制文件。该版本包括多种架构的 CPU 和 GPU 变体，支持 Vulkan、CUDA、OpenVINO、SYCL 和 ROCm。

github llama.cpp · 14 天前

llama.cpp 发布 b9673，支持 USM 系统分配和跨平台二进制文件

llama.cpp 版本 b9673 引入了用于 ≥1GB GPU 缓冲区的可选 USM 系统分配功能，在设备支持可用时启用 VRAM 超卖。该功能需要 GGML_SYCL_USM_SYSTEM 环境变量，默认处于禁用状态，如果不支持则回退到常规分配。

lab Claude Code Releases · 15 天前

v2.1.179 版本说明

v2.1.179 修复了流式连接中断、WSL2 中的鼠标滚轮滚动问题，以及导致 Bash 工具描述过多的沙箱 glob 错误。同时解决了反馈调查错误、促销横幅堆叠以及子代理视图中的焦点问题，并改进了远程会话中的插件加载。

github llama.cpp · 15 天前

llama.cpp 发布 b9660，包含修复和新二进制文件

llama.cpp 发布了版本 b9660，修复了 LFM2 工具调用解析中的双重转义问题。此次更新包括适用于 macOS、Linux、Android、Windows 和 openEuler 的二进制文件，涵盖多种架构和硬件加速选项，并附带专用 UI 包。

github LangGraph · 15 天前

langgraph-cli 0.4.30 发布

langgraph-cli 版本 0.4.30 现已可用，支持兼容的 API 版本范围。此次发布还包括标准化的 README.md 结构，以提升文档的一致性。

lab Claude Code Releases · 15 天前

Claude v2.1.178 发布说明

Claude v2.1.178 引入了使用 Tool(param:value) 语法的新权限规则，改进了嵌套目录中的工作流和技能加载，并增强了自动模式和错误消息。它修复了包括崩溃、身份验证错误以及 Chrome 和 VSCode 中的 UI 行为在内的关键问题，同时优化了工具提示和撤销功能。

github llama.cpp · 15 天前

llama.cpp 发布版本 b9672，更新 BoringSSL

llama.cpp 已发布版本 b9672，将 BoringSSL 更新至 0.20260616.0。该版本包含适用于 macOS、Linux、Android、Windows 和 openEuler 的二进制文件，支持多种架构和硬件加速选项，包括 Vulkan、CUDA、ROCm、OpenVINO 和 SYCL。

github Goose (Block) · 15 天前

v1.38.0 的发布分支已创建

已为版本 1.38.0 创建了发布分支。这标志着更新发布流程的开始。

github llama.cpp · 16 天前

llama.cpp 发布 b96669，为 Eagle3 添加后端采样

llama.cpp 版本 b9669 为 Eagle3 添加了后端采样支持。该版本包含适用于 macOS、Linux、Android、Windows 和 openEuler 的二进制文件，覆盖多种架构和硬件加速选项，包括 Vulkan、CUDA、ROCm、OpenVINO 和 SYCL。

github llama.cpp · 16 天前

llama.cpp 发布 b9670：修复与新构建

llama.cpp release b9670 包含对 llama-graph 中 NVFP4 边缘情况的修复，例如移动 GEMM 后的 MUL 操作并将 build_ffn 限制为支持的组合。该版本提供了适用于 macOS、Linux、Android、Windows 和 openEuler 的二进制文件，涵盖多种架构和后端选项，包括 CUDA、Vulkan、SYCL 和 OpenVINO。

github llama.cpp · 16 天前

llama.cpp Release b9667 Adds Vulkan and CUDA Support

llama.cpp release b9667 introduces Vulkan support with S_v=16 via gated_delta_net. It includes binaries for macOS, Linux, Android, Windows, and openEuler across multiple architectures, with options for Vulkan, CUDA 12.4 and 13.3, ROCm, OpenVINO, and SYCL.

github llama.cpp · 16 天前

llama.cpp 发布 b9668，新增 UMA 主机可见内存和跨平台二进制文件

llama.cpp 版本 b9668 实现了 UMA 主机可见内存缓冲区，以改善 UMA 设备上的性能，基于 0cc4m 的建议。该版本包含适用于 macOS、Linux、Android、Windows 和 openEuler 的二进制文件，支持 CPU、Vulkan、ROCm、OpenVINO、SYCL 和 HIP，并附带专用 UI 包。

github llama.cpp · 16 天前

llama.cpp 发布 b9665，新增 --offline 标志和新二进制构建

llama.cpp 版本 b9665 引入了用于基准测试的新 --offline 标志。该版本包含适用于 macOS、Linux、Android、Windows 和 openEuler 的二进制构建，支持多种架构和硬件加速选项，包括 Vulkan、CUDA、ROCm、OpenVINO 和 SYCL。