Rust 0.0.13 版本发布
Rust 0.0.13 版本已发布。这个早期版本是 Rust 初始开发阶段的一部分,包含了该语言的基础功能。
Rust 0.0.13 版本已发布。这个早期版本是 Rust 初始开发阶段的一部分,包含了该语言的基础功能。
Rust 版本 0.0.14 已发布。这个早期版本是 Rust 初始开发阶段的一部分,并包含了该语言的基础功能。
LLaMA.cpp 发布了版本 b9729,提供适用于 macOS、Linux、Android、Windows 和 openEuler 的二进制文件,涵盖多种架构。该版本包括对 CPU、Vulkan、OpenVINO、SYCL 和 ROCm 的支持,以及一个新的 UI 包。内部对 'webui' 的引用已被移除。
LLaMA.cpp 版本 b9728 引入了对 --api-key-file 配置中注释行的支持。该版本包含适用于 macOS、Linux、Android、Windows 和 openEuler 的预构建二进制文件,涵盖多种架构和硬件加速选项,包括 Vulkan、CUDA、OpenVINO 和 SYCL。
llama.cpp 版本 b9726 引入了新的 --agent 参数,并移除了冗余的 webui 命名兼容性。该版本包含适用于 macOS、Linux、Android、Windows 和 openEuler 的预编译二进制文件,支持多种架构和硬件加速选项。
llama.cpp 版本 b9727 将 cpp-httplib 更新至 0.48.0 版。该版本包含适用于 macOS、Linux、Android、Windows 和 openEuler 的二进制文件,支持多种架构和硬件加速选项,包括 Vulkan、CUDA、OpenVINO 和 SYCL。
Docker 项目已添加对构建 UI 组件的支持。此更新还包括在容器配置中使用现有的 APP_VERSION。
llama.cpp 版本 b9724 包含多项错误修复和改进,例如构建修复、area() 函数中的溢出避免以及 get_u32() 中的健全性检查。该版本提供了适用于 macOS(arm64 和 x64)、Linux(x64、arm64、s390x、Vulkan、ROCm、OpenVINO、SYCL)、Android(arm64)、Windows(x64、arm64、CUDA 12/13、Vulkan、OpenVINO、SYCL、HIP)和 openEuler(支持 ACL Graph 的 x86 和 aarch64)的预编译二进制文件,以及一个 UI 包。
llama.cpp 版本 b9723 通过 Eagle3 引入了对 Qwen3.5 和 Qwen3.6 模型的支持。该版本包括针对混合模型的延迟边界检查点恢复,以及对 API 和命名约定的更新。二进制构建文件适用于 macOS、Linux、Android、Windows 和 openEuler 平台,并提供 CPU、Vulkan、OpenVINO、SYCL 和 ROCm 选项。
LLaMA.cpp 版本 b9722 修复了服务器上下文处理中 n_discard 值未绑定的问题。该版本包含适用于 macOS、Linux、Android、Windows 和 openEuler 的预编译二进制文件,支持各种架构以及 Vulkan、CUDA、OpenVINO 和 SYCL 等加速框架。
llama.cpp 版本 b9718 将槽位选择整合为单个函数 get_available_slot,同时保持用于提示缓存更新的 LCP 相似度检查。该版本包含适用于 macOS、Linux、Android、Windows 和 openEuler 的二进制构建,支持多种架构和硬件加速选项。
llama.cpp 发布了 b9721 版本,提供适用于 macOS、Linux、Android、Windows 和 openEuler 的二进制文件,涵盖多种架构。该版本包括 CPU、Vulkan、ROCm、OpenVINO、SYCL 和 HIP 支持,并附带专用 UI 包。Apple Silicon 的 KleidiAI 功能目前处于禁用状态。
ggml-cpu 现在支持 Power10 Q8/Q4 MMA 矩阵乘法中的 K tails,不再要求 K 能被 kc 整除。这使得更多工作负载能够使用 MMA 内核,并减少对 mnpack 的回退。
v0.17.6 版本添加了预批准工具输入护栏和仅 SDK 的工具输出自定义数据。它还强制执行严格的 JSON 兼容工具输出契约,并抑制工具名称中的不必要空白警告。@siddiksawani 在本版本中做出了首次贡献。
llama.cpp 版本 b9716 引入了对 InternVL 的批处理支持,通过高效的批处理提升模型性能。该版本包括适用于 macOS、Linux、Android、Windows 和 openEuler 的二进制构建,涵盖多种架构和硬件加速选项,包括 Vulkan、OpenVINO、SYCL 和 ROCm。
llama.cpp 已发布版本 b9713,为 mtmd-cli 添加了批处理支持以及视频测试。该版本包含适用于 macOS、Linux、Android、Windows 和 openEuler 的二进制文件,覆盖多种架构和硬件加速选项,包括 Vulkan、CUDA、OpenVINO 和 SYCL。
llama.cpp 版本 b9714 向流式传输端点添加了 "X-Accel-Buffering": "no" 头,以防止 Nginx 缓冲响应,从而解决了 Pi 编码工具等应用程序的流式传输问题。该发布版包含适用于 macOS、Linux、Android、Windows 和 openEuler 的二进制文件,支持多种架构和硬件加速选项。
LLaMA.cpp 版本 b9715 引入了对 GGML_OP_COL2IM_1D 的 CUDA 支持,这是在 CPU 实现基础上的扩展。该版本提供了适用于 macOS、Linux、Android、Windows 和 openEuler 的二进制文件,涵盖多种架构和加速框架,包括 Vulkan、ROCm、OpenVINO 和 SYCL。
v1.14.8a2 向 Flow 定义添加了单个智能体操作,并在加载时验证 CEL 表达式。它包含一个新的 Datadog 集成指南,带有可导入的操作仪表板,以及 v1.14.8a1 的更新快照和变更日志。
llama.cpp 发布了版本 b9711,包含适用于 macOS、Linux、Android、Windows 和 openEuler 的更新二进制文件。该版本支持 ARM64、x64、Vulkan、ROCm、OpenVINO、SYCL 和 HIP,并为 CPU 和 GPU 加速提供了专用二进制文件。此外还提供了一个新的 UI 包。