Docker 为 s390x 架构提供预构建的 Web UI
已提交一个拉取请求,旨在为 Docker 中的 s390x 架构添加预构建的 Web UI。该更改目前待发布,尚未公开。
已提交一个拉取请求,旨在为 Docker 中的 s390x 架构添加预构建的 Web UI。该更改目前待发布,尚未公开。
Rust 0.0.15 版本已发布。该早期版本属于 Rust 的初始开发阶段,包含了语言的基础功能。
Open Interpreter 发布了 0.0.16 版本。此次更新引入了新功能和核心功能的改进,增强了用户交互和任务执行能力。
Open Interpreter 发布了 0.0.17 版本。此次更新引入了新功能并改进了其核心功能,增强了用户交互和任务执行能力。
LLaMA.cpp 发布了版本 b9732,包含适用于 macOS、Linux、Android、Windows 和 openEuler 的更新二进制文件。此次发布包括重构的子节点到路由器通信、唤醒处理修复、改进的 update_status() 以及文档。新构建支持 Vulkan、ROCm、OpenVINO、SYCL 以及在多种架构上的 CUDA 12/13。
ggml-webgpu 项目已为 Vulkan 和 NVIDIA GPU 添加了半精度 (F16) 支持的适配器切换。此更新提升了在 macOS、Linux、Android、Windows 和 openEuler 等多个平台上兼容硬件的性能,并提供针对 ARM 和 x64 架构的特定构建版本。
llama.cpp 版本 b9731 引入了使用 std::partial_sort 的优化,以减少令牌排序开销,将 top-n 令牌选择的性能从 8.555ms 提升至 0.704ms。该版本包含适用于 macOS、Linux、Android、Windows 和 openEuler 的预构建二进制文件,支持多种架构和硬件加速选项。
llama.cpp 版本 b9730 包含对 Windows 上 UTF-8 处理的修复以及对 ggml_fopen 和 CLI 的改进。该版本为 macOS、Linux、Android、Windows 和 openEuler 提供了适用于多种架构和硬件加速选项(包括 Vulkan、CUDA、OpenVINO 和 SYCL)的二进制文件。
Rust 0.0.12 版本已发布。这个早期版本属于 Rust 的初始开发阶段,包含了该语言的基础功能。
Rust 0.0.13 版本已发布。这个早期版本是 Rust 初始开发阶段的一部分,包含了该语言的基础功能。
Rust 版本 0.0.14 已发布。这个早期版本是 Rust 初始开发阶段的一部分,并包含了该语言的基础功能。
LLaMA.cpp 发布了版本 b9729,提供适用于 macOS、Linux、Android、Windows 和 openEuler 的二进制文件,涵盖多种架构。该版本包括对 CPU、Vulkan、OpenVINO、SYCL 和 ROCm 的支持,以及一个新的 UI 包。内部对 'webui' 的引用已被移除。
LLaMA.cpp 版本 b9728 引入了对 --api-key-file 配置中注释行的支持。该版本包含适用于 macOS、Linux、Android、Windows 和 openEuler 的预构建二进制文件,涵盖多种架构和硬件加速选项,包括 Vulkan、CUDA、OpenVINO 和 SYCL。
llama.cpp 版本 b9726 引入了新的 --agent 参数,并移除了冗余的 webui 命名兼容性。该版本包含适用于 macOS、Linux、Android、Windows 和 openEuler 的预编译二进制文件,支持多种架构和硬件加速选项。
llama.cpp 版本 b9727 将 cpp-httplib 更新至 0.48.0 版。该版本包含适用于 macOS、Linux、Android、Windows 和 openEuler 的二进制文件,支持多种架构和硬件加速选项,包括 Vulkan、CUDA、OpenVINO 和 SYCL。
Docker 项目已添加对构建 UI 组件的支持。此更新还包括在容器配置中使用现有的 APP_VERSION。
llama.cpp 版本 b9724 包含多项错误修复和改进,例如构建修复、area() 函数中的溢出避免以及 get_u32() 中的健全性检查。该版本提供了适用于 macOS(arm64 和 x64)、Linux(x64、arm64、s390x、Vulkan、ROCm、OpenVINO、SYCL)、Android(arm64)、Windows(x64、arm64、CUDA 12/13、Vulkan、OpenVINO、SYCL、HIP)和 openEuler(支持 ACL Graph 的 x86 和 aarch64)的预编译二进制文件,以及一个 UI 包。
llama.cpp 版本 b9723 通过 Eagle3 引入了对 Qwen3.5 和 Qwen3.6 模型的支持。该版本包括针对混合模型的延迟边界检查点恢复,以及对 API 和命名约定的更新。二进制构建文件适用于 macOS、Linux、Android、Windows 和 openEuler 平台,并提供 CPU、Vulkan、OpenVINO、SYCL 和 ROCm 选项。
LLaMA.cpp 版本 b9722 修复了服务器上下文处理中 n_discard 值未绑定的问题。该版本包含适用于 macOS、Linux、Android、Windows 和 openEuler 的预编译二进制文件,支持各种架构以及 Vulkan、CUDA、OpenVINO 和 SYCL 等加速框架。
llama.cpp 版本 b9718 将槽位选择整合为单个函数 get_available_slot,同时保持用于提示缓存更新的 LCP 相似度检查。该版本包含适用于 macOS、Linux、Android、Windows 和 openEuler 的二进制构建,支持多种架构和硬件加速选项。