llama.cpp 发布 b9757:新二进制文件和功能
llama.cpp 发布了版本 b9757,包含适用于 macOS、Linux、Android、Windows 和 openEuler 的更新二进制文件。该版本移除了 top-n-sigma 采样器中无条件执行的 softmax+sort 操作,提升了采样效率。新构建支持 Vulkan、OpenVINO、SYCL、ROCm 和 CUDA,涵盖多种架构,包括 Apple Silicon 和 ARM64。
llama.cpp 发布了版本 b9757,包含适用于 macOS、Linux、Android、Windows 和 openEuler 的更新二进制文件。该版本移除了 top-n-sigma 采样器中无条件执行的 softmax+sort 操作,提升了采样效率。新构建支持 Vulkan、OpenVINO、SYCL、ROCm 和 CUDA,涵盖多种架构,包括 Apple Silicon 和 ARM64。
llama.cpp 发布 b9758,为 bin_bcast 和一元运算引入 bf16 支持。同时扩展了对版本早于 2026.0 的旧版 Intel 编译器的兼容性,并提供适用于 macOS、Linux、Android、Windows 和 openEuler 平台的新构建版本,包括对 Vulkan、OpenVINO、SYCL 和 CUDA 的支持。
通过在将 -1 规范化为 n(在末尾插入)而非 n+1,修复了在文件末尾追加时发生的文件编辑崩溃问题。该补丁将 -1 限制为追加模式,并拒绝替换/删除操作中的 -1,以防止静默覆盖最后一行,同时确保插入偏移量以整数形式计算,以避免堆缓冲区溢出。
llama.cpp 发布了版本 b9751,包含适用于 macOS、Linux、Android、Windows 和 openEuler 的更新二进制文件。该版本修复了内存使用问题,并支持多种架构以及 Vulkan、CUDA、OpenVINO 和 SYCL 等硬件加速选项。
llama.cpp 发布了版本 b9752,对服务器进行了重构,重点在于批处理构建,包括改进了对批处理满情况的处理以及错误修复。该版本包含适用于 macOS、Linux、Android、Windows 和 openEuler 的预编译二进制文件,支持多种架构以及 CUDA、Vulkan、OpenVINO 和 SYCL 等加速框架。
llama.cpp 版本 b9753 引入了改进的规范模型加载进度报告,包括新的“阶段”列表。该版本包含适用于 macOS、Linux、Android、Windows 和 openEuler 的二进制文件,支持多种架构和硬件加速选项,如 Vulkan、CUDA、OpenVINO 和 SYCL。
llama.cpp 版本 b9754 在 common/peg 模块中引入了 AC 解析器,以实现更严格的语法生成。该版本包含适用于 macOS、Linux、Android、Windows 和 openEuler 的预编译二进制文件,支持多种架构以及 Vulkan、CUDA、OpenVINO 和 SYCL 等加速技术。
Android 构建文档已更新,以包含对 libandroid-spawn 的依赖。此新增项旨在支持指定环境内的构建过程。
三星电子已向全球员工推出OpenAI的ChatGPT Enterprise和Codex。此次部署代表了OpenAI迄今为止最大的企业AI举措之一。
llama.cpp 版本 b9750 引入了 call 语句的实现,并回滚了一项非预期的更改。该版本提供了适用于 macOS、Linux、Android、Windows 和 openEuler 的预编译二进制文件,支持多种架构和硬件加速选项,包括 Vulkan、CUDA、OpenVINO 和 SYCL。
llama.cpp 发布了 b9748 版本,在架构中添加了“verbose”字段,并为 macOS、Linux、Android、Windows 和 openEuler 提供了二进制文件。该版本支持 CPU、Vulkan、OpenVINO、SYCL 和 ROCm,涵盖多种架构,并提供 iOS 以及 Windows CUDA 和 Vulkan 构建版本。
已推出AI控制路线图,通过整合传统安全措施与实时监控能力来保障内部系统的安全。
GPT-5.5 Instant 通过更强的推理能力、更好的上下文处理、更清晰的沟通以及医生指导的评估,提升了 ChatGPT 在健康与保健方面的回复质量。
《自然》杂志发表的一项研究显示,对话式AI系统AMIE在管理复杂健康状况方面与初级保健医生的表现不相上下。
英国政府已与Google DeepMind合作,开发一款旨在加速住房规划决策的AI驱动原型。该举措旨在通过利用人工智能提高决策效率,从而简化房屋建设流程。
OpenAI 已为 ChatGPT Enterprise 引入新的支出控制和使用分析功能。这些功能帮助企业在使用 AI 的过程中管理成本并做出明智的决策。
llama.cpp 版本 b9747 通过 SSE 端点引入了实时模型加载进度跟踪。该版本包含适用于 macOS、Linux、Android、Windows 和 openEuler 的二进制文件,支持各种架构以及 Vulkan、CUDA、OpenVINO 和 SYCL 等加速技术。
llama.cpp 版本 b9745 引入了对 Step3.5/3.7 flash MTP3 的支持,包括用于层偏移和 nextn 标志的新 API。该版本提供了适用于 macOS、Linux、Android、Windows 和 openEuler 的预构建二进制文件,并支持 CPU、Vulkan、CUDA、OpenVINO 和 SYCL 加速选项。
LLaMA.cpp 发布了版本 b9744,包含适用于 macOS、Linux、Android、Windows 和 openEuler 的更新二进制文件。该版本支持多种架构和硬件加速器,如 Vulkan、CUDA、OpenVINO、SYCL 和 ROCm。此外还提供了用于界面访问的 UI 包。
llama.cpp 版本 b9742 引入了用于 SSM-conv 权重的填充步长,提升了神经网络操作的效率。该版本提供了适用于 macOS、Linux、Android、Windows 和 openEuler 的二进制文件,支持多种架构以及包括 Vulkan、CUDA、OpenVINO 和 SYCL 在内的多个 API。