llama.cpp 发布 b9752:服务器重构与跨平台二进制文件
llama.cpp 发布了版本 b9752,对服务器进行了重构,重点在于批处理构建,包括改进了对批处理满情况的处理以及错误修复。该版本包含适用于 macOS、Linux、Android、Windows 和 openEuler 的预编译二进制文件,支持多种架构以及 CUDA、Vulkan、OpenVINO 和 SYCL 等加速框架。
llama.cpp 发布了版本 b9752,对服务器进行了重构,重点在于批处理构建,包括改进了对批处理满情况的处理以及错误修复。该版本包含适用于 macOS、Linux、Android、Windows 和 openEuler 的预编译二进制文件,支持多种架构以及 CUDA、Vulkan、OpenVINO 和 SYCL 等加速框架。
llama.cpp 版本 b9753 引入了改进的规范模型加载进度报告,包括新的“阶段”列表。该版本包含适用于 macOS、Linux、Android、Windows 和 openEuler 的二进制文件,支持多种架构和硬件加速选项,如 Vulkan、CUDA、OpenVINO 和 SYCL。
llama.cpp 版本 b9754 在 common/peg 模块中引入了 AC 解析器,以实现更严格的语法生成。该版本包含适用于 macOS、Linux、Android、Windows 和 openEuler 的预编译二进制文件,支持多种架构以及 Vulkan、CUDA、OpenVINO 和 SYCL 等加速技术。
Android 构建文档已更新,以包含对 libandroid-spawn 的依赖。此新增项旨在支持指定环境内的构建过程。
三星电子已向全球员工推出OpenAI的ChatGPT Enterprise和Codex。此次部署代表了OpenAI迄今为止最大的企业AI举措之一。
llama.cpp 版本 b9750 引入了 call 语句的实现,并回滚了一项非预期的更改。该版本提供了适用于 macOS、Linux、Android、Windows 和 openEuler 的预编译二进制文件,支持多种架构和硬件加速选项,包括 Vulkan、CUDA、OpenVINO 和 SYCL。
llama.cpp 发布了 b9748 版本,在架构中添加了“verbose”字段,并为 macOS、Linux、Android、Windows 和 openEuler 提供了二进制文件。该版本支持 CPU、Vulkan、OpenVINO、SYCL 和 ROCm,涵盖多种架构,并提供 iOS 以及 Windows CUDA 和 Vulkan 构建版本。
已推出AI控制路线图,通过整合传统安全措施与实时监控能力来保障内部系统的安全。
GPT-5.5 Instant 通过更强的推理能力、更好的上下文处理、更清晰的沟通以及医生指导的评估,提升了 ChatGPT 在健康与保健方面的回复质量。
《自然》杂志发表的一项研究显示,对话式AI系统AMIE在管理复杂健康状况方面与初级保健医生的表现不相上下。
英国政府已与Google DeepMind合作,开发一款旨在加速住房规划决策的AI驱动原型。该举措旨在通过利用人工智能提高决策效率,从而简化房屋建设流程。
OpenAI 已为 ChatGPT Enterprise 引入新的支出控制和使用分析功能。这些功能帮助企业在使用 AI 的过程中管理成本并做出明智的决策。
llama.cpp 版本 b9747 通过 SSE 端点引入了实时模型加载进度跟踪。该版本包含适用于 macOS、Linux、Android、Windows 和 openEuler 的二进制文件,支持各种架构以及 Vulkan、CUDA、OpenVINO 和 SYCL 等加速技术。
llama.cpp 版本 b9745 引入了对 Step3.5/3.7 flash MTP3 的支持,包括用于层偏移和 nextn 标志的新 API。该版本提供了适用于 macOS、Linux、Android、Windows 和 openEuler 的预构建二进制文件,并支持 CPU、Vulkan、CUDA、OpenVINO 和 SYCL 加速选项。
LLaMA.cpp 发布了版本 b9744,包含适用于 macOS、Linux、Android、Windows 和 openEuler 的更新二进制文件。该版本支持多种架构和硬件加速器,如 Vulkan、CUDA、OpenVINO、SYCL 和 ROCm。此外还提供了用于界面访问的 UI 包。
llama.cpp 版本 b9742 引入了用于 SSM-conv 权重的填充步长,提升了神经网络操作的效率。该版本提供了适用于 macOS、Linux、Android、Windows 和 openEuler 的二进制文件,支持多种架构以及包括 Vulkan、CUDA、OpenVINO 和 SYCL 在内的多个 API。
llama.cpp 版本 b9743 为 macOS、Linux、Android、Windows 和 openEuler 引入了适用于多种架构的新二进制文件。该版本增加了对 Vulkan、CUDA 12.4 和 13.3、OpenVINO、SYCL 以及 ROCm 的支持,并通过 JSON schema 到语法的对齐,更新了 UI 并改进了解析器的间距规则。
流停滞提示现在显示“等待 API 响应 · 将在 … 后重试”,并在 20 秒无活动后激活,替换了之前的消息和延迟。
llama.cpp 版本 b9741 为 macOS、Linux、Android、Windows 和 openEuler 引入了适用于多种架构的新二进制文件。该版本包含对 Vulkan、CUDA 12.4 和 13.3、OpenVINO、SYCL 以及 ROCm 的支持,并更新了 iOS 和 Ubuntu 的版本。
通过修改argv覆盖,仅在argc匹配时应用,以防止破坏程序化参数,从而解决Windows上test-args-parser的随机失败问题。这修复了OpenVINO Windows工作流中的fastfail断言,同时保留了真实二进制文件的UTF-8处理。