为 Android 构建添加 libandroid-spawn 依赖
Android 构建文档已更新,以包含对 libandroid-spawn 的依赖。此新增项旨在支持指定环境内的构建过程。
Android 构建文档已更新,以包含对 libandroid-spawn 的依赖。此新增项旨在支持指定环境内的构建过程。
三星电子已向全球员工推出OpenAI的ChatGPT Enterprise和Codex。此次部署代表了OpenAI迄今为止最大的企业AI举措之一。
llama.cpp 版本 b9750 引入了 call 语句的实现,并回滚了一项非预期的更改。该版本提供了适用于 macOS、Linux、Android、Windows 和 openEuler 的预编译二进制文件,支持多种架构和硬件加速选项,包括 Vulkan、CUDA、OpenVINO 和 SYCL。
llama.cpp 发布了 b9748 版本,在架构中添加了“verbose”字段,并为 macOS、Linux、Android、Windows 和 openEuler 提供了二进制文件。该版本支持 CPU、Vulkan、OpenVINO、SYCL 和 ROCm,涵盖多种架构,并提供 iOS 以及 Windows CUDA 和 Vulkan 构建版本。
已推出AI控制路线图,通过整合传统安全措施与实时监控能力来保障内部系统的安全。
GPT-5.5 Instant 通过更强的推理能力、更好的上下文处理、更清晰的沟通以及医生指导的评估,提升了 ChatGPT 在健康与保健方面的回复质量。
《自然》杂志发表的一项研究显示,对话式AI系统AMIE在管理复杂健康状况方面与初级保健医生的表现不相上下。
英国政府已与Google DeepMind合作,开发一款旨在加速住房规划决策的AI驱动原型。该举措旨在通过利用人工智能提高决策效率,从而简化房屋建设流程。
OpenAI 已为 ChatGPT Enterprise 引入新的支出控制和使用分析功能。这些功能帮助企业在使用 AI 的过程中管理成本并做出明智的决策。
llama.cpp 版本 b9747 通过 SSE 端点引入了实时模型加载进度跟踪。该版本包含适用于 macOS、Linux、Android、Windows 和 openEuler 的二进制文件,支持各种架构以及 Vulkan、CUDA、OpenVINO 和 SYCL 等加速技术。
llama.cpp 版本 b9745 引入了对 Step3.5/3.7 flash MTP3 的支持,包括用于层偏移和 nextn 标志的新 API。该版本提供了适用于 macOS、Linux、Android、Windows 和 openEuler 的预构建二进制文件,并支持 CPU、Vulkan、CUDA、OpenVINO 和 SYCL 加速选项。
LLaMA.cpp 发布了版本 b9744,包含适用于 macOS、Linux、Android、Windows 和 openEuler 的更新二进制文件。该版本支持多种架构和硬件加速器,如 Vulkan、CUDA、OpenVINO、SYCL 和 ROCm。此外还提供了用于界面访问的 UI 包。
llama.cpp 版本 b9742 引入了用于 SSM-conv 权重的填充步长,提升了神经网络操作的效率。该版本提供了适用于 macOS、Linux、Android、Windows 和 openEuler 的二进制文件,支持多种架构以及包括 Vulkan、CUDA、OpenVINO 和 SYCL 在内的多个 API。
llama.cpp 版本 b9743 为 macOS、Linux、Android、Windows 和 openEuler 引入了适用于多种架构的新二进制文件。该版本增加了对 Vulkan、CUDA 12.4 和 13.3、OpenVINO、SYCL 以及 ROCm 的支持,并通过 JSON schema 到语法的对齐,更新了 UI 并改进了解析器的间距规则。
流停滞提示现在显示“等待 API 响应 · 将在 … 后重试”,并在 20 秒无活动后激活,替换了之前的消息和延迟。
llama.cpp 版本 b9741 为 macOS、Linux、Android、Windows 和 openEuler 引入了适用于多种架构的新二进制文件。该版本包含对 Vulkan、CUDA 12.4 和 13.3、OpenVINO、SYCL 以及 ROCm 的支持,并更新了 iOS 和 Ubuntu 的版本。
通过修改argv覆盖,仅在argc匹配时应用,以防止破坏程序化参数,从而解决Windows上test-args-parser的随机失败问题。这修复了OpenVINO Windows工作流中的fastfail断言,同时保留了真实二进制文件的UTF-8处理。
LLaMA.cpp 版本 b9739 增加了对使用 OpenCL Adreno 的 Windows ARM64 的支持。该版本包含适用于 macOS、Linux、Android、Windows 和 openEuler 的二进制文件,覆盖多种架构和 API,包括 Vulkan、CUDA、OpenVINO 和 SYCL。
llama.cpp 版本 b9738 修复了 CORS 代理,避免转发认证头。此次发布包含适用于 macOS、Linux、Android、Windows 和 openEuler 的二进制构建文件,支持多种架构和硬件加速选项,包括 Vulkan、CUDA、OpenVINO 和 SYCL。
ggml 项目通过将 n_batch * M 上的分区展平,优化了 AMX 性能,确保所有线程都参与量化。这一改进在 CPU 和 GPU 平台上的各种模型和硬件配置中,将速度提升了最高 1.47 倍,结果显示推理时间一致缩短。