全部文章 — korshunov.ai

全部文章页 1 / 8

github llama.cpp · 9 天前

为 Android 构建添加 libandroid-spawn 依赖

Android 构建文档已更新，以包含对 libandroid-spawn 的依赖。此新增项旨在支持指定环境内的构建过程。

lab OpenAI News · 10 天前

三星为员工部署ChatGPT和Codex

三星电子已向全球员工推出OpenAI的ChatGPT Enterprise和Codex。此次部署代表了OpenAI迄今为止最大的企业AI举措之一。

github llama.cpp · 10 天前

llama.cpp 发布 b9750：新增 call 语句及跨平台二进制文件

llama.cpp 版本 b9750 引入了 call 语句的实现，并回滚了一项非预期的更改。该版本提供了适用于 macOS、Linux、Android、Windows 和 openEuler 的预编译二进制文件，支持多种架构和硬件加速选项，包括 Vulkan、CUDA、OpenVINO 和 SYCL。

github llama.cpp · 10 天前

llama.cpp 发布 b9748 版本，新增二进制文件和特性

llama.cpp 发布了 b9748 版本，在架构中添加了“verbose”字段，并为 macOS、Linux、Android、Windows 和 openEuler 提供了二进制文件。该版本支持 CPU、Vulkan、OpenVINO、SYCL 和 ROCm，涵盖多种架构，并提供 iOS 以及 Windows CUDA 和 Vulkan 构建版本。

lab Google DeepMind Blog · 10 天前

内部系统安全的AI控制路线图

已推出AI控制路线图，通过整合传统安全措施与实时监控能力来保障内部系统的安全。

lab OpenAI News · 10 天前

GPT-5.5 Instant 增强 ChatGPT 的健康回复

GPT-5.5 Instant 通过更强的推理能力、更好的上下文处理、更清晰的沟通以及医生指导的评估，提升了 ChatGPT 在健康与保健方面的回复质量。

lab Google — The Keyword (AI) · 10 天前

新研究表明AMIE在疾病管理上与医生表现相当

《自然》杂志发表的一项研究显示，对话式AI系统AMIE在管理复杂健康状况方面与初级保健医生的表现不相上下。

lab Google DeepMind Blog · 10 天前

英国政府与Google DeepMind推出AI驱动的住房规划原型

英国政府已与Google DeepMind合作，开发一款旨在加速住房规划决策的AI驱动原型。该举措旨在通过利用人工智能提高决策效率，从而简化房屋建设流程。

lab OpenAI News · 10 天前

OpenAI 为 ChatGPT Enterprise 推出支出控制和使用分析功能

OpenAI 已为 ChatGPT Enterprise 引入新的支出控制和使用分析功能。这些功能帮助企业在使用 AI 的过程中管理成本并做出明智的决策。

github llama.cpp · 10 天前

llama.cpp 发布 b9747，新增实时模型加载跟踪和新平台二进制文件

llama.cpp 版本 b9747 通过 SSE 端点引入了实时模型加载进度跟踪。该版本包含适用于 macOS、Linux、Android、Windows 和 openEuler 的二进制文件，支持各种架构以及 Vulkan、CUDA、OpenVINO 和 SYCL 等加速技术。

github llama.cpp · 10 天前

llama.cpp 发布 b9745，添加 MTP3 支持及跨平台二进制文件

llama.cpp 版本 b9745 引入了对 Step3.5/3.7 flash MTP3 的支持，包括用于层偏移和 nextn 标志的新 API。该版本提供了适用于 macOS、Linux、Android、Windows 和 openEuler 的预构建二进制文件，并支持 CPU、Vulkan、CUDA、OpenVINO 和 SYCL 加速选项。

github llama.cpp · 11 天前

LLaMA.cpp 发布 b9744：新增二进制文件和功能

LLaMA.cpp 发布了版本 b9744，包含适用于 macOS、Linux、Android、Windows 和 openEuler 的更新二进制文件。该版本支持多种架构和硬件加速器，如 Vulkan、CUDA、OpenVINO、SYCL 和 ROCm。此外还提供了用于界面访问的 UI 包。

github llama.cpp · 11 天前

llama.cpp 发布 b9742：为 SSM-conv 权重添加了填充步长

llama.cpp 版本 b9742 引入了用于 SSM-conv 权重的填充步长，提升了神经网络操作的效率。该版本提供了适用于 macOS、Linux、Android、Windows 和 openEuler 的二进制文件，支持多种架构以及包括 Vulkan、CUDA、OpenVINO 和 SYCL 在内的多个 API。

github llama.cpp · 11 天前

llama.cpp 发布 b9743，新增二进制文件和 GPU 支持

llama.cpp 版本 b9743 为 macOS、Linux、Android、Windows 和 openEuler 引入了适用于多种架构的新二进制文件。该版本增加了对 Vulkan、CUDA 12.4 和 13.3、OpenVINO、SYCL 以及 ROCm 的支持，并通过 JSON schema 到语法的对齐，更新了 UI 并改进了解析器的间距规则。

lab Claude Code Releases · 11 天前

v2.1.185 中更新了流停滞提示

流停滞提示现在显示“等待 API 响应 · 将在 … 后重试”，并在 20 秒无活动后激活，替换了之前的消息和延迟。

github llama.cpp · 11 天前

llama.cpp b9741 版本发布新增二进制文件与支持

llama.cpp 版本 b9741 为 macOS、Linux、Android、Windows 和 openEuler 引入了适用于多种架构的新二进制文件。该版本包含对 Vulkan、CUDA 12.4 和 13.3、OpenVINO、SYCL 以及 ROCm 的支持，并更新了 iOS 和 Ubuntu 的版本。

github llama.cpp · 11 天前

修复Windows上test-args-parser的随机失败

通过修改argv覆盖，仅在argc匹配时应用，以防止破坏程序化参数，从而解决Windows上test-args-parser的随机失败问题。这修复了OpenVINO Windows工作流中的fastfail断言，同时保留了真实二进制文件的UTF-8处理。

github llama.cpp · 11 天前

LLaMA.cpp 发布 b9739，新增 Windows OpenCL Adreno ARM64 支持

LLaMA.cpp 版本 b9739 增加了对使用 OpenCL Adreno 的 Windows ARM64 的支持。该版本包含适用于 macOS、Linux、Android、Windows 和 openEuler 的二进制文件，覆盖多种架构和 API，包括 Vulkan、CUDA、OpenVINO 和 SYCL。

github llama.cpp · 11 天前

llama.cpp 发布 b9738：修复 CORS 认证头转发问题并新增二进制构建

llama.cpp 版本 b9738 修复了 CORS 代理，避免转发认证头。此次发布包含适用于 macOS、Linux、Android、Windows 和 openEuler 的二进制构建文件，支持多种架构和硬件加速选项，包括 Vulkan、CUDA、OpenVINO 和 SYCL。

github llama.cpp · 11 天前

ggml 通过分区展平优化 AMX

ggml 项目通过将 n_batch * M 上的分区展平，优化了 AMX 性能，确保所有线程都参与量化。这一改进在 CPU 和 GPU 平台上的各种模型和硬件配置中，将速度提升了最高 1.47 倍，结果显示推理时间一致缩短。