全部文章 — korshunov.ai

全部文章页 1 / 10

llama.cpp 发布 b9757：新二进制文件和功能

llama.cpp 发布了版本 b9757，包含适用于 macOS、Linux、Android、Windows 和 openEuler 的更新二进制文件。该版本移除了 top-n-sigma 采样器中无条件执行的 softmax+sort 操作，提升了采样效率。新构建支持 Vulkan、OpenVINO、SYCL、ROCm 和 CUDA，涵盖多种架构，包括 Apple Silicon 和 ARM64。

github llama.cpp · 9 天前

llama.cpp 发布 b9758，增加 bf16 支持并扩大编译器兼容性

llama.cpp 发布 b9758，为 bin_bcast 和一元运算引入 bf16 支持。同时扩展了对版本早于 2026.0 的旧版 Intel 编译器的兼容性，并提供适用于 macOS、Linux、Android、Windows 和 openEuler 平台的新构建版本，包括对 Vulkan、OpenVINO、SYCL 和 CUDA 的支持。

github llama.cpp · 9 天前

修复在文件末尾追加时 edit_file 崩溃的问题

通过在将 -1 规范化为 n（在末尾插入）而非 n+1，修复了在文件末尾追加时发生的文件编辑崩溃问题。该补丁将 -1 限制为追加模式，并拒绝替换/删除操作中的 -1，以防止静默覆盖最后一行，同时确保插入偏移量以整数形式计算，以避免堆缓冲区溢出。

github llama.cpp · 10 天前

llama.cpp 发布 b9751：新二进制文件与修复

llama.cpp 发布了版本 b9751，包含适用于 macOS、Linux、Android、Windows 和 openEuler 的更新二进制文件。该版本修复了内存使用问题，并支持多种架构以及 Vulkan、CUDA、OpenVINO 和 SYCL 等硬件加速选项。

github llama.cpp · 10 天前

llama.cpp 发布 b9752：服务器重构与跨平台二进制文件

llama.cpp 发布了版本 b9752，对服务器进行了重构，重点在于批处理构建，包括改进了对批处理满情况的处理以及错误修复。该版本包含适用于 macOS、Linux、Android、Windows 和 openEuler 的预编译二进制文件，支持多种架构以及 CUDA、Vulkan、OpenVINO 和 SYCL 等加速框架。

github llama.cpp · 10 天前

llama.cpp 发布 b9753：新增二进制文件和进度报告

llama.cpp 版本 b9753 引入了改进的规范模型加载进度报告，包括新的“阶段”列表。该版本包含适用于 macOS、Linux、Android、Windows 和 openEuler 的二进制文件，支持多种架构和硬件加速选项，如 Vulkan、CUDA、OpenVINO 和 SYCL。

github llama.cpp · 10 天前

llama.cpp 发布 b9754：新增 AC 解析器和跨平台二进制文件

llama.cpp 版本 b9754 在 common/peg 模块中引入了 AC 解析器，以实现更严格的语法生成。该版本包含适用于 macOS、Linux、Android、Windows 和 openEuler 的预编译二进制文件，支持多种架构以及 Vulkan、CUDA、OpenVINO 和 SYCL 等加速技术。

github llama.cpp · 10 天前

为 Android 构建添加 libandroid-spawn 依赖

Android 构建文档已更新，以包含对 libandroid-spawn 的依赖。此新增项旨在支持指定环境内的构建过程。

lab OpenAI News · 10 天前

三星为员工部署ChatGPT和Codex

三星电子已向全球员工推出OpenAI的ChatGPT Enterprise和Codex。此次部署代表了OpenAI迄今为止最大的企业AI举措之一。

github llama.cpp · 10 天前

llama.cpp 发布 b9750：新增 call 语句及跨平台二进制文件

llama.cpp 版本 b9750 引入了 call 语句的实现，并回滚了一项非预期的更改。该版本提供了适用于 macOS、Linux、Android、Windows 和 openEuler 的预编译二进制文件，支持多种架构和硬件加速选项，包括 Vulkan、CUDA、OpenVINO 和 SYCL。

github llama.cpp · 10 天前

llama.cpp 发布 b9748 版本，新增二进制文件和特性

llama.cpp 发布了 b9748 版本，在架构中添加了“verbose”字段，并为 macOS、Linux、Android、Windows 和 openEuler 提供了二进制文件。该版本支持 CPU、Vulkan、OpenVINO、SYCL 和 ROCm，涵盖多种架构，并提供 iOS 以及 Windows CUDA 和 Vulkan 构建版本。

lab Google DeepMind Blog · 10 天前

内部系统安全的AI控制路线图

已推出AI控制路线图，通过整合传统安全措施与实时监控能力来保障内部系统的安全。

lab OpenAI News · 10 天前

GPT-5.5 Instant 增强 ChatGPT 的健康回复

GPT-5.5 Instant 通过更强的推理能力、更好的上下文处理、更清晰的沟通以及医生指导的评估，提升了 ChatGPT 在健康与保健方面的回复质量。

lab Google — The Keyword (AI) · 10 天前

新研究表明AMIE在疾病管理上与医生表现相当

《自然》杂志发表的一项研究显示，对话式AI系统AMIE在管理复杂健康状况方面与初级保健医生的表现不相上下。

lab Google DeepMind Blog · 10 天前

英国政府与Google DeepMind推出AI驱动的住房规划原型

英国政府已与Google DeepMind合作，开发一款旨在加速住房规划决策的AI驱动原型。该举措旨在通过利用人工智能提高决策效率，从而简化房屋建设流程。

lab OpenAI News · 10 天前

OpenAI 为 ChatGPT Enterprise 推出支出控制和使用分析功能

OpenAI 已为 ChatGPT Enterprise 引入新的支出控制和使用分析功能。这些功能帮助企业在使用 AI 的过程中管理成本并做出明智的决策。

github llama.cpp · 10 天前

llama.cpp 发布 b9747，新增实时模型加载跟踪和新平台二进制文件

llama.cpp 版本 b9747 通过 SSE 端点引入了实时模型加载进度跟踪。该版本包含适用于 macOS、Linux、Android、Windows 和 openEuler 的二进制文件，支持各种架构以及 Vulkan、CUDA、OpenVINO 和 SYCL 等加速技术。

github llama.cpp · 10 天前

llama.cpp 发布 b9745，添加 MTP3 支持及跨平台二进制文件

llama.cpp 版本 b9745 引入了对 Step3.5/3.7 flash MTP3 的支持，包括用于层偏移和 nextn 标志的新 API。该版本提供了适用于 macOS、Linux、Android、Windows 和 openEuler 的预构建二进制文件，并支持 CPU、Vulkan、CUDA、OpenVINO 和 SYCL 加速选项。

github llama.cpp · 11 天前

LLaMA.cpp 发布 b9744：新增二进制文件和功能

LLaMA.cpp 发布了版本 b9744，包含适用于 macOS、Linux、Android、Windows 和 openEuler 的更新二进制文件。该版本支持多种架构和硬件加速器，如 Vulkan、CUDA、OpenVINO、SYCL 和 ROCm。此外还提供了用于界面访问的 UI 包。

github llama.cpp · 11 天前

llama.cpp 发布 b9742：为 SSM-conv 权重添加了填充步长

llama.cpp 版本 b9742 引入了用于 SSM-conv 权重的填充步长，提升了神经网络操作的效率。该版本提供了适用于 macOS、Linux、Android、Windows 和 openEuler 的二进制文件，支持多种架构以及包括 Vulkan、CUDA、OpenVINO 和 SYCL 在内的多个 API。