全部文章 — korshunov.ai

全部文章页 2 / 16

media Hugging Face Forums · 9 小时前

Wmf — 一种新的实验技术

文章内容已被作者删除，未留下关于该技术的实质性信息。

media Hugging Face Forums · 9 小时前

在 MacBook M5 Pro 上运行本地 LLM - 完全的新手！

一位非程序员分享了在配备 128GB 统一内存的 MacBook M5 Max 上设置本地大型语言模型基础设施的经验。用户详细介绍了他们的软件栈、模型选择以及在学习 AI 的同时建立稳定、可远程访问系统的目标。

media Together AI Blog · 10 小时前

Together AI 亮相 ICML 2026：全栈前沿研究

Together AI 将在 ICML 2026 上展示九篇论文，涵盖其平台开发的完整技术栈。

lab Hugging Face Blog · 11 小时前

Hugging Face 和 Cerebras 将 Gemma 4 引入实时语音 AI

Hugging Face 和 Cerebras 已将 Google 的 Gemma 4 模型集成到其平台中，以支持实时语音人工智能应用。此次合作使开发人员能够利用 Gemma 4 的多模态能力进行低延迟音频处理任务。

media Together AI Blog · 11 小时前

宣布完成8亿美元C轮融资，加速向开源AI的转型

该公司在C轮融资中筹集了8亿美元，旨在加速向开源人工智能的过渡。

lab Hugging Face Blog · 11 小时前

ScarfBench：评估AI代理在企业Java框架迁移中的表现

本文介绍了ScarfBench，这是一个旨在评估AI代理在不同框架之间迁移企业Java应用程序性能的基准测试。该研究强调了框架迁移的复杂性，并提出了一种标准化的评估方法，以评估代理在该领域的能力。

github CrewAI · 13 小时前

crewAI 1.15.2a1 发布说明

crewAI 1.15.2a1 版本为代理编排框架引入了几项新功能、错误修复和文档更新。

github llama.cpp · 16 小时前

llama.cpp b9859 版本添加了对 OpenCL 预编译内核的支持

llama.cpp b9859 版本引入了从库中加载预编译二进制内核的能力，专门针对 Adreno GPU。此更新还为 macOS、Linux、Windows、Android 和 openEuler 提供了适用于 CPU、GPU 和各种加速后端的二进制文件。

lab xAI News · 17 小时前

xAI 推出 Grok Voice 无代码语音代理构建器

xAI 宣布了 Voice Agent Builder 的测试版发布，这是一个无代码平台，旨在在不到两分钟内配置 Grok Voice 上的生产级语音代理。该工具允许运营商和开发人员部署高容量语音代理，而无需从头构建底层电话或 AI 堆栈。

github llama.cpp · 18 小时前

llama.cpp b9858 发布，修复 HF 模型路径

llama.cpp 项目发布了 b9858 版本，其中包括将 Hugging Face 主拆分作为模型路径的更改。此更新解决了关于模型加载路径的问题 #25181。

github llama.cpp · 20 小时前

llama.cpp b9857 发布：Flash Attention 重构与新二进制文件

llama.cpp b9857 版本引入了对 Hexagon Flash Attention 实现的全面重构，重点在于优化和精度提升。此次更新对 hex-mm 和 hex-fa 模块进行了重大更改，包括将量化任务折叠到主矩阵乘法线程中、与 ADD 操作融合以及优化掩码处理。

github llama.cpp · 1 天前

llama.cpp b9855 版本发布，新增 AVX2 nvfp4 优化及新二进制文件

llama.cpp 项目已发布 b9855 版本，在 ggml-cpu 后端中引入了针对 nvfp4 点积的 AVX2 优化，使用 UE4M3 查找表 (LUT)。

github llama.cpp · 1 天前

llama.cpp b9856 发布，为 FA 引入 CUDA restrict + PDL

llama.cpp 项目已发布 b9856 版本，在 CUDA 中为 Flash Attention 引入了 `restrict` 关键字和 PDL 的一致使用。此次更新附带了适用于 macOS、Linux、Android、Windows 和 openEuler 的预编译二进制文件，覆盖多种硬件后端。

github llama.cpp · 1 天前

移除 PWA 导航回退以防止缓存 API 端点请求

此次更新移除了渐进式 Web 应用 (PWA) 的导航回退机制。此更改旨在防止意外缓存 API 端点请求。

github llama.cpp · 1 天前

llama.cpp b9852 版本新增对 OpenCL q1_0 的支持

llama.cpp 项目已发布 b9852 版本，引入了对 q1_0 量化格式的初步 OpenCL 支持。此更新包括通用的 q1_0 功能以及针对 OpenCL 设备的特定 Adreno GEMM/GEMV 实现。

lab Anthropic News · 1 天前

Anthropic在出口管制后重新部署Fable 5

在美国政府解除出口管制后，Anthropic正在恢复其Claude Fable 5和Mythos 5模型在全球范围内的访问权限。Fable 5将于7月1日起在Claude平台上面向全球用户开放，使用限制将持续至7月7日，之后将切换为基于信用的访问模式。

github llama.cpp · 1 天前

llama.cpp b9851 版本修复了 CUDA 整数截断问题并提供二进制文件

llama.cpp 项目发布了 b9851 版本，其中包括对 CUDA 的修复，以防止在 flash_attn_mask_to_KV_max 内核中出现整数截断和溢出错误。此更新解决了与指定内核中的 KQ mask 步幅相关的问题。

github llama.cpp · 1 天前

llama.cpp b9850 发布：Qwen3 修复与新二进制文件

llama.cpp b9850 版本引入了特定的模型支持更新，包括为 Qwen3Next 注册 t_layer_inp 张量、修复层处理循环中的输入赋值问题，以及解决 qwen-coder-next 的 DFLASH 问题。它还添加了用于 Qwen3 模型注意力归一化的张量。

github MCP (GitHub org) · 1 天前

MCP Python SDK v2.0.0b1 发布，全面支持 2026 规范

Model Context Protocol (MCP) Python SDK 发布了其首个测试版 v2.0.0b1，引入了对 2026-07-28 MCP 规范的完整支持。此预发布版本仅通过显式选择加入（opt-in）启用，确保标准安装仍解析为稳定的 1.x 版本。

lab Microsoft Research Blog · 2 天前

SkillOpt：将智能体技能作为可训练参数

微软研究院推出了SkillOpt，该方法将智能体技能文件视为冻结目标模型之外的可训练参数，将手动技能编辑转化为受控的优化过程。这种方法在不更新底层模型权重的情况下提高了智能体的可靠性和一致性。