全部文章 — korshunov.ai

全部文章页 1 / 19

media Hugging Face Forums · 13 小时前

Context Gravity

Chris Diaz 分享了一个名为 Context Gravity 的新项目，该项目目前在 GitHub 上可用。作者正在寻求社区对该存储库的反馈。

media Hugging Face Forums · 16 小时前

Show HF：ServBay，面向编码代理的本地优先运行时与AI网关

ServBay 被介绍为一种本地优先的运行时和基础设施解决方案，旨在弥合 AI 编码代理与用户主机之间的差距。它解决了“最后一公里”问题，即智能代理缺乏系统级能力来配置数据库、域名或 SSL 证书，而无需开发人员手动干预。

media Hugging Face Forums · 16 小时前

Prism Transformer：用于分层注意力处理的渐进式头调度

Prism Transformer 引入了一种渐进式头调度机制，该机制在不同层之间变化注意力头的数量，早期层使用较少但更宽的头，随着深度增加单调递增。这种方法通过解决早期层与后期层不同的结构需求，在不增加架构开销的情况下挑战了标准的均匀分配。

github CrewAI · 16 小时前

LangChain v1.15.2a2 发布说明

此版本使用 Bedrock 集成的新功能、flow agent 文档和流式导航更新了 LangChain，同时包含错误修复和文档改进。

media Hugging Face Forums · 17 小时前

分形梦境 + 量子启发式规划：结合 DeepSeek Coder 的自组织知识发现工具

作者提出了一种自组织知识发现工具，该工具集成了分形模式生成和受量子启发的叠加态，以增强 DeepSeek Coder 对知识空间的探索。该系统通过将成功的创意路径存储为缓存查询而非内存来优化搜索轨迹，并根据硬件限制调整资源使用。

media Hugging Face Forums · 17 小时前

Wmf — 一种新的实验技术

文章内容已被作者删除，未留下关于该技术的实质性信息。

media Hugging Face Forums · 17 小时前

在 MacBook M5 Pro 上运行本地 LLM - 完全的新手！

一位非程序员分享了在配备 128GB 统一内存的 MacBook M5 Max 上设置本地大型语言模型基础设施的经验。用户详细介绍了他们的软件栈、模型选择以及在学习 AI 的同时建立稳定、可远程访问系统的目标。

media Together AI Blog · 17 小时前

Together AI 亮相 ICML 2026：全栈前沿研究

Together AI 将在 ICML 2026 上展示九篇论文，涵盖其平台开发的完整技术栈。

lab Hugging Face Blog · 18 小时前

Hugging Face 和 Cerebras 将 Gemma 4 引入实时语音 AI

Hugging Face 和 Cerebras 已将 Google 的 Gemma 4 模型集成到其平台中，以支持实时语音人工智能应用。此次合作使开发人员能够利用 Gemma 4 的多模态能力进行低延迟音频处理任务。

media Together AI Blog · 18 小时前

宣布完成8亿美元C轮融资，加速向开源AI的转型

该公司在C轮融资中筹集了8亿美元，旨在加速向开源人工智能的过渡。

lab Hugging Face Blog · 18 小时前

ScarfBench：评估AI代理在企业Java框架迁移中的表现

本文介绍了ScarfBench，这是一个旨在评估AI代理在不同框架之间迁移企业Java应用程序性能的基准测试。该研究强调了框架迁移的复杂性，并提出了一种标准化的评估方法，以评估代理在该领域的能力。

github CrewAI · 20 小时前

crewAI 1.15.2a1 发布说明

crewAI 1.15.2a1 版本为代理编排框架引入了几项新功能、错误修复和文档更新。

lab Claude Code Releases · 22 小时前

Claude Code v2.1.198 发布说明

Claude Code v2.1.198 更新使 Chrome 中的 Claude 正式可用，并通过新的通知钩子和自动化拉取请求工作流增强了后台代理功能。

lab Google — The Keyword (AI) · 22 小时前

纽约教育工作者和行业领袖齐聚谷歌，共同塑造课堂中的AI

谷歌、纽约就业首席执行官委员会和Urban Assembly在谷歌办公室为150位教育和行业领袖举办了AI峰会。此次活动汇集了利益相关者，讨论并塑造人工智能在教室环境中融合的未来。

lab Google — The Keyword (AI) · 23 小时前

谷歌2026年6月最新AI新闻公告

本文回顾了谷歌在2026年6月期间发布的各项人工智能更新和公告。

github llama.cpp · 23 小时前

llama.cpp b9859 版本添加了对 OpenCL 预编译内核的支持

llama.cpp b9859 版本引入了从库中加载预编译二进制内核的能力，专门针对 Adreno GPU。此更新还为 macOS、Linux、Windows、Android 和 openEuler 提供了适用于 CPU、GPU 和各种加速后端的二进制文件。

lab xAI News · 1 天前

xAI 推出 Grok Voice 无代码语音代理构建器

xAI 宣布了 Voice Agent Builder 的测试版发布，这是一个无代码平台，旨在在不到两分钟内配置 Grok Voice 上的生产级语音代理。该工具允许运营商和开发人员部署高容量语音代理，而无需从头构建底层电话或 AI 堆栈。

github llama.cpp · 1 天前

llama.cpp b9858 发布，修复 HF 模型路径

llama.cpp 项目发布了 b9858 版本，其中包括将 Hugging Face 主拆分作为模型路径的更改。此更新解决了关于模型加载路径的问题 #25181。

github llama.cpp · 1 天前

llama.cpp b9857 发布：Flash Attention 重构与新二进制文件

llama.cpp b9857 版本引入了对 Hexagon Flash Attention 实现的全面重构，重点在于优化和精度提升。此次更新对 hex-mm 和 hex-fa 模块进行了重大更改，包括将量化任务折叠到主矩阵乘法线程中、与 ADD 操作融合以及优化掩码处理。

github llama.cpp · 1 天前

llama.cpp b9855 版本发布，新增 AVX2 nvfp4 优化及新二进制文件

llama.cpp 项目已发布 b9855 版本，在 ggml-cpu 后端中引入了针对 nvfp4 点积的 AVX2 优化，使用 UE4M3 查找表 (LUT)。