全部文章 — korshunov.ai

全部文章页 3 / 15

llama.cpp b9847 版本修复了 Gemma E4B MTP FlashAttention

llama.cpp 项目已发布 b9847 版本，其中包含对 CUDA 上 Gemma E4B MTP FlashAttention 的修复以及移除未使用的模板声明。

Trajlens：LeRobotDataset 的验证器，已审计 100 个 Hub 数据集

作者介绍了 Trajlens，这是 Hugging Face Hub 上 LeRobotDataset 类别的一个开源 linter，并报告了对标记为 'lerobot' 的 100 个随机公共数据集进行审计的结果。审计显示，只有 19 个数据集通过了验证，其中 13 个因特定的上游 bug 而失败，47 个遇到加载错误或超时。

media Hugging Face Forums · 2 天前

架构提案：用于开源AI的认识论对抗网络（EAN）

一项功能请求提出了认识论对抗网络（EAN），这是一种旨在将AI从反映机构共识的系统转变为去中心化、多视角验证引擎的架构。这种方法旨在通过消除任何单一的“真理”模型，来消除政治和企业权力斗争。

media Hugging Face Forums · 2 天前

关于开源LLM在聊天机器人开发中应用的社区讨论

Hugging Face论坛上的一个讨论帖询问用户目前用于聊天机器人开发的免费或开源AI模型有哪些，以及他们偏好的原因。

media Hugging Face Forums · 2 天前

我的硬件能跑哪前5个模型？拒绝AI脑叶切除

一位用户在 Hugging Face 论坛上寻求关于无审查 AI 模型的推荐，这些模型能够推理复杂主题，并引用了对早期 GPT-4 版本而非当前版本的偏好。

github llama.cpp · 2 天前

llama.cpp b9846 发布，为 Asahi Linux 带来 Vulkan 矩阵乘法优化

llama.cpp 项目已发布 b9846 版本，其中包含针对 Asahi Linux 的 Vulkan 后端优化。此更新将矩阵乘法中的块大小循环回滚，以改善在运行 Linux 的 Apple Silicon 硬件上的兼容性和性能。

github llama.cpp · 2 天前

llama.cpp b9844 版本新增 NVFP4 支持和新二进制文件

llama.cpp 项目发布了 b9844 版本，该版本为 NVFP4 量化格式引入了 ggml-webgpu 支持。此次更新还提供了适用于 macOS、iOS、Linux、Android、Windows 和 openEuler 的预构建二进制文件，覆盖多种硬件后端。

media Hugging Face Forums · 2 天前

AgentSeal：SWE-bench Pro 的语料库可用性审计

AgentSeal v5 审计工具评估了 SWE-bench Pro 基准中工件的公开可用性，以评估潜在的污染风险。研究发现，虽然有 12 个实例显示出确定性的内容重叠，且 76 个仓库可能是语料库成员，但大多数证据是日期未知的公开复现，而非已证实的截断前污染。

lab Google — The Keyword (AI) · 2 天前

开启英国下一个生产力时代：打造AI先锋国家

Google UK发布了最新的经济影响报告，详细阐述了帮助更多人解锁该国AI驱动技术红利的策略。

github llama.cpp · 2 天前

llama.cpp b9843 版本发布，提供 macOS、Linux、Windows 二进制文件

llama.cpp 项目已发布 b9843 版本，为 macOS、Linux、Android、Windows 和 openEuler 在各种硬件架构上提供预构建的二进制文件。

github LangGraph · 2 天前

LangGraph 1.2.7 发布说明

LangGraph 版本 1.2.7 已发布，为 LangChain 生态系统引入了错误修复和依赖更新。

media Hugging Face Forums · 2 天前

发布开源双语Transformer机制指南

一份详细阐述Transformer内部工作原理的开源双语（英文和西班牙文）指南已发布。该资源涵盖了注意力崩溃和KV缓存压缩背后的精确数学原理与机制。

media Hugging Face Forums · 2 天前

[研究] 从功能几何到动态语法：跨越7种架构的新LIMEN审计（V23–V24）

独立研究项目LIMEN分析了七个开源Transformer模型的内部动力学，揭示语义歧义会改变轨迹几何结构，并在不同架构中发现了通用的动态语法。

lab Microsoft Research Blog · 2 天前

Memora：一种平衡抽象与具体性的谐波记忆表示

微软研究院推出 Memora，这是一个可扩展的智能体记忆框架，旨在为长周期 AI 任务平衡抽象与具体性。该系统将丰富的记忆内容与轻量级的检索结构解耦，在基准测试中创下新的最先进成果，同时最多减少 98% 的上下文 token。

lab Claude Code Releases · 2 天前

Claude Code v2.1.196 版本说明

Claude Code 版本 2.1.196 引入了组织默认模型、可点击的文件附件以及针对 MCP 服务器审批的改进安全性。此次更新还增强了后台会话的可靠性，修复了各种智能体状态报告问题，并优化了代码审查工作流中的令牌使用。

lab Hugging Face Blog · 3 天前

DiScoFormer：一个适用于密度和分数的Transformer，跨越分布

本文介绍了DiScoFormer，这是一种统一的Transformer模型，能够在各种数据分布上执行密度估计和基于分数的生成任务。

media Hugging Face Forums · 3 天前

UCTF项目：关于机器原生AI训练表示的开放研究计划

UCTF项目已从单一提案重组为一个开放的、假设驱动的研究计划，旨在调查机器原生的中间表示能否减少多语言AI训练中的跨语言语义冗余。

media Hugging Face Forums · 3 天前

生成深度强化学习课程证书时出错

一名用户报告称，在尝试生成 Hugging Face 上深度强化学习课程的结业证书时遇到了错误。尽管输入了所需的用户名和姓名信息，问题仍然存在，且网上没有现有的指导。

lab Google — The Keyword (AI) · 3 天前

请教AI专家：到底什么是全栈？

一位Google专家解释了采用全栈方法处理人工智能的概念。文章强调，这种综合方法论长期以来一直是Google AI工作的基础。

github llama.cpp · 3 天前

llama.cpp b9842 发布：去重 /v1/models 中的预设和缓存模型条目

llama.cpp b9842 版本引入了对 /v1/models 端点中预设和缓存模型条目的去重更改。此更新由来自 Hugging Face 的 Adrien Gallouët 审核通过。