全部文章 — korshunov.ai

全部文章页 1 / 19

代际上下文架构：解决大语言模型上下文腐烂问题

代际上下文架构（GCA）提出将大语言模型的上下文窗口视为有限的生命周期，而非无限存储，以解决多智能体系统中的“上下文腐烂”和注意力稀释问题。通过强制实施人工寿命限制，在性能下降之前终止智能体，并通过扁平文件 Markdown 保险库将其状态传递给新一代。

media Hugging Face Forums · 3 天前

2026年世界杯预测器

一位开发者创建了一个2026年世界杯预测工具，该工具利用历史数据来模拟比赛结果。该应用程序根据从大约5万场跨越一个世纪的国际比赛中学习到的模式，为任意两支国家队提供获胜概率和比分预测。

media Hugging Face Forums · 3 天前

Transformer的全面双语指南：从基础到KV缓存压缩与注意力动态

Carles Marin发布了一份开源的双语（英语和西班牙语）指南，将Transformer架构的数学基础与其实际实现联系起来。该资源侧重于底层机制，提供可复现的代码和交互式元素来解释复杂主题。

media Hugging Face Forums · 3 天前

发布开源双语Transformer机制指南

一份详细阐述Transformer内部工作原理的开源双语（英语/西班牙语）指南已发布。该资源涵盖了注意力崩溃和KV缓存压缩等概念背后的精确数学原理和机制。

lab OpenAI News · 4 天前

惠普公司启动与OpenAI的Frontier战略合作

在试点项目取得成功后，惠普公司正在扩大其与OpenAI的战略合作，将人工智能部署到客户体验、员工生产力和软件开发中。该公司利用OpenAI Frontier平台作为统一的运营模式，以管理上下文、权限和评估，从而从实验性用例转向企业级生产。

github llama.cpp · 4 天前

llama.cpp b9837 发布，新增 --reasoning-preserve 标志和新二进制文件

llama.cpp 项目已发布版本 b9837，为 Jinja 聊天模板引入了新的 `--reasoning-preserve` 标志，以保留推理令牌。此更新还修正了帮助信息，并为 macOS、Linux、Windows、Android 和 openEuler 在各种硬件后端上提供了预构建的二进制文件。

media Hugging Face Forums · 4 天前

HoLo-ToLk：基于零参数HSL基底的无分词器语音模型

作者介绍了HoLo-ToLk，这是一个研究项目，旨在构建不使用分词器或学习输入嵌入的零参数HSL字节基底上的语音转文本（STT）和文本转语音（TTS）模型。该工作证明，当结合特定的架构修改时，原始HSL字节可以作为音频处理的可行信号。

github llama.cpp · 4 天前

llama.cpp b9835 版本发布，修复了 UI 停止和推理跳过问题

llama.cpp 项目已发布 b9835 版本，其中包含对单模型模式下停止和推理跳过功能的修复。此更新解决了用户界面中的特定问题，以改进模型推理期间的控制。

media Hugging Face Forums · 4 天前

关于AI学习二进制代码的假设性探讨

一位论坛用户提出了一个推测性问题，即训练神经网络或AI系统理解二进制代码是否会显著增强其整体能力，特别是在编码任务方面。

media Hugging Face Forums · 4 天前

概念：用数据交换数据以训练AI模型

一位用户提出了一个网站的概念，个人可以在该网站上交换数据以训练AI模型，从而消除货币交易的需求。该系统基于信用经济运作，用户从一定数量的信用开始，并针对特定的数据需求发布悬赏。

github llama.cpp · 4 天前

llama.cpp b9833 发布：MiniCPM5 解析器与多平台二进制文件

llama.cpp 项目发布了 b9833 版本，引入了专为 MiniCPM5 模型设计的解析器，并附带多项错误修复和重构。此次更新包括工具调用解析支持、语法简化，以及修正 Jinja API 行为以符合 Jinja2 标准。

github llama.cpp · 4 天前

llama.cpp b9832 版本新增 --dump-prog 调试标志

llama.cpp 项目发布了 b9832 版本，为 Jinja 模板引擎引入了新的 `--dump-prog` 命令行选项，以辅助调试。此次更新还包含了适用于 macOS、Linux、Android、Windows 和 openEuler 的预构建二进制文件，覆盖多种 CPU 和 GPU 架构。

github llama.cpp · 4 天前

llama.cpp b9831 版本发布，新增 DFlash 支持和全新二进制文件

llama.cpp b9831 版本引入了 DFlash v2 支持，包括按层类型的滑动窗口注意力机制，并附带针对多个平台的全面预构建二进制文件。

github llama.cpp · 4 天前

llama.cpp b9830 版本新增 --offline 标志并修复内存漏洞

llama.cpp b9830 版本引入了在 llama download 命令中使用 --offline 标志的功能，允许脚本在无网络访问的情况下验证缓存模型。此更新还解决了 URL-task on_done 回调中潜伏的 use-after-free 漏洞，其中 first_path 被错误地通过引用捕获。

media Hugging Face Forums · 4 天前