全部文章 — korshunov.ai

全部文章页 1 / 21

检测和获取数据集增量最佳实践

Hugging Face 论坛上的用户询问检测新数据添加或数据集更新的高效方法，旨在触发流水线而无需重新处理整个数据集。

PrismML的1-bit Bonsai-8B在CPU上使用语法进行工具调用时优于IBM Granite

对PrismML的1-bit Bonsai-8B模型与IBM Granite及其他LLM的基准测试显示，在使用语法约束解码时，Bonsai-8B实现了最高的工具调用准确率。该测试使用llama.cpp在CPU上进行，突出了输出约束在使小型量化模型有效执行代理任务中的关键作用。

media r/LocalLLaMA · 13 小时前

Lemonade SDK 发布 RPG-HaloTales-V1，用于本地多媒体角色扮演

Lemonade SDK 发布了一款名为 RPG-HaloTales-V1 的新模型，旨在提供用户可在本地运行的多媒体角色扮演体验。

media r/LocalLLaMA · 13 小时前

用于NPC间对话的开源本地LLM NPC后端

作者发布了一个完全本地的、开源的语音到语音后端，专为大型语言模型（LLM）NPC设计，可实现NPC之间的直接交互，无需依赖云服务。该系统集成了语音转文本、本地LLM和文本转语音组件，使NPC能够相互对话、保留上下文并影响未来的玩家互动。

media r/LocalLLaMA · 14 小时前

3x Spark 配置的最佳编码模型？

一位用户正在寻求推荐，以便在由三台 Asus Ascent GX10 (GB10) 单元组成的专用硬件设置上运行最佳的编码模型，预计并发用户数为 5-10 人。

media r/LocalLLaMA · 14 小时前

Hugging Face 的 Andi 演示了使用 Gemma 4 31B 的完全开源语音管道

来自 Hugging Face 的 Andi 发布了一个完全开源且免费使用的演示，用于创建语音交互管道。该系统集成了 Nvidia parakeet、由 Cerebras 提供的 Gemma 4 31B 模型以及针对 Qwen3TTS 的自定义推理。

media r/LocalLLaMA · 14 小时前

Z.ai推出ZCode，挑战Cursor、Claude Code和GitHub Copilot在AI编程领域的地位

Z.ai推出了ZCode，这是一款旨在与Cursor、Claude Code和GitHub Copilot等成熟平台竞争的全新AI编程工具。

media r/LocalLLaMA · 14 小时前

SimpleLLMChat 1.2.5 更新：适用于 Windows XP 的智能体 AI

开发者发布了 SimpleLLMChat 的 1.2.5 版本，这是一个专为在运行 Windows XP 和 .NET 4.0 的旧机器上运行的智能体 AI 框架。

media r/LocalLLaMA · 14 小时前

你的 RAG 里有什么？

一位 Reddit 用户质疑检索增强生成（RAG）在涉及编码、系统管理工作和小型代码库的个人项目中的实际效用。作者认为，行业标准知识已被模型很好地覆盖，而特定的数据来源（如代码库或 API 参考）要么太小而不需要索引，要么太大而无法有效管理。

media r/LocalLLaMA · 14 小时前

Palantir CEO 怒斥封闭模型

Palantir CEO Alex Karp 公开批评 Anthropic 和 OpenAI 涉嫌向客户收取过高费用并滥用其数据。这一立场出现在 Palantir 最近达成协议购买 Nvidia 芯片以在其企业客户处运行本地模型之际。

media r/LocalLLaMA · 14 小时前

一种可靠的结构性输出廉价技巧：将验证错误反馈到重试中

为了提高从大型语言模型生成结构化输出的可靠性，提出了一种方法，在重试期间将验证错误和模型的先前输出反馈回提示词。这种方法将过程从重新滚动随机响应转变为通过编辑前一次尝试来自我纠正特定错误。

media Hugging Face Forums · 20 小时前

报告的 ZeroGPU 槽位与列出的空间之间的差异

一名用户遇到了配额错误，显示使用了 17 个 ZeroGPU 槽位，而限制为 10 个，尽管只列出了 8 个请求 zero-a10g 硬件的空间。

media Hugging Face Forums · 20 小时前

用户在Azure上部署SAM3时遇到SecretsInjectionError

一名用户报告在使用Hugging Face Foundry示例在Microsoft Azure上部署Meta SAM3模型时遇到了SecretsInjectionError。该错误在调用已部署的API的设置和安装阶段发生。

media Hugging Face Forums · 20 小时前

NanoI2V：从零构建图像到视频模型

NanoI2V 是一个开源项目，从零开始实现图像到视频的生成模型，旨在为现代视频生成技术提供清晰且具教育意义的参考。该仓库优先考虑可读性和可复现性，而非大多数前沿项目中常见的复杂性。

media Hugging Face Forums · 20 小时前

如何在 HuggingFace 上发布我的研究？

一位 Hugging Face 论坛用户寻求指导，了解如何正确发布其研究项目 TIS（Token Importance Scoring），以及相关的代码和文档。

github Goose (Block) · 20 小时前

Goose v1.40.0 版本说明

Goose v1.40.0 更新为桌面应用程序引入了广泛的本地化支持，新增法语、德语、意大利语、葡萄牙语、印尼语、马来语、越南语、繁体中文、韩语、日语、西班牙语和印地语的语言包。

media Hugging Face Forums · 23 小时前

Context Gravity

Chris Diaz 分享了一个名为 Context Gravity 的新项目，该项目目前在 GitHub 上可用。作者正在寻求社区对该存储库的反馈。

media Hugging Face Forums · 1 天前

Show HF：ServBay，面向编码代理的本地优先运行时与AI网关

ServBay 被介绍为一种本地优先的运行时和基础设施解决方案，旨在弥合 AI 编码代理与用户主机之间的差距。它解决了“最后一公里”问题，即智能代理缺乏系统级能力来配置数据库、域名或 SSL 证书，而无需开发人员手动干预。

media Hugging Face Forums · 1 天前

Prism Transformer：用于分层注意力处理的渐进式头调度

Prism Transformer 引入了一种渐进式头调度机制，该机制在不同层之间变化注意力头的数量，早期层使用较少但更宽的头，随着深度增加单调递增。这种方法通过解决早期层与后期层不同的结构需求，在不增加架构开销的情况下挑战了标准的均匀分配。

github CrewAI · 1 天前

LangChain v1.15.2a2 发布说明

此版本使用 Bedrock 集成的新功能、flow agent 文档和流式导航更新了 LangChain，同时包含错误修复和文档改进。