全部文章
media Hugging Face Forums · 8 天前

用户询问在 Hugging Face 上更改组织名称的流程

一位用户在 Hugging Face 讨论区发帖,寻求有关重命名其组织的帮助。该用户表示,他们于 6 月 15 日向 website@huggingface.co 发送了一封电子邮件,请求将组织名称从 DZER-Studios 更改为 Vexion-LM。尽管已发送初始请求,但该用户报告称未收到任何回复,并观察到组织名称仍未更改。因此,发帖人询问平台是否仍支持组织重命名。他们还请求指导如何通过其他方法联系团队以处理此项特定的行政请求。

media Hugging Face Forums · 8 天前

关于模型基准测试方法的社区探讨

一位用户在 Hugging Face 讨论区发帖,寻求有关如何对机器学习模型进行基准测试的建议。该问题由一位微调领域的新手发起,希望在完成模型后对其进行评估。帖子明确询问了社区为此目的所采用的既定方法或策略。它强调了从业者理解模型开发中标准评估实践的普遍需求。目前讨论帖仅包含来自单个参与者的一个帖子。在可见的源内容中,未提供任何具体的基准、指标或技术解决方案。

media Hugging Face Forums · 8 天前

Qwen3/Gemma3 在 CPU 模式下对等长批次跳过注意力掩码

一名用户报告了 Hugging Face text-embeddings-inference 库中的一个严重 bug,该问题影响 Qwen3 和 Gemma3 模型。当在 CPU 上处理并发请求进行推理时会出现此问题,导致准确率显著下降。具体而言,Candle 后端错误地跳过了所有输入序列长度相等的批次的注意力掩码。这一缺陷损害了在这些特定条件下生成的嵌入的可靠性。为解决该问题,作者提交了一个包含修复方案的拉取请求,并在本地机器上进行了充分测试。该 bug 凸显了处理批量输入的基于 CPU 的嵌入服务中潜在的稳定性风险。