全部文章 — korshunov.ai

全部文章页 1 / 18

用户询问在 Hugging Face 上更改组织名称的流程

一位用户在 Hugging Face 讨论区发帖，寻求有关重命名其组织的帮助。该用户表示，他们于 6 月 15 日向 website@huggingface.co 发送了一封电子邮件，请求将组织名称从 DZER-Studios 更改为 Vexion-LM。尽管已发送初始请求，但该用户报告称未收到任何回复，并观察到组织名称仍未更改。因此，发帖人询问平台是否仍支持组织重命名。他们还请求指导如何通过其他方法联系团队以处理此项特定的行政请求。

media Hugging Face Forums · 8 天前

关于模型基准测试方法的社区探讨

一位用户在 Hugging Face 讨论区发帖，寻求有关如何对机器学习模型进行基准测试的建议。该问题由一位微调领域的新手发起，希望在完成模型后对其进行评估。帖子明确询问了社区为此目的所采用的既定方法或策略。它强调了从业者理解模型开发中标准评估实践的普遍需求。目前讨论帖仅包含来自单个参与者的一个帖子。在可见的源内容中，未提供任何具体的基准、指标或技术解决方案。

media Hugging Face Forums · 8 天前

Qwen3/Gemma3 在 CPU 模式下对等长批次跳过注意力掩码

一名用户报告了 Hugging Face text-embeddings-inference 库中的一个严重 bug，该问题影响 Qwen3 和 Gemma3 模型。当在 CPU 上处理并发请求进行推理时会出现此问题，导致准确率显著下降。具体而言，Candle 后端错误地跳过了所有输入序列长度相等的批次的注意力掩码。这一缺陷损害了在这些特定条件下生成的嵌入的可靠性。为解决该问题，作者提交了一个包含修复方案的拉取请求，并在本地机器上进行了充分测试。该 bug 凸显了处理批量输入的基于 CPU 的嵌入服务中潜在的稳定性风险。

github CrewAI · 8 天前

v1.14.8a4 发布说明

v1.14.8a4 在 CLI TUI 中增加了对话流支持。它包括修复技能归档提取和声明式流定义路径验证期间的符号链接路径遍历问题。v1.14.8a3 的文档已更新。

github llama.cpp · 8 天前

LLaMA.cpp 发布 b9784：Hexagon MM 优化与跨平台二进制文件

LLaMA.cpp 发布了版本 b9784，对基于 Hexagon 的 MM 操作进行了重大优化，包括 32x32 分块权重重排、改进的 dyn.quant 处理以及统一的内核参数管理。该版本包含适用于 macOS（arm64 和 x64）、iOS 以及多种 Linux 架构的新二进制文件，支持 Vulkan、ROCm 和 OpenVINO。

github llama.cpp · 8 天前

llama.cpp 发布 b9782，包含新二进制文件和支持

llama.cpp 发布了版本 b9782，包括适用于 macOS、Linux、Android、Windows 和 openEuler 的二进制文件。此次更新增加了对 Vulkan、OpenVINO、SYCL、ROCm 和 CUDA 在多架构上的支持，并更新了 UI 以及禁用了 KleidiAI 和 openEuler 支持等功能。

lab Google DeepMind Blog · 8 天前

Gemini 3.5 Flash 新增计算机使用能力

Google 在 Gemini 3.5 Flash 中引入了计算机使用功能，使模型能够执行代码并与外部工具交互。该功能允许用户通过集成的计算功能运行编程任务并访问实时信息。

lab Hugging Face Blog · 8 天前

推出FFASR排行榜：在真实世界中基准测试自动语音识别

FFASR排行榜的推出旨在评估真实世界条件下的语音识别系统。它为评估自动语音识别模型在不同环境和用例中的性能提供了基准。

lab Hugging Face Blog · 8 天前

NVIDIA NeMo AutoModel 加速 Transformer 微调

NVIDIA 的 NeMo AutoModel 通过自动化模型选择和优化，实现了更快的 Transformer 模型微调。它减少了开发时间，并提高了在 NVIDIA 硬件上训练大型语言模型的效率。

lab Claude Code Releases · 8 天前

v2.1.190：错误修复和可靠性改进

版本 2.1.190 包括错误修复和可靠性改进。此更新中没有宣布新功能。

github llama.cpp · 8 天前

llama.cpp 发布 b9781，支持 Vulkan 和多平台

llama.cpp 发布了版本 b9781，为 Linux 和 Windows 添加了 Vulkan 支持，并扩展到包括 ARM64 和 x64 在内的多种架构，覆盖 macOS、Linux、Android 和 Windows。该版本包含 CPU、CUDA、OpenVINO、SYCL 和 ROCm 构建版本，并提供 UI 组件。

lab Mistral AI News · 8 天前

企业安全与访问的新连接器控制功能

Mistral Studio 现在提供丰富的管理员控制功能，可按工作区和工具管理连接器访问权限，实现细粒度权限控制。功能包括带作用域的 API 密钥、多账户连接器以及用于根本原因分析的新版 Connectors Debugger，所有这些都支持与企业系统的安全、可审计集成。

lab Microsoft Research Blog · 8 天前

Talos：罕见病诊断的自动化基因组重分析

Talos 是一款开源工具，可自动化地对基因组数据进行迭代重分析，以识别罕见病诊断。它在每位患者仅产生 1.3 个候选变异的情况下，实现了 90% 的目标内诊断恢复率，并为 5,000 名未确诊患者提供了 241 例新诊断，其中大多数新发现出现在证据发表后的 32 天内。

media Hugging Face Forums · 8 天前

Aiden 移动代理原型正在开发中

Aiden 是一款物理 AI 代理设备，通过 HDMI 监控手机屏幕，并通过 USB HID 控制它，从而实现无需越狱或安装软件的应用自动化。它支持自带 LLMs，无需后端基础设施或数据收集，并以 AGPL 许可证作为开源开发板发布。

lab OpenAI News · 8 天前

OpenAI与博通推出专为大语言模型优化的推理芯片

OpenAI和博通推出了Jalapeño，这是一款专为大型语言模型推理设计的定制AI芯片。该芯片旨在提升AI系统的性能、效率和可扩展性。

github llama.cpp · 8 天前

vulkan-shaders-gen 现在在着色器编译错误时构建失败

当着色器编译失败时，vulkan-shaders-gen 工具现在会检测并导致构建失败，从而防止生成损坏的 libggml-vulkan。此修复解决了一个先前的问题：构建成功掩盖了运行时故障，并改进了跨平台的错误处理和原子标志管理。

github llama.cpp · 8 天前

LLaMA.cpp 发布 b9777，新增模型与跨平台二进制文件

LLaMA.cpp 发布 b9777，新增了 LFM2.5-ColBERT-350M 和 LFM2.5-Embedding-350M 模型。该版本包含适用于 macOS、Linux、Android、Windows 和 openEuler 的预构建二进制文件，支持多种架构以及 CUDA、Vulkan、OpenVINO 和 SYCL 等加速技术。

github vLLM · 8 天前

v0.24.0rc1：修复 SM75 上的 topk 直方图构建问题

vllm 发布了 v0.24.0rc1，其中包括对 SM75 上 topk 直方图构建问题的修复。该更改是从提交 191826e 中 cherry-pick 的，并由 Mohammad Miadh Angkad 签署确认。

media Hugging Face Forums · 8 天前

我用 Go 语言为 AI 代理构建了一个 MCP 服务器 - 200 行教程

一个 200 行的 Go 语言教程展示了如何使用 Go 的并发性和简洁性构建轻量级模型上下文协议（MCP）服务器。该服务器使 Claude 等 AI 代理能够访问结构化数据和 Go 应用程序，可能使其有用性提升 10 倍。

media Hugging Face Forums · 8 天前

适用于本地使用并在 Unity 中通过 MCP 工作的最佳模型，显存占用 12 GB

一位用户正在寻找专为 Unity 6.5 和 MCP 设计的轻量级 LLM，且显存占用需在 12 GB 以内。他们目前依赖 Cursor 和 Claude 的免费层级，但认为这些不够用，询问是否存在任何专用模型或替代解决方案。