全部文章 — korshunov.ai — ML 新闻

全部文章页 1 / 21

blog Simon Willison · 4 小时前

理解才能参与

Geoffrey Litt 认为，开发人员必须深入理解由编码代理生成的代码，以避免认知债务并保持作为创造性过程中的积极参与者。

media r/LocalLLaMA · 5 小时前

OpenLumara 现在通过 OpenAI 端点桥接任何 UI 到本地模型

开源框架 OpenLumara 现在支持与任何能够与 OpenAI 端点通信的用户界面连接，例如 KoboldLite 和 OpenWebUI。此更新允许用户将节省 token 的框架集成到现有工作流程中，而无需更改首选的前端。

media r/LocalLLaMA · 5 小时前

有人在使用像QGIS这样的软件进行大规模空间或城市布局生成时，使用本地LLM吗？

一位用户正在寻求关于能够生成大规模结构数据（例如整个城市布局、道路网络和复杂网格系统）的本地语言模型的推荐。

media r/LocalLLaMA · 7 小时前

双R9700：Qwen3.6 27B的最佳公式？

一名用户正在研究使用 llama.cpp 在双 AMD Radeon R9700 设置上优化 Qwen3.6-27B 模型，比较 Vulkan 和 ROCm 后端之间的性能。

media r/LocalLLaMA · 7 小时前

Gemma 4 WebGPU 内核实现 255 tok/s

Xenova 发布了 Gemma 4 的 WebGPU 内核，实现了每秒 255 个 token 的性能。此优化使密集模型在 Web 浏览器中的运行速度超过 100 tok/s。

blog Simon Willison · 7 小时前

使用 DSPy 评估和改进 Datasette Agent 的 SQL 系统提示

Simon Willison 利用 Claude Code 和 Fable 5 模型，自动化了 Datasette Agent 系统提示的评估和优化过程，特别针对其只读 SQL 查询执行功能。该过程涉及安装最新的 Datasette alpha 版本和 DSPy，以识别代理在处理模式信息方面的弱点。

media r/LocalLLaMA · 11 小时前

针对文案评分微调的Gemma-4-31B在EqBench3上Elo得分提升290

一位用户发布了专门针对文案和创意写作任务优化的Gemma-4-31B-it模型的窄域微调版本。该模型经过训练，旨在消除通用的营销陈词滥调，并采用以具体细节和紧凑行动号召为特征的直接响应风格。

github llama.cpp · 14 小时前

llama.cpp b9860 发布添加了 llama_ftype_name API

llama.cpp 项目发布了版本 b9860，引入了一个新的公共 C API 函数 `llama_ftype_name`，用于暴露模型文件类型（量化）名称。

media r/LocalLLaMA · 14 小时前

智能体正在协作编写关于LLM强化学习的庞大维基（目前已收录200多篇论文），任何人都可以加入

一个合作项目正在进行中，AI智能体正在编译一份关于大型语言模型强化学习的综合维基，已经处理了超过200篇研究论文。

media r/LocalLLaMA · 14 小时前

Reddit帖子呼吁感谢开源开发者

一位Reddit用户强调了向开源贡献者表达感激之情的迫切需求，并以vLLM最近的快速更新为例，展示了社区努力的成果。

media r/LocalLLaMA · 14 小时前

重建 Gemma 4 31b... 更好... 作为 26b...

一位开发者概述了通过将其参数量减少到约 26B 来重建 Gemma 4 31B 模型的计划，同时旨在提高性能。该项目涉及架构更改、特定的训练技术和数据集策展，以创建更小、更高效的模型。

media r/LocalLLaMA · 14 小时前

poolside/Laguna-XS-2.1

文章宣布了 Laguna-XS-2.1 的发布，该模型在 Hugging Face 上由 poolside 组织提供。

media r/LocalLLaMA · 14 小时前

Kimi K2.7 Code 已在 GitHub Copilot 中全面可用

Moonshot AI 的 Kimi K2.7 Code 模型已在 GitHub Copilot 平台中全面开放。

media r/LocalLLaMA · 16 小时前

Reddit用户询问Ubuntu是否为本地AI最兼容的Linux发行版

r/LocalLLaMA社区的一位Reddit用户正在转向Linux，并寻求确认Ubuntu是否为运行本地AI工作负载提供最佳兼容性。

media Hugging Face Forums · 16 小时前

网站下载中的 Unicode 字符支持

Hugging Face 网站在通过下载按钮或 resolve URL 从数据集中下载单个文件时，未能正确编码 Unicode 字符。

media Hugging Face Forums · 16 小时前

LLM代理能否发展出预知能力？

文章认为，当前的LLM代理往往以隐式的后果意识行事，这对于具有重大后果的任务来说是不够的。它提出了“显式预知”作为必需的架构层，以确保代理在执行前对风险建模并预测效果。

media Hugging Face Forums · 16 小时前

哪个开源模型最适合客户支持代理？

Hugging Face 论坛上的用户正在询问，构建 AI 客户支持聊天机器人或虚拟助手时，哪个免费 AI 模型是最佳选择。该帖子不包含具体的模型比较、测试结果或技术细节。

media Hugging Face Forums · 16 小时前

Hugging Face 模型下载计数器错误

一位用户在 Hugging Face 社区论坛上报告称，其模型仓库 InternScience/Agents-A1-FP8 的下载统计量一直为零，尽管该模型是在两天前上传的。用户指出，该仓库包含一个 config.json 文件，并怀疑存在技术问题导致计数器无法更新。

media Hugging Face Forums · 16 小时前

用户报告 Hugging Face 账单支持响应延迟

Hugging Face 讨论论坛的一位用户报告称，他们向账单支持发送的关于未经授权订阅的电子邮件未收到回复。该人士正在寻求退还意外收费的费用，并指出尽管已经联系了支持团队，但仍缺乏沟通。

media Hugging Face Forums · 16 小时前

检测和获取数据集增量最佳实践

Hugging Face 论坛上的用户询问检测新数据添加或数据集更新的高效方法，旨在触发流水线而无需重新处理整个数据集。